技术原理

什么是无监督学习?它是如何工作的?

来教你的电脑,并期望它能回馈我们几十年前的梦想。但是现在,随着机器学习的兴起,一切都变了。我甚至可以说机器已经变得比我们聪明了一点。在本文中,我们将讨论以下主题:

机器学习概述什么是无监督学习?为什么重要?无监督学习的类型无监督学习应用无监督学习有监督学习与无监督学习比较无监督学习

的缺点因此深入了解无监督机器学习的所有内容。我们开始吧!:)

机器学习概述

机器学习,用最简单的话来说,就是教你的机器一些东西。你收集和清理数据,创建算法,从数据中教授算法基本模式,然后期望算法能给你一个有用的答案。如果算法达到你的期望,你已经成功地教了你的算法。如果不是的话,就把所有的东西都扔掉,从头开始。这就是它的工作原理。如果你正在寻找一个正式的定义,机器学习就是创建模型的过程,这个模型可以执行一个特定的任务,而不需要人类显式地编程它来做某事。

有三种类型的机器学习,它们基于算法的创建方式。它们是:

监督学习——你监督学习过程,这意味着你在这里收集的数据被贴上了标签,因此你知道需要将什么输入映射到什么输出。这有助于你纠正你的算法,如果它给你一个错误的答案。无监督学习-这里收集的数据没有标签,您不确定输出。因此,您可以对算法建模,以便它能够从数据中理解模式并输出所需的答案。当算法学习时,您不会干扰。强化学习-在这种学习中没有数据,也没有教算法什么。你对算法建模,使其与环境交互,如果算法做得好,你奖励它,否则你惩罚算法。随着不断的互动和学习,对于分配给它的问题,它从坏到最好。”现在我们知道什么是机器学习和不同类型的机器学习,让我们深入到这里讨论的实际主题,并回答什么是无监督学习?在哪里使用无监督学习?无监督学习算法等等。

什么是无监督学习如前所述,

无监督学习可以被认为是自学习,算法可以在没有任何标签的数据集中找到以前未知的模式。它有助于建立概率密度函数的模型,发现数据中的异常,等等。举个简单的例子,想想一个学生,他有课本和所有需要学习的材料,但没有老师指导。最终,学生必须自学才能通过考试。这种自我学习是我们将其扩展为机器的无监督学习。

让我给你一个现实生活中的例子,说明无监督学习可能被用来学习某些东西。

无监督学习的例子

假设你一生中从未看过板球比赛你的朋友邀请你去他们家参加印度和澳大利亚的比赛。你不知道什么是板球,但只是为了你的朋友,你说是的,并与他们过去。比赛开始了,你就坐在那里,一片空白。你的朋友们很享受维拉特科利的打球方式,也很想参与其中。当你开始学习游戏的时候。你分析屏幕,得出一些结论,可以用来更好地理解游戏有两个队穿着蓝色和黄色的球衣。由于Virat Kohli属于印度,你可以在屏幕上看到印度的得分,你得出结论,印度有蓝色的球衣,这使得澳大利亚有黄色的球衣。球场上有不同类型的球员。属于印度的有蝙蝠在他们的手意味着他们正在击球。有人跑过来把球打了个滚,把他变成了一个投球手。球场周围大约有9名球员试图阻止球到达球场边界。球门后面有人和两个裁判来管理比赛。如果球击中了球门或者被外野手接住了,击球手就出局了,必须走回去。维拉特科利的球衣背面有18号球衣和他的名字,如果这名球员得了4分或6分,你需要加油。”

“你一个接一个地做这些观察,现在知道什么时候该欢呼或嘘声当灯芯掉下来。从一无所知到了解板球的基本知识,你现在可以享受与你的朋友的比赛。

这里发生了什么?你掌握了所有你需要学习板球基本知识的材料。电视,你的朋友们什么时候为谁欢呼。这让你在没有人指导的情况下自学板球。这就是无监督学习遵循的原则。因此,在了解了无监督学习是什么之后,让我们来看看是什么使它在机器学习领域如此重要。

为什么它如此重要那么无监督学习能帮助我们获得什么呢?让我来告诉你所有关于它的事情。

无监督学习算法工作在数据集上,这些数据集是没有标签的,并且找到我们以前不知道的模式。如果我们需要对元素进行分类或找到它们之间的关联,那么获得的这些模式是有帮助的。它们还可以帮助检测数据中的异常和缺陷,我们可以处理这些异常和缺陷。”最后也是最重要的一点,我们收集的数据通常是没有标签的,这使得我们在使用这些算法时更容易工作,让我们向前看,了解不同类型的无监督学习。

类型的无监督学习

无监督学习已主要分为两类:

聚类关联

聚类是一种无监督学习类型,您可以在您正在处理的数据中找到模式。它可以是形状、大小、颜色等,可用于分组数据项或创建群集。下面讨论一些常用的聚类算法:

Clustering Algorithms - Data Science Tutorial - Edureka

分层聚类-该算法基于数据集中不同数据点之间的相似性来构建聚类。它检查数据点的各种特征,并寻找它们之间的相似性。如果发现数据点相似,则将它们组合在一起。这将一直持续到对数据集进行分组,从而为每个群集创建层次结构为止。K-Means聚类——该算法一步一步地工作,主要目标是实现具有识别标签的聚类。该算法通过计算簇的质心并确保该质心与新数据点之间的距离尽可能小,从而创建尽可能同质的不同数据点簇。数据点和质心之间的最小距离决定了它属于哪一个簇,同时确保簇之间不相互交错。质心的作用就像星团的心脏。这最终给了我们一个可以根据需要标记的集群。

K-means - Artificial Intelligence Algorithms - Edureka

K-NN聚类-这可能是机器学习算法中最简单的一种,因为该算法并不真正学习,而是根据存储的数据集对新数据点进行分类。这种算法也被称为懒惰学习者,因为它只在算法被赋予一个新的数据点时才学习。它可以很好地处理较小的数据集,因为庞大的数据集需要时间来学习。”

“关联是一种无监督学习,在这种学习中,您可以找到一个数据项与另一个数据项之间的依赖关系,并将它们映射为有助于您更好地获利。下面讨论关联规则挖掘中的一些流行算法:

association-rules-apriori-algorithm

Apriori算法-Apriori算法是一种基于广度优先搜索的算法,用于计算项目之间的支持度。这种支持基本上映射了一个数据项与另一个数据项之间的依赖关系,这有助于我们了解哪些数据项会影响另一个数据项发生某些事情的可能性。例如,面包会影响购买者购买牛奶和鸡蛋。所以地图绘制有助于提高商店的利润。这种映射可以通过这种算法来学习,该算法生成规则作为其输出。FP Growth Algorithm–频率模式(FP)算法查找重复模式的计数,将其添加到表中,然后查找最合理的项并将其设置为树的根。然后将其他数据项添加到树中并计算支持。如果该特定分支未能达到支持阈值,则将对其进行修剪。所有迭代完成后,将创建一个具有项目根目录的树,然后使用该树生成关联规则。此算法比Apriori更快,因为计算和检查支持以增加迭代次数,而不是创建规则并从数据集中检查支持。”

“既然你对这两种无监督学习有了清晰的理解,现在让我们了解一下无监督学习的一些应用。

无监督学习的应用

无监督学习以各种方式帮助我们解决各种实际问题。

它们帮助我们理解可以用于基于各种特征对数据点进行聚类的模式。了解数据集中的各种缺陷,这些缺陷是我们最初无法检测到的。它们有助于根据彼此的依赖关系映射各种项。通过删除计算机不需要学习的功能来清理数据集。”

“这最终会产生对我们有帮助的应用程序。下面将讨论使用无监督学习算法的某些示例:

AirBnB–这是一个很好的应用程序,有助于主机停留和体验连接世界各地的人们。此应用程序使用无监督学习,用户查询其需求,Airbnb学习这些模式,并推荐属于同一组或集群的住宿和体验。Amazon——Amazon还使用无监督学习来了解客户的购买情况,并推荐最常一起购买的产品,这是关联规则挖掘的一个例子。信用卡欺诈检测-无监督学习算法了解用户的各种模式及其对信用卡的使用。如果卡的使用部位与行为不符,则会发出警报,可能被标记为欺诈,并会给您打电话,确认是否是您在使用卡。”

“这些是无监督学习算法的一些应用,并显示了它们的勇气。既然我们已经完成了无监督学习的应用,让我们继续讨论有监督学习和无监督学习之间的区别。

有监督学习与无监督学习参数有监督学习无监督学习数据集标记数据集无标记数据集学习引导学习算法使用数据集复杂度更简单的方法自己学习计算复杂准确度更准确度更低

无监督学习

的缺点尽管无监督学习在许多著名的应用中都得到了应用并且工作出色,但它仍然有许多缺点。

无法获得将数据排序为数据集的方式或方法未标记。可能是莱斯因为输入的数据是不知道的,并且被制造机器的人贴上标签。算法获得的信息可能并不总是与我们需要的输出类相对应。用户必须理解并映射使用相应标签获得的输出。”这些基本上是你在使用无监督学习算法时可能面临的主要缺点。现在,让我们向前看,总结一下您在本文中所学的一切。

我们对什么是机器学习及其各种类型有了一个概述。然后我们深入了解了无监督学习是什么,为什么它如此重要。之后,我们讨论了各种类型的无监督学习,即聚类和关联挖掘。之后,我们讨论了各种算法、无监督学习的应用、有监督和无监督学习之间的区别以及在使用无监督学习算法时可能面临的缺点。

将我们带到本文的结尾。我希望它能帮助你清楚而准确地理解无监督学习是什么。下一次,快乐学习!”

既然你知道了无监督学习,看看Edureka的机器学习工程师硕士课程,Edureka是一家值得信赖的在线学习公司,拥有超过250个网络,000名满意的学习者遍布全球。

Edureka的机器学习工程师硕士课程是为希望成为机器学习工程师的学生和专业人士设计的。本课程旨在使您精通监督学习、无监督学习和自然语言处理等技术。它包括人工智能和机器学习的最新进展和技术方法的培训,如深度学习、图形模型和强化学习。

有问题要问我们吗?请在“什么是无监督学习,它是如何工作的”的评论部分提到它?“博客,我们会尽快回复您。”

你也可能喜欢

发表评论

您的电子邮件地址不会被公开。 必填项已用 * 标注

提示:点击验证后方可评论!

插入图片
人工智能 教育 投稿者
我还没有学会写个人说明!
最近文章
  • * 没有更多文章了
  • 热门搜索

    分类目录