技术原理

机器学习统计:初学者指南

,了解数据,并能从中创造价值是十年来的技能。机器学习是帮助企业实现这一目标的核心技能之一。然而,要开始,你需要建立正确的基础。因此,在本文中,我将介绍一些基本概念,并为您提供一些指导,帮助您开始机器学习之旅。所以,在这篇关于机器学习统计的文章中,我们将讨论以下主题:

概率什么是概率?独立Bayes规则与条件概率统计机器学习中正态分布线性代数矩阵运算

概率与统计量

概率是什么“概率”量化事件发生的可能性。例如,如果你掷一个公平、无偏的骰子,那么1出现的概率是1/6。现在,如果你想知道为什么?那答案就很简单了!”

这是因为有六种可能性,而且所有的可能性都一样(公平死)。因此我们可以加上1 1 1 1 1 1=6。但是,因为我们对1出现的事件感兴趣。事件只有一种发生的方式。因此,

1出现的概率=1/6

类似于所有其他数字,因为所有事件的可能性都是相同的。很简单,对吧?”

好吧,在这个例子中,概率的一个常见定义听起来像-1出现的概率是1出现的次数与如果模具被滚动无限次,模具被滚动的总次数的比率。这有什么意义?”

让我们让它更有趣。考虑一下这两个案例——你掷了5次公平的骰子。在一种情况下,出现的数字序列是–[1,4,2,6,4,3]。在另一种情况下,我们得到–[2,2,2,2,2,2]。你认为哪个更可能?”

都有可能。看起来很奇怪吧?”

现在,考虑另一种情况,即每种情况下的所有5个卷都是独立的。意思是,一卷不影响另一卷。在第一种情况下,当6出现时,它不知道2出现在它之前。因此,所有5个滚动都是同样可能的。

类似地,第二种情况下的直2可以理解为一个独立事件序列。所有这些事件的可能性都是一样的。总的来说,由于我们有相同的骰子,在第一种情况下出现一个特定数字的概率与第二种情况相同。接下来,在这篇关于机器学习统计的文章中,让我们理解术语独立性。

独立性

两个事件A和B被认为是独立的,如果A的出现不影响事件B。例如,如果你掷硬币和掷骰子,骰子的结果对硬币是否显示正面或反面没有影响。另外,对于两个独立事件A和B,A和B可以一起发生的概率。例如,如果你想要硬币显示头部和模具的概率为3,

P(A和B)=P(A)*P(B)

因此P=1/12(头部出现的概率)*⅙(3出现的概率)=1/12

在前面的例子中,对于这两种情况,P=⅙*⅙*⅙*⅙*⅙*⅙*⅙。

现在让我们谈谈不独立的事件。考虑下表:

肥胖非肥胖心脏问题45 15无心脏问题10 30

对100人进行了调查。60人有心脏问题,40人没有。60人有心脏问题,45人肥胖。在40名没有心脏问题的患者中,10名肥胖。如果有人问你——

心脏病的概率是多少?有心脏病而不肥胖的概率是多少?”

“第一个问题的答案很简单–60/100。第二个是15/100。现在考虑第三个问题——一个人是随机挑选的。他被发现患有心脏病。他肥胖的可能性有多大?”现在想想给你的信息-大家都知道他患有心脏病。因此他不可能是40个没有心脏病的人。只有60个可能的选项(表中的第一行)。现在,在这些减少的可能性中,他肥胖的概率是45/60。现在,您已经知道了什么是独立事件,接下来在这篇关于机器学习统计的文章中,让我们了解条件概率。

条件概率

要了解条件概率,让我们继续讨论上面的例子。肥胖和心脏病的患病情况是不独立的。如果肥胖不影响心脏问题,那么有心脏问题的人的肥胖和非肥胖病例的数量将是相同的。

同样,我们得到了这个人有心脏问题,我们必须找出他肥胖的可能性。所以,在这种情况下,概率是以他有心脏问题为条件的。如果事件A发生的概率是以事件B为条件的,我们现在把它表示为

P(A | B)

,有一个定理可以帮助我们计算这个条件概率。它被称为Bayes规则。

P(A | B)=P(A和B)/P(B)

您可以通过插入刚才讨论的示例来检查这个定理。如果到目前为止您已经了解了,您可以开始使用以下机器学习算法-Naive Bayes。它使用条件概率来分类电子邮件是否是垃圾邮件。它可以执行许多其他分类任务。但本质上,条件概率是朴素贝叶斯的核心,

统计:

统计用于对大量数据点进行总结和推断。在数据科学和机器学习中,您经常会遇到以下术语

中心性度量分布(特别是正态)中心性度量和价差度量平均值:

平均值只是数字的平均值。要找出平均数,你必须把这些数字加起来,再除以数字。例如,[1,2,3,4,5]的平均值是15/5=3。

mean-statistics-for-machine-learning中值:

中值是一组数字按升序排列时的中间元素。例如,数字[1,2,4,3,5]按升序排列[1,2,3,4,5]。中间一个是3。因此中值是3。但是如果数字的数目是偶数,因此没有中间数呢?在这种情况下,取中间两个数字的平均值。对于一个以升序排列的2n个数的序列,取第n个数和(n 1)个数的平均值得到中值。示例–[1,2,3,4,5,6]的中值(3 4)/2=3.5

模式:

模式只是一组数字中最常见的数字。例如,[1,2,3,3,4,5,5,5]的模式是5。

方差:

方差不是中心性度量。它衡量你的数据是如何在平均值上传播的。它被量化为

variance

x是N个数字的平均数。你取一个点,减去平均值,取这个差的平方。对所有的N个数字都这样做,然后取平均值。方差的平方根称为标准差。接下来,在这篇关于机器学习统计的文章中,让我们了解正态分布。

正态分布

分布有助于我们了解数据是如何传播的。例如,在一个年龄样本中,年轻人可能比老年人多,因此年龄的较小值大于较大值。但我们如何定义分布呢?考虑下面的示例

Normal-Distribution-Statistics-for-Machine=Learning

y轴表示密度。这种分布的模式是30,因为它是峰值,因此最频繁。我们也可以找到中间带。中间带位于x轴上覆盖曲线下一半区域的点。任何正态分布下的面积为1,因为所有事件的概率之和为1。例如,在上述情况下,

mean-median-mode-statistics-for-machine-learning

的中值约为4。这意味着4之前的曲线下面积与4之后的曲线下面积相同。考虑另一个例子“kds我们看到三个正态分布。蓝的和红的有同样的意思。红色的变化较大。因此,它比蓝色的更分散。但由于面积必须是1,所以红色曲线的峰值比蓝色曲线短,以保持面积不变。

希望您了解基本统计和正态分布。现在,在这篇关于机器学习统计学的文章中,让我们学习线性代数。

线性代数

现代人工智能离不开线性代数。它构成了深度学习的核心,甚至在线性回归等简单算法中也得到了应用。不用再耽搁了,我们开始吧。

你必须熟悉向量。它们是空间中的一种几何表示。例如,向量[3,4]沿x轴有3个单位,沿y轴有4个单位。考虑下图-

Linear-Algebra-Statistics-for-Machine-Learning

矢量d1沿x轴有0.707个单位,沿y轴有0.707个单位。向量有一维。它必然有大小和方向。例如,

2D-coordinates

上面的图像有一个向量(4,3)。它的震级是5,与x轴成36.9度。

现在,什么是矩阵?矩阵是一个多维的数字数组。它是用来干什么的?我们拭目以待。但首先,让我们看看它是如何使用的。

矩阵

一个矩阵可以有很多维。让我们考虑一个二维矩阵。它有行(m)和列(n)。因此它有m*n个元素。

例如,

这个矩阵有5行5列。我们称之为A。因此A(2,3)是第二行和第三列的条目,即8。

现在,既然你知道什么是矩阵,让我们来看看矩阵的不同运算。

矩阵运算加法矩阵

可以加上两个相同维数的矩阵。加法按元素进行。

Matrix-Addition-Statistics-for-Machine-Learning标量乘法

矩阵可以乘以标量。这样的乘法导致矩阵中的每一项都被标量相乘。标量只是一个数

scalar矩阵转置

矩阵转置很简单。对于矩阵a(m,n),设a'为其转置。然后

A'(i,j)=A(j,i)

例如,

mean-statistics-for-machine-learning1”矩阵乘法

这可能比其他操作有点棘手。在深入研究之前,让我们定义两个向量之间的点积。

考虑向量X=[1,4,6,0]和向量Y=[2,3,4,5]。那么X和Y之间的点积被定义为

X.Y=1*2 4*3 6*4 0*5=38

,所以,它是元素的乘法和加法。现在,我们考虑两个矩阵A(m,n)和B(n,k),其中m,n,k是维数,因此是整数。我们将矩阵乘法定义为

mean-statistics-for-machine-learning2”

。在上例中,乘积(44)的第一个元素由左矩阵第一行与右矩阵第一列的点积得到。类似地,72是通过左矩阵第一行与右矩阵第二列的点积得到的。

注意,对于左矩阵,列数应等于右列中的行数。在我们的例子中,乘积A B是存在的,但不是B A,因为m不等于k。对于两个矩阵A(m,n)和B(n,k),乘积AB是定义的,乘积的维数是(m,k)(m,n,(n,k)的最外层维数)。但是,除非m=k,

,否则BA是没有定义的,因此我们结束了这篇关于机器学习统计的文章。我希望你懂一些机器学习的行话。不过,它并没有在这里结束。为了确保你已经做好了行业准备,你可以看看Edureka的数据科学和人工智能课程。它们可以在这里找到

你也可能喜欢

发表评论

您的电子邮件地址不会被公开。 必填项已用 * 标注

提示:点击验证后方可评论!

插入图片
人工智能是什么的一个分支 投稿者
我还没有学会写个人说明!
最近文章
  • * 没有更多文章了
  • 热门搜索

    分类目录