技术原理

机器学习中的混淆矩阵:一站式解决方案

成为一个认证的专业

在监督机器学习,我们通常有两种不同类型的用例,回归,和分类问题。混淆矩阵有助于计算分类模型的准确性,从而间接地帮助我们描述分类模型的性能。在评估模型时,这是最重要的一步。我将在本文中介绍以下主题:

1。什么是混淆矩阵?”

“”

“2。混淆矩阵

3的精度和组成。精确,召回和F-测量

4。使用Python和Sklearn

创建混淆矩阵什么是混淆矩阵?混淆矩阵是任何分类问题用例中预测结果和实际结果的比较汇总。在使用一些训练数据对模型进行训练后,为了确定模型的性能,非常有必要进行比较总结。”机器学习中的混淆矩阵:一站式解决方案“对于二进制分类用例,混淆矩阵是一个2×2矩阵,如下所示

预测的1类值例如:1预测的2类值例如:0实际的1类值

例如:1

TP(真阳性)FN(假阴性)实际的2类值

例如:0

FP(假阳性)TN(真阴性)上图中的

:我们有

实际的类1值=1,它类似于二进制结果中的正值。实际的类2值=0,与二进制结果中的负值类似。”

“混淆矩阵的左侧索引基本上表示实际值,顶部列表示预测值。”

创建混淆矩阵时存在各种组件。下面提到的组件

正(P):预测结果为正(例如:图像是一个cat)

负(N):预测结果为负(例如:图像不是cat)

真正(TP):这里TP基本上表示预测值,实际值为1(True)

真正负(TN):这里TN表示预测值,实际值为0(False)

表示假负(FN):这里FN表示预测值为0(负值),实际值为1。这里两个值都不匹配。因此它是假阴性。

假阳性(FP):这里FP表示预测值为1(正),实际值为0。这两个值再次不匹配。因此,它是假阳性的。

精度和混淆矩阵的分量在混淆矩阵建立后,我们确定了所有分量的值,这样就很容易计算出精度。所以,让我们来看看组件,以便更好地理解这一点。分类精度

Accuracy-formula-Confusion-Matrix

由上式可知,TP(真正)和TN(真负)之和是正确的预测结果。因此,为了计算百分比的准确度,我们将其与所有其他分量相除。但是,在准确性方面存在一些问题,我们不能完全依赖它。

让我们认为我们的数据集是完全不平衡的。在这种情况下,根据问题陈述,98%的准确率可以是好的,也可以是坏的。因此,我们有一些更关键的条款,这将有助于我们确定我们计算的准确性。术语如下:

TPR(真阳性率)或灵敏度:

真阳性率(也称为灵敏度)测量真阳性相对于总实际阳性的百分比,该百分比由(TP FN)

预测的1类值表示,例如:1预测的2类值例如:0总实际类别1值

例如:1

TP(真阳性)FN(假阴性)总实际阳性实际类别2值

例如:0

FP(假阳性)TN(真阴性)总实际阴性TPR=真阳性/(真阳性 假阴性

TN#创建混淆矩阵的Python脚本。实际数据=[1,1,0,1,0,0,1,0,0,0,0,1,0,1]

2。我们需要从sklearn库导入混淆矩阵,如下所示:

从sklearn.metrics标准导入混淆矩阵

3。接下来,我们将创建如下所示的混淆矩阵:

最终结果=混淆矩阵(实际数据、预测数据)

4。现在我们可以通过导入如下所示的库来计算精度:

从sklearn.metrics导入精确度准确度=准确度得分(实际数据、预测数据)

5。最后,我们计算F1分数或F-测度,如下所示:

从sklearn.metrics导入分类报告报表=分类报表(实际数据、预测数据)

下面是完整的代码:

实际数据=[1,1,0,1,0,0,1,0,0,0,0,1,0,1]从sklearn.metrics导入混淆矩阵最终结果=混淆矩阵(实际数据、预测数据)打印(最终结果)从sklearn.metrics导入精确度准确度=准确度得分(实际数据、预测数据)从sklearn.metrics标准进口分类报告打印(准确度)打印(报告)

matrix

accuracy-output

support

因此,本文到此结束。我希望您对混淆矩阵的所有困惑现在都得到了解决。

Edureka的机器学习认证培训使用Python帮助您获得各种机器学习算法的专业知识,如回归、聚类、决策树、随机森林、天真的Bayes和Q-Learning。这个使用Python训练的机器学习向您展示了统计、时间序列和不同类别的机器学习算法的概念,如有监督、无监督和强化算法。在整个数据科学认证课程中,您将解决有关媒体、医疗保健、社交媒体、航空、人力资源的真实案例研究

你也可能喜欢

发表评论

您的电子邮件地址不会被公开。 必填项已用 * 标注

提示:点击验证后方可评论!

插入图片
人工智能专业录取分数 投稿者
我还没有学会写个人说明!
最近文章
  • * 没有更多文章了
  • 热门搜索

    分类目录