技术原理

Scikit learn–使用Python的机器学习

在这个博客中,我们将讨论使用python学习Scikit。在讨论Scikit学习之前,必须了解机器学习的概念,并且必须知道如何将Python用于数据科学。使用机器学习,您不必手动收集您的见解。你只需要一个算法,机器就会为你做剩下的事情!这不是很刺激吗?Scikit学习是我们可以使用Python实现机器学习的一个吸引人的地方。它是一个免费的机器学习库,包含简单有效的数据分析和挖掘工具。我将带您浏览以下主题,这些主题将作为即将到来的博客的基础:

什么是机器学习?Scikit学习安装用例概述-逻辑回归什么是机器学习?”

“机器学习是一种人工智能,它允许软件应用程序从数据中学习,并在没有人为干预的情况下更准确地预测结果。但这是怎么发生的呢?为此,机器需要对一些数据进行训练,并在此基础上检测出一个模式来创建模型。从数据中获取知识并提供强大见解的过程都是关于机器学习的。请参阅下图,以更好地了解其工作原理:

MachineLearning - Scikit Learn - Edureka

使用数据,系统学习一个算法,然后使用它来构建预测模型。之后,我们调整模型或利用反馈数据提高模型的精度。利用这些反馈数据,我们调整模型并预测新数据集上的操作。我们将讨论一个算法方法的用例,我们将在其中训练和测试数据,这将帮助您更好地了解它是否适合您的特定问题。

接下来,机器学习有三种类型:

监督学习:这是一个从训练数据集学习算法的过程。监督学习是在输入变量(X)和输出变量(Y)之间生成映射函数,并使用算法在它们之间生成函数的过程。它也被称为预测建模,是指利用数据进行预测的过程。算法包括线性回归、Logistic回归、决策树、随机森林和朴素贝叶斯分类器。我们将进一步讨论监督学习的一个用例,其中我们使用逻辑回归来训练机器。无监督学习:这是一个使用未标记信息训练模型的过程。此过程可用于根据输入数据的统计特性对类中的数据进行聚类。无监督学习也称为聚类分析,即根据描述对象或其关系的数据中找到的信息对对象进行分组。目标是一个组中的对象应彼此相似但不同于另一组中的对象。一些算法包括K-means聚类、层次聚类等。强化学习:强化学习是通过与空间或环境交互来学习的。RL代理从其行为的结果中学习,而不是从被显式地教导中学习。它根据过去的经验(剥削)和新的选择(探索)来选择行动。”

Scikit Learn概述

Scikit Learn是一个用于在Python中执行机器学习的库。Scikit-learn是一个开源的图书馆,在BSD许可下,可以在各种环境下重用,鼓励学术和商业用途。它在Python中提供了一系列有监督和无监督的学习算法。除此之外,它还包含以下包:

NumPy Matplotlib SciPy(Scientific Python)

要实现Scikit学习,首先需要导入以上包。如果你不熟悉这些库,你可以进口matplotlib.pyplot文件作为plt从sklearn导入数据集数字=数据集.加载数字()打印(数字.数据)[0。0个。0。。。,10岁。0个。0.]...,[0。0个。1。。。,6岁。0个。0.][0。0个。10。。。,12岁。一。0.]]

这里我们刚刚导入了库、支持向量机、数据集并打印了数据。它是存储数据的一长串数字数据。它允许访问可用于对数字样本进行分类的特征。接下来,您还可以尝试其他一些操作,如target、images等进口matplotlib.pyplot文件作为plt从sklearn导入数据集数字=数据集.加载数字()打印(数字图像[0])[[0。0个。5个。13岁。9号。一。0个。0.]///数据的图像[0。0个。13岁。15岁。10个。15岁。5个。0.][0。四。12岁。0个。0个。8个。8个。0.][0。5个。8个。0个。0个。9号。8个。0.][0。2。14岁。5个。10个。12岁。0个。0.]

如上所示,打印目标数字和数字图像。数字.目标给出数字数据集的基本真实值,即对应于每个数字图像的数字。接下来,数据始终是具有形状(n个采样,n个特征)的2D数组,尽管原始数据可能具有不同的形状。但在数字的情况下,每个原始样本都是一个形状(8,8)的图像,可以使用数字图像

学习和预测

接下来,在Scikit学习中,我们使用了一个数据集(10个可能类的样本,数字从0到9),我们需要在给定图像时预测数字。为了预测类,我们需要一个估计器来帮助预测不可见样本所属的类。在Scikit learn中,我们有一个分类估计器,它是一个python对象,实现了fit(x,y)和predict(T)方法。让我们考虑下面的示例:

进口matplotlib.pyplot文件作为plt从sklearn导入支持向量机数字=数据集.加载数字()//数据集打印(len(数字.数据))x、 是的=数字.数据[:-1],数字.目标[:-1]//训练数据合身(x,y轴)print('预测:',预测(数字.数据[-1]))//预测数据节目单()

输出-

1796预测:[8]

MachineLearning- scikit learn - Edureka在上面的示例中,我们首先找到了长度并加载了1796个示例。接下来,我们将这些数据用作学习数据,需要测试最后一个元素和第一个负元素。另外,我们还需要检查机器是否预测了正确的数据。为此,我们使用了Matplotlib来显示数字图像。因此,总结一下,你有数字数据,你得到了目标,你拟合并预测了它,因此你可以走了!这真是又快又容易,不是吗?”

您还可以用图像可视化目标标签,只需参考下面的代码:

进口matplotlib.pyplot文件作为plt从sklearn导入支持向量机数字=数据集.加载数字()images_and_labels=列表(zip(数字图像, 数字.目标))#对于列表中的每个元素#在i 1位置初始化2X4子块#在所有子批次中显示图像#为每个子批次添加标题#显示情节

输出–

Visualization - scikit learn - Edureka如您在上面的代码中所看到的,我们使用“zip”函数将图像和目标标签连接到列表中,然后将其保存到一个变量中,例如images\u和\u labels。之后,我们在每个位置以2乘4的方式为网格中的前8个元素编制了索引。之后,我们刚刚在Matplotlib的帮助下展示了这些图片,并添加了标题“training”。

用例-使用逻辑回归预测

问题声明-一家汽车公司发布了一款新的SUV上市。利用之前关于SUV销量的数据,他们想预测可能有兴趣购买这款车的人的类别。

为此,让我们看看一个数据集,其中我有用户ID、性别、年龄、估计工资和购买列。这只是一个示例数据集,您可以从这里下载整个数据集。一旦我们在pyCharm中导入数据,它看起来有点像这样。

DataSet - ScikitLearn - Edureka

现在让我们了解这些数据。正如您在上面的数据集中看到的,我们有一些类别,如id、性别、年龄等。现在根据这些类别,我们将培训我们的机器并预测购买数量。在这里,我们有自变量‘年龄’、‘期望工资’和因变量‘购买’。现在我们将应用监督学习,即logistic回归算法,利用现有数据找出购买数量。

首先,让我们对logistic回归进行概述。

logistic回归-logistic回归以二进制格式生成结果,用于预测分类结果因变量。当因变量是二进制的,即可用类别的数量是两个,例如,逻辑回归的通常输出是–

是和否真和假高、低通和失败

,现在从代码开始,我们将首先导入这些库:Numpy、Matplotlib和Pandas。在Pycharm中导入pandas非常容易,步骤如下:

设置->添加包->pandas->安装

之后,我们将导入数据集,并将因变量(购买的)和自变量(年龄、薪水)分别导入到:

数据集=pd.read_csv公司(“社交网络”_广告.csv')X=数据集.iloc[:,[2,3]]值打印(X)

下一步是训练和测试数据。一种常见的策略是将所有标记的数据分为训练和测试子集,训练子集和测试子集的比率通常为70-80%和20-30%。因此,我们使用交叉验证创建了训练和测试集。

从sklearn.cross_验证进口列车分割X U列,X U测试,y U列,y U测试=列测试U拆分(X,y,测试U大小=0.25,随机U状态=0)

我们还可以使用StandarScaler缩放输入值以获得更好的性能,如下所示:

从sklearn.预处理导入标准缩放器sc=标准缩放器()X_列=sc.fit_变换(X_列车)X_测试=sc.变换(X_测试)

现在我们将创建逻辑回归模型。

从sklearn.linear_模型导入逻辑回归分类器=逻辑回归(随机状态=0)分类器.fit(Xú车,yú车)

我们可以使用它并预测测试集的结果。

y_pred=分类器.预测(X_测试)

现在,我们可以检查有多少预测是准确的,有多少没有使用混淆矩阵。让我们定义Y为正实例,N为负实例。这四个结果在2*2混淆矩阵中表示,如下所示:ConfusionMatrix - Scikit learn - Edureka

从sklearn.metrics标准导入混淆矩阵cm=混淆矩阵(y_检验,y_pred)打印(厘米)

输出-

[[65 3]print(accurity_score(y_test,y_pred)*100)//prints the accurity

Output–

89.0

Hurray!因此,我们成功地使用Scikit learn实现了logistic回归,准确率为89%。

单击此处,使用Python Scikit learn library获取上述预测的完整源代码。

使用此代码,我们只介绍了python提供的众多流行算法中的一种,我们还介绍了Scikit的所有基础知识学习库,因此您现在就可以开始练习了。你练习得越多,学到的就越多。请继续关注更多的python教程博客!”

有问题吗?请在“Scikit learn”博客的评论部分提及它,我们将尽快与您联系。要深入了解Python及其各种应用程序,您可以在这里注册,接受24/7支持和终身访问的在线实时培训。“

你也可能喜欢

发表评论

您的电子邮件地址不会被公开。 必填项已用 * 标注

提示:点击验证后方可评论!

插入图片
人工智能电影 投稿者
我还没有学会写个人说明!
最近文章
  • * 没有更多文章了
  • 热门搜索

    分类目录