机器学习是使计算机能够在不明确编程的情况下学习的能力。这是通过向计算机提供数据并将数据转换为决策模型的数据来完成的,然后将其用于未来的预测。
>在本教程中,我们将讨论机器学习以及开始机器学习所需的一些基本概念。我们还将设计一些python示例来预测某些元素或事件。
机器学习是一种旨在从经验中学习的技术。例如,作为人类,您可以通过观察其他人下棋来学习如何下棋。以同样的方式,计算机是通过为它们提供的数据来编程的,然后能够从中预测未来的元素或条件。您可能会发现编写这样的程序很容易,它将给出所需的结果,但您可能还会发现该程序对大型数据集没有有效的作用。这是机器学习开始发挥作用的地方。
在机器学习中涉及各种步骤:
数据收集数据
Supervised Learning
Sklearn is a machine learning library for the Python programming language with a range of features such as multiple analysis, regression,和聚类算法。我们将编写一个简单的程序,以说明监督学习如何使用Sklearn库和Python语言进行。
> Sklearn还与Numpy和Scipy库很好地互操作。
>> SKLEARN安装指南为多个平台提供了一种非常简单的方法。它需要几个依赖性:
pip install -U scikit-learn<br>简单地安装Anaconda。这要照顾所有依赖性,因此您不必担心一个一个一个。
>
来测试Sklearn是否正常运行,只需从python解释器中导入它:Python 3.9.12 (main, Apr 5 2022, 06:56:58) <br>[GCC 7.5.0] :: Anaconda, Inc. on linux<br>Type "help", "copyright", "credits" or "license" for more information.<br>>>> import sklearn<br>>>> <br>
,如果不会出现错误,那么您就可以完成了。我们希望能够区分不同动物。因此,我们将设计一种算法,该算法可以专门告诉给定的动物是马还是鸡。
from sklearn import tree<br>我们首先需要从每种类型的动物中收集一些样本数据。一些示例数据如下表所示。
features = [[7, 0.6, 40], [7, 0.6, 41], [37, 600, 37], [37, 600, 38]]<br>定义要使用的动物分类的功能。
#labels = [chicken, chicken, horse, horse]<br><br># we use 0 to represent a chicken and 1 to represent a horse<br><br>labels = [0, 0, 1, 1]<br>>定义每个分类器将提供的输出。鸡的代表为0,而一匹马将以1表示。然后,我们定义基于决策树的分类器。这是预测高度为7英寸,重量为0.6 kg的动物,温度为41:
classifier = tree.DecisionTreeClassifier()<br>>以下是如何预测高度38英寸的动物,重量为600 kg,温度为37.5:37.5:37.5:
>
classifier.fit(features, labels)<br>
from sklearn import tree<br>features = [[7, 0.6, 40], [7, 0.6, 41], [37, 600, 37], [37, 600, 38]]<br>#labels = [chicken, chicken, horse, horse]
labels = [0, 0, 1, 1]
classif = tree.DecisionTreeClassifier()
classif.fit(features, labels)
from sklearn import tree<br>features = [[7, 0.6, 40], [7, 0.6, 41], [37, 600, 37], [37, 600, 38]]<br>
#labels = [chicken, chicken, horse, horse]
labels = [0, 0, 1, 1]
classif = tree.DecisionTreeClassifier()
classif.fit(features, labels)
print(classif.predict([[7, 0.6, 41]]))
线性回归
>
在统计中,>线性回归是一种线性方法,用于建模标量响应与一个或多个解释性变量之间的关系(也称为相关变量和自变量)。
可以在此处找到数据集。将CSV文件下载到您的工作目录中
>让我们开始导入必要的依赖项。
pip install -U scikit-learn<br>
>接下来,将CSV数据加载到pandas dataframe。输出:
Python 3.9.12 (main, Apr 5 2022, 06:56:58) <br>[GCC 7.5.0] :: Anaconda, Inc. on linux<br>Type "help", "copyright", "credits" or "license" for more information.<br>>>> import sklearn<br>>>> <br>
,如上所述,数据包含1960年至2016年不同国家的GDP。下一步是创建x和y维数阵列。型号。
from sklearn import tree<br>以下是图:
features = [[7, 0.6, 40], [7, 0.6, 41], [37, 600, 37], [37, 600, 38]]<br>>
#labels = [chicken, chicken, horse, horse]<br><br># we use 0 to represent a chicken and 1 to represent a horse<br><br>labels = [0, 0, 1, 1]<br>
>
>无监督的学习是当您仅使用一组输入来训练计算机时。然后,机器将能够找到输入数据与您可能想要预测的其他任何其他关系之间的关系。与监督学习不同,在您向机器展示一些可以进行培训的机器的情况下,无监督的学习旨在使计算机查找不同数据集之间的模式或关系。classifier = tree.DecisionTreeClassifier()<br>
无监督的学习可以进一步细分为:
classifier.fit(features, labels)<br>
clustering
关联是您确定描述大量数据的规则。这种类型的学习可以适用于基于作者或类别的书籍,无论是动机,虚构的还是教育的书籍。
>>
以上是Python的机器学习简介的详细内容。更多信息请关注PHP中文网其他相关文章!