通常,你可能通过阅读一些机器学习书籍、博客,观看相关的视频教程来学习Python与机器学习,但是,这往往并不算走了上机器学习的学习道路,因为你没有动手实现相关的模型。
因此,本文将介绍利用scikit-learn实现常用的5个机器学习模型。scikit-learn库是Python中一个非常流行的机器学习库,它能够非常简单地实现常见的模型,并且代码很容易运行。
引言
刚开始学习的时候,你不需要了解scikit-learn中所有算法模型。你可以只选择学习少数几个模型并用代码实现它们。
本文将基于scikit-learn库内置的数据集上,介绍5个常用的分类模型,分别如下:
LogisticRegression朴素贝叶斯KNN决策树SVM本文每个模型的示例代码都只提供了实现框架,并不保证模型参数最优。模型参数的选择,后续文章将展开详细讨论。
LogisticRegression(逻辑回归)
LogisticRegression是利用线性模型对数据拟合,并预测每个类别的概率。这个模型既可以用于回归问题,也可以用于分类问题。
下面代码是利用逻辑回归模型对scikit-learn库内置的iris数据集进行拟合。这是一个多分类问题,逻辑回归预测值在0和1之间,所以使用one-vs-all模式来进行多分类。主要