SVM支持向量机是建立于统计学习理论上的一种分类算法,适合与处理具备高维特征的数据集。

下面给出几个本人认为讲解的相当不错的:

支持向量机通俗导论(理解SVM的3层境界):

这篇讲的很详细,由浅入深层层推进。

还有一个比较通俗的简单版本的:手把手教你实现SVM算法:ht

VN原理比较复杂,但是思想很简单,一句话概括,就是通过某种核函数,将数据在高维空间里寻找一个最优超平面,能够将两类数据分开。

针对不同数据集,不同的核函数的分类效果可能完全不一样。可选的核函数有这么几种:

线性函数:形如K(x,y)=x*y这样的线性函数;

多项式函数:形如K(x,y)=[(x·y)+1]^d这样的多项式函数;

径向基函数:形如K(x,y)=exp(-|x-y|^2/d^2)这样的指数函数;

Sigmoid函数:就是上一篇文章中讲到的Sigmoid函数。

我们就利用几个数据集,直接给出Python代码,看看运行效果:

测试1:身高体重数据

手把手教你实现机器学习SVM算法_多项式

运行结果如下:手把手教你实现机器学习SVM算法_公众号_02

可以看到,针对这个数据集,使用3次多项式核函数的SVM,得到的效果最好。

测试3:圆形边界

最后我们测试一个数据分类边界为圆形的情况:圆形内为一类,原型外为一类。看这类非线性的数据SVM表现如何:

测试数据生成代码如下所示:

手把手教你实现机器学习SVM算法_数据集_03

测试结果如下:

SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0, degree=3, gamma=0.0,  kernel='linear', max_iter=-1, probability=False, random_state=None,

手把手教你实现机器学习SVM算法_数据_04可以看到,对于这种边界,径向基函数的SVM得到了近似完美的分类结果。

不断更新资源

深度学习、机器学习、数据分析、python

手把手教你实现机器学习SVM算法_数据_05