今天发布一篇图片博客,看一下效果如何,如果效果,以后的博客尽量发图片上来。
机器学习实战
本系列博客源自于读《机器学习实战—中文版》这本书的学习笔记,用于日后翻阅、查看资料用。
机器学习算法越来越受到人们的青睐,是由于这些算法在一定程度上可以达到智能的目的,比如人脸识别、图像文本分类等在一定程度上可以代替人工繁琐复杂的操作。《机器学习实战》这本书写的非常好,它并没有从理论的角度讲解机器学习算法背后的数学原理,而是通过“原理简述+问题实例+实际代码+运行效果”来一一介绍每个算法。我们也都知道,只有用代码真正实现了某个算法,才能真正理解那个算法的精髓。而这本书就是以实际代码实现为主,逐步让我们加深对算法的理解。
这本书的算法实现完全基于Python语言。Python的优点我就不介绍了,其中最主要的一点是有第三方的科学计算库,可以很方便的实现算法的公式计算。
这本书的主要介绍的算法是源自于一篇ICDM会议上的论文----“数据挖掘十大算法”。这篇论文依据知识发现和数据挖掘国际会议获奖者的问卷调查结果统计除了排名前十的数据挖掘算法。论文选出的十大机器学习算法包括:C4.5决策树、Kmeans、支持向量机(SVM)、Apriori、最大期望算法(EM)、PageRank算法、AdaBoost算法、k-近邻算法(kNN)、朴素贝叶斯算法(NB)和分类回归树算法(CART)。这本书除了PageRank算法(相关著作太多)和EM算法(涉及太多数学知识),其余的算法都介绍了。
机器学习算法分为有监督学习和无监督学习。这本书前两部分介绍的是有监督学习,第三部分介绍的是无监督学习。有监督学习有两种功能,一种是分类(本书第一部分介绍),一种是回归预测(本书第二部分介绍)。这样就对这本书的思路有了一个总体把握。
如果自身对机器学习非常了解的话,我相信你不会读到这里;有一定了解的话可以继续看后续博文;如果刚刚接触的话,可以自己百度谷歌一些机器学习的基础知识。
阅读这本书还需要了解Python语言以及Python中的NumPy科学计算库。
安装带有NumPy的python,可以参考这里:把教程中的Anaconda安装好就可以了。
NumPy基础操作教程可以参考这里:(转)Numpy教程。
希望本系列博文能帮助一些人,最主要的还是作为自己的学习笔记!