机器学习是一门能够发掘数据价值的算法和应用,是计算机科学中最激动人心的一个领域之一。

接下来的时间,开始学习吧!

python机器学习第一章

1.机器学习方法分为三类:监督学习,无监督学习,强化学习。

(1)监督学习的两种方法:类别分类和回归分析

类别分类又分为:二类别分类,多类别分类

类别分类是指,基于对过往的已知示例的观察和学习,实现对新样本类别的预测,例如判断一份邮件是否为垃圾邮件。

回归分析是指,能够针对连续输出变量进行预测,数据中会给出大量的自变量(输入值)和相应的连续因变量(输出结果),通过尝试寻找这两个变量之间的关系,得到预测输出结果。例如,根据房屋面积预测房屋价格。

(2)强化学习

强化学习的目标是构建一个系统(agent),在环境(environment)交互的过程中提高系统的性能,典型例子:象棋对弈游戏。

(3)无监督学习的子类有:聚类,数据压缩降维

在监督学习中,在训练模型之前,我们能够事先获知每个训练样本对应的目标值。强化学习中,可以由Agent定义反馈函数对特定的行为进行判定。

在无监督学习中,可以将无类标的数据或者总体分布趋势不明朗的数据中提取有效信息来探索数据的整体结构。

  a.聚类,指数据在没有任何相关先验信息的情况下,帮助我们将数据划分为有意义的小的组别(也就是簇-cluster),每个簇中的内部成员有一定的相似性,与其他的簇内部成员差别较大。

     例如,可根据客户的不同兴趣或其他因素进行划分,指定相应的市场营销策略。

  b.数据压缩降维,通常面对的数据都是高维的,这样会对有限的数据存储空间和机器学习的算法性能提出挑战,无监督降维可以做到清楚数据中噪音,最大程度保留相关信息的情况下将数据压缩到一个维度较小的空间,使得占用存储空间更小,学习算法运行更快,但可能会降低某些算法的准确性能。

PS:

任何算法都有其内在的局限性,在解决实际问题的过程中,需要选用不同的算法来训练模型,并比较他们的性能,从中选最优,最合适的,不要偷懒哟哦^.^。