一、统计学习的定义及特点####

统计学习是关于计算机基于数据构建概率统计模型并根据模型进行预测与分析的一门学科。统计学习也称统计机器学习。现在,我们所说的机器学习一般就是指统计机器学习。

统计学习的主要特点是:


1.统计学习以计算机及网络为平台;
2.统计学习以数据为研究对象;
3.统计学习的目的是对数据进行预测和分析;
4.统计学习以方法为中心,构建模型并应用模型进行预测分析;
5.统计学习由多个学科交叉,并逐渐形成独自的理论体系与方法论。


二、统计学习的对象与目的####

统计学习的对象当然是数据,统计学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提。

对数据的预测和分析是通过建立概率统计模型实现的,统计学习总的目标是学习什么样的模型,以及怎样学习模型,以使模型能更准确地预测和分析,同时考虑尽可能地提高效率。

三、统计学习的方法简介####

统计学习由监督学习、非监督学习、半监督学习和强化学习等组成。统计学习方法包含模型的假设空间、模型选择的准则以及模型学习的算法,称为统计学习的三要素,简称模型、策略和算法。

实现统计学习的步骤如下:


(1)得到一个有限的数据集合;
(2)确定包含所有可能的模型的假设空间,即学习模型的集合;
(3)确定模型选择的准则,即学习的策略;
(4)实现最优模型的算法,即学习的算法;
(5)通过学习方法选择最优模型;
(6)利用学习的最优模型对新数据进行预测或分析。