1.k-means的复杂度分析

参数:1.随机选取k个中心点

           2.n个样本点

           3.每两个样本点计算距离的时间复杂度d

           4.模型收敛的迭代次数为t次

时间复杂度:O(k*n*d*t)

空间复杂度:O(n*d)

一般认为k,d,t是常量,所以时间复杂度与空间复杂度都是O(n),即kmeans是线性的。

2.boosting,bagging与stacking的区别

boosting:调整训练样本分布,使得先前训练错的样本在后续能够获得更多关注,主要降低偏差提高继承模型的拟合能力,训练顺序上是采用串行的方式。

bagging:采用有放回采样的方法对各个独立的基分类器进行投票,主要目的是为了降低方差提高模型的泛化能力,训练数据上是采用并行的方式。

stacking:模型融合方法,使用不同类型的基分类器进行训练,对最后的结果进行加权平均,目的是为了提高预测的准确率。