时间紧张,先记一笔,后续优化与完善。整顿的数据挖掘基本概念一书中的第一章的知识点数据挖掘:从数据中提取有效模型的过程。其中,提出的模型可所以数据的汇总结果,不过一般情况下是数据中极端的特征所组成的集合。邦弗朗尼道理:数据挖掘中考核数据的一个误区,指某个明显的特征如果是很有可能在随机数据中涌现的话,那么根据这个明显的特征所取得的数据就具有不可依赖性。TF.IDF:计算词频和词语重要度的一个计量指标幂定律:类似于马太效应,可以表现为y=cxa,a为x的指数,此处a就是幂。这个定律在很多地方使用每日一道理 古人云:“海纳百川,有容乃大。”人世间,不可能没有矛盾和争吵,我们要以磊落的胸怀和宽容的微笑去