大数据时代的机器学习

转载

mb5ff592736e0cf 2017-06-19 16:38:00

本文參考CCF YOCSEF的“大数据时代的机器学习报告会”的相关内容。

张长水：大数据时代的机器学习 VS 传统机器学习

从机器学习角度看，“大数据”指的是数据量大，数据本身不够精确。数据混杂，数据自然产生。机器学习对大数据的处理的两个挑战：

大数据时代给机器学习带来新的机遇：

于剑：从认知角度看待大数据

该报告从认知角度分析数据与知识的联系。眼下机器学习的知识主要是概念，传统的小数据非常难反映领域的复杂知识，大数据提供了学习复杂知识的机会。在大数据时代，未来的机器学习能够超越概念学习。进入复杂知识学习时代。

李沐：深度学习在统计机器学习领域的应用

深度学习在图像，视频领域已经取得非常大的进展。可是在自然语言处理方面。还有非常多的问题须要解决。包含怎样用深度学习的方法处理：

当前该领域的一些进展：

徐盈辉：大规模机器学习在阿里电子商务中的应用

当前，阿里数据平台事业部的server上。积攒下超过100PB的多元异构数据。电子商务环境下的机器学习课题包含：

李沐：大规模分布式机器学习系统及其应用

该报告主要介绍由百度，Google以及CMU合作建立的开源计算平台---參数server（Parameter Server）。

该项目产生的背景是因为工业领域产生的数据已达到千亿样本，百亿特征。这导致对于复杂的非线性多分类任务。模型參数的计算量是很巨大的。这就须要通过分布式系统来解决问题。

须要探索在不同机器上分配计算负荷、共享内存计算模型、并行化学习策略以及减少通讯开销的策略和方法。

PS:人物介绍

张长水：清华大学教授

于剑：北京交通大学教授

李沐：微软亚洲研究院研究员，百度深度学习研究院少帅学者

徐盈辉：淘宝搜索算法高级研发专家

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客