机器学习是一种允许计算机使用现有数据预测未来行为、结果和趋势的数据科学方法。 使用机器学习,计算机可以在未显式编程的情况下进行学习。机器学习的预测可以使得应用和设备更智能。 在线购物时,机器学习基于历史购买推荐你可能喜欢的其他产品。 刷信用卡时,机器学习将事务与事务数据库进行比较,帮助检测欺诈行为。当机器人吸尘器清理房间时,机器学习帮助其决定工作是否完成。
随着微软的ML.NET https://github.com/dotnet/machinelearning/ 的最新一个RC 版本即将发布之间,而且在微软官方的机器学习框架API趋向稳定,在.NET 社区也有一个团队 https://github.com/SciSharp 也在构建一个和ML.NET 类似的相竞争的社区产品,社区最近迎来了一个重量级的深度学习项目https://github.com/SciSharp/SiaNet ,这个项目有点像Kearas。
Python 和 R 语言都具有健全的生态系统,其中包括了很多开源工具和资源库,从而能够帮助任何水平层级的数据科学家展示其分析工作。Python ,由于更看重预测结果的准确性,使其成为机器学习的一把利器。 R ,作为一种以统计推断为导向的编程语言,在数据分析界也得到广泛应用。基于 Numpy 和 Scipy ,scikit-learn 提供大量用于数据挖掘和分析的工具,从而提高了 Python 本就出色的机器学习可用性。NumPy 和 SciPy 各自为战,虽然它们是 Python 中数据分析的核心部分,但数据分析家更可能仅仅原生地去使用它们,而不是基于一个更高的角度。 Scikit-learn 却将二者结合成为一个机器学习资源库,同时也降低了大家的学习门槛。微软的ML.NET 目标之一就是要打造C#的 Scikit-learn。在数据分析领域,Python 也因几个库而包受推崇。 作为其中最为著名的库之一,Pandas 为 Python 提供了高性能处理的数据结构和数据分析工具。如同其他很多 Python 的库一样,从你着手一个新项目到真正做些有价值的工作这过程的时间将会因它大大缩短,https://github.com/SciSharp 正是这些Python的库移植到了.NET, 编程风格保持和Python一致,方便从Python移植庞大的机器学习资源。
今天特别想在公众号里头针对使用.NET人群做个调查,欢迎大家积极参与,这个调查的很简单,只有4道题。