其实开源版最大的问题是你用着用着出现了很多问题,但是这些问题没有前人解决过。第三方发行版的好处在于运维成本低,你不需要再去踩一遍坑,人家已经把坑填上了。Cloudera和Hortonworks都是基于Apache协议,100%开源;相较于原生的hadoop在兼容性、安全型以及稳定性方面有所提升;版本管理清晰,更新更快;提供了部署、安装、配置工具,大大提高了集群部署的效率,可以在几个小时内部署好集群;运维简单。提供了管理、监控、诊断、配置修改的工具,管理配置方便,定位问题快速、准确,使运维工作简单,有效。去年这两家合并后在今年推出了新的产品CDP,还是值得期待一波的,如果有人对新的产品感兴趣的话可以留言问我要CDP的介绍视频~
一张图告诉你为什么要选择第三方发行版的Hadoop