本书介绍
对于Apache Kafka来说,这是一个激动人心的时刻。Kafka被成千上万的组织所使用,包括超过三分之一的财富500强公司。它是发展最快的开源项目之一,并围绕它产生了一个巨大的生态系统。它是管理和处理数据流运动的核心。那么Kafka从何而来?我们为什么要建造它?到底是什么?
Kafka是从我们在领英建立的内部基础设施系统开始的。我们的观察非常简单:有许多数据库和其他系统用于存储数据,但我们的体系结构中缺少的是有助于我们处理连续数据流的东西。在建造Kafka之前,我们试验了各种现成的选择;从消息传递系统到日志聚合和ETL工具,但是没有一个给我们想要的东西。我们最终决定从头开始做一些东西。
文末附本书2020年最新免费pdf下载地址。
我们的想法是,与其专注于保存大量数据,如关系数据库、键值存储、搜索索引或缓存,不如专注于将数据视为一个不断发展和不断增长的流,并围绕这一想法构建一个数据系统——实际上是一个数据架构。这个想法比我们预期的更加适用。虽然Kafka开始在社交网络的幕后支持实时应用和数据流,但你现在可以在每个可以想象的行业中看到它是下一代架构的核心。大型零售商正在围绕连续的数据流重新设计他们的基本业务流程;汽车公司正在收集和处理来自联网汽车的实时数据流;银行也在围绕Kafka反思他们的基本流程和制度。
本书目录
内容截图
本书免费pdf下载地址
微信公众号“深度学习与NLP”回复关键字“kfk20”获取下载地址。