“开源”是 2021 中国技术发展的年度热词,越来越多人关注开源、贡献开源。

2022年1月12日,SegmentFault 思否作为中国领先的新一代开发者社区,展开了第三届“中国技术先锋”年度评选。来自Apache IoTDB的PMC 黄向东老师成功入选“2021 中国开源先锋 33 人之心尖上的开源人物”

原文链接:https://segmentfault.com/a/1190000041270720

IoTDB PMC 黄向东成功入选『2021 中国开源先锋 33 人之心尖上的开源人物』,我们记录了他和 IoTDB 的故事..._大数据

黄向东老师作为Apache IoTDB的奠基人,自2016年以来,带领团队开创IoTDB项目,并致力于项目在各个领域的推广与应用,目前IoTDB项目已在行业中得到广泛应用。

特别感谢SegmentFault思否团队对于黄向东老师与Apache IoTDB项目的认可,Apache IoTDB团队会不忘初心,继续打造最优秀的时序数据库软件,助力国家工业互联网发展!

Q

IoTDB PMC 黄向东成功入选『2021 中国开源先锋 33 人之心尖上的开源人物』,我们记录了他和 IoTDB 的故事..._大数据_02

做Apache IoTDB的初衷

IoTDB PMC 黄向东成功入选『2021 中国开源先锋 33 人之心尖上的开源人物』,我们记录了他和 IoTDB 的故事..._java_03

黄向东:

某公司在实际业务中,保存了20 万设备 3 年的数据,这些TB级别的数据使得 Oracle 被拖的根本吃不消。关键的问题点还不仅仅是存量数据大,新增数据依然以非常快的速度在增长。而且很多这类设备数据的查询分析任务在传统的关系型数据库里不好满足。

我们当时给出的方案还是基于 Cassandra 来做设计。当时规划了 5 台机器的集群,性能刚满足。但随着时间推移设备总量在增加,业务系统的查询请求量也在增加。在经过对Cassandra大量的改进之后,我们发现如果再改可能就需要大面积重构 Cassandra 的代码了。

在清华软院的支持下,我们最终决定重新设计一个存储方式,来解决物联网场景下的时序数据高效写入、低延迟读取、高压缩比持久化。

Q

IoTDB PMC 黄向东成功入选『2021 中国开源先锋 33 人之心尖上的开源人物』,我们记录了他和 IoTDB 的故事..._大数据_02

初期有哪些困难?

IoTDB PMC 黄向东成功入选『2021 中国开源先锋 33 人之心尖上的开源人物』,我们记录了他和 IoTDB 的故事..._java_05

黄向东:

我们要做的是一个核心基础软件。核心基础软件对代码本身要求是很高的,每一行代码每秒钟都要运行几千万次,也要求极高的稳定性。这点是和业务软件有很大的差别。

同时,要解决业界的难题,就必须要在技术创新上有所突破。在11年到14年,国内在时序数据库上是空白的,国际上也只有InfluxDB一家。再加上,工业界采集、管理、使用机器设备检测数据的业务负载非常复杂,这就对创新提出了更高的挑战。

当时我们也希望我们的工作能服务千千万万的企业,像Spark、Hadoop一样,所以成为Apache基金会的毕业项目是一种可能的渠道。但这个事情是没有成功的经验可以借鉴的,一切都是摸着石头过河。并且Apache对项目和社区的要求非常高,我们做了非常多的工作去符合要求,包括提高代码质量、建设多样化的社区等等。

Q

IoTDB PMC 黄向东成功入选『2021 中国开源先锋 33 人之心尖上的开源人物』,我们记录了他和 IoTDB 的故事..._大数据_02

坚持下来开源的动力是什么?

IoTDB PMC 黄向东成功入选『2021 中国开源先锋 33 人之心尖上的开源人物』,我们记录了他和 IoTDB 的故事..._人工智能_07

黄向东:

在不断的接触之后,我们发现开源模式,能解决我们之前一直想解决的问题。

首先是,在有多样化的社区之后,能看到更多的业界全貌。之前在学校里,我们以论文作为主要的信息来源,但对于想真正解决业界问题的我们来说这是远远不够的。我们需要大家的声音,从各个角度不断提出真实的市场痛点。

其次是,这种大家一起来贡献的模式,有助于这个项目的鲁棒性。我们集多方之所长,在多个场景进行验证。

黄向东

清华大学软件学院助理研究员、Apache 软件基金会 Member、Apache IoTDB PMC Chair

IoTDB PMC 黄向东成功入选『2021 中国开源先锋 33 人之心尖上的开源人物』,我们记录了他和 IoTDB 的故事..._大数据_08

什么是Apache IoTDB?

工业物联网时序数据库管理系统 Apache IoTDB 是支持物联网时序数据收集、存储、查询与分析一体化的数据管理引擎,支持“端-边-云”一体化部署,适用于高端装备、工厂设备、高速网联设备等多种数据管理场景,是工业互联网时序数据管理的核心基础支撑。

Apache IoTDB的发展历程

  • 2012年,团队成员在国家 863 计划课题“复杂装备状态监测与运维服务支撑软件平台开发”中,深刻感受到现有 NoSQL 技术与工业物联网应用之间的功能与性能鸿沟,同时发现基于开源 NoSQL 的自主创新与国际开源社区之间存在割裂,持续性发展存在问题
  • 2015 年,团队提出面向时序数据的紧致存储技术原型,并在现有 NoSQL 产品上开发了新的查询、存储引擎,形成了第一代工业物联网数据管理系统
  • 2016 年 3 月,团队在总结前述经验的基础上,正式提出面向时序数据优化的列式紧致文件存储格式TsFile,迈出从最底层文件结构开始自主管理数据的第一步,并在 Github 上开源
  • 2016 年 6 月,团队基于 TsFile,开始研发支持实时读写与分析的工业物联网数据库 IoTDB,同年 8 月发布 0.1.2 版本
  • 2018 年 6 月,IoTDB 0.7.0 版本发布,是第一个能够在常见负载下可长期稳定运行的版本,标志着 IoTDB 从技术原型向软件产品迈进
  • 2018 年 9 月,为进一步实现全球协同创新,团队向大数据领域全球最著名的开源软件基金会 Apache 发出提案,设立 IoTDB 项目
  • 2018 年 11 月 18 日,经 Apache 软件基金会公开投票,IoTDB 正式成为 Apache 旗下孵化器项目,成为我国高校目前唯一主导发起的 Apache 项目。
  • 2019 年 8 月,Apache IoTDB 0.8.0 版本发布,是第一个 Apache 认证的发布版
  • 2019年,Apache IoTDB 相继获得第七期优秀大数据产品称号、中国开源云联盟组织评选的第二届中国优秀开源项目一等奖、2019 年度最受欢迎中国开源项目称号,位列数据库软件第 1 名。并在中国工业互联网峰会作为重要成果作主题发布
  • 2020 年 9 月 16 日,Apache 软件基金会正式发出决议,将 Apache IoTDB 升为全球顶级项目(TLP)。标志着 IoTDB 建成了全球认可的国际开源社区,并成为我国高校在 Apache 社区主导的唯一孵化成功的项目
  • 2021 年 10 月 Apache IoTDB 被科技部选中参加国家“十三五”科技创新成就展


QQ群:659990460