8月30日,事务处理性能委员会TPC正式公布了最新的国际权威数据库性能基准榜单,“清华系”发起研制的Apache IoTDB开发的国产化时序数据库软件TimechoDB,在性能和系统成本维度上双双打破世界纪录。在央视《24小时》节目中,1分34秒重要报道了!
事务处理性能委员会TPC,于1988年成立,为国际上最权威的数据库性能测评基准组织之一。如甲骨文Oracle、微软SQL Server、IBM DB2等国际上绝大多数知名数据库厂商及企业版产品均参与了其设立的基准测评。
TPCx-IoT 是由该组织制定的专门衡量物联网场景下系统性能的行业基准。下图为TimechoDB刷新了物联网场景榜单TPCx-IoT,位居榜首。
1.何为时序数据库?
随着物联网的发展,时序数据库的需求越来越多,比如水文监控、工厂的设备监控、国家安全相关的数据监控、通讯监控、金融行业指标数据、传感器数据等。在互联网行业中,也有着非常多的时序数据,例如用户访问网站的行为轨迹,应用程序产生的日志数据等等。
时序数据的典型特征包括测点多、采样频率高、存储成本高,下图为时序数据库的发展历程。
时序数据库应具备的特点如下:
1. 压缩能力
2. 自动rotate
3. 支持分片,水平扩展
4. 自动扩展分区,
5. 插入性能
6. 分区可删除
7. 易用性(SQL接口)
8. 类型丰富
9. 高效分析能力
2.IoTDB诞生的价值
IoTDB是一款国产自研的物联网原生时序数据库,其技术发源于清华大学,目前已历经13年的发展。IoTDB的诞生,主要是为了解决工业物联网时序数据管理的实时性、压缩比、分布式部署等多方面痛点。目前应用很广,包括新能源电厂、钢铁厂、车联网、轨道交通等,都用上了IoTDB,摆脱了对国外数据库的依赖。
IoTDB 提供数据采集工具,可对接多类协议,底层为纯自研列式存储文件系统TsFile,在此基础上设计存储、查询计算、流处理、分析引擎,以及系统管理模块与多种应用工具,并支持对接大数据生态,与单机版、分布式版、双活版等多类形态部署。
3.PG开源的时序
TimescaleDB是基于PostgreSQL的时序数据库插件,完全继承了PostgreSQL的功能,TimescaleDB是一个开放源代码的时间序列数据库,针对快速提取和复杂查询进行了优化。它使用“完整的SQL”,并且与传统的关系数据库一样易于使用。
因此TimescaleDB如何持续地发展下去、如何发展地更好,除了探寻在性能等综合素质方面的提升外,在PostgreSQL的肩膀上怎么样更好地适应现代化需求才是重中之重。
4.总结
时序数据已用于越来越多的应用中,包括物联网、DevOps、金融、零售、物流、石油天然气、制造业、汽车、太空、SaaS,乃至机器学习和人工智能。坚定“做一款国产自研的,能用、好用、管用的时序数据库”的信念,不断迭代、优化,切实满足用户需求,让国产数据库成为强力的基建。
国产软件自主研发,从国家目前对软硬件国产化发展支持的角度来说,至少政策层面是一片利好的, “去IOE”是国产化政策在信息技术领域的具体体现,而这也是为了让我们摆脱“受制于人”的局面,是非常必要的。