从中兴、华为等一系列高新科技企业被美国制裁,到俄乌冲突事件爆发后,西方各国相继宣布制裁俄罗斯,以Oracle、IBM、微软、SAP为代表的科技巨头暂停在俄服务,这一系列动作给我们敲响了加速国产化替代的警钟。数据库作为提供数据存储与处理能力的基础软件,是信息系统的基础、信息安全的基石,因此,数据库自主可控和国产化替代已经刻不容缓。
兼容性是国产化替代关键,自研数据库更具潜力
Oracle数据库发展较早,在国内市场内占领了一定先机,企业经过信息化的长期积累和革新,基于Oracle开发了大量的系统业务。为了能够适配新的国产数据库产品,必须对应用代码进行大量修改,各数据表的数据类型、函数、语法规则需要进行系统、全面的改造,这就要求新的国产数据库对原有数据库能够有很好的兼容性支持,降低迁移的代码改造成本。
Oracle经过多年的发展,在SQL语言、性能、实例形态、容灾方案等方面有很多积累扩展。若要实现Oracle数据库的国产化替代,除了要能够提供在性能、容灾能力、安全能力等方面全方位提供对等的能力,首先要解决的就是如何兼容Oracle的大量SQL方言,尤其是Oracle的PL/SQL这一独特的广受欢迎的语法体系。
中国信通院《数据库发展研究报告》中表示,“国内关系型数据库产品中多数是基于MySQL和PostgreSQL二次开发的”。因此,这些产品对MySQL、PostgreSQL兼容性较好,但没有体系化的兼容Oracle,尤其是PL/SQL方面。
“高度的商业数据库兼容能力意味着大量的设计和研发工作,涉及产品整体架构的多个方面,十分考验厂商对代码的理解和掌控能力”。国家工业信息安全发展研究中心 、中国电子学会和北京国家金融科技认证中心联合发布的《分布式数据库发展趋势研究报告》中指出,“完全自主研发的产品在这方面具备先天的优势,未来无论在兼容性适配还是产品能力的研发上都更具潜力”。
KunDB是星环科技自主研发的国产分布式交易型数据库,提供完整的关系型数据库的能力,高度兼容MySQL和Oracle,可低成本实现数据库国产化的替代和迁移,具备可扩展、高并发、高可用、数据灾备等特性,满足企业关键业务处理、高并发查询、业务分布式改造、交易分析混合的数据中台等复杂场景,在金融、政务、能源、医疗、交通、教育等多个行业应用,为用户提供高性能、稳定可靠、经济实用、自主可控的国产化数据库产品。
高度兼容Oracle,实现低成本国产化平滑替代
KunDB对Oracle语法各个方面高度兼容,成为业内领先的具备支撑Oracle业务迁移能力的国产数据库。KunDB高度兼容Oracle语法与PL/SQL,支持VARCHAR2/NVARCHAR2、NUMBER等全部常用数据类型,在PL/SQL语法上,支持控制语句、集合、动态SQL、子程序、预定义包、错误处理等全部PL/SQL语法,并且通过自主原创的PL/SQL编译器,KunDB支持复杂PL/SQL程序,执行性能比解释执行提升一个数量级,解决了Oracle业务迁移到国产化数据库的核心痛点,为其他兼容性完善提供了基础。
在Oracle数据库对象、DML、函数、系统视图、内置包、驱动等方面,KunDB做到了常用功能的兼容,满足大部分业务的迁移需求,极大降低了企业业务迁移成本。
例如在某省级社保系统迁移过程中,KunDB仅用了3天就完成了8万多行PL/SQL代码的迁移工作,高效、低成本、安全地保障了原数据库迁移,平滑实现了数据库系统的国产化替代。
创新过程语言编译技术,完整支持Oracle PL/SQL语法
KunDB自研创新的过程语言编译技术及中间优化语言TIR,支持复杂PL/SQL程序,执行性能比解释执行提升一个数量级。
- 抽象和实现了星环通用中间PL/SQL指令集TIR,为多种代码编译执行方式提供基础表达能力
- 结合LLVM代码生成技术,直接生成CPU指令,比Go等高级语言运行时生成代码的效率提升一个数量级
- 内置LLVM优化器,使用最新的编译优化技术,做无效代码、公共表达式、死码、边界检查消除等优化,保证最终执行代码的最简化
- 自研表达式计算引擎,支持向量化和JIT执行,PL/SQL和SQL均可调用,比Go语言的通用表达式计算性能提升5倍以上
KunDB为PL/SQL定义了极其精简、通用的TIR指令集,其中6类指令可用于PL的解释,8条指令可用PL/SQL中的游标、游标遍历、静态SQL、动态SQL的解释,这14条指令的组合,可覆盖PL/SQL语法范围内所有语法组合的解释。PL/SQL被解析成抽象语法树后,PL和SQL被TIR指令集解释成相应的指令集合。TIR指令支持LLVM编译器,可生成不同平台的Native code,即CPU指令集加速执行。在LLVM的编译过程中,还会自动同步完成部分代码的逻辑优化,比如无效代码的去除。编译生成的执行指令集KunDB会保存在元数据中,为相同PL/SQL文本提供可复用的指令集(类似执行计划)。而对于LLVM指令集中还不支持的PL/SQL指令,会保留为高级语言(Golang)的指令最终交由高级语言编译器编译执行。所以KunDB的PL/SQL执行,是将大部分指令映射成CPU指令执行的,而且不需要重复编译,相较于每次编译成其它高级语言的方式,有较大的性能优势。以类似TPCC中NewOrder处理的PL/SQL实现为例,不考虑SQL执行的情况下,纯PL的逻辑的执行,使用KunDB的动态编译执行是完全由高级语言编译执行的3倍以上。
另外,PL/SQL以及常规SQL语法中的表达式计算是影响性能的关键因素之一,也借鉴了动态编译执行的思想,KunDB设计和实现了基于列存数据和动态执行的表达式引擎,对于数值类型的聚合计算,使用动态编译执行比普通解释执行要快10倍以上。
查询优化和向量化执行引擎,高性能复杂SQL查询
KunDB基于火山模型的优化器和向量化执行引擎支持了跨分片的查询,支持的SQL包含递归查询、嵌套子查询、别名等复杂SQL场景。针对聚合计算类SQL中性能消耗较高的表达式计算做了特别优化的表达式模块,逻辑优化可以用该模块进行如常量折叠,公共表达式提取等优化,执行器调用该模块进行表达式的计算。以TPCH为例,KunDB可高效跑完100GB规模内的全部22个复杂查询SQL。
适配Oracle应用生态,保障业务平滑迁移
KunDB适配Oracle应用开发生态,支持基于Oracle的业务直接或者通过中间件框架连接KunDB,包括Java、.NET、C/C++等语言开发的应用,尤其是针对C/C++应用提供兼容Oracle的OIC/OCCI驱动,来保障业务的平滑迁移。KunDB还提供了开放的数据生态,通过全局事务日志可与异构系统实时同步,可应用在实时数仓建设、Oracle和KunDB双数据库系统并轨运行回切等场景。
以某大型医疗HIS系统适配为例,使用的.NET EFCore开发框架与星环科技KunDB连接,通过高兼容性和迁移服务保障了多个核心业务系统的平滑迁移, 业务全量功能测试中个别的核心数据库源系统数据类型、语法兼容问题仅经过少量调整便能达成应用适配,在节省大量人力成本的同时,保障了数据库无损切割,实现了快速、安全地替换Oracle的目标。
星环科技分布式交易型数据库KunDB自主研发,并以优异的成绩通过了工信部、央行、信通院等多项数据库权威测试认证,为用户提供高并发、高性能、高可靠的国产数据库产品。同时,KunDB高度兼容Oracle PL/SQL和MySQL方言,可实现低成本数据库国产化替代,并且适配支持国产服务器、芯片、操作系统等软硬件生态,助力企业打造自主可控数据平台。