ABSTRACT

ABSTRACT

信息系统的发展目前正处于感知智能迈向认知智能的关键阶段, 传统信息系统难以满足发展要求, 数字化转型势在必行. 数字线索(digital thread)是面向全生命周期的数据处理框架, 通过连接生命周期的各阶段数据, 实现物理世界与数字空间的映射与分析. 知识图谱(knowledge graph)是结构化的语义知识库, 以符号形式描述物理世界中的概念及其相互关系, 通过知识驱动形成体系化的构建与推理流程. 两者对知识赋能的信息系统研究具有重要意义. 综述了知识赋能的新一代信息系统的研究现状、发展与挑战. 首先, 从数字线索系统出发, 介绍数字线索的概念和发展, 分析数字线索的六维数据构成和6个数据处理阶段; 然后介绍知识图谱系统, 给出普遍认同的知识图谱的定义和发展, 概括知识图谱的架构与方法; 最后, 分析和探索数字线索与知识图谱结合的方向, 列举KG4DT (knowledge graph for digital thread)和DT4KG (digital thread for knowledge graph)的受益方向, 对未来知识赋能的新一代信息系统提出开放问题.

新一代g信息网大数据分析 新一代信息系统_新一代g信息网大数据分析

CONTENT

新一代信息系统可以结合数字线索与知识图谱以实现数据与知识双驱动的知识赋能. 其中, 数字线索以多种传感器获取信息并孪生化实体数据, 通过虚实映射的数据处理和分析手段为信息系统提供底层支撑. 同时, 知识图谱以结构化的数据标签描述客观世界, 通过基于语义的上下文搜索形式为信息系统增强顶层认知能力并最终实现知识赋能. 数字线索与知识图谱的有机融合为知识赋能的新一代信息系统提供了新的研究视野.

(1) 数字线索使能的信息系统

数字线索体系架构如下图所示, 根据流程逻辑可划分感知层、数据层、模型层、功能层和应用层. 感知层中, 数字线索利用物联网基础设施, 对物理实体进行精准测量感知. 数据层以多维异构数据为基础, 将数据和工程知识组成权威真相源(authoritative source of truth, AST), 进行数据采集、数据传输、数据管理等操作. 模型层以统一建模为核心, 通过系统工程方法实现物理实体在数字空间的虚拟映射, 充分利用下层采集数据, 支撑上层功能要求. 功能层是数字线索的直接价值体现部分, 主要实现系统认知、状态分析、辅助决策等功能, 助力应用层中数字线索在各类场景的价值实现, 包括智慧城市、智慧医疗、智慧工业等.

新一代g信息网大数据分析 新一代信息系统_机器学习_02

图1 数字线索体系架构

(2) 知识图谱驱动的信息系统

知识图谱首先对原始数据(非结构化、半结构化和结构化)进行获取与处理, 提取信息要素. 然后, 通过知识抽取、知识融合、知识加工等技术方法, 从原始数据库和第三方数据库中提取知识事实, 构建知识图谱. 最后进行知识推理和应用, 知识推理是知识图谱能力输出的主要方式, 知识应用将知识图谱与其他特定业务或领域相结合, 利用知识图谱的技术特性提高业务效率. 

(3) 数据与知识双驱动的新一代信息系统

数字线索与知识图谱融合的信息系统双驱动应用形式如下图所示, 通过数字线索与知识图谱双向交叉, 一方面, 知识图谱具有高度语义抽象的图结构、推理能力以及可解释性等特点, 可以赋能数字线索(knowledge graph for digital thread, KG4DT), 实现结构化设计、可靠性增强、知识化增值等; 另一方面, 数字线索基于完整的生命周期信息进行全数据采集、全元素建模、全决策仿真, 提供物理空间与数字空间的精准映射与实时交互, 可以驱动知识图谱(digital thread for knowledge graph, DT4KG), 提供数据链治理、形式化建模和数字孪生化等服务.

新一代g信息网大数据分析 新一代信息系统_生命周期_03

图2 新一代信息系统双驱动引擎

(4) 知识赋能信息系统的机遇与挑战

人工智能3.0正迈向新的阶段, 数据与知识双驱动的新一代信息系统以数字线索和知识图谱为核心方法实现知识赋能, 成为“感知智能”转向“认知智能”的关键, 存在着诸多机遇与挑战. 

知识赋能的信息系统对于数据与知识双驱动的结合, 不仅是系统升级与技术变革, 更重要的是将产生巨大的社会效能: 一方面, 知识赋能的信息系统将有力推动传统技术的革新, 数据与知识双驱动的信息系统通过复杂方案关联、事件回溯分析、知识事实可视化等知识化处理能力, 将为不同领域提供标准化的信息交互体系、基础设备安全保障、跨层次跨学科的知识资源共享平台, 进一步扩展系统控制范围与控制深度, 对产业结构调整产生深远影响; 另一方面, 知识赋能的信息系统将推动数字化转型升级, 数字化转型已成为国家推动创新的有效途径. 围绕《“十四五”国家信息规划》提出的数字化转型战略, 知识赋能的新一代信息系统有机关联物理世界与数字空间的全生命周期数据, 通过建立重要资料的数字孪生体, 以数字化、网络化、智能化形式, 将逐步完善新兴产业设计概念, 塑造未来生产样式.

同时, 知识赋能的信息系统围绕数据与知识双驱动的发展形式也面临着诸多挑战: ① 激活数据要素, 将数字线索作为数据支撑技术并充分激活数据要素潜能所面临的新挑战. ② 扩展知识内涵, 通过知识图谱实现认知推理并扩展知识内涵需要作进一步思考. ③ 领域深度结合, 推动数字线索与知识图谱技术交叉实现数据与知识双驱动, 并继续结合多元技术最终实现知识赋能的信息系统值得深思.

(5) 结束语

数字化转型背景下, 数字线索提供面向全生命周期的海量数据处理架构, 成为破解数据孤岛问题和实现物理世界与数字空间映射交互的重要研究领域, 而知识图谱打破传统数据存储和使用方式, 以图结构抽取和运用知识, 是认知智能的关键赋能手段. 本文阐述、分析和总结了数字线索和知识图谱的研究与应用, 分别介绍了两者的基本概念和发展历程, 概括了数字线索的数据构成和数据处理方法以及知识图谱的体系架构和典型方法技术, 总结了各自应用方向与领域. 最后, 结合相关技术研究, 本文分析了二者有机结合下, 知识赋能的新一代信息系统可能的形式(KG4DT & DT4KG). 希望本综述能够为知识赋能的新一代信息系统研究与发展提供一定的理论参考和创新思路.