拥有大数据不是目的,探索大数据的价值是关键。工业大数据由企业信息数据、设备物联网数据和外部互联网数据组成,具有很大的价值。例如,通过分析用户使用数据来改进产品,通过分析现场测量数据来提高工件加工水平,通过工况数据进行产品健康管理等。

 

  实施工业大数据项目需要关注以下3个关键问题:

 

  数据质量控制问题

 

  原始数据(生数据)质量决定分析结果的质量。企业信息系统数据质量仍然存在问题,例如2014年某大型机车企业ERP系统中近20%物料存在“一物多码”问题。装备物联网数据质量堪忧,某大型制造企业1个月的状态工况数据中,无效工况(如盾构机传回了工程车工况)、重名工况(同一状态工况使用不同名字)、时标混乱(当前时间错误或时标对不齐)等数据质量问题约30%。

 

  多源数据关联问题

 

  层次化的物料表(Bill Of Material,BOM)定义了企业信息系统数据的核心语义结构。针对跨生命周期的研制BOM和实例BOM间结构失配问题,我们提出了中性BOM模型,并以此为核心,向前关联设计制造BOM,向后关联服务保障BOM,形成星型结构,极大地降低了数据关联的复杂度。同时,针对装备物联网数据和外部互联网数据,可以根据其绑定的物理对象(零部件或产品)与相应的BOM节点相关联。从而以BOM为桥梁,关联3个不同来源的工业大数据。

 

  大数据系统集成问题

 

  工业大数据其来源更加广泛,并且装备物联网数据(半结构化数据)和外部互联网数据(非结构化数据)都要与企业信息系统(结构化数据)进行集成,因此要重构数据支撑平台,甚至替换“旧”系统。

 

  大数据强调数据关联和整合,这必然会大大增加安全风险。为了确保数据安全,一是充分利用技术手段,二是选择可靠的实现服务提供商。