物联数据Spark历史批量数据分析 物联网数据分析系统_物联数据Spark历史批量数据分析


我们在上一篇文章中给大家介绍了物联网的数据分类,物联网的数据分析有静态数据和动态数据,或者根据数据的属性进行分类。物联网数据也是有各种各样的,那么怎么把它们联系到一起呢?这就需要说一下数据的关联性了,下面我们就讲一下这个内容。

数据关联性是指数据之间的关联性是不同数据之间的关系,数据之间的关系对了解整个系统的运行有着最直接的影响,数据之间的正确关系的梳理是系统有效运行,产生价值的基石。数据之间的关联性可以从时间的关联性、流程关联性、数据的时效性这三个方面来分析。

首先说一下时间关联性,时间关联性就是同一时刻的数据照相,数据是同一时刻系统产生的,它反映的是系统这一时刻的状态,从数据世界角度看,这个系统就是这一时刻的数据集合。数据照相体现的是系统静态展示;时间戳是这类数据关键的因素,因此要求各个数据获取的时间戳必须相同,时间戳是目前很多数据所缺失的,也是物联网实施中需要关注和解决的问题之一。

而流程关联性就是指一个点的数据进过一定时间后影响第二个点数据的产生,它体现的是系统动态的流程展示。数据之间的流程关系性需要模型提供,并在实施中进行修正。

最后说一下数据的时效性。数据的时效性是指数据产生到其被清除的时间,数据时效性是由系统的实施部署所决定。数据可以被使用多次也可以被使用一次后就可以被清除。总的来说远程部署数据还是边缘部署数据影响着数据的时效性,通常边缘部署的数据时效性短,远程数据的时效性长。边缘部署需要的数据通常及时性强,但是边缘存储空间,计算能力弱因此不能长期保存;远程数据通常为历史性数据展示、计算分析,同时云端空间、计算的伸缩性强,因此数据时效性长。

由此可见,数据的实时性也是数据时效性的一部分,实时性和数据的部署位置,数据的重要性以及传输方式都有关联性。数据的关联性在物联网中都是十分重要的,物联网中的数据关联性就是文中提到的时间关联性、流程关联性、数据时效性。希望这篇文章能够给大家带来帮助。