这篇文章提出了一种3W模型来建模人类移动行为,同时还能对用户的隐私进行保护。它是在WHERE模型的基础上得到的,但是基于此,本文提出的模型还考虑了用户的活动空间和全天出行规律,另外,本文还对用户进行了聚类处理。

一、模型结构

1.1 模型输入

模型的输入包含四个部分:1)时间引用文件。事先给定,决定生成当前轨迹的时间。2)空间聚合层。即地图的空间划分,要求在实验中保持一致。3)移动轨迹。4)home和work位置。事先给定。

1.2 WHO组件

该部分是用来提取具有相似行为特征的用户。

在这部分中,根据出现规律对用户进行聚类,

人口数据分析怎么做 人口数据模型_数据挖掘


向量对每个用户都计算一个。然后使用K均值算法对用户进行聚类,聚类的个数由轮廓系数判据决定:

人口数据分析怎么做 人口数据模型_人口数据分析怎么做_02


聚类之后,可计算每个簇的home分布和work分布,计算方式为:对每个簇,计算聚合层(即空间划分)上的家庭和工作位置分布,并将其归一化,就得到了一对空间概率分布。

每个簇的通勤距离分布计算为簇中每个用户通勤距离的中值在聚合层上的分布。

对每个用户而言,它所有的活动可以约束到一个椭圆中,椭圆的半轴的比作为该用户的扩散系数(Spread),对其平均得到用户所在簇的扩散系数。

人口数据分析怎么做 人口数据模型_数据_03

1.3 WHERE部分

该部分决定移动的空间方面。从这个组件开始,为轨迹生成的部分。
必须确定要合成的总人数,并使用该总人数将不同移动组的份额重新调整为要为每个群生成的人数

事先,WHERE给要生成的个体分配一个home,work位置和活动空间。其中,home位置人口数据分析怎么做 人口数据模型_数据_04进行采样得到,然后由人口数据分析怎么做 人口数据模型_数据挖掘_05分布采样得到通勤距离d,然后根据宽度得到一个圆环,在圆环内根据人口数据分析怎么做 人口数据模型_聚类_06得到work位置

使用椭圆来确定活动空间,home在椭圆中心,work在边缘,半长轴为通勤距离。

人口数据分析怎么做 人口数据模型_聚类_07

1.4 WHEN

用来确定移动行为的时间。

人口数据分析怎么做 人口数据模型_聚类_08


人口数据分析怎么做 人口数据模型_人口数据分析怎么做_09

二、实验

2.1 评价指标

对于每个小时的生成数据集的人口分布和原始数据的人口分布,作者使用EMD方法来计算两个分布的相似性。

人口数据分析怎么做 人口数据模型_数据_10

对于群体特征,作者采用了旅行距离和流量特征。并使用KL散度来计算生成数据集和真实数据集之间的相似性。

作者分布实施了两个实验,一个是根据公开数据生成一个移动轨迹数据集。一个是根据真实的移动轨迹,生成移动轨迹。

2.2 合成数据测试

根据人口普查数据和出粗车数据来生成轨迹数据。

2.3 真实数据测试

使用真实采集的GPS轨迹作为原始数据,每隔5s记录一次位置,记录时间跨度为一周,然后预处理数据,降采样得到以一个小时为间隔的轨迹数据。

2.4 结果

(1)合成数据测试结果

人口数据分析怎么做 人口数据模型_聚类_11


人口分布差异

人口数据分析怎么做 人口数据模型_数据挖掘_12


群体特征差异

人口数据分析怎么做 人口数据模型_数据集_13


每个区域观测到的流和真实情况对比。(2)真实数据测试结果

人口分布差异

人口数据分析怎么做 人口数据模型_人口数据分析怎么做_14


距离分布差异

人口数据分析怎么做 人口数据模型_数据挖掘_15


每个区域流数量差异

人口数据分析怎么做 人口数据模型_人口数据分析怎么做_16

三、总结

在这篇论文中,作者提出了WHO-WHERE-WHEN方法,一个改进的隐私保护的人口流动模型。该模型可以合成人工轨迹,代表与真实社区非常相似的运动行为的群体。该算法旨在大规模采样和复制数据。