技术领域
本发明属于机器学习技术领域,具体涉及一种人类移动可预测性量化方法。
背景技术
随着物联网的不断发展以及传感感知设备的不断普及,人们可以通过越来越丰富的方式记录自己的日常的行为,为研究人类行为提供了充足的数据。针对人类行为移动的研究对地理区域分析、城市交通和规划以及计算机科学和公共卫生等领域具有重要的作用,其作为人类行为的基本表征和潜在的社会经济活动刻画标准,反映了人们移动的模式。
现有的针对人类移动行为的研究主要包括移动轨迹的刻画和下一时刻位置的预测。针对人类下一时刻的位置预测方法主要包括回归方法、移动自平均方法以及机器学习方法,由于模型的逐渐复杂以及移动轨迹数据的不断增多,人类移动预测的准确率也越来越高。然而这些工作都只是在模型层面去提高移动轨迹预测的准确性,无法从根本上回答对应的移动轨迹历史序列的可预测性如何,即给定用户移动的历史轨迹,如何量化准确预测下一个时刻位置的最大概率是多少。
发明内容
为了克服现有技术的不足,本发明提供了一种基于信息熵的人类移动可预测性量化方法,首先通过感知设备获取用户移动数据,将用户的移动数据转化为时间维度上的位置序列得到用户移动轨迹,然后根据信息熵的大小来定型地刻画用户移动轨迹的可预测性高低,再根据用户历史移动轨迹计算下一个时刻用户到达不同位置的条件概率分布,接下来确定用户下一个时刻概率最大的位置为用户最可能到达的位置点,最后根据条件概率分布计算准确预测用户下一时刻所在位置的概率,得到用户轨迹的可预测性。本发明方法可以衡量移动轨迹可以被准确预测的上限,能够作为人类移动轨迹预测算法的一种评估方法,根据预测算法的准确率和移动轨迹序列的可预测性评估预测算法的优劣。
本发明解决其技术问题所采用的技术方案包括以下步骤:
步骤1:使用感知设备获取用户移动数据;
步骤2:将用户移动数据转化为时间维度上的位置序列得到用户移动轨迹;
定时采样用户的经纬度信息,将经纬度信息映射到地图网格上,得到时间维度上的用户的位置变化序列X={x
步骤3:计算用户轨迹的信息熵E:
其中,x为用户移动轨迹的位置点,{X}为用户移动轨迹的位置变化序列集合,p(x)为位置点x在用户移动轨迹的位置变化序列集合中出现的概率;
根据信息熵E的大小定性地度量用户移动轨迹的可预测性大小:
当E=0时,用户轨迹是完全有规律的,对应的用户移动轨迹的可预测性为1;
当E=log
当E等于其它值时,进入步骤4,计算用户移动轨迹的可预测性PA;
步骤4:根据用户历史移动轨迹计算下一时刻用户到达不同位置的真实条件概率分布:定义前n时刻的用户历史移动轨迹序列为h(n)={x
步骤5:从步骤4的真实条件概率分布找到概率最大的位置为用户下一时刻最可能到达的位置点x
步骤6:根据条件概率分布计算准确预测用户下一时刻到达位置的概率,得到用户轨迹的可预测性;
步骤6-1:采用预测算法,根据前n时刻的用户历史移动轨迹序列h(n),预测下一时刻用户到达不同位置的概率分布为:P
步骤6-2:根据步骤4得到的下一时刻用户到达不同位置的真实条件概率分布P{X=x|h(n),x∈h(n)},得到准确预测用户下一时刻到达位置的概率为:
步骤6-3:根据步骤5,用户下一时刻概率最大的位置x
则P
步骤6-4:定义用户移动轨迹的可预测性为PA;当用户历史移动轨迹序列的长度为n的时候,用户历史移动轨迹子序列集合H(n)={{x
优选地,所述步骤2中定时采样用户的经纬度信息,定时时间为1小时。
优选地,所述步骤2中地图网格的大小为500m×500m。
优选地,所述步骤6-1中的预测算法为马尔可夫模型或长短期记忆网络或循环神经网络。
本发明的有益效果如下:
1、现有技术主要是针对人类移动轨迹的预测方面,本发明从定量和定性两个角度评估人类移动轨迹的可预测性,即可以被准确预测的程度。
2、本发明提出的可预测性度量方法可以衡量移动轨迹能被准确预测的上限,可以作为人类移动轨迹预测算法的一种评估方法,根据预测算法的准确率和移动轨迹序列的可预测性评估预测算法的优劣。
3、本发明不仅局限于人类移动轨迹,可以应用到度量任意离散时间序列的可预测性,评估序列可以被准确预测的程度。
附图说明
图1为本发明方法流程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
本发明提出一种基于信息论的人类移动可预测性的量化方法。利用以下原理:时间序列的可预测性表示序列能够被准确预测的程度,而时间序列的信息熵能够建模对应序列的不确定性程度,信息熵越大表示时间序列越复杂,越不好预测,也就代表了其可预测性较低。通过将序列的信息熵与可预测性对应起来可以实现基于信息熵的时间序列可预测性量化,将人类的移动轨迹映射到时间维度可以得到人类移动的可预测性。
如图1所示,一种基于信息熵的人类移动可预测性量化方法,包括以下步骤:
步骤1:使用感知设备获取用户移动数据;
步骤2:将用户移动数据转化为时间维度上的位置序列得到用户移动轨迹;
定时采样用户的经纬度信息,将经纬度信息映射到地图网格上,得到时间维度上的用户的位置变化序列X={x
步骤3:计算用户轨迹的信息熵E:
其中,x为用户移动轨迹的位置点,{X}为用户移动轨迹的位置变化序列集合,p(x)为位置点x在用户移动轨迹的位置变化序列集合中出现的概率;
根据信息熵E的大小定性地度量用户移动轨迹的可预测性大小:
当E=0时,用户轨迹是完全有规律的,对应的用户移动轨迹的可预测性为1;
当E=log
当E等于其它值时,进入步骤4,计算用户移动轨迹的可预测性PA;
步骤4:根据用户历史移动轨迹计算下一时刻用户到达不同位置的真实条件概率分布:定义前n时刻的用户历史移动轨迹序列为h(n)={x
步骤5:从步骤4的真实条件概率分布找到概率最大的位置为用户下一时刻最可能到达的位置点x
步骤6:根据条件概率分布计算准确预测用户下一时刻到达位置的概率,得到用户轨迹的可预测性;
步骤6-1:采用预测算法,根据前n时刻的用户历史移动轨迹序列h(n),预测下一时刻用户到达不同位置的概率分布为:P
步骤6-2:根据步骤4得到的下一时刻用户到达不同位置的真实条件概率分布P{X=x|h(n),x∈h(n)},得到准确预测用户下一时刻到达位置的概率为:
步骤6-3:根据步骤5,用户下一时刻概率最大的位置x
则P
步骤6-4:定义用户移动轨迹的可预测性为PA;当用户历史移动轨迹序列的长度为n的时候,用户历史移动轨迹子序列集合H(n)={{x
具体实施例:
1、通过感知设备获取用户移动数据,例如使用GPS设备获取用户移动轨迹的经纬度变化信息。
2、根据不同的离散化方法将用户的移动数据转化为时间维度上的位置序列得到用户移动轨迹。预处理人类移动轨迹数据,定时(1小时)采样用户的经纬度信息,将其映射到500m×500m的地图网格上,得到时间维度上的用户的位置变化序列X={x
3、计算用户轨迹的信息熵,根据信息熵的大小来定型地刻画用户移动轨迹的可预测性高低。
根据信息熵E的大小可以定性地度量用户移动轨迹的可预测性大小,当E=0时,认为用户轨迹是完全有规律的,对应的可预测性为1;当E=log
4、根据用户历史移动轨迹计算下一个时刻用户到达不同位置的条件概率分布。
5、确定用户下一个时刻概率最大的位置为用户最可能到达的位置点x
6、根据条件概率分布计算准确预测用户下一时刻所在位置的概率,得到用户轨迹的可预测性,最终得到序列的可预测性PA。
机译: 基于人类视觉模型的图像压缩小波系数量化方法
机译: 基于视频分析的开放柔性系统可预测性的一种方法
机译: 基于视频分析的开放柔性系统可预测性的一种方法