首页> 中国专利> 基于影响因素分析的交通流量序列模式匹配方法

基于影响因素分析的交通流量序列模式匹配方法

摘要

本发明公开了一种基于影响因素分析的交通流量序列模式匹配方法。本发明首先在对已有交通流量序列通过聚类得到结果的前提下,确定每一类当中每一条交通流量序列的属性向量。其次针对每个类,统计其每个属性中每个值的出现次数,计算其出现频率,并得到每个类的重要性系数矩阵。然后确定待匹配交通流量序列的属性向量,计算待匹配交通流量序列与每一类的相似度向量。最后由待匹配交通流量序列的相似度向量,计算每条属性的相似度与该属性可能的取值数量相乘再累加,得到待匹配交通流量序列与每一类的相似度,选取相似度最大的一类作为最终匹配结果。本发明在保证精确性的前提下,还有计算复杂度小等优点。

著录项

  • 公开/公告号CN108346287A

    专利类型发明专利

  • 公开/公告日2018-07-31

    原文格式PDF

  • 申请/专利权人 浙江大学;

    申请/专利号CN201810087650.2

  • 申请日2018-01-30

  • 分类号G08G1/01(20060101);

  • 代理机构33200 杭州求是专利事务所有限公司;

  • 代理人忻明年

  • 地址 310058 浙江省杭州市西湖区余杭塘路866号

  • 入库时间 2023-06-19 06:30:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-08-04

    授权

    授权

  • 2018-08-24

    实质审查的生效 IPC(主分类):G08G1/01 申请日:20180130

    实质审查的生效

  • 2018-07-31

    公开

    公开

说明书

技术领域

本发明涉及一种对交通流量序列进行模型匹配的方法,具体是一种基于影响因素分析的交通流量序列模式匹配方法,属于交通控制领域。

背景技术

近年来,随着经济的快速发展,机动车持有量迅速增加,交通管理现状和需求的矛盾进一步加剧。在此情况下,如何利用先进的科技手段提高交通管理水平是当前交通管理部门亟待解决的问题。

模型匹配,或者说模式识别,就是通过计算机用数学技术方法来研究模式的自动处理和判读。随着计算机技术的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是计算机对模式的识别。现有的一些模式识别的方法主要有:判别函数法,k近邻分类法,非线性映射法,特征分析法,主因子分析法等。

将模型匹配技术应用于交通领域,利用大数据技术和智能分析技术,整合城市管理的其他数据,将真正推动智慧交通建设,为交通管理奠定良好的基础。因此,本发明提出一种基于影响因素分析的交通流量序列模式匹配方法,能为交通流量序列做出更精准的预测提供条件,进而可以做出进一步的交通管理调度。

发明内容

本发明的目的在于实现对交通流量序列做快速的模型匹配,为交通流量序列做出更精准的预测提供条件。

本发明的基本思想为:具有相同属性的不同流量序列,其形状或者说数值也有较大概率相同或者类似。以某一类样本序列内某一属性出现次数与此类内样本总数的比值作为影响因素,影响因素与属性取值个数的累积和作为相似度。以此相似度作为评判依据,能够很好的判断待匹配数据能与此类样本序列匹配程度,最终输出使得相似度最大的类作为匹配结果。

本发明的基本步骤如下:

基于影响因素匹配的交通流量序列模式预测方法包括以下步骤:

c1、在对已有交通流量序列通过聚类得到结果的前提下,确定每一类当中每一条交通流量序列的属性向量。

c2、针对每个类,统计其每个属性中每个值的出现次数,计算其出现频率,并得到每个类的重要性系数矩阵。

c3、确定待匹配交通流量序列的属性向量,计算待匹配交通流量序列与每一类的相似度向量。

c4、由待匹配交通流量序列的相似度向量,计算每条属性的相似度与该属性可能的取值数量相乘再累加,得到待匹配交通流量序列与每一类的相似度,选取相似度最大的一类作为最终匹配结果。

步骤c1的过程包括:

c11、假设原交通流量序列分为J类。原始数据可能有多个属性,从其中选出对交通流量序列有影响的m个属性构成交通流量序列的属性向量V。即:

V=[v1,v2,…,vi,…,vm]>

该向量的每一个元素均为事先设定的能够影响交通序列的因素,包括但不限于星期,天气,季节等。第i个属性元素有pi个不同取值,且pi的最大值为n。

步骤c2的过程包括:

c21、针对交通流量序列J个类中的某个类j(1<j<J)内的所有交通流量序列,统计其每个属性i中每个值的出现次数,以vji,q表示在类j内所有交通流量序列中第i个属性的第q个取值出现的次数与类j内总样本数的比值。

c22、由上述知,针对类j,其属性向量V共有m个元素。对于其任意一个属性i,vji,q中所有非0元素个数为pi,即属性i最多有pi个取值,且pi的最大值为n。于是可以构造一个大小为m*n矩阵Wj。该矩阵为类j的重要性系数矩阵。

Wj内的元素即vji,q,当类j内不存在符合属性i的第q个取值的流量序列时,根据vji,q的定义,其值为0。属性i有pi个取值,当pi小于n时,在Wj的第i列的pi+1行及以下补0以保证矩阵的完整性。

步骤c3的过程包括:

c31、确定待匹配交通流量序列的属性向量取值为

V*=[v*1,v*2,…,v*i,…,v*m]>

其中v*i表示第i个属性取值编号。例如,当属性i表示星期时,若待匹配交通流量序列的属性是星期一,且星期一的编号为1,则v*i=1。

c32、确定待匹配交通流量序列的每一个属性i与类j流量序列相应属性的相似度。

对于属性i,设待匹配交通流量序列的该属性值在j类中所占的比重为即待匹配交通流量序列与类j的相似度为由于待匹配交通流量序列有多个属性,同理,对任意一个属性,也均有一个相似度。因此,待匹配交通流量序列的m个属性构成的与类j的相似度向量为:

特别的,针对某属性i,若类j所有流量序列的属性值均与待匹配交通流量序列的属性值相同,则其相似度为1.0,若j类所有流量序列属性值与待匹配交通流量序列属性值均不同,则其相似度为0.0。

步骤c4的过程包括:

c41、考虑待匹配交通流量序列属性与类j属性的相似度矩阵,若存在类j满足所有属性与待匹配流量序列对应属性的相似度在所有类中均是最大者,则待匹配交通流量序列应属于类j,类j的交通流量序列样本应作为预测的背景数据。然而,多数情况下,很难保证待匹配交通流量序列所有属性与类j的相似性均最大,需要综合评估各个相似性系数以确定预测交通流量序列的最佳类编号。评估方法如下:

针对待匹配交通流量序列的属性i1和i2,其属性编号分别为假设二者与类j有相同的相似性系数,即但若属性i1和属性i2的所有可能的取值的个数不同则待匹配流量序列的属性i1较i2更加近似于类j。即,以某一属性i与类j的相似度乘以该属性的所有取值个数pi的积作为该属性与类j的相似度。

以所有属性为对象,待匹配流量序列与类j的相似性可定义为:

式中,Υj为待匹配流量序列与类j的相似度;m为属性取值向量元素个数。

若j*是时间序列分类之后的其中一类,且满足

j=1,2,…,J,则待匹配流量序列应属于类j*,类j*的交通流量序列样本应作为预测的背景数据。

本发明的有益效果:本发明提出了一种基于影响因素匹配的交通流量序列模式预测方法,提出了具有相同属性的不同流量序列,其形状或数据分布也有较大概率相同或者类似的思想。以样本序列内某一属性出现频率作为影响因素,影响因素与属性取值个数的累积和作为相似度,选择相似度最大的类作为预测序列的背景数据。在保证了精确性的前提下,还有计算复杂度小等优点。本发明属于时间序列预测前的数据模式匹配工作,为交通流量序列做出更精准的预测提供条件。

附图说明

图1算法实现过程流程图。

图2待匹配序列与各个类的最终相似度。

具体实施方式

以某城市周期为一年共352天的流量序列数据为例,对6个待匹配数据做模型匹配,见图1。

1、在对已有交通流量序列通过聚类得到结果的前提下,确定每一类当中每一条交通流量序列的属性向量。

(1)原交通流量序列数据共分为3个类。该交通流量序列共有M个属性,从其中选出对交通流量序列有影响的m个属性构成交通流量序列的属性向量V。即

V=[v1,v2,…,vi,…,vm]>

在此例中,选出四个能够影响时间序列的因素,包括星期,是否假期,是否下雨,季节。显然,第一个元素星期共有7种取值,以1到7对其编号。类似的,假期、是否下雨、季节分别有2种、2种、4种取值,分别对其编号。

2、针对3个类,分别统计其每个属性i中每个值的出现次数,计算得到重要性系数矩阵Wj

(1)针对其中某个类j(1<j<J)内的所有交通流量序列,统计其每个属性i中每个值的出现次数,以vji,q表示在类j内所有交通流量序列中第i个属性的第q个取值出现的次数与类j内总样本数的比值。

(2)构造大小为m×n的类j的全部取值重要性系数矩阵矩阵Wj

计算结果如下

3、确定待匹配交通流量序列的属性向量V*,并根据重要性系数矩阵Wj确定每个属性i在类j中所占的比重,即该属性与类j的相似度进而构成相似性向量H。

(1)确定待匹配交通流量序列的属性取值向量为

V*=[v*1,v*2,…v*i,…,v*m]>

(2)对每一个属性i确定其与j类流量序列的相似度。

仅考虑第i个属性时,若待匹配交通流量序列的该属性值在j类中所占的比重为即待匹配交通流量序列与j类流量序列的相似度为其数值就是重要性系数矩阵Wj内的元素vji,q。因此,m个属性构成的相似性向量为:

4、将每条属性i的相似度与属性i可能的取值数量相乘再累加,得到待匹配数据与类j的最终相似度Υj,如图2所示。

若j*是时间序列分类之后的其中一类,且满足

j=1,2,…,J,则待匹配对象应属于类j*,类j*的交通流量序列样本应作为预测的背景数据。

最终得到最后序列的匹配结果,如下表所示。

数据编号123456所属分类类3类3类2类2类1类1匹配结果类3类3类2类2类1类1

匹配结果相当精准。

综上,本发明涉及一种对待匹配交通流量序列进行模型匹配的方法,具体是一种基于影响因素分析的交通流量序列模式匹配方法,具备结果较精准、计算复杂度较低的特点。本发明基本思想为:具有相同属性的不同流量序列,其形状或者说数据也有较大概率相同或者类似。在对原数据做聚类之后,本发明能够对一个未知类型的流量序列做出判断其所属类,进而为后续预测提供技术支持。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号