法律状态公告日
法律状态信息
法律状态
2017-02-01
授权
授权
2014-09-10
实质审查的生效 IPC(主分类):G06Q10/04 申请日:20140519
实质审查的生效
2014-08-13
公开
公开
技术领域
本发明涉及一种城市轨道交通客流高峰持续时间预测方法,属于城市轨道交通智能 化技术。
背景技术
随着我国各大中城市新线的不断建成和投入使用、轨道网络的逐渐形成,城市轨道 交通在城市发展和人民日常工作生活中发挥着越来越重要的作用,城市公共交通的轨道 化程度已成为一个城市现代化的重要标志之一。而我国的城市轨道交通事业发展还处于 初期,运营管理水平还比较低,尤其在轨道交通客流高峰事件管理方面还比较欠缺,主 要依靠管理人员主观经验,缺少必要的理论支持,存在不能及时反应客流需求变化、通 行能力浪费和服务水平低相矛盾的问题。
目前,国内外在交通事件持续时间预测方面已经做了一定的研究,这些事件持续时 间预测技术之间彼此差异较大,它们使用不同的数据源,不同的变量,不同的样本大小 和各种不相同的预测技术。这些预测方法包括:基于统计的预测方法,回归分析,决策 树模型,模糊逻辑法,生存分析等。基于统计的方法是统计交通事件持续时间的均值、 方差,将事件持续时间值作为随机变量并分析是否满足某一概率密度函数,拟合后可以 做出基于概率的事件持续时间预测;回归分析一般是提取交通事件的重要影响因素进行 多元线性回归或者多项式回归;决策树模型通过历史交通事件持续时间及其影响因素数 据的样本进行大量的模式训练,确定每种模式划分以及每种模式下交通事件持续时间的 最大、最小值、平均值及预测置信区间的上下限值;生存分析模型是用来描述关于从一 个明确定义的时间原点直到某个特定事件发生的时间节点之间的时间的数据的分析方 法,这种方法也经常用于预测交通事件的结束时间。但这些现有成果的研究对象主要是 针对道路交通事件的持续时间,鲜有关于客流事件持续时间的研究。
对于我国城市轨道交通而言,轨道线网建设还未成熟完善,客流模式还处于发展之 中。由于城市人口密度大,选择轨道交通出行的乘客迅速增加,高峰时段拥挤时有发生。 因此,为合理的节省企业资源和提高运营的管理水平迫切需要一种简单迅速、准确性高, 同时又能跟随轨道交通客流模式发展变化的城市轨道交通客流高峰持续时间预测方法。
发明内容
发明目的:为了克服现有技术中轨道交通运营对于客流高峰管理的不足,本发明提 供一种城市轨道交通客流高峰持续时间预测方法,该方法使用贝叶斯分类方法对客流进 行分类,并结合时间序列模型提高客流高峰持续时间预测的准确性。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种城市轨道交通客流高峰持续时间预测方法,包括如下步骤:
(1)客流统计:设定单位时间Δt,按单位时间Δt对时间进行分段;对历史客流数 据,统计各个单位时间段内的全线进站流量,将统计数据分为两个集合,分别为训练集 和测试集;
(2)高峰时间计算:对所有单位时间段内的全线进站流量的统计结果由低到高进 行排序,取85%分位点的全线进站流量作为高峰阈值Qt;当连续5个单位时间段的全线 进站流量高于Qt时,则确定首次全线进站流量高于Qt的单位时间段开始时刻出现客流 高峰;在出现客流高峰后,若连续5个单位时间段内有两个单位时间段的全线进站流量 低于Qt时,则确定第二次全线进站流量低于Qt的单位时间段开始时刻退出客流高峰; 客流高峰持续时间Td为出现客流高峰和退出客流高峰的差值,对所有训练集和测试集计 算客流高峰持续时间;
(3)建立客流高峰事件属性集:根据数据库信息(包括客流数据、事故、施工、 天气等信息数据),对客流高峰事件建立对应的属性集;
(4)训练数据处理:对训练集数据进行清洗,剔除明显的孤立点;设定最小的客 流高峰持续时间为TdMIN,最大的客流高峰持续时间为TdMAX,按一定的间隔宽度将 [TdMIN,TdMAX]划分为连续的区间[TdMIN,γ1)、[γ1,γ2)、…[γc-1,γc),γc-1<TdMAX≤γc,按时 间长度由短至长,对区间进行依次编号为1,2,…,c;将所有训练集数据中客流高峰持续 时间落在同一区间内的客流高峰事件归为一类;
(5)确定属性分类界限:对每一类客流高峰事件分析属性集的概率分布,建立客 流高峰事件的损失函数,使用贝叶斯分类器方法确定属性分类界限;
(6)建立时间序列预测模型:对训练集客流高峰事件按照步骤(5)所得的属性分 类界限进行重新分类;重新分类后,同一类客流高峰事件按发生的时间依次排序,对于 每一类客流高峰事件建立时间序列预测模型;
(7)预测方法检验:使用测试集数据对步骤(6)得到的时间序列预测模型进行检 验:若未能通过检验,则回到步骤(4)重新设置区间的时间长度;若通过检验,则确 定所建立的时间序列预测模型是有效的,可以用于实际轨道交通运营管理。
具体的,所述步骤(1)中,历史客流数据需要有足够的样本量,能够反映尽量多 的规律,减少样本不足带来的随机误差;一般训练集数据应选择一年或两年的客流数据。
具体的,所述步骤(3)中的属性集,其元素以向量形式表示,每个客流高峰事件 对应一个多维属性向量,各属性以数值形式表示,属性包括平均线路全日进站客流量、 线路站点数量、季节、是否工作日、是否节假日、天气、是否施工、有无大型活动、是 否发生事故等。
具体的,所述步骤(5)中,贝叶斯分类器采用基于最小风险的贝叶斯决策方法, 根据各城市不同的要求确定损失函数的参数,从而平衡企业资源的浪费和服务质量的下 降。
更为具体的,所述步骤(5)中,对于某一客流高峰事件,设对其做决策所属的区 间编号为i,其实际所属的区间编号为j,i,j=1,2,…,c,损失函数分为两段:当i≥j时, 损失主要来源于多余运能、管理、人员调度的造成的直接浪费,呈线性关系;当i<j时, 站台拥挤度增加,损失主要来源与服务质量的下降,呈指数增加。
具体的,所述步骤(6)中,时间序列预测模型是在贝叶斯分类的基础上对每一类 事件建立单独的预测模型,将分类预测和趋势预测相结合,以挖掘客流模式的发展趋势。
具体的,所述步骤(7)中,检验采用平均绝对百分比误差(MAPE)法,当测试集 数据实际值与预测值的平均绝对百分比误差值在允许的范围内时(如<30%),则认为方 法是可行的。
有益效果:本发明提供的城市轨道交通客流高峰持续时间预测方法,其优点在于: 通过分类的方法进行预测,使用过程简单快捷,能实时迅速的得到预测结果为客流高峰 管理提供决策支持;通过选择合适的损失函数参数可以有效的平衡企业经济效益和企业 社会形象;在贝叶斯分类的基础上结合时间序列模型可以使预测结果更好的符合当地轨 道交通客流模式的发展趋势,进一步提高预测的精确度。
附图说明
图1为本发明的方法操作流程示意图;
图2为本发明的建模及模型训练步骤示意图。
具体实施方式
下面结合附图对本发明作更进一步的说明。
如图1所示为一种城市轨道交通客流高峰持续时间预测方法,下面结合实施例对本 发明做出进一步的说明。
Step1、客流统计
设定单位时间Δt=1min,按单位时间Δt对时间进行分段;选取一条线路连续两年的 历史客流数据,统计各个单位时间段内的全线进站流量,将统计数据分为两个集合,第 一年的数据作为训练集,第二年的数据作为测试集。
Step2、高峰时间计算
对所有单位时间段内的全线进站流量的统计结果由低到高进行排序,取85%分位点 的全线进站流量作为高峰阈值Qt;当连续5个单位时间段(即连续5min)的全线进站 流量高于Qt时,则确定首次全线进站流量高于Qt的单位时间段开始时刻出现客流高峰; 在出现客流高峰后,若连续5个单位时间段内有两个单位时间段(即5min内有2min) 的全线进站流量低于Qt时,则确定第二次全线进站流量低于Qt的单位时间段开始时刻 退出客流高峰;客流高峰持续时间Td为出现客流高峰和退出客流高峰的差值,对所有训 练集和测试集计算客流高峰持续时间。
Step3、建立客流高峰事件属性集
根据数据库信息,对客流高峰事件建立对应的属性集;属性包括平均线路全日进站 客流量、线路站点数量、季节、是否工作日、是否节假日、天气、是否施工、有无大型 活动、是否发生事故等;各个属性以数值的形式表示,例如季节用[1,2,3,4]分别表示 [春,夏,秋,冬]四个季节;属性集中的元素以向量形式表示,每个客流高峰事件对应一 个d维属性向量
Step4、训练数据处理
对训练集数据进行清洗,剔除明显的孤立点;针对本案,孤立点的判定方法是:在 以一个客流高峰事件的持续时间为中心,半径为10min的时间段内搜索其他客流高峰事 件,若搜索到的高峰客流事件数量不大于2,则将该客流高峰事件视为孤立点。
设定最小的客流高峰持续时间TdMIN=5min,最大的客流高峰持续时间为TdMAX,按 10min的间隔宽度将[TdMIN,TdMAX]划分为连续的区间[5min,15min)、[15min,25min)、…, 当最后一个区间长度不足时按时间长度10min向后延长,对区间进行依次编号为 1,2,…,c;将所有训练集数据中客流高峰持续时间落在同一区间内的客流高峰事件归为 一类。
Step5、确定属性分类界限
对每一类客流高峰事件分析属性集的概率分布,建立客流高峰事件的损失函数,采 用基于最小风险的贝叶斯决策方法确定属性分类界限,要求所有的决策活动使得期望风 险R最小,对于属性向量作决策ψi,其期望风险R为:
其中,表示某一个属性向量值,i、j为Step4中的区间编号,ωj表示区间j,ψi表示对属性向量值代表的客流高峰事件做决策其客流高峰持续时间属于区间i, 表示所有属性向量的客流高峰事件中客流高峰持续时间落在区间j的条 件概率,δ(ψi,ωj)表示实际属于区间j作决策ψi的损失函数。
损失函数为:
其中,α、β为修正系数,这两个修正系数可以根据当地的政策、居民出行习惯、 交通资源等进行确定,尽可能地选择减少资源浪费和提高服务质量的平衡点;当i≥j时 损失主要来源于多余运能、管理、人员调度的造成的直接浪费,呈线性关系;当i<j时 站台拥挤度增加,损失主要来源与服务质量的下降,呈指数增加;特别的,当i=j时, 所做决策无损失,δ(ψi,ωj)=0。
Step6、建立时间序列预测模型
对训练集数据按照Step5所得的属性分类界限进行重新分类;重新分类后,同一类 客流高峰事件按发生的时间依次排序,对于每一类客流高峰事件建立时间序列预测模 型,所述时间序列预测模型的函数形式为观测值与在此之前k个同类客流高峰事件的持 续时间之间的线性回归方程,时间序列预测模型参数使用训练集历史数据进行标定;所 述时间序列预测模型为:
l=b0+b1l1+b2l2+…+bklk
其中,l表示当前客流高峰事件持续时间的观测值,l1、l2、…、lk表示在该观测值之 前k个同类客流高峰事件的持续时间,b0、b1、b2、…、bk为常量参数。
可以借助SAS软件导入同类的客流高峰的持续时间数据对每一类客流高峰事件的 模型参数b0、b1、b2、…、bk进行标定。
Step7、预测方法检验
使用测试集数据对Step6得到的时间序列预测模型进行检验:若未能通过检验,则 回到Step4重新设置区间的时间长度;若通过检验,则确定所建立的时间序列预测模型 是有效的,可以用于实际轨道交通运营管理。
检验采用平均绝对百分比误差(MAPE)法评估所建预测模型的准确性,MAPE其 表达式如下:
其中,Ai是第i个观察量的实际值,P是第i个观察量的预测值。MAPE值越低, 预测模型越准确。
当测试集数据实际值与预测值的MAPE值在允许的范围内时(如<30%),则认为方 法是可行的,可以应用于实际轨道交通运营管理;若MAPE值过大则回到Step4,重新 设置区间的时间长度(各区间的长度不一定必须相等),重复建立预测模型的步骤直到 模型通过有效性检验。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员 来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也 应视为本发明的保护范围。
机译: 客流预测装置,客流预测方法和乘客流量预测计划
机译: 城市轨道交通客流估算方法
机译: 导航系统,等待信号的频率预测方法,持续时间预测方法,等待信号的频率预测程序以及持续时间预测程序