首页> 中国专利> 基于高速公路收费数据的省际出行流量估算方法

基于高速公路收费数据的省际出行流量估算方法

摘要

本发明提供了一种基于高速公路收费数据的省际出行流量估算方法。该方法包括:提取高速公路收费数据中的跨省出行相关的数据字段数据;对提取的高速公路收费数据进行数据预处理;根据数据预处理后的高速公路收费数据提取省际出行链集合,基于提取的省际出行链集合计算高速公路省际出行O‑D及O‑D交通量。本发明基于全国的高速公路收费数据,结合全国高速公路网络拓扑数据、全国收费站基础信息数据等,给出了高速公路省际出行链的提取算法,计算了高速公路省际出行流量,并与统计得到的实际断面流量进行对比,有效提高了省际断面流量推算的实用性。

著录项

  • 公开/公告号CN113096413A

    专利类型发明专利

  • 公开/公告日2021-07-09

    原文格式PDF

  • 申请/专利权人 北京交通大学;

    申请/专利号CN202110307548.0

  • 申请日2021-03-23

  • 分类号G08G1/065(20060101);G08G1/01(20060101);G07B15/06(20110101);

  • 代理机构11255 北京市商泰律师事务所;

  • 代理人黄晓军

  • 地址 100044 北京市海淀区西直门外上园村3号

  • 入库时间 2023-06-19 11:45:49

说明书

技术领域

本发明涉及高速公路运营管理技术领域,尤其涉及一种基于高速公路收费数据的省际出行流量估算方法。

背景技术

高速公路跨省出行,是指车辆从某省的入口收费站驶入高速公路网络,再从其他省份驶出高速公路网络的单次出行。跨省出行流量是指特定时间段内,各省之间完成跨省出行的车辆数。跨省出行流量可以作为高速公路省间费用清分的重要依据,如何科学、准确地估算跨省出行流量是交通领域的热点问题之一。

取消省界收费站之前,我国高速公路以省为单位运营收费,跨省出行的车辆在每个省停车收费,无需省际清分。取消省界收费站之后,我国高速公路收费由省际收费站收费模式改为龙门架分段式收费模式,省际清分问题随之出现。现状龙门架分段式收费模式存在诸多问题。首先车辆的ETC安装率有待提高;其次门架识别存在故障频发、计费错误、多次扣费和扣费延迟等问题。因此,结合交通模型与方法,提出解决高速公路网络清分问题的新思路,成为高速公路运营管理中的重要问题。

与高速公路清分问题类似,多运营主体的大规模城市轨道交通网络也存在清分问题,且现有研究成果比较丰富。城市轨道交通网络的清分是以AFC刷卡数据为基础,采用交通流分配模型来推算网络断面客流分布状况,从而达到清分目的。然而,直接应用现有的城市轨道交通网络客流分配算法还存在缺陷,一方面,相比于城市轨道交通网络,全国高速公路网络的规模更为庞大,这对流量分配算法的计算效率提出更高要求;另一方面,相对于规范程度更高的AFC数据,全国高速公路收费数据是以省为单位进行管理的,数据规范性、完整性与一致性存在不足,这也为数据处理带来难度。如何通过海量的高速公路收费数据,准确、快速及完整地获取跨省出行流量成为一个难点。

发明内容

本发明的实施例提供了一种基于高速公路收费数据的省际出行流量估算方法,以克服现有技术的问题。

为了实现上述目的,本发明采取了如下技术方案。

一种基于高速公路收费数据的省际出行流量估算方法,包括:

提取高速公路收费数据中的跨省出行相关的数据字段数据;

对提取的高速公路收费数据进行数据预处理;

根据数据预处理后的高速公路收费数据提取省际出行链集合,基于提取的省际出行链集合计算高速公路省际出行O-D及O-D交通量。

优选地,所述的提取高速公路收费数据中的跨省出行相关的数据字段数据,包括:

提取高速公路收费数据中的跨省出行相关的数据字段,该数据字段包括;收费卡ID、入口收费站编号、出口收费站编号、入口收费时间、出口收费时间和交易金额。

优选地,所述的对提取的高速公路收费数据进行数据预处理后,包括:

剔除提取的高速公路收费数据中的省内出行数据;

根据下述的7种清洗规则对剔除处理后的高速公路收费数据进行数据清洗处理,具体如下:

(1)清除卡号、出入口收费站和时间字段中存在明显错误或缺失的收费数据;

(2)清除入口收费站和出口收费站相同的收费数据;

(3)清除出口收费时间早于或等于入口收费时间的收费数据;

(4)清除在高速公路收费系统中停留时间超过设定时长的收费数据;

(5)清除出口或入口收费时间不在研究时段内的收费数据;

(6)清除缴纳费用高于实际行驶里程或时间的收费数据;

(7)清除出入口收费站编号无法识别,不能与实际收费站相对应的收费数据。

优选地,所述的根据数据清洗处理后的数据字段数据提取省际出行链集合,包括:

步骤1:初始化。设省际出行链集合Ω为空集,读取高速公路收费数据集,并将其按照卡号和入口收费时间升序排列,排序后的数据集记为N,建立一个空队列Q,执行步骤2;

步骤2:读取数据集N中的第一条记录N

步骤3:读取数据集N中的第i条记录N

步骤4:判断第i条记录的卡号id

步骤5:判断第i条记录的入口收费站

步骤6:判断第i条记录的入口收费时间

步骤7:置Q为空队列,执行步骤8;

步骤8:将

步骤9:判断队列Q中的第一个元素和最后一个元素是否均为非省界收费站且这两个收费站所属的省份不同,如果是,将队列Q添加到省际出行链集合Ω,并清空队列Q中的所有元素,执行步骤10;否则执行步骤10;

步骤10:判断当前记录是否为最后一条记录,如果是则结束;否则置i=i+1,转到步骤3。

优选地,所述的基于提取的省际出行链集合计算高速公路省际出行O-D及O-D交通量,包括:

基于省际出行链集合Φ计算研究时间段内各O-D对(r,s)和O-D交通需求量q

步骤1:初始化,设置省际出行O-D对集合W为空集,令n=1;

步骤2:读取省际出行链集合Φ中的第n条出行链

步骤3:判断当前省际出行链

优选地,所述的方法还包括:

根据高速公路省际出行O-D及O-D交通量计算出省界收费站位置处的断面流量,包括如下的处理步骤:

步骤1:输入高速公路拓扑网络,建立高速公路省界断面集合H,设置所有省界断面的流量初始值为x

步骤2:读取集合W中的第k个O-D对w

步骤3:计算第k个O-D对之间的最短路径,并获取最短路径所经过的省界收费断面集H(w

步骤4:对于最短路径中的所有高速公路省界断面h∈H(w

步骤5:判断当前O-D对w

优选地,所述的方法还包括:

基于省际出行链集合统计省界收费站位置处的实际断面流量,包括如下的处理步骤:

步骤1:初始化,设置所有省界收费站位置处的实际断面流量的初始值为y

步骤2:读取省际出行链集合Φ中的第n条出行链

步骤3:提取出行链

步骤4:对于任意的h∈H

步骤5:判断当前省际出行链

由上述本发明的实施例提供的技术方案可以看出,本发明实施例基于全国的高速公路收费数据,结合全国高速公路网络拓扑数据、全国收费站基础信息数据等,给出了高速公路省际出行链的提取算法,计算了高速公路省际出行流量,并与统计得到的实际断面流量进行对比,有效提高了省际断面流量推算的实用性。

本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于高速公路收费数据的省际出行流量估算方法的处理流程图;

图2为本发明实施例提供的一种根据高速公路收费数据提取省际出行链的具体方法的具体流程图;

图3为本发明实施例提供的一种采用省际出行链集合Ω,计算研究时间段内各O-D对(r,s)和O-D交通需求量q

图4为本发明实施例提供的一种计算省界断面流量的方法的处理流程图;

图5为本发明实施例提供的一种基于省际出行链数据集,统计实际断面流量的方法的处理流程图;

图6为本发明实施例提供的一种预测路径与实际路径对比示意图。

具体实施方式

下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。

为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。

实施例一

为了解决现有技术的不足,提高省际流量估算的数据有效性和计算效率,提高省际流量估算的数据有效性和计算效率,本发明提供了一种基于高速公路收费数据的省际出行流量估算方法,该方法首先预处理高速公路收费数据。原始的高速公路收费数据存在大量冗余,还存在缺失或异常的错误数据,为保证数据质量,首先进行数据预处理。该方法的处理流程如图1所示,包括如下的处理步骤:

步骤S10:提取高速公路收费数据中的跨省出行相关的数据字段。通常情况下,高速公路收费数据包含与出行车辆信息、交易时间地点信息、交易金额信息等有关的24个字段。根据需要,本发明仅选择使用其中与跨省行为密切相关的6个字段,即收费卡ID、入口收费站编号、出口收费站编号、入口收费时间、出口收费时间和交易金额。

步骤S20:剔除省内出行数据。省内出行数据是指仅在同一省份内部进行的出行活动产生的数据,其入口收费站和出口收费站为相同省份的非省界收费站。省内出行数据与跨省出行流量的大小无关。由于在高速公路收费数据中,省内出行数据的占比很大(约占80%),因此,为了节省储存空间和提升计算效率,在本步骤率先将省内出行数据剔除。

收费数据清洗。高速公路收费数据存在大量的缺失和明显错误,为保证数据质量,需要对收费数据进行清洗。本发明针对高速公路收费数据制定了7种清洗规则,具体如下:

(1)清除卡号、出入口收费站和时间等关键字段存在明显错误或缺失的收费数据;

(2)清除入口收费站和出口收费站相同的收费数据;

(3)清除出口收费时间早于或等于入口收费时间的收费数据;

(4)清除在高速公路收费系统中停留时间过长的收费数据,入口时间和出口时间的间隔超过72小时被认为是停留时间过长;

(5)清除出口或入口收费时间不在研究时段内的收费数据;

(6)清除缴纳费用明显高于实际行驶里程或时间的收费数据;

(7)清除出入口收费站编号无法识别,不能与实际收费站相对应的收费数据。

步骤S30:根据收费数据中包含的车辆进出高速公路网络的时间和收费站等时间空间信息,提取跨省出行的省际出行链。取消省界收费站之前,跨省出行的车辆每经过一个省份,都在跨过省界或出行结束时缴费。因此,车辆的一次跨省出行会产生两条及以上的收费记录。将一次跨省出行的收费记录按照时间和出行轨迹排列的链路称省际出行链,本发明实施例提供的一种根据高速公路收费数据提取省际出行链的具体方法的具体流程如图2所示,包括如下的处理步骤:

步骤1:初始化。设省际出行链集合Ω为空集,读取高速公路收费数据集,并将其按照卡号和入口收费时间升序排列,排序后的数据集记为N,建立一个空队列Q,执行步骤2;

步骤2:读取数据集N中的第一条记录N

步骤3:读取数据集N中的第i条记录N

步骤4:判断第i条记录的卡号id

步骤5:判断第i条记录的入口收费站

步骤6:判断第i条记录的入口收费时间

步骤7:置Q为空队列,执行步骤8;

步骤8:将

步骤9:判断队列Q中的第一个元素和最后一个元素是否均为非省界收费站且这两个收费站所属的省份不同,如果是,将队列Q添加到省际出行链集合Ω,并清空队列Q中的所有元素,执行步骤10;否则执行步骤10;

步骤10:判断当前记录是否为最后一条记录,如果是则结束;否则置i=i+1,转到步骤3。

输出:省际出行链集合Φ。

步骤S40:基于提取的省际出行链集合,计算高速公路省际出行O-D及O-D交通量。

基于收费数据提取的省际出行链包含了研究时段内一次省际出行的O-D信息。采用省际出行链集合Ω,计算研究时间段内各O-D对(r,s)和O-D交通需求量q

步骤1:初始化,设置省际出行O-D对集合W为空集,令n=1;

步骤2:读取省际出行链集合Φ中的第n条出行链

步骤3:判断当前省际出行链

输出:O-D对集合W和O-D出行量q

步骤S50:基于省际出行O-D集合W和对应的O-D交通量,进行高速公路省际出行量估算。

其中,省际出行量是指位于我国省界线附近高速公路路段的断面流量。在本发明中,将高速公路省际出行断面流量具体定义为省界收费站位置处的断面流量,即省界断面流量。本发明实施例提供的一种计算省界断面流量的方法的处理流程如图4所示,包括如下的处理步骤:

步骤1:输入高速公路拓扑网络,建立高速公路省界断面集合H,设置所有省界断面的流量初始值为x

步骤2:读取集合W中的第k个O-D对w

步骤3:计算第k个O-D对之间的最短路径,并获取最短路径所经过的省界收费断面集H(w

步骤4:对于最短路径中的所有高速公路省界断面h∈H(w

步骤5:判断当前O-D对w

输出:高速公路省界断面流量x

步骤S60:基于省际出行链集合Φ,对研究时间段内实际经过高速公路省际出行断面的流量进行统计,并对估算的省界断面流量进行校验。

本发明实施例提供的一种基于省际出行链数据集,统计实际断面流量的方法的处理流程如图5所示,包括如下的处理步骤:

步骤1:初始化,设置所有实际断面流量的初始值为y

步骤2:读取省际出行链集合Φ中的第n条出行链

步骤3:提取出行链

步骤4:对于任意的h∈H

步骤5:判断当前省际出行链

输出:高速公路实际断面流量y

本发明针对全国高速公路收费数据的规范性、完整性与一致性存在不足,和现有的客流分配算法无法满足全国高速公路省际清分需要等问题,综合考虑了省际流量估算的数据有效性和计算效率,提供了一种基于高速公路收费数据的省际出行流量估算方法。

实施例二

本方法基于全国高速公路收费数据,对省际出行流量进行了估算。为保证收费数据的质量,并清除原始数据中存在的大量冗余,首先预处理高速公路收费数据。收费数据的预处理包括根据需要提取数据字段、剔除与省际出行量无关的省内收费数据、清洗存在缺失或明显错误的数据。其次,根据收费数据中车辆进出高速公路网络的时空信息,提取了跨省出行的省际出行链。省际出行链是将一次跨省出行的所有收费记录,按照时间和出行轨迹排列的链路。省际出行链完整地包含了研究时段内省际出行的O-D信息和途径的所有省界收费站。因此,可基于省际出行链集合提取高速公路省际出行的所有O-D和O-D交通量。最后,基于高速公路拓扑网络和省际出行O-D,采用交通流分配方法对O-D交通量进行网络加载,完成高速公路省界断面流量的估算。此外,为了保证估算结果的精度,本发明基于省际出行链集合,统计了研究时间段内经过各个省界断面的实际流量,并利用省界断面实际流量对省界断面流量的估算结果进行了比对和校验。

在这里,用部分高速公路收费数据对本发明所发明的省际出行流量估算方法进行说明。预处理后,并以“收费卡ID”(简称“卡号”)为主要关键字、“入口收费时间”为次要关键字将收费数据升序排列的收费数据样例如表1所示。其中,入口收费时间和出口收费时间的默认年月日为2018年6月1日。对表1涉及到的各入口收费站和出口收费站的补充信息如表2所示。表2中收费站的顺序编号为各收费站在全国高速公路收费站数据集S中的序列号。

表1:高速公路收费数据样例

表2:收费站补充信息

基于以上收费数据样例共提取出4条省际出行链,用收费站的顺序编号表示这4条省际出行链中的元素,如下表3所示。4条省际出行链在地理地图上的可视化分别如图5(a-d)中的“实际路径”所示。提取的省际出行链均满足以下特征:

(1)在空间上相互连续。在省际出行链中,前一条收费记录的出口收费站和后一条收费记录的入口收费站在省界处连续。例如,编号为1的收费记录的出口收费站和编号为2的收费记录的入口收费站在浙苏省界通过一段很短的高速公路直接相连。

(2)在时间上相互衔接。在省际出行链中,前一条收费记录的出口收费时间等于后一条收费记录的入口收费时间,两条记录在时间上相互衔接。例如,编号为1的收费记录的出口收费时间和编号为2的收费记录的入口收费时间相等,均为09:13。

(3)收费站属性特征。省际出行链的首元素和末元素均为非省界收费站,且所属省份不同;其他收费站均为省界收费站。例如,在表3中编号为1的省际出行链中,收费站8326和6968均为非省界收费站,且分别属于浙江省和山东省;收费站8098,8099,7027和7019均为省界收费站。

表3:收费数据样例提取的省际出行链

基于省际出行链提取省际出行O-D及O-D交通量。从表3所示的4条省际出行链中,共提取出4个不同的O-D对,分别为(8326,6968)、(315,913)、(6017,7301)和(152,4574)。这4个O-D对的O-D交通量均为1。

图6为本发明实施例提供的一种预测路径与实际路径对比示意图。基于省际出行O-D估算高速公路省际出行量的具体计算步骤如下:

(1)O-D对(8326,6968):基于高速公路拓扑网络计算O-D对(8326,6968)的最短路径,如图5(a)中的“预测路径”所示,该最短路径共经过4个省界断面,分别为8098,8099,7027和7019,这4个断面的省界断面流量分别加1;

(2)O-D对(315,913):计算O-D对(315,913)的最短路径如图5(b)中的“预测路径”所示,该最短路径共经过2个省界断面,分别为481和489,这2个断面的省界断面流量分别加1;

(3)O-D对(6017,7301):计算O-D对(6017,7301)的最短路径如图5(c)中的“预测路径”所示,该最短路径共经过4个省界断面,分别为6490,6491,6914和6087,这4个断面的省界断面流量分别加1;

(4)O-D对(152,4574):计算O-D对(152,4574)的最短路径如图5(d)中的“预测路径”所示,该最短路径共经过4个省界断面,分别为839,861,2356和2412,这4个断面的省界断面流量分别加1。

计算的省界断面流量结果为:省界断面8098,8099,7027,7019,481,489,6490,6491,6914,6087,839,861,2356和2412的流量均为1,其他省界断面的流量为0。

最后,通过统计省际断面的实际流量,对估算的省界断面流量结果进行校验。提取第一条省际出行链中的省界收费站,分别为8098,8099,7027和7019,这4个省界收费站的实际断面流量分别加1;提取第二条省际出行链中的省界收费站,分别为481和489,这2个省界收费站的实际断面流量分别加1;提取第三条省际出行链中的省界收费站,分别为6490,6491,6914和6087,这4个省界收费站的实际断面流量分别加1;提取第四条省际出行链中的省界收费站,分别为839,861,2356和2412,这4个省界收费站的实际断面流量分别加1。

最终结果为:省界断面8098,8099,7027,7019,481,489,6490,6491,6914,6087,839,861,2356和2412的实际流量均为1,其他省界断面的实际流量为0。经检验,根据表1收费数据样例计算得到的省界断面流量的估算结果与实际值完全一致。

综上所述,本发明实施例基于全国的高速公路收费数据,结合全国高速公路网络拓扑数据、全国收费站基础信息数据等,给出了高速公路省际出行链的提取算法,计算了高速公路省际出行流量,并与统计得到的实际断面流量进行对比,有效提高了省际断面流量推算的实用性。

本发明实施例的基于高速公路收费数据的省际出行流量估算方法在流量分配过程中考虑了出行者的实际选择行为,即出行者更倾向于选择最短路出行,使得O-D对之间的预测路径更接近实际。

本发明实施例的基于高速公路收费数据的省际出行流量估算方法用于解决大规模网络的清分问题。

本发明提出的省际出行链提取算法、省际断面流量估算方法等结构简单,通过设置外循环,逐条处理集合中的数据,有效保证了算法的计算效率。

本发明实施例的基于高速公路收费数据的省际出行流量估算方法基于简单实用的全有全无流量分配算法,对省际出行O-D进行网络加载,容易实施。

本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号