首页> 中国专利> 一种基于GRU的多因素感知短期景区内游客人数预测方法

一种基于GRU的多因素感知短期景区内游客人数预测方法

摘要

本发明涉及一种基于GRU的多因素感知短期景区内游客人数预测方法,具体实施如下:1)对原始景区数据进行预处理,得到多个时间序列和预测时刻的相关情境信息及其距当前时刻的时刻数;2)利用CNN卷积神经网络提取时间序列的特征向量;利用GRU网络处理CNN提取的特征向量,得到时序特征向量;3)将GRU中得到的时序特征向量和预测时刻的相关情境信息及其距当前时刻的时刻数独热(one‑hot)编码相连接,输入到全连接层中,得到预测时刻景区内游客人数。本发明利用CNN和GRU处理景区多时序数据,并加入预测时刻的相关情境信息及其距当前时刻的时刻数来预测短期景区内游客人数,在智能旅游、流量预测等领域具有广阔的应用前景。

著录项

  • 公开/公告号CN109389244A

    专利类型发明专利

  • 公开/公告日2019-02-26

    原文格式PDF

  • 申请/专利权人 浙江鸿程计算机系统有限公司;

    申请/专利号CN201811038526.3

  • 申请日2018-09-06

  • 分类号G06Q10/04(20120101);G06K9/00(20060101);G06N3/04(20060101);G06N3/08(20060101);G06Q50/14(20120101);

  • 代理机构33216 杭州之江专利事务所(普通合伙);

  • 代理人张慧英

  • 地址 310053 浙江省杭州市滨江区浦沿街道伟业路1号2幢

  • 入库时间 2024-02-19 06:53:11

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-08-18

    授权

    授权

  • 2019-03-22

    实质审查的生效 IPC(主分类):G06Q10/04 申请日:20180906

    实质审查的生效

  • 2019-02-26

    公开

    公开

说明书

技术领域

本发明涉及旅游人数预测方法领域,尤其涉及一种基于GRU的多因素感知短期景区内游客人数预测方法。

背景技术

随着社会经济的飞速发展和人们生活水平的提高,出门旅游的人越来越多,给景区管理带来很大挑战。而短期景区内游客人数预测则能为景区科学管理与流量合理调度提供重要的数据依据。

短期景区内游客人数预测方法大致可分为基于自回归模型的方法、基于传统机器学习的方法和基于深度学习的方法。自回归模型有自回归滑动平均模型(ARMA)、自回归积分滑动平均模型(ARIMA)等,是研究时间序列经典的模型,擅长解决变化平稳的时间序列预测问题。然而,这类模型只能处理线性变化的时间序列且很难利用其他影响景区内游客人数的因素。传统机器学习的模型主要有因子分解机、支持向量回归(SVR)等,有相对完善的理论基础,能在数据较为稀疏的情况下挖掘出特征间的关系。然而,这类模型在景区内游客人数预测时忽略了相关时序数据,并且在建立时需要经过大量的分析来选择关键参数。随着深度学习的发展,出现了一些基于深度学习的景区内游客人数预测模型,利用卷积神经网络(CNN)、长短时记忆网络(LSTM)等提取深度特征。然而,这类模型虽然能充分学习数据间的关系,但没有考虑相关时序数据或者考虑了相关时序数据但忽略了非时序数据,如情境信息等。

发明内容

本发明为克服上述的不足之处,目的在于提供一种基于GRU的多因素感知短期景区内游客人数预测方法,本发明方法首先对原始景区数据进行预处理得到多个时间序列和预测时刻的相关情境信息及其距当前时刻的时刻数;然后利用CNN提取时间序列的特征向量;再利用GRU处理通过CNN提取的特征向量得到时序特征向量;将时序特征向量和预测时刻的相关情境信息及其距当前时刻的时刻数独热(one-hot)编码相连接,送入全连接层,得到预测时刻景区内游客人数。本发明充分利用景区的多时序数据和非时序数据来预测短期景区内游客人数,在智能旅游、流量预测等领域具有广阔的应用前景。

本发明是通过以下技术方案达到上述目的:一种基于GRU的多因素感知短期景区内游客人数预测方法,包括数据处理、特征提取、游客人数预测三个阶段,具体步骤如下:

(1)数据处理阶段:对获取得到的原始景区数据进行预处理,得到多个时间序列和预测时刻的相关情境信息及其距当前时刻的时刻数;

(2)特征提取阶段:利用CNN卷积神经网络提取时间序列的特征向量,并利用GRU网络处理CNN提取的特征向量,得到时序特征向量;

(3)游客人数预测阶段:将GRU中得到的时序特征向量和预测时刻的相关情境信息及其距当前时刻时刻数的one-hot编码相连接,输入到全连接层中,得到预测时刻景区内游客人数。

作为优选,所述数据处理阶段的具体步骤如下:

(1.1)获取当前时刻前m个时刻的景区闸机数据、监控点车辆数据和预测时刻的相关情境信息及其距当前时刻的时刻数n;

(1.2)将景区闸机数据处理成3个时间序列,分别是景区内游客人数xtot,进入景区游客流量xin,离开景区游客流量xout

(1.3)按车牌信息将车辆分为本地、外地本省和外省三类,按车辆类型将车辆分为客车和轿车两类,将景区附近监控点车辆数据处理成12个时间序列,分别为本地客车进入流量xttbin,本地客车离开流量xttbout,本地轿车进入流量xttcin,本地轿车离开流量xttcout,外地本省客车进入流量xtfbin,外地本省客车离开流量xtfbout,外地本省轿车进入流量xtfein,外地本省轿车离开流量xtfcout,外省客车进入流量xffbin,外省客车离开流量xffbut,外省轿车进入流量xffcin,外省轿车离开流量xffcout

(1.4)对每个时间序列进行归一化处理;

(1.5)对预测时刻的相关情境信息及其距当前时刻的时刻数n进行one-hot编码得到向量表示vt、vh、vw、vn

作为优选,所述在步骤(1.1)中,景区闸机数据包括游客进入景区数据和游客离开景区数据;相关情境信息包括时间段、节假日、天气状况;获取预测时刻的相关情境信息(时间段、节假日、天气状况)及其距当前时刻的时刻数n时,时间段按上午(08:00~10:59)、中午(11:00~13:59)、下午(14:00~17:00)划分,节假日按小长假或黄金周、周末、工作日划分,天气状况按sunny、cloudy、rainy、snowy、foggy、clear划分;其中,天气状况基于景区天气预报得到。

作为优选,所述在步骤(1.4)中,对每个时间序列进行最大最小归一化处理,使处理后的数据归一化到[0,1]的范围,公式如下:

其中,x为原始数值,xmax为该数值所在时间序列的最大值,xmin为该数值所在时间序列的最小值。

作为优选,所述特征提取阶段的具体步骤如下:

(2.1)将归一化后的时间序列xtot按长度s进行划分,其中s能整除m,划分后分别输入到CNN中,得到特征向量集其中表示时间序列xtot的第i段s个时刻的特征向量;

(2.2)对剩下的14个时间序列xin、xout、xttbin、xttbout、xttcin、xttcout、xtfbin、xtfbout、xtfcin、xtfcout、xffbin、xffbout、xffcin、xffcout重复步骤1,得到特征向量集

(2.3)将所有特征向量集中同一时间的特征向量拼接得到V={vi,1≤i≤m/s},其中表示第i段s个时刻的特征向量;

(2.4)将V中的特征向量按时间顺序输入到GRU中,得到时序特征向量vs

作为优选,所述的CNN卷积神经网络包含卷积层和池化层,每层包含多个神经单元:

(i)卷积层:以数据a为输入,对其进行核卷积,输出数据的特征图:

其中l表示层数,表示在l+1层的第j个特征图,K为卷积核,b为偏置量,ReLU为激活函数;

(ii)池化层:用最大池化操作对数据进行下采样:

其中,为在l+1层第i个神经单元的数值,r表示池化区域大小。

作为优选,所述的GRU网络是一类循环神经网络,每个GRU单元包含一个记忆单元ct和两个门:更新门zt和重置门rt,分别控制数据的更新和重置;以xt为t时刻的输入,ht-1和ct-1为前一时刻的隐状态和记忆单元状态,计算公式如下:

rt=sigm(Wxrxt+Whrht-1)

zt=sigm(Wxzxt+Whzht-1)

ct=tanh(Wxcxt+Whc(rt°ht-1))

ht=(1-zt)°ht-1+zt°ct

其中,操作符°表示点乘运算,W表示权重矩阵,sigm和tanh分别表示sigmoid函数和双曲正切函数;

在步骤(2.4)中,GRU网络是包含m/s个GRU单元的单层GRU;将V中的特征向量分别输入对应GRU单元,通过GRU网络得到时序特征向量vs;在GRU网络中,上一时刻的状态输入到下一GRU单元中,保留了数据的时序信息。

作为优选,所述游客人数预测阶段的步骤如下:

(3.1)将GRU中得到的时序特征向量vs与预测时刻的相关情境信息及其距当前时刻时刻数n的one-hot编码vt、vh、vw以及vn相连接,得到全连接层的输入向量vf

(3.2)将输入向量vf输入到全连接层中,得到预测时刻景区内游客人数。

作为优选,所述得到预测时刻景区内游客人数的方法为:全连接层将通过GRU得到的特征进行加权,公式如下:

yt=xtw

xt为输入向量,w为权重,yt为经过全连接后得到的预测时刻景区内游客人数,其中全连接层神经元数为1,激活函数为LeakyReLU。

本发明的有益效果在于:(1)本发明充分考虑了景区闸机数据、监控点车辆数据中的多时序数据和预测时刻的相关情境信息(时间段、节假日、天气状况)及其距当前时刻的时刻数;(2)本发明利用深度学习方法(CNN和GRU)提取时序特征,避免了传统方法造成的信息丢失,对短期景区内游客人数进行准确预测。

附图说明

图1是本发明方法的流程框架图。

具体实施方式

下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此:

实施例:一种基于GRU的多因素感知短期景区内游客人数预测方法,如图1所示,包括数据处理、特征提取和游客人数预测三个阶段,具体如下:

(1)数据处理阶段:

步骤1,获取当前时刻前m个时刻的景区闸机数据、监控点车辆数据和预测时刻的相关情境信息(时间段、节假日、天气状况)及其距当前时刻的时刻数n。

获取当前时刻前m个时刻的景区闸机数据(包括游客进入景区数据和游客离开景区数据)和监控点车辆数据。

获取预测时刻的相关情境信息(时间段、节假日、天气状况)及其距当前时刻的时刻数n。时间段按上午(08:00~10:59)、中午(11:00~13:59)、下午(14:00~17:00)划分,节假日按小长假或黄金周、周末、工作日划分,天气状况按sunny、cloudy、rainy、snowy、foggy、clear划分。其中,天气状况基于景区天气预报得到。

步骤2,将景区闸机数据处理成3个时间序列(景区内游客人数xtot,进入景区游客流量xin,离开景区游客流量xout)。

步骤3,按车牌信息将车辆分为本地、外地本省和外省三类,按车辆类型将车辆分为客车和轿车两类,将景区附近监控点车辆数据处理成12个时间序列(本地客车进入流量xttbin,本地客车离开流量xttbout,本地轿车进入流量xttcin,本地轿车离开流量xttcout,外地本省客车进入流量xtfbin,外地本省客车离开流量xtfbout,外地本省轿车进入流量xtfcin,外地本省轿车离开流量xtfcout,外省客车进入流量xffbin,外省客车离开流量xffbout,外省轿车进入流量xffcin,外省轿车离开流量xffcout)。

步骤4,对每个时间序列进行归一化处理。

对每个时间序列进行最大最小归一化处理,使处理后的数据归一化到[0,1]的范围,公式如下:

x为原始数值,xmax为该数值所在时间序列的最大值,xmin为该数值所在时间序列的最小值。

步骤5,对预测时刻的相关情境信息(时间段、节假日、天气状况)及其距当前时刻的时刻数n进行one-hot编码得到向量表示vt、vh、vw、vn

(2)特征提取阶段:

步骤1,将归一化后的时间序列xtot按长度s(s能整除m)进行划分,分别输入到CNN中,得到特征向量集其中表示时间序列xtot的第i段s个时刻的特征向量。

本方法构建的CNN包含卷积层和池化层,每层包含多个神经单元。

(i)卷积层:以数据a为输入,对其进行核卷积,输出数据的特征图:

其中l表示层数,表示在l+1层的第j个特征图,K为卷积核,b为偏置量,ReLU为激活函数。

(ii)池化层:用最大池化操作对数据进行下采样:

为在l+1层第i个神经单元的数值,r表示池化区域大小。

具体网络如图1中特征提取阶段虚线框所示,不同的时间序列采用的CNN网络结构相同,但学习到的网络参数不同。同一时间序列的不同段采用的CNN网络结构相同且共享网络参数。若窗口参数s为60,卷积层和池化层的参数如图1中特征提取阶段虚线框所示,卷积层中@前的数值表示卷积核大小,@后的数值表示卷积核数目,池化层中数值表示池化操作的大小;若窗口参数s发生改变,卷积层和池化层的参数也要做相应调整。输入时间序列经过一系列卷积和池化得到对应的特征向量。

步骤2,对剩下的14个时间序列xin、xout、xttbin、xttbout、xttecin、xttcout、xtfbin、xtfcout、xtfcin、xtfcout、xffbin、xffbout、xffcin、xffcout重复步骤1,得到特征向量集

步骤3,将所有特征向量集中同一时间的特征向量拼接得到V={vi,1≤i≤m/s},其中表示第i段s个时刻的特征向量。

步骤4,将V中的特征向量按时间顺序输入到GRU中,得到时序特征向量vs

GRU网络是一类循环神经网络,每个GRU单元包含一个记忆单元ct和两个门:更新门zt和重置门rt,分别控制数据的更新和重置。以xt为t时刻的输入,ht-1和ct-1为前一时刻的隐状态和记忆单元状态,计算公式如下:

rt=sigm(Wxrxt+Whrht-1)>

zt=sigm(Wxzxt+Whzht-1)>

ct=tanh(Wxcxt+Whc(rt°ht-1))>

ht=(1-zt)°ht-1+zt°ct>

操作符°表示点乘运算,W表示权重矩阵,sigm和tanh分别表示sigmoid函数和双曲正切函数。

本方法构建的GRU网络是包含m/s个GRU单元的单层GRU。将V中的特征向量分别输入对应GRU单元,通过GRU网络得到时序特征向量vs。在GRU网络中,上一时刻的状态输入到下一GRU单元中,保留了数据的时序信息。

(3)游客人数预测阶段:

步骤1,将GRU中得到的时序特征向量vs与预测时刻的相关情境信息及其距当前时刻时刻数n的one-hot编码vt、vh、vw以及vn相连接,得到全连接层的输入向量vf

步骤2,将输入向量vf输入到全连接层中,得到预测时刻景区内游客人数。

全连接层将通过GRU得到的特征进行加权,公式如下:

yt=xtw>

xt为输入向量,w为权重,yt为经过全连接后得到的预测时刻景区内游客人数。其中全连接层神经元数为1,激活函数为LeakyReLU。

以上的所述乃是本发明的具体实施例及所运用的技术原理,若依本发明的构想所作的改变,其所产生的功能作用仍未超出说明书及附图所涵盖的精神时,仍应属本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号