首页> 中国专利> 基于BP神经网络非线性组合的SARIMA-GRU时序预测模型

基于BP神经网络非线性组合的SARIMA-GRU时序预测模型

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提供了基于BP神经网络非线性组合的SARIMA‑GRU时序预测模型，属于时间序列预测技术领域；解决了如何综合利用多种预测方法所提供的有效信息，通过多个角度分析数据从而获得更好的预测结果的技术问题；解决上述技术问题采用的技术方案为：包括如下步骤：数据预处理：对原始时序数据进行预处理，并划分训练集和测试集；搭建SARIMA时序预测模型：对训练集数据进行平稳性检测，确定SARIMA模型的参数，得到SARIMA时序预测模型；搭建GRU时序预测模型：通过智能优化算法搜索GRU网络超参数，通过梯度下降算法训练GRU网络，得到GRU时序预测模型；搭建BP‑SARIMA‑GRU时序预测模型：构造BP神经网络的训练集，拟合BP神经网络，得到BP‑SARIMA‑GRU时序预测模型；评估BP‑SARIMA‑GRU模型；本发明应用于时序预测。

著录项

公开/公告号CN114943328A

专利类型发明专利
公开/公告日2022-08-26

原文格式PDF
申请/专利权人山西清众科技股份有限公司;
展开▼

申请/专利号CN202210708948.7
发明设计人高志熙;李宁;韩晓红;刘剑;侯祥敏;张云仙;张凯杰;梁宏锦;柏华伟;
展开▼

申请日2022-06-21
分类号G06N3/04(2006.01);G06N3/08(2006.01);G06Q10/06(2012.01);G06K9/62(2022.01);
代理机构太原高欣科创专利代理事务所(普通合伙) 14109;太原高欣科创专利代理事务所(普通合伙) 14109;
代理人孟肖阳;冷锦超
地址 030006 山西省太原市综改示范区学府园区南中环街529号清控创新基地A座7层
入库时间 2023-06-19 16:31:45

法律信息

法律状态公告日

法律状态信息

法律状态
2022-09-13

实质审查的生效 IPC(主分类):G06N 3/04 专利申请号:2022107089487 申请日:20220621

实质审查的生效

说明书

技术领域

本发明提供了一种基于BP神经网络非线性组合的SARIMA-GRU时序预测模型，属于计算机技术的时间序列预测技术领域。

背景技术

时间序列是指某一类统计指标的数值按照发生时间的先后顺序排列形成的序列，时间序列预测是根据已有历史数据来预测未来可能的变化趋势，从而为理论研究和工程应用等提供科学的决策支持。常用的时序预测方法有：统计学中的ARMA、ARIMA、SARIMA模型以及深度学习中的RNN、LSTM、GRU等。由于时间序列受到多方面因素的影响，通常同时包含线性成分和非线性成分，并且具有非平稳性和快速变换等特点，因此在实际预测工作中，单个模型在某些特定的时间或状态下有很好的预测效果，但面对复杂的环境变化时单项预测模型的准确性可能会降低。例如SARIMA模型在应对平稳且线性的时间序列预测问题中已经很好效果，但在应对非线性数据时预测精度较低；GRU网络在学习数据长期依赖关系并挖掘其中隐藏的关联信息方面具有独特优势，但在分析时间序列时会忽略线性因素造成的影响，对线性成分的挖掘效果欠佳。

对于同一预测问题往往可以采用多种方法进行求解，这些方法表现出不同的特点，适用于具有不同特征的时间序列。因此，可以按照一定规则将多个模型进行组合，综合利用这些方法所提供的有效信息，从多个角度分析数据，突出各个方法的优点，避免各个方法的缺点，从而提高模型的预测精度及稳定性，取得更好的预测结果。作为统计学和深度学习中经典的时序预测模型，SARIMA和GRU的组合模型已被广泛使用，但当前学者对于SARIMA 和GRU的组合方式都是通过最小二乘估计法或误差倒数法来实现的，这些方法只是通过简单线性相加的方式求解单项模型的预测值在组合中的最优权重，无法及时反应复杂环境的动态变化从而影响到犯罪预测模型的鲁棒性以及预测结果的准确率。

为解决上述问题，本发明提出一种基于BP神经网络非线性组合的SARIMA-GRU时序预测模型，综合利用了GRU网络在非线性特征挖掘上的优势和SARIMA模型在线性时序预测中的优势，可以很好的捕捉时序数据的复合特征并及时反应环境的动态变化，从而获得更好的预测结果。

发明内容

本发明为了克服现有技术中存在的不足，所要解决的技术问题为：提供一种结构的改进。

为了解决上述技术问题，本发明采用的技术方案为：基于BP神经网络非线性组合的SARIMA-GRU时序预测模型，包括如下步骤：

步骤1：数据预处理：对原始时序数据进行预处理，并划分训练集和测试集；

步骤2：搭建SARIMA时序预测模型：对训练集数据进行平稳性检测，确定SARIMA 模型的参数，得到SARIMA时序预测模型；

步骤3：搭建GRU时序预测模型：通过智能优化算法搜索GRU网络超参数，通过梯度下降算法训练GRU网络，得到GRU时序预测模型；

步骤4：搭建BP-SARIMA-GRU时序预测模型：构造BP神经网络的训练集，拟合BP 神经网络，得到BP-SARIMA-GRU时序预测模型；

步骤5：评估BP-SARIMA-GRU模型：将SARIMA和GRU模型在测试集上的预测结果作为输入，得到BP-SARIMA-GRU模型的组合预测结果，计算组合预测结果与真实值间的误差从而评估组合模型的效果。

所述步骤2中搭建SARIMA时序预测模型的具体步骤如下：

首先对原始的时序数据进行平稳化处理，然后进行模型定阶和参数估计操作，找到最佳的(p,d,q)×(P,D,Q)

上式中：Φ(B)表示p阶自回归多项式，Θ(B)表示q阶移动平均多项式；U(B

找到最佳参数(P,D,Q)

上式中：Δ

所述步骤3中搭建GRU时序预测模型的具体步骤如下：

通过智能优化算法搜索GRU网络的最佳隐藏层结构和时间步长超参数，并基于梯度下降算法来模型的权重参数，GRU主要由更新门z

上式中：h

所述步骤4中BP—SARIMA-GRU时序预测模型中的BP神经网络的输入数据为SARIMA和GRU模型在训练集上的预测结果，输出为真实值，隐藏层节点数j，BP神经网络的结构为2-j-1，采用MAE作为损失函数，ReLU为激活函数，采用Adam算法进行训练拟合，将各层神经元所确定的权重矩阵作为两种方法组合预测中的比重。

本发明相对于现有技术具备的有益效果为：本发明提出的BP—SARIMA-GRU模型可以从多个角度分析数据，获取全面的动态信息从而提高模型的预测精度及稳定性。具体而言，该模型通过BP神经网络将GRU和SARIMA模型的预测结果进行非线性组合，综合利用了GRU网络在非线性特征挖掘上的优势和SARIMA模型在线性时序预测中的优势，可以很好的捕捉时序数据的复合特征并及时反应环境的动态变化，从而获得更好的预测结果。

附图说明

下面结合附图对本发明做进一步说明：

图1为本发明的BP-SARIMA-GRU时序预测模型构建的流程图；

图2为本发明GRU的内部结构示意图。

具体实施方式

如图1-2所示，本发明要解决的问题：在时间序列预测中，“如何综合利用多种预测方法所提供的有效信息，通过多个角度分析数据从而获得更好的预测结果”。当前的时序预测模型都是基于单一算法或简单线性组合的方式来实现，此类模型无法捕捉到数据中的复合特征或无法及时反应环境的动态变化，在预测结果的准确率和稳定性方面都存在缺陷。因此本发明通过BP神经网络非线性组合的SARIMA-GRU模型重新执行时序预测问题，该模型将 GRU和SARIMA模型的预测结果通过BP网络非线性组合，采用反向传播算法进行权重学习，将各层神经元所确定的权重矩阵作为两种方法在组合预测中的比重，综合利用GRU网络在非线性特征挖掘上的优势和SARIMA模型在线性时序预测中的优势，突出各个方法的优点，避免各个方法的缺点，从而获得更好的预测结果。

本发明解决其技术问题所采用的技术方案包括以下步骤：

步骤1：数据预处理。对原始数据进行预处理操作，以保证模型的拟合效果。

步骤2：搭建SARIMA模型。首先对原始的时序数据进行平稳化处理，然后进行模型定阶和参数估计等操作，找到最佳的(p,d,q)×(P,D,Q)

参数P、D、Q分别表示季节性自回归阶数、季节性差分阶数和季节性移动平均阶数，S 为季节周期数。具体计算公式如式(2)所示。其中B为滞后算子，B

步骤3：搭建GRU模型。通过智能优化算法搜索GRU网络的最佳隐藏层结构和时间步长等超参数，并基于梯度下降算法来模型的权重参数。GRU是改进版的LSTM，具有结构简单、参数少、训练速度快等优点，GRU主要由更新门z

步骤4：搭建BP-SARIMA-GRU模型。本发明中BP神经网络的输入数据为SARIMA 和GRU模型在训练集上的预测结果，输出为真实值，通过实验测试最佳的隐藏层节点数J，即BP神经网络的结构为2-j-1，选用MAE作为损失函数，ReLU为激活函数，采用Adam 算法进行训练拟合，将各层神经元所确定的权重矩阵作为两种方法在组合预测中的比重。

步骤5：评估BP-SARIMA-GRU模型。将SARIMA和GRU模型在测试集上的预测结果作为输入，得到BP-SARIMA-GRU模型的预测值

下面结合附图和实施例对本发明进一步说明。

1.数据预处理。本发明使用某市的真实案件数据进行验证，首先将案发记录中的离群值和无效数据进行剔除，然后对案件类型和时空信息都相同的重复记录进行去重，最后对案件时空信息不完整不精确的记录进行修补，得到完整且格式统一的案件时序数据以保证模型的训练效果。取75％的数据作为训练集，剩余25％用于测试。

2.搭建SARIMA模型。首先通过单位根检验案件时序数据中是否存在单位根，由ADF的检测结果可知d＝1，D＝1；然后通过BIC准则评估性能最优的模型，遍历参数p、q、P、 Q所有可能的组合情况，选取BIC值最小的SARIMA(0,1,1)×(0,1,1)

3.搭建GRU模型。本实验搭建含两个隐藏层和一个全连接层的GRU模型，通过智能优化算法来搜索模型的最佳隐藏层单元数和时间步长，选用MAE作为损失函数，ReLU为激活函数，以Adam为优化器对每个候选结构训练1000次。两个隐藏层的神经元个数最终稳定在35和22，时间步长的最终取值为7，即根据之前7天的数据来预测未来一天的案件数量可以取得最好的效果，最终得到性能最优的GRU案件预测模型。

4.搭建BP-SARIMA-GRU模型。本发明中BP神经网络的输入数据为SARIMA和GRU 模型在训练集上的预测结果，输出为案件数量的真实值，选用MAE作为损失函数，ReLU 为激活函数，采用Adam算法进行训练拟合，将各层神经元所确定的权重矩阵作为两种方法在组合预测中的比重。通过消融实验可知，当BP神经网络的最佳隐藏层节点数j＝8时可以得到最好的案件预测效果，即BP神经网络的拓扑结构为2-8-1。

5.评估BP-SARIMA-GRU模型。本实验采用RMSE作为评估标准，将SARIMA和GRU 模型在测试集上的预测结果作为输入，得到BP-SARIMA-GRU模型对案件数量的预测值

关于本发明具体结构需要说明的是，本发明采用的各部件模块相互之间的连接关系是确定的、可实现的，除实施例中特殊说明的以外，其特定的连接关系可以带来相应的技术效果，并基于不依赖相应软件程序执行的前提下，解决本发明提出的技术问题，本发明中出现的部件、模块、具体元器件的型号、连接方式除具体说明的以外，均属于本领域技术人员在申请日前可以获取到的已公开发明、已公开的期刊论文、或公知常识等现有技术，无需赘述，使得本案提供的技术方案是清楚、完整、可实现的，并能根据该技术手段重现或获得相应的实体产品。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于PSO-BP神经网络的天然气湿气管道持液率预测模型方法 [P] . 中国专利： CN114818487A . 2022-07-29
2. 一种基于BP神经网络预测模型的舵角发生器 [P] . 中国专利： CN115056959A . 2022-09-16
3. PHYSICAL PROPERTY PREDICTION MODEL FOR PREDICTING MELTING POINT BASED ON QUANTITATIVE STRUCTURE-ACTIVITY RELATIONSHIP USING LINEAR AND NONLINEAR MACHINE LEARNING METHODS [P] . 韩国专利： KR20160127486A . 2016-11-04

机译：基于线性和非线性机器学习方法的定量结构-活动关系预测熔化点的物理性能预测模型
4. PHYSICAL PROPERTY PREDICTION MODEL FOR PREDICTING BOILING POINT BASED ON QUANTITATIVE STRUCTURE-ACTIVITY RELATIONSHIP USING LINEAR AND NONLINEAR MACHINE LEARNING METHODS [P] . 韩国专利： KR20160127487A . 2016-11-04

机译：基于线性和非线性机器学习方法的定量结构-活度关系预测沸点的物理属性预测模型
5. TOXICITY PREDICTION MODEL FOR PREDICTING ACUTE ORAL TOXICITY BASED ON QUANTITATIVE STRUCTURE-TOXICITY RELATIONSHIP BY USING NON-LINEAR LEARNING METHOD [P] . 韩国专利： KR20160132559A . 2016-11-21

机译：基于非线性学习方法的定量结构-毒性关系预测急性口腔毒性的毒性预测模型