首页> 中国专利> 一种基于改进ELM模型的月径流变化趋势预测方法

一种基于改进ELM模型的月径流变化趋势预测方法

摘要

一种基于改进ELM模型的月径流变化趋势预测方法,包括以下步骤:S1、构造影响月径流变化趋势的径流综合指数及其影响对象,获得前期的观测值,并以前期若干月的观测值作为初选因子;S2、基于偏互信息法对初选因子进行因子筛选;S3、改进粒子群算法并构建IPSO‑ELM模型;S4、基于IPSO‑ELM模型预测月径流变化趋势。构造表征流域整体径流变化趋势的径流综合指数及其影响对象,能够实现整个流域径流变化趋势的综合表征;采用偏互信息法,获得影响月径流过程变化的关键因子集;结合10折交叉验证与改进粒子群算法优化ELM参数,并据此构建的IPSO‑ELM模型,能够有效提高中长期径流变化趋势的预测效果。

著录项

  • 公开/公告号CN113052373A

    专利类型发明专利

  • 公开/公告日2021-06-29

    原文格式PDF

  • 申请/专利权人 南京工业职业技术大学;

    申请/专利号CN202110284457.X

  • 发明设计人 岳兆新;廖常武;周惠;彭建华;

    申请日2021-03-17

  • 分类号G06Q10/04(20120101);G06N3/00(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构32356 南京灿烂知识产权代理有限公司;

  • 代理人朱妃

  • 地址 210023 江苏省南京市栖霞区仙林大学城羊山北路1号

  • 入库时间 2023-06-19 11:39:06

说明书

技术领域

本发明涉及水文预报技术领域,尤其是一种基于改进ELM模型的月径流变化趋势预测方法。

背景技术

及时、准确的中长期水文预报可为水资源高效利用、水利工程建设与运行,以及防汛抗旱指挥决策等提供重要的基础数据和科学的决策依据。当前,中长期水文预报仍然处于探索、发展阶段,预报精度还不能满足各生产部门的实际需求。

常用的中长期径流预测方法主要有成因分析方法、统计学方法、基于智能算法的预测方法和基于数值天气预报的预测方法四大类。其中,其中,成因分析方法和统计学方法是水文学科的典型方法,具有一定的适用范畴,但也存在诸多需要研究的问题。比如影响径流序列长期变化的物理成因复杂,难以完全掌握其客观规律。而统计学方法多以线性方法为主,难以适应径流变化影响要素的复杂非线性特性,具有一定的局限性。基于智能算法和数值天气预报的综合预测方法是近些年发展起来的新方法,是伴随计算机信息技术的发展和新数学建模方法的涌现而发展起来的新技术。前者具有较好的非线性映射、泛化和容错能力,被广泛应用于径流预测领域;后者则在水文预报中耦合一定预见期内的数值天气预报产品,在探索增长径流预报预见期方面,具有一定的研究意义。

基于智能算法的中长期径流预测模型主要根据输入、输出变量之间的函数关系构建基于人工神经网络、支持向量机等预测模型对未来中长期径流进行预测分析。尽管上述基于智能算法的预测模型应用广泛,但模型结构相对复杂,参数在训练过程中需要初始化以及不断优化调整,效率相对较低,且BP神经网络采用基于梯度下降的方法,容易陷入局部最小值问题,算法需要多次迭代,因而整体效率不高。极限学习机(Extreme LearningMachine,ELM)是一种单隐层前馈神经网络,相对于BP神经网络和支持向量机,极限学习机具有参数设置简单、计算速度快、误差小、泛化能力强等优点,并已在水文等领域得到了广泛应用。但传统的ELM模型输入权值和隐含层阈值随机给定,可能导致部分隐含层节点失效。

此外,影响径流过程变化的关键因子筛选也是中长期径流预测需要研究的重要内容。因子筛选方法主要包括先验知识法、相关系数法、主成分分析法和信息熵法。先验知识法主要依赖于人工经验,主观性较强,具有一定的局限性。相关系数法和主成分分析法,整体上属于线性方法,难以适应中长期径流过程影响因子的复杂非线性特性,具有一定的适用范围。信息熵法,尤其是互信息方法忽略了变量分布,适用于备选因子间的线性和非线性相关关系。偏互信息方法是在互信息方法基础上的改进,可以有效避免对已入选因子的影响,减少冗余变量,降低计算复杂度。

发明内容

本发明的目的在于提供一种基于改进ELM模型的月径流变化趋势预测方法,构造表征流域整体径流变化趋势的径流综合指数及其影响对象,能够实现整个流域径流变化趋势的综合表征;针对影响整个流域中长期径流过程变化的特征因子呈现高维、非线性等特点,采用基于偏互信息法的因子筛选方法,能够有效避免对已入选因子的影响,减少冗余变量,降低计算复杂度;结合10折交叉验证与改进粒子群算法优化ELM参数,并据此构建的IPSO-ELM模型,能够有效提高中长期径流变化趋势的预测效果。

为达到上述目的,根据本发明的一个方面,本发明提供如下技术方案:

一种基于改进ELM模型的月径流变化趋势预测方法,包括以下步骤:

S1、构造影响月径流变化趋势的径流综合指数及其影响对象,获得前期的观测值,并以前期若干月的观测值作为初选因子;

S2、基于偏互信息法对初选因子进行因子筛选;

S3、改进粒子群算法并构建IPSO-ELM模型;

S4、基于IPSO-ELM模型预测月径流变化趋势。

本发明进一步设置为:所述步骤S1构造影响月径流变化趋势的径流综合指数及其影响对象,获得前期观测值,并以前期若干月的观测值作为初选因子,具体为,

构造反映流域水情丰枯变化的径流综合指数、表征流域整体降雨丰枯情势的流域月尺度面雨量指数、影响整个流域的遥相关气候指数和覆盖整个流域的植被指数,获得上述各指数的前期观测值,并以获得前期若干月的观测值作为月径流变化趋势的初选因子。

本发明进一步设置为:所述步骤S2基于偏互信息法对初选因子进行因子筛选,即步骤S1中的初选因子,作为偏互信息法的备选输入因子,径流综合指数作为预测对象,计算偏互信息值,并根据偏互信息值大小进行排序,排序前列的因子即为预测模型的关键因子集,具体为,

定义偏互信息值PMI,

x'=x-E[x|z] (2)

y'=y-E[y|z] (3)

式中,PMI为偏互信息值,f

给定N个离散样本,偏互信息值则可采用如下离散形式定义,

x

y

式中,N为离散样本个数,i为观测样本编号,f

公式(4)中的边缘概率密度估计函数选用高斯函数作为核函数,具体为,

式中,j为观测样本编号,x

根据不同的备选输入因子,获得若干个偏互信息值,并由大到小将偏互信息值依次排序,排序靠前的偏互信息值对应的备选输入因子集合即为预测模型的关键因子集。

本发明进一步设置为:所述步骤S3改进粒子群算法并构建IPSO-ELM模型,即改进粒子群算法并采用步骤S2中的关键因子集作为模型输入,构建径流综合指数作为模型输出的IPSO-ELM模型,具体包括以下步骤,

S3.1、改进粒子群算法;

S3.1.1、参数改进,

惯性权值w和加速常数c

w

式中,w

在迭代过程中,c

S3.1.2、变异操作,

对粒子以概率p重新初始化,粒子更新算法为,

式中,x

变异概率p

式中,p

S3.2、构建IPSO-ELM模型;

S3.2.1、将步骤S2中获得的关键因子集作为构建IPSO-ELM模型的输入因子;

S3.2.2、ELM隐含层节点数选择,

采用试凑法寻找所需的隐含层节点,即初始隐含层节点数,通过线性增长方式逐步增加ELM的隐含层节点个数,对每一次增长后待选择的节点数训练多次,求取每阶段的均方根误差平均值,最终选取所需的隐含层节点数;

S3.2.3、ELM参数初始化,具体包括以下步骤,

S3.2.3.1、给定训练样本[x

S3.2.3.2、确定激励函数,并根据步骤S3.2.2确定隐含层节点数C;

S3.2.3.3、初始化Q

S3.2.3.4粒子群种群个体t

S3.2.3.5对于每个种群个体t

S3.2.4、IPSO适应度选取,

计算10折交叉验证的均方根误差作为IPSO适应度,寻找平均均方根误差最小的个体;

S3.2.5、迭代更新,

采用S3.1改进粒子群算法,并利用式(13)与(14)更新位置和速度,同时引入变异算子,在粒子更新之前有一定的概率初始化粒子速度和位置,计算适应度值,更新粒子的个体极值和群体极值;

式中,

S3.2.6、ELM所需参数生成,

判断是否达到终止条件,即是否达到IPSO适应度值预设精度或满足所设误差值或所设迭代次数,若达到终止条件,则停止迭代,获得ELM所需参数组合,由此得到IPSO-ELM模型,若未达到终止条件,回到步骤S3.2.3.4。

本发明进一步设置为:所述步骤S4基于IPSO-ELM模型预测月径流变化趋势,具体为,

将步骤S2中的关键因子集作为模型输入,输入至IPSO-ELM模型,获得径流综合指数预测值,从而对中长期径流变化趋势进行预测。

本发明进一步设置为:采用平均绝对百分比误差MAPE(Mean AbsolutePercentage Error)、均方根误差RMSE(Root Mean Squared Error)、确定性系数DC(Deterministic Coefficient)、相对误差RE(Relative Error),以及合格率QR(QualifiedRate)多个评价指标对IPSO-ELM模型的月径流变化趋势预测结果进行综合评定,

式中:

式中,QR为预测的合格率,m

与现有技术相比,本发明具有的有益之处是:

(1)构造表征流域整体径流变化趋势的径流综合指数及其影响对象,能够实现整个流域径流变化趋势的综合表征;

(2)针对影响整个流域中长期径流过程变化的特征因子呈现高维、非线性等特点,采用基于偏互信息法的因子筛选方法,能够有效避免对已入选因子的影响,减少冗余变量,降低计算复杂度;

(3)结合10折交叉验证与改进粒子群算法优化ELM参数,并据此构建的IPSO-ELM模型,能够有效提高中长期径流变化趋势的预测效果。

附图说明

图1为本发明一种基于改进ELM模型的月径流变化趋势预测方法的流程图;

图2为本发明实施例的构建IPSO-ELM模型流程图;

图3为本发明实施例的IPSO-ELM与BPNN、SVM、ELM和PSO-ELM等模型的预测结果对比;

图4为本发明实施例的IPSO-ELM与BPNN、SVM、ELM和PSO-ELM等模型的相对误差对比。

具体实施方式

下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

如图1所示,一种基于改进ELM模型的月径流变化趋势预测方法包括以下步骤:

S1、构造影响月径流变化趋势的径流综合指数及其影响对象,获得前期的观测值,并以前期若干月的观测值作为初选因子,具体为,构造反映流域水情丰枯变化的径流综合指数、表征流域整体降雨丰枯情势的流域月尺度面雨量指数、影响整个流域的遥相关气候指数和覆盖整个流域的植被指数,获得上述各指数的前期观测值,并以获得前期若干月的观测值作为月径流变化趋势的初选因子。

S2、基于偏互信息法对初选因子进行因子筛选,具体为,

定义偏互信息值PMI,

x'=x-E[x|z] (2)

y'=y-E[y|z] (3)

式中,PMI为偏互信息值,f

给定N个离散样本,偏互信息值则可采用如下离散形式定义,

x

y

式中,N为离散样本个数,i为观测样本编号,f

公式(4)中的边缘概率密度估计函数选用高斯函数作为核函数,具体为,

式中,j为观测样本编号,x

根据不同的备选输入因子,获得若干个偏互信息值,并由大到小将偏互信息值依次排序,排序靠前的偏互信息值对应的备选输入因子集合即为预测模型的关键因子集。

S3、改进粒子群算法并构建IPSO-ELM模型,具体为,

S3.1、改进粒子群算法;

S3.1.1、参数改进,

惯性权值w和加速常数c

w

式中,w

在迭代过程中,c

S3.1.2、变异操作,

对粒子以概率p重新初始化,粒子更新算法为,

式中,x

变异概率p

式中,p

S3.2、构建IPSO-ELM模型;

S3.2.1、将步骤S2中获得的关键因子集作为构建IPSO-ELM模型的输入因子;

S3.2.2、ELM隐含层节点数选择,

采用试凑法寻找所需的隐含层节点,即初始隐含层节点数,通过线性增长方式逐步增加ELM的隐含层节点个数,对每一次增长后待选择的节点数训练多次,求取每阶段的均方根误差平均值,最终选取所需的隐含层节点数;

S3.2.3、ELM参数初始化,具体包括以下步骤,

S3.2.3.1、给定训练样本[x

S3.2.3.2、确定激励函数,并根据步骤S3.2.2确定隐含层节点数C;

S3.2.3.3、初始化Q

S3.2.3.4粒子群种群个体t

S3.2.3.5对于每个种群个体t

S3.2.4、IPSO适应度选取,

计算10折交叉验证的均方根误差作为IPSO适应度,寻找平均均方根误差最小的个体;

S3.2.5、迭代更新,

采用S3.1改进粒子群算法,并利用式(13)与(14)更新位置和速度,同时引入变异算子,在粒子更新之前有一定的概率初始化粒子速度和位置,计算适应度值,更新粒子的个体极值和群体极值;

式中,

S3.2.6、ELM所需参数生成,

判断是否达到终止条件,即是否达到IPSO适应度值预设精度或满足所设误差值或所设迭代次数,若达到终止条件,则停止迭代,获得ELM所需参数组合,由此得到IPSO-ELM模型,若未达到终止条件,回到步骤S3.2.3.4。

S4、基于IPSO-ELM模型预测月径流变化趋势,具体为,将步骤S2中的关键因子集作为模型输入,输入至IPSO-ELM模型,获得径流综合指数预测值,从而对中长期径流变化趋势进行预测。

进一步的,采用平均绝对百分比误差MAPE(Mean Absolute Percentage Error)、均方根误差RMSE(Root Mean Squared Error)、确定性系数DC(DeterministicCoefficient)、相对误差RE(Relative Error),以及合格率QR(Qualified Rate)多个评价指标对IPSO-ELM模型的月径流变化趋势预测结果进行综合评定,

式中:

式中,QR为预测的合格率,m

ELM模型:ELM属于一种具有三层的前向神经网络,但是它与前向神经网络不同的是输入层权重和偏置随机给定,输出层权重通过矩阵的广义逆求解,这样不但可以减少网络参数的调整次数还可以有效节省训练时间。

假设给定任意N

式中:N

预测值与真实值误差最小,可表示为:

也就是存在β

用矩阵表示为:

Hβ=T

式中:H为隐层节点的输出,β为输出权重,T为期望输出。

其中:

一般W

根据上述原理,传统ELM的算法步骤如下:

(1)随机赋值输入权重W

(2)计算隐含层输出矩阵H;

(3)计算输出层权重

以雅砻江流域为实施例,进行实例仿真,以验证本发明的效果,

构造影响月径流变化趋势的径流综合指数及其影响对象,获得前期的观测值,并以前期若干月的观测值作为初选因子,具体为,反映雅砻江流域水情丰枯变化的径流综合指数、表征雅砻江流域整体降雨丰枯情势的流域月尺度面雨量指数、影响整个流域的21个遥相关气候指数和覆盖整个流域的植被指数,具体如表1所示,上述24个对象生成的候选因子包括雅砻江流域径流综合指数f

表1雅砻江流域中长期径流过程变化影响对象

采用步骤S2中的基于偏互信息法的因子筛选方法,对上述候选因子进行优选,筛选后的优选因子为13个,流域径流综合指数:f

构建IPSO-ELM模型,如图2所示,数据集为1998年4月至2008年7月,包括前期流域径流综合指数、降水、遥相关气候指数,以及NDVI植被指数数据共计124组样本,其中:用于10折交叉验证模型数据为1998年4月至2006年7月共计100组样本(随机选取90组用于训练,余下10组用于验证模型),测试数据为2006年8月至2008年7月共24组样本。

ELM隐含层节点数选择,通过试凑法选取隐含层节点数,具体方法为:选择Sigmoid作为ELM的激励函数,初始隐含层节点个数设定为5,通过线性增长方式逐步增加ELM的隐含层节点个数,步长为5。由于训练样本总数为90,所以隐含层节点个数不能超过90。对每一次增长后待选择的节点数,采用5折交叉验证的方法,每次训练50次,求取每阶段的RMSE平均值,以选取最优隐含层节点数。

ELM参数初始化,种群规模为40,最大迭代次数为400,粒子位置区间为[-2,2],粒子速度区间[-0.5,0.5],其他参数设置为c

IPSO适应度函数选取,计算10折交叉验证的均方根误差作为IPSO的适应度,寻找平均均方根误差最小的个体。

迭代更新,利用式(13)与(14)更新位置和速度,同时引入变异算子,在粒子更新之前有一定的概率初始化粒子速度和位置,计算适应度值,更新粒子的个体极值和群体极值。

ELM所需参数生成并得到IPSO-ELM模型,判断是否达到终止条件,达到适应度值预设精度或满足最小误差值或最大迭代次数,则停止迭代,获得ELM所需参数生成组合,由此得到IPSO-ELM模型;若未达到终止条件,继续迭代。

将偏互信息法筛选后的13个优选因子作为模型输入,输入至IPSO-ELM模型,获得径流综合指数预测值,从而对中长期径流变化趋势进行预测。

采用平均绝对百分比误差MAPE(Mean Absolute Percentage Error,MAPE)、均方根误差RMSE(Root Mean Squared Error)、确定性系数DC(Deterministic Coefficient)、相对误差RE(Relative Error),以及合格率QR(Qualified Rate)等多个评价指标对模型的预测结果进行综合评定。其中:IPSO-ELM与BPNN、SVM、ELM和PSO-ELM等模型的预测结果对比如图3所示,相对误差对比如图4所示;综合性能对比如表2所示。

表2不同模型的综合性能对比

由图3、图4和表2可知,IPSO-ELM模型的预测效果最佳,其主要原因在于:(1)BPNN和SVM模型结构相对复杂,参数在训练过程中需要初始化与不断优化调整,整体效率不高,而ELM具有参数设置简单、计算速度快、误差小、泛化能力强等优点,因而整体预测效果优于上述两种常用模型;(2)针对传统ELM模型输入权值和隐含层阈值随机给定,可能导致部分隐含层节点失效问题,本文结合K折交叉验证与改进粒子群算法,加快了ELM模型参数寻优速度,因而提高了预测效果。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号