首页> 中国专利> 有向图深度神经网络径流概率预报方法、系统、设备及终端

有向图深度神经网络径流概率预报方法、系统、设备及终端

摘要

本发明属于水文水资源技术领域,公开了一种有向图深度神经网络径流概率预报方法、系统、设备及终端,有向图深度神经网络径流概率预报方法包括:构建水文站点与气象站点有向图结构;根据多站点有向图,结合空间信息捕捉过程和特征聚合过程两个过程建立有向图深度神经网络预报模型;构建由预报径流和其预报因子组成的数据集,采用Adam优化算法训练有向图深度神经网络,得到具有高精度的多步长径流预报结果;将有向图深度神经网络得到的预报结果与实测径流值重新构建隐含马尔科夫回归训练数据集;训练隐含马尔科夫回归模型,得到径流概率预报结果。本发明将图论理论与神经网络模型结合,通过卷积操作捕捉空间信息,并通过多层网络聚合降雨径流过程,提高了径流预报精度。

著录项

  • 公开/公告号CN113837475A

    专利类型发明专利

  • 公开/公告日2021-12-24

    原文格式PDF

  • 申请/专利权人 中水珠江规划勘测设计有限公司;

    申请/专利号CN202111135983.6

  • 申请日2021-09-27

  • 分类号G06Q10/04(20120101);G06N3/04(20060101);G06N3/08(20060101);G06N7/00(20060101);G06F16/901(20190101);G06Q50/26(20120101);

  • 代理机构11401 北京金智普华知识产权代理有限公司;

  • 代理人张晓博

  • 地址 510630 广东省广州市天河区天寿路105号9-19层

  • 入库时间 2023-06-19 13:49:36

说明书

技术领域

本发明属于水文水资源技术领域,尤其涉及一种有向图深度神经网络径流概率预报方法、系统、设备及终端。

背景技术

目前,准确可靠的径流预报,能为水库群调度决策提供有益的数据依据,对于增加发电效益、降低防洪风险、提升水资源综合利用效益具有重大意义。随着计算机技术的发展,支持向量机回归、神经网络、长短期记忆网络等机器学习和深度学习方法在径流预报中展现出了优秀的性能。然而,这一类基于统计的黑箱模型往往存在一下两点缺点:一是黑箱模型仅仅是数据与数据之间的传输,其模型参数在水文径流产生的过程中没有较好的物理解释;二是传统的预报模型仅预报一个单点值,无法量化预报中的不确定性。因此,如何建立具有一定物理意义的统计学习模型,并使其具有区间预测和概率预测的能力来量化预报不确定性是亟需解决的理论和实际工程问题。

通过上述分析,现有技术存在的问题及缺陷为:

(1)现有基于统计的黑箱模型仅仅是数据与数据之间的传输,其模型参数在水文径流产生的过程中没有较好的物理解释。

(2)传统的预报模型仅预报一个单点值,无法量化预报中的不确定性。

解决以上问题及缺陷的难度为:一般的统计模型仅仅只是单纯考虑输入输出数据的相关性,难以建立一种考虑水文物理过程的模型;径流预报误差存在“非正态”、“异方差”的特性,难以用一般的高斯分布量化预报的不确定性。

解决以上问题及缺陷的意义为:将深度学习模型往概念性水文模型发展,提高水文预报精度的同事,给出合理的参数解释;此外,量化径流预报的不确定性,为水库调度决策提供了更为丰富、可靠的预报信息,有助于调度决策者合理分配水资源。

发明内容

针对现有技术存在的问题,本发明提供了一种有向图深度神经网络径流概率预报方法、系统、设备及终端,尤其涉及一种基于有向图深度神经网络的有向图深度神经网络径流概率预报方法、系统、设备及终端,旨在解决现有统计学习径流预报方法无具体水文物理意义,且无法量化预报中的不确定性的技术问题。

本发明是这样实现的,一种有向图深度神经网络径流概率预报方法,所述有向图深度神经网络径流概率预报方法包括以下步骤:

步骤一,构建水文站点与气象站点有向图结构;

步骤二,根据多站点有向图,结合空间信息捕捉过程和特征聚合过程两个过程建立有向图深度神经网络预报模型;

步骤三,构建由预报径流和其预报因子组成的数据集,采用Adam优化算法训练有向图深度神经网络,得到具有高精度的多步长径流预报结果;

步骤四,将有向图深度神经网络得到的预报结果与实测径流值重新构建隐含马尔科夫回归训练数据集;

步骤五,训练隐含马尔科夫回归模型,得到径流概率预报结果。

进一步,步骤一中,所述构建水文站点与气象站点有向图结构,包括:

以长江上游水文站点和气象站点为研究对象,将每个水文站点和气象站点作为有向图中的点;根据水文站点和气象站点所在流域中的区域以及水文站点之间的上下游关系确定每个水文站点与其他水文站点以及气象站点的关系,将具有因果关系的点用向量连接;将所有的点和向量构成有向图。

进一步,步骤二中,所述根据多站点有向图,结合空间信息捕捉过程和特征聚合过程两个过程建立有向图深度神经网络预报模型,包括:

有向图深度神经网络模型由空间信息捕捉过程和特征聚合过程组成;其中,所述空间信息捕捉过程由多个卷积层和一个全连接层组成,用于通过卷积操作捕捉区域范围内的降雨对水文站点径流的影响,该过程看作水文模型中的降雨产流模型,所述空间信息捕捉过程表述如下:

其中,v=1,…,NI为水文站点的索引,L为该过程的网络层数,

所述特征聚合过程由多层感知网络组成,用于建立卷积神经网络捕捉的降雨特征以及上游径流特征与当前水文站点径流的非线性关系,该过程看作水文模型中的汇流过程,所述特征聚合过程表述如下:

其中,L’为特征聚合过程的网络层数,

进一步,步骤三中,所述构建由预报径流和其预报因子组成的数据集,采用Adam优化算法训练有向图深度神经网络,得到具有高精度的多步长径流预报结果,包括:

预报因子为所有水文站点和气象站点前期实测径流数据和降雨数据,预报值为目标站点未来径流值,由预报因子和预报值组成的训练集表示如下:

D

y

其中,D

构建完数据集后,对数据进行归一化处理,设置有向图深度神经网络的参数,包括每个空间信息捕捉过程的卷积层个数和全连接层节点数,多层感知网络的感知层个数、隐藏层节点数以及输出层节点数,网络学习率,训练代数;采用结合Adam优化算法在训练集上训练有向图深度神经网络,迭代优化模型参数;根据训练后的有向图深度神经网络模型,得到多步长径流预报结果Y

进一步,步骤四中,将步骤三中训练集有向图深度神经网络得到的预报径流结果Y

进一步,步骤五中,所述训练隐含马尔科夫回归模型,得到径流概率预报结果,包括:

隐含马尔科夫回归主要由隐含马尔科夫模型和概率预报两部分组成,采用Baum-Welch算法训练隐含马尔科夫模型参数;其中,所述隐含马尔科夫模型的隐含变量与观测变量的联合概率分布表示如下:

其中,D

观测变量的条件概率分布定义为p(d

p(d

其中,μ

采用EM算法迭代优化模型的参数θ={π,A,φ},得到训练后的隐含马尔科夫模型;根据高斯联合概率分布的性质、概率乘法公式以及贝叶斯公式推理得到给出预报因子后的预报值的条件概率密度函数,如下式所示:

其中,

本发明的另一目的在于提供一种应用所述的有向图深度神经网络径流概率预报方法的径流概率预报系统,所述径流概率预报系统包括:

有向图结构构建模块,用于构建水文站点与气象站点有向图结构;

预报模型构建模块,用于根据多站点有向图,结合空间信息捕捉过程和特征聚合过程两个过程建立有向图深度神经网络预报模型;

预报模型优化模块,用于构建由预报径流和其预报因子组成的数据集,采用Adam优化算法训练有向图深度神经网络,得到具有高精度的多步长径流预报结果;

训练数据集构建模块,用于将有向图深度神经网络得到的预报结果与实测径流值重新构建隐含马尔科夫回归训练数据集;

径流概率预报模块,用于通过训练隐含马尔科夫回归模型,得到径流概率预报结果。

本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:

构建水文站点与气象站点有向图结构;根据多站点有向图,结合空间信息捕捉过程和特征聚合过程两个过程建立有向图深度神经网络预报模型;构建由预报径流和其预报因子组成的数据集,采用Adam优化算法训练有向图深度神经网络,得到具有高精度的多步长径流预报结果;将有向图深度神经网络得到的预报结果与实测径流值重新构建隐含马尔科夫回归训练数据集;训练隐含马尔科夫回归模型,得到径流概率预报结果。

本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:

构建水文站点与气象站点有向图结构;根据多站点有向图,结合空间信息捕捉过程和特征聚合过程两个过程建立有向图深度神经网络预报模型;构建由预报径流和其预报因子组成的数据集,采用Adam优化算法训练有向图深度神经网络,得到具有高精度的多步长径流预报结果;将有向图深度神经网络得到的预报结果与实测径流值重新构建隐含马尔科夫回归训练数据集;训练隐含马尔科夫回归模型,得到径流概率预报结果。

本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的径流概率预报系统。

结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明提供的有向图深度神经网络径流概率预报方法,将图论理论与神经网络模型结合,通过卷积操作捕捉空间信息,通过多层网络聚合降雨径流过程,提高了径流预报精度,并采用隐含马尔科夫回归方法定量描述了径流预报的不确定性,对水资源规划与管理具有重要意义。

本发明通过构建水文站点与气象站点有向图结构,采用卷积神经网络对多站点降雨数据进行空间信息捕捉,采用多层感知网络对降雨径流特征进行聚合,充分的模拟了水文降雨径流的产流和汇流过程,有效的解释了不同过程在水文径流预报中的物理意义。

本发明通过隐含马尔科夫回归方法,将深度学习模型的单点预报值转换为概率预报结果,对径流预报的不确定性进行了定量分析,获得了传统确定下预报方法无法得到的预测不确定性信息。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的有向图深度神经网络径流概率预报方法流程图。

图2是本发明实施例提供的径流概率预报系统结构框图;

图中:1、有向图结构构建模块;2、预报模型构建模块;3、预报模型优化模块;4、训练数据集构建模块;5、径流概率预报模块。

图3是本发明实施例提供的以长江上游水文站点和气象站点构建的有向图结构示意图。

图4是本发明实施例提供的宜昌站1998年4月10日至10月28日概率预报不确定性分析图。

图5(a)和图5(b)是本发明实施例提供的宜昌站在整个测试期的概率预报不确定性分析图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

针对现有技术存在的问题,本发明提供了一种有向图深度神经网络径流概率预报方法、系统、设备及终端,下面结合附图对本发明作详细的描述。

如图1所示,本发明实施例提供的有向图深度神经网络径流概率预报方法包括以下步骤:

步骤1,构建水文站点与气象站点有向图结构;

步骤2,根据多站点有向图,结合空间信息捕捉过程和特征聚合过程两个过程建立有向图深度神经网络预报模型;

步骤3,构建由预报径流和其预报因子组成的数据集,采用Adam优化算法训练有向图深度神经网络,得到具有高精度的多步长径流预报结果;

步骤4,将有向图深度神经网络得到的预报结果与实测径流值重新构建隐含马尔科夫回归训练数据集;

步骤5,训练隐含马尔科夫回归模型,得到径流概率预报结果。

如图2所示,本发明实施例提供的径流概率预报系统包括:

有向图结构构建模块1,用于构建水文站点与气象站点有向图结构;

预报模型构建模块2,用于根据多站点有向图,结合空间信息捕捉过程和特征聚合过程两个过程建立有向图深度神经网络预报模型;

预报模型优化模块3,用于构建由预报径流和其预报因子组成的数据集,采用Adam优化算法训练有向图深度神经网络,得到具有高精度的多步长径流预报结果;

训练数据集构建模块4,用于将有向图深度神经网络得到的预报结果与实测径流值重新构建隐含马尔科夫回归训练数据集;

径流概率预报模块5,用于通过训练隐含马尔科夫回归模型,得到径流概率预报结果。

下面结合具体实施例对本发明的技术方案作进一步描述。

实施例

本发明实施例提供的基于有向图深度神经网络的有向图深度神经网络径流概率预报方法,包括以下步骤:

步骤1.构建水文站点与气象站点有向图结构;

步骤2.根据多站点有向图,结合空间信息捕捉过程和特征聚合过程两个过程建立有向图深度神经网络预报模型;

步骤3.构建由预报径流和其预报因子组成的数据集,采用Adam优化算法训练有向图深度神经网络,得到具有高精度的多步长径流预报结果;

步骤4.将有向图深度神经网络得到的预报结果与实测径流值重新构建隐含马尔科夫回归训练数据集;

步骤5.训练隐含马尔科夫回归模型,得到径流概率预报结果。

步骤1.构建水文站点与气象站点有向图结构。

本发明实例以长江上游水文站点和气象站点为研究对象,将每个水文站点和气象站点作为有向图中的点;根据水文站点和气象站点所在流域中的区域以及水文站点之间的上下游关系确定每个水文站点与其他水文站点以及气象站点的关系,将具有因果关系的点用向量连接;将所有的点和向量构成有向图,如图3所示。

步骤2.根据多站点有向图,结合空间信息捕捉过程和特征聚合过程两个过程建立有向图深度神经网络预报模型。

本发明的有向图深度神经网络模型主要由空间信息捕捉过程和特征聚合过程组成。其中,空间信息捕捉过程由多个卷积层和一个全连接层组成,主要目的在于通过卷积操作捕捉区域范围内的降雨对水文站点径流的影响,这一过程可以看作水文模型中的降雨产流模型。空间信息捕捉过程可表述如下:

其中,v=1,…,NI为水文站点的索引,L为该过程的网络层数,

特征聚合过程则是由多层感知网络组成,其目标在于建立卷积神经网络捕捉的降雨特征以及上游径流特征与当前水文站点径流的非线性关系,这一过程可以看作水文模型中的汇流过程。特征聚合过程可表述如下:

其中,L’为特征聚合过程的网络层数,

步骤3中.构建由预报径流和其预报因子组成的数据集,采用Adam优化算法训练有向图深度神经网络,得到具有高精度的多步长径流预报结果。

预报因子为所有水文站点和气象站点前期实测径流数据和降雨数据,预报值为目标站点未来径流值,由预报因子和预报值组成的训练集可表示如下:

D

y

其中,D

构建完数据集后,对数据进行归一化处理,设置有向图深度神经网络的参数,包括每个空间信息捕捉过程的卷积层个数和全连接层节点数,多层感知网络的感知层个数、隐藏层节点数以及输出层节点数,网络学习率,训练代数。采用结合Adam优化算法在训练集上训练有向图深度神经网络,迭代优化模型参数。根据训练后的有向图深度神经网络模型,得到多步长径流预报结果Y

步骤4.将步骤3中训练集有向图深度神经网络得到的预报径流结果Y

步骤5.训练隐含马尔科夫回归模型,得到径流概率预报结果。

隐含马尔科夫回归主要由隐含马尔科夫模型和概率预报两部分组成,首先采用Baum-Welch算法训练隐含马尔科夫模型参数。隐含马尔科夫模型的隐含变量与观测变量的联合概率分布表示如下:

其中,D

p(d

其中,μ

采用EM算法迭代优化模型的参数θ={π,A,φ},得到训练后的隐含马尔科夫模型。然后根据高斯联合概率分布的性质、概率乘法公式以及贝叶斯公式推理得到给出预报因子后的预报值的条件概率密度函数,如下式:

其中,

本发明以长江上游宜昌站水文站位预报对象,宜昌站以上水文站点和气象站点为预报因子,采用1970年至1997年的日均数据为训练集,1998年至2004年日均数据为测试集,对宜昌站点未来三天日径流做出预报,按照图2所示的有向图深度神经网络的有向图深度神经网络径流概率预报方法进行预测。以下采用均方根误差(Root Mean Square Error,RMSE)以及纳什系数(Nash-Sutcliffe efficiency coefficient,NSE)两个评价指标评估预报方法的性能,并分析概率预报的不确定性。

表1和表2分别给出有向图深度神经网络(DGDNN)模型、长短期记忆神经网络模型(LSTM)、门控制循环单元模型(GRU)以及神经网络模型(ANN)的RMSE和NSE评价指标值。RMSE指标值越小越好,NSE是一个相对值,其范围在负无穷到1之间,越接近于1,代表预报值与实测径流值越接近。从表1和表2可以看出,采用提出的有向图深度神经网络预报的方法比其他对比模型的预报精度更高,具有优越的预报性能。

表1四种模型未来三天径流预报的RMSE值

表2四种模型未来三天径流预报的NSE值

在预报精度评价的基础上,进一步对预报的不确定性进行分析。图4以时间轴为横坐标,预报径流区间以及观测径流值为纵坐标,展示了概率预报的95%、70%置信区间。从图中可以明显的看出预报区间在汛期的宽度普遍大于预报区间在枯水期的宽度,代表径流预报在汛期的不确定性要大于枯水期的不确定性。图5以预报均值为横坐标,展示了概率预报的95%、70%置信区间,从图中可以明显的看出置信区间随着预报均值的增加呈变宽的趋势,这一现象证明了本发明的概率预报较好的描述了预报不确定性“异方差”这一特性。综上所述,图4和图5证明了本发明能够有效的估计不同调度时期的径流预报不确定性,因此能够为调度决策提供可靠的径流概率预报值。

表3给出了部分日期下,DGDNN、LSTM、GRU、ANN预报径流与实际径流的实验数据。

表3DGDNN、LSTM、GRU、ANN预报径流与实际径流的实验数据

在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上;术语“上”、“下”、“左”、“右”、“内”、“外”、“前端”、“后端”、“头部”、“尾部”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘Solid StateDisk(SSD))等。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号