首页> 中国专利> 一种基于改进的遗传算法优化BP神经网络的气象数据预测方法

一种基于改进的遗传算法优化BP神经网络的气象数据预测方法

摘要

一种基于改进的遗传算法优化BP神经网络的气象数据预测方法,包括数据收集与分析、建立BP神经网络预测模型和区划图制作与分析;本发明采用改进的遗传算法优化BP神经网络方法获取某市气象数据,通过GIS技术对数据进行处理与分析完成区划图的制作,同时通过气候区划变化柱状图,表明了BP神经网络与GIS技术结合应用于区划研究中,具有实用性,直观地体现出气候区划变化趋势,通过神经网络和GIS技术结合,可为蚕桑产业合理布局提供了更加可靠的科学依据。

著录项

说明书

技术领域

本发明涉及农业气候区划技术领域,尤其涉及一种基于改进的遗传算法优化BP神经网 络的气象数据预测方法。

背景技术

中国的蚕桑生产已有多年的历史,如今已经发展成为一项巨大的产业。目前,中国的蚕 桑产业己取得一定的成就,并成为发展产业,西部地区蚕桑产业发展亮点突出,不断提高西 部地区的茧丝产量和质量,延长蚕桑产业链条,强化科技支撑能力,对践行我国提出的创新 驱动发展战略具有重要意义。河池地处亚热带季风气候区,种桑养蚕的自然条件在其他气候 区就显得十分优越,具有“桑树生长期长、蚕造多、供茧早二个来月、休市晚二个来月”的 独特优势,使河池成为最适合桑蚕生产的区域之一。

河池市蚕桑气候区划研究的目的是将科技前沿的机器学习技术在蚕桑领域加以实施、扩 展,通过机器学习对数据的处理以及预测,使得人们可以更加清晰、直观地得到蚕桑适宜生 长的环境与区域信息,并且根据环境与区域信息作出相应的响应处理,从而实现了真正意义 上的机器学习。另外,可以为河池市地区蚕桑产业稳定发展和竞争力的提高提供一些可行的 思路。

本发明运用指数平滑方法来找出影响河池市桑蚕分布地区的温度、水分这两大因素的气 象指标条件,并针对河池市桑蚕分布地区的温度、水分这两大因素的影响对农业气象指标条件 做了预测以及开展河池市桑蚕气候区划,为当地的人们充分利用自然环境和资源,科学合理规 避各种气象和自然灾害,合理布局养殖蚕业,以及发展生态保护、防灾减震等工作,提供科学可 靠的基础。

发明内容

本发明的目的在于提出一种基于改进的遗传算法优化BP神经网络的气象数据预测方法, 从而区划河池市蚕桑气候,为未来5年河池市蚕桑生产的合理布局提供科学理论依据。

本发明为了实现上述目的,采用如下技术方案:

为合理区划河池市蚕桑气候,分为如下步骤:

步骤一数据收集与分析

预测模型中,数据是重中之重,河池市环江县的气象数据主要是从中国气象数据网上进 行获取,数据来源可靠;

1)数据收集

本发明所用数据是气象环境中的基本气象数据,例如:年平均气温、年降雨量等,这些 基本数据也是研究区气象状态所需的一些数据,主要通过气象数据官网以及地面监测站获取;

2)数据归纳

为了使计算机便于对数据进行处理,需要制定一个规范性的表格,将所需数据进行一个 整体的归纳,在本发明中主要使用了Excel表格,同时预测数据在matlab软件中更便于使用。

步骤二建立基于改进的GA优化BP神经网络预测模型

在本发明中,建立神经网络模型,选取了河池市2000-2014年15年4-10月的温度、降 雨量以及日照时数等基础气象数据作为样本进行神经网络训练,通过对2015-2019年的气象 数据进行测试,误差在可接受范围里,就可以对未来五年的气象数据进行预测,从结果可以 看出,利用改进的GA优化BP神经网络模型预测的气象数据结果误差会更小一点。以下是 几种模型的实验验证:

首先是对传统的BP神经网络进行测试。对BP神经网络的一些参数进行设置完以后,BP 神经网络就可以进行训练,实现其对气象数据的预测,其次第二种方法将遗传算法思想应用 于BP神经网络中,优化其权值、阈值,提高预测模型精度,完成遗传算法中参数的设置, 即可进行训练预测。matlab软件的便捷性更为GA-BP神经网络的预测提供了巨大的帮助,最 后一种方法是通过对遗传算法的改进所提出的,适应度函数作为筛选最优个体的关键点,对 适应度函数进行改进具有很大的操作性,提出动态标定的方法对其进行改进,将改进后的算 法结合BP神经网络进行气象数据预测,提高神经网络预测精度。

步骤三区划图制作与分析

在GIS分析功能中,叠加分析作为其一种非常常用的空间分析功能,通常是指相同类型 的两个数据图层经过一系列运算,形成新的图层的过程,数据分析目标不仅在空间位置上具 有一定的关联性,同时经过叠加分析过程,还改变了多层数据中的不同点、相关性和变化等 特征,生成了生新的属性特征关系,本发明通过不同的划分标准将所得的气象数据信息内容 进行显示,以借此获得巨大的空间信息,根据以往研究者的经验,从模型中选出几个对蚕桑 影响较为重要的气候因子进行叠加分析与区划;

1)选定降雨量、有效积温、日照时数和年平均温度进行叠加区划的气候因子;

2)使用ArcMap软件中的Geostatistical Analyst工具条,选择地统计向导方法,利用克 里金法进行插值,得到各个气候因子的分布图;

3)使用ArcMap的Reclassify对区划图进行重分类,这样是为了在原有数值上对数据进 行重新分类整理,便于叠加操作;

4)叠加分析,将河池各气象因素的重分级后的图层进行叠加,得到最适宜气候区、适 宜气候区以及次适宜气候区等三个气候区域,具体如图1所示;

5)未来5年河池市蚕桑气候区划

河池市未来5年的蚕桑气候区划图制作数据主要依赖于改进的GA-BP神经网络预测模型 预测得到的数据,并加以海拔等自然因素,根据未来5年河池市平均气温分布图、未来5年 河池市有效积温分布图、未来5年河池市年降雨量分布图以及未来5年河池市日照时数分布 图,经过GIS叠加分析技术得到未来5年河池市蚕桑气候区划图;

6)河池市蚕桑区划变化分析

为了更能直观的反映河池市蚕桑气候区划在未来5年内的变化趋势,根据GIS属性数据 制作出河池市区划变化柱形图。

本发明具有如下优点:

1、改进的GA-BP神经网络预测平均气温模型的精度更进一步得到了提高:

表1 平均气温预测值平均相对误差统计

从表1可知,BP神经网络预测2015-2019年平均气温的平均相对误差分别为10.35%、 11.04%、10.13%、12.87%、12.73%,利用GA-BP神经网络预测2015-2019年平均气温的平均 相对误差分别为8.93%、9.39%、9.63%,9.66%、8.97%,改进的GA-BP神经网络预测2015-2019 年平均气温的平均相对误差分别为6.38%、7.01%、6.57%、7.28%、6.69%,同时从折线图中 可以看出改进的GA-BP神经网络预测平均气温模型的平均相对误差要比GA-BP神经网络气 温预测的平均相对误差以及BP神经网络气温预测的平均相对误差要小的多。

2、改进的GA-BP神经网络预测平均降雨量模型的精度更进一步得到了提高:

表2 年降雨量预测值平均相对误差统计

从表2可知,BP神经网络预测2015-2019年降雨量的平均相对误差分别为10.2%、11.71%、 10.49%、10.87%、10.27%。利用GA-BP神经网络预测2015-2019年降雨量的平均相对误差分 别为6.87%、7.39%、6.27%,6.66%、7.97%,改进的GA-BP神经网络预测2015-2019年降雨 量的平均相对误差分别为4.93%、5.01%、3.33%、4.12%、4.56%;同时从折线图中可以看出 改进的GA-BP神经网络预测降雨量模型的平均相对误差要比GA-BP神经网络降雨量预测的 平均相对误差以及BP神经网络降雨量预测的平均相对误差要小的多。

3、改进的GA-BP神经网络预测日照时数模型的精度更进一步得到了提高:

表3 年日照时数值预测平均相对误差统计

从表3可知,BP神经网络预测2015-2019年日照时数的平均相对误差分别为9.96%、 10.93%、10.37%、10.67%、11.27%,2015-2019年日照时数的平均相对误差在使用GA-BP神 经网络方法预测得到为6.39%、7.6%、6.66%、6.66%、7.57%;2015-2019年日照时数的平均 相对误差在改进的GA-BP神经网络方法中预测得到为4.29%、5.89%、3.66%、5.07%、5.75%; 同时从折线图中可以看出改进的GA-BP神经网络预测日照时数模型的平均相对误差要比 GA-BP神经网络日照时数预测的平均相对误差以及BP神经网络日照时数预测的平均相对误 差要小的多。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例技术描述中所需要使用 的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本 领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附 图。

图1为目前河池市蚕桑农业气候区划图;

图2为BP神经网络结构示意图;

图3为未来5年河池市蚕桑农业气候区划图;

图4为河池市蚕桑农业气候区划变化柱状图。

具体实施方式

下面结合附图以及具体实施方式对本发明作进一步详细说明,区划河池市蚕桑气候包括 如下步骤:

步骤一 数据收集与分析

预测模型中,数据是重中之重,河池市环江县的气象数据主要是从中国气象数据网上进 行获取,数据来源可靠;

1)数据收集

本发明所用数据是气象环境中的基本气象数据,例如:年平均气温、年降雨量等。这些 基本数据也是研究区气象状态所需的一些数据。主要通过气象数据官网以及地面监测站获取;

2)数据归纳

为了使计算机便于对数据进行处理,需要制定一个规范性的表格,将所需数据进行一个 整体的归纳。在本发明中主要使用了Excel表格,同时预测数据在matlab软件中更便于使用;

步骤二 分析蚕桑产量变化与气候要素之间的关系

蚕桑的生长、产量以及质量的变化,都与外界的环境相联系。数理统计学中的相关分析 是一种非常好的分析变量之间关系的方法。本发明用气象产量与气候因素做相关分析。农业 产量是受自然因子和生产力水平所影响。通常可以将农业产量划分为趋势产量Y(m)、气 象产量Y(n)以及随机噪音Y(w)三个组成。根据以往的研究,阻尼系数取0.3。在求得趋势产量后,利用Y=Y(m)+Y(n),求得气象产量。同时因为蚕桑在4-10月之间活动频繁, 研究此时间内的相关性具有代表性,故采用灰色关联分析方法,计算河池市蚕茧量单产时的气象产量与历年4-10月平均气温、日照时数以及降雨量之间进行相关分析,得到相关系数,相关系数结果见表4。

表4 4-10月气候要素相关系数表

利用相关分析去研究气象产量分别和4月温度、降雨量、日照时数一直到10月温度、降 雨量、日照时数等几项之间的相关关系。同时相关系数表直观的反映了气象产量与气象要素 之间的相关性。从表中可知,4-10月的年平均气温的平均相关系数达到0.88。4-10月的年平 均气温的平均相关系数达到0.78。4-10月的日照时数的平均相关系数达到0.69。气象产量与 年平均气温、降雨量、日照时数之间的相关系数比较大,因此说明了蚕桑产量对温度、降雨 量、日照时数具有依赖性。

步骤三 建立基于改进的GA优化BP神经网络预测模型

1)BP神经网络

BP神经网络是一种输入-输出模式映射关系,同时BP神经网络是能学习和存贮的。BP 神经网络算法的核心思想是使用最速下降法,气象数据进入输入层再通过隐含层的反向传播 进入到输出层,在数次的训练中,通过不断地调整网络的权值和阈值,不断的测出新结果使 预测数据与实测数据之间的误差平方和最小,此时的网络训练模型才算合格。BP神经网络模 型结构主要包括输入层(input layer)、隐含层(hide layer)和输出层(output layer)。如图2所 示。

2)改进的遗传算法

基于改良的遗传算法对BP神经网络提出了优化的主要构想就是通过使用遗传算法(GA) 来优化初始权值,同时在获取最优解的情况下还会对阈值等参数进行一定的优化。使以改进遗 传算法为基础的BP神经网络对气象学数据模拟进行预测,能够在预测期间有较快速度地实施 预测。种群的初始化,适应性函数,选择运算,交叉和变异运算5个阶段,是遗传算法优化BP神 经网络的主要环节。

1、种群初始化

实数编码是针对个体进行编码的一种重要手段。实数串可能是由于种群内的每个个体独 立构造而来。主要包括了输入层和隐含层节点的权值,隐含层的阈值,输出层节点的阈值,以及 输入层的阈值。同时在单位个体内均包括了整个神经网络在训练中的全部权值和阈值。

2、适应度函数

BP神经网络的权值、阈值一般通过种群中的个体得到,筛选出最优个体就显得尤为重要 了。适应度函数在筛选最优个体时起决定性作用。适应度函数主要是根据实际值与预测值之 间的误差绝对值和方差两个主要值进行计算的。根据已知概念,适应度函数可以通过以下计 算公式求出。

本实验中的改进遗传算法的部分就在于适应度函数的改进,选择适应度最大值与适应度 最小值,通过公式选择最佳适应度。具体公式如下:

其中,计算公式中,n代表输出层的节点数;y

3、选择操作

遗传算法中,选取适应度数值最高的个体,淘汰其他适应度数值比较低的个体进行选取操 作。通过选择运算把种群中的最佳个体进行选取,并遗传到下一代,通过持续地传递,使得基于 遗传算法的BP神经网络在预测技术上更加具有代表性。遗传算法里存在着多种的选取操作。 在本发明中主要利用到轮盘赌法。主要思想是将色子置于轮盘边缘,通过轮盘不断旋转,其 轮盘区间也随之不断变化,当轮盘停止时,色子所指区间即为选择的个体号。选择操作的运 算通常是建立在适应度函数的基础之上。因此,选择操作与适应度函数之间呈正比例关系。 遗传算法中每个单元个体被选择的概率pi通过以下公式计算。

f

其中计算公式中,N为种群个体数目;F

4、交叉操作

遗传算法中产生新的权值、阈值在于交叉操作这一步骤,对遗传算法的性能应用中起到 关键作用。分为三个基本部分,第一是选择父个体;第二是生成新的子代个体;第三是选择 子代个体。遗传算法中每个单元个体采用的是实数编码的方法,因此交叉操作的方法选择实 数交叉法,在改进的遗传算法中,考虑到了虚数部分。本发明中是两个任意染色体在某处进 行交叉操作,主要方法公式如下。

在公式中,b是属于[0,1]之间的任何一个随机数。

5、变异操作

在遗传算法优化过程中,交叉变异操作主要是在特定的交叉率和变异率内进行操作的。 一般来说,假如有100个个体,其中规定交叉概率为0.1,但是交叉个数不一定就是10个, 这就是概率问题。为了保障种群的多样性,可以从是否发生变异以及发生变异进行随机变异 操作几个方面进行变异操作。例如可以选择第i个个体的第j个基因a

3)基于改进的GA优化BP神经网络预测模型

在本发明中,建立神经网络模型,选取了河池市2000-2014年15年4-10月的温度、降 雨量以及日照时数等基础气象数据作为样本进行神经网络训练。通过对2015-2019年的气象 数据进行测试,误差在可接受范围里,就可以对未来五年的气象数据进行预测。从结果可以 看出,利用改进的GA优化BP神经网络模型预测的气象数据结果误差会更小一点。以下是 几种模型的实验验证。

首先是对传统的BP神经网络进行测试。对BP神经网络的一些参数进行设置完以后,BP 神经网络就可以进行训练,实现其对气象数据的预测。其次第二种方法将遗传算法思想应用 于BP神经网络中,优化其权值、阈值,提高预测模型精度。完成遗传算法中参数的设置, 即可进行训练预测。matlab软件的便捷性更为GA-BP神经网络的预测提供了巨大的帮助。最 后一种方法是通过对遗传算法的改进所提出的。适应度函数作为筛选最优个体的关键点。对 适应度函数进行改进具有很大的操作性。提出动态标定的方法对其进行改进。将改进后的算 法结合BP神经网络进行气象数据预测,提高神经网络预测精度;

步骤四 区划图制作与分析

在GIS分析功能中,叠加分析作为其一种非常常用的空间分析功能。通常是指相同类型 的两个数据图层经过一系列运算,形成新的图层的过程。数据分析目标不仅在空间位置上具 有一定的关联性,同时经过叠加分析过程,还改变了多层数据中的不同点、相关性和变化等 特征,生成了生新的属性特征关系。本发明通过不同的划分标准将所得的气象数据信息内容 进行显示,以借此获得巨大的空间信息。根据以往研究者的经验,从模型中选出几个对蚕桑 影响较为重要的气候因子进行叠加分析与区划;

1)选定降雨量、有效积温、日照时数和年平均温度进行叠加区划的气候因子;

2)使用ArcMap软件中的Geostatistical Analyst工具条,选择地统计向导方法,利用克里 金法进行插值,得到各个气候因子的分布图;

3)使用ArcMap的Reclassify对区划图进行重分类,这样是为了在原有数值上对数据进 行重新分类整理,便于叠加操作;

4)叠加分析,将河池各气象因素的重分级后的图层进行叠加,得到最适宜气候区、适宜 气候区以及次适宜气候区等三个气候区域,具体如图1所示。

最适宜气候区:该气候区包括宜州市、都安瑶族自治县、金城江区、罗城仫佬族自治县 及环江毛南族自治县,同时各个县也有少量的最适宜气候区。这些地区均要求年平均气温在 20℃以上,≥12℃的有效积温在2700℃以上,以及年降水量≥1500mm。

该气候区为河池市自然资源比较丰富的区域。其热量资源达到蚕桑所需的适宜温度。同 时该区域年降雨量与年日照时数均符合蚕桑生长所需。该区域主要集中于河池市海拔较低的 区域,同时这些区域交通便利,人员集中,在生活上比较方便。因此该区域比较适合养蚕。 该区域每年可养蚕的批次至少可达8-10批次,是河池市境内养蚕批次最高的区域。优越的气 候条件,使该区域蚕利用率较高,回报利用率高,群众更愿意接受养蚕,可以在该区域进行 产业规模化的尝试。故将该区列为最适宜区。

适宜气候区:该气候区主要包括巴马瑶族自治县、大化瑶族自治县以及各个县的丘陵地 带,这些地区均要求年平均气温在18℃以上,≥12℃的有效积温至少在2500℃以上,年降水 量≥1300mm。

同时该气候区光热条件较好,日照时数适中,降雨量较好,能够满足桑树光合作用所需 的气候条件,保证桑树正常生长发育。适宜气候区的区域大多数集中于地势平缓的丘陵一带, 其所在区域雨量与日照时数充足,满足蚕桑生长所需。但其气温增速要比最适宜气候区要低 一些,导致桑树开始发育时间要比最适宜气候区更晚一些,全年养蚕日期也相应缩短,该区 域每年可养蚕的批次可达7-9批次,一般比最适宜气候区少1-2批,同时该区域对饲养蚕虫 场地的利用率较高,回报利用率较高,故定为基本适宜区。

次适宜气候区:该区位于河池市西北部的南丹县、天峨县、凤山县以及东兰县等地区。 这些地区均要求年平均气温在18℃以下,≥12℃的有效积温在2300℃以下,年降水量≤ 1200mm。

次适宜气候区内热量资源相对于适宜气候区来说相对较少。次适宜气候区的日照时数长 短减少,降雨量比较均衡。但基本能够满足蚕桑所需的气候条件,保障蚕桑正常生长发育。 图中这些区域划分为次适宜气候区主要是由于该区域的气温比适宜气候区低,同时高气温的 时间段比较短,造成桑树发育比最适宜气候区、适宜气候区迟,适合种桑养蚕的时间段就会 比较少。因其该区域具有高海拔地区,多为高山地区,故其气温相对较低,开春发芽时间推 迟,影响桑树生长。该区域每年可养蚕的批次可达5-7批次,一般比适宜气候区少1-2批, 同时该区域对饲养蚕虫场地的利用率较高,回报利用率较高,故将该区定为次适宜气候区也 就是基本适宜区;

5)未来5年河池市蚕桑气候区划

河池市未来5年的蚕桑气候区划图制作数据主要依赖于改进的GA-BP神经网络预测模型 预测得到的数据,并加以海拔等自然因素。根据未来5年河池市平均气温分布图、未来5年 河池市有效积温分布图、未来5年河池市年降雨量分布图以及未来5年河池市日照时数分布 图,经过GIS叠加分析技术得到未来5年河池市蚕桑气候区划图,如图3所示;

6)河池市蚕桑区划变化分析

为了更能直观的反映河池市蚕桑气候区划在未来5年内的变化趋势,根据GIS属性数据 制作出河池市区划变化柱形图,如图4所示。分为三个标准,以适应气候区为基准点,最适 宜气候区面积增加为青色柱形,次适宜气候区增加为紫色柱形。

从图中可以看出,未来5年河池市蚕桑气候区划有比较大的变化,三个标准之间的比例 分别是3∶3∶5,可以看出,天峨县、南丹县以及东兰县三个地方的适宜区域呈下降的趋势, 最适宜气候区域也在不断的减少,同时次适宜气候区域在不断的增加,未来5年在这些区域 的桑树种植面积以及养蚕场地可以适当的减少,将重心往南边迁移。凤山县、金城江区以及 环江毛南族自治县三个地方的适宜区域呈平稳的趋势,未来5年各类气候区域变化不大。最 适宜气候区域也是基本没变,同时适宜气候区域与次适宜气候区域未发生明显的变化趋势, 未来5年在这些区域的桑树种植面积以及养蚕场地可以适当的增加,在维持现状的基础上, 可以适当的增加种植面积和场地。巴马瑶族自治县、大化瑶族自治县、都安瑶族自治县、宜 州市以及罗城仫佬族自治县这五个地方的适宜区域呈上升的趋势,未来5年最适宜气候区域 在不断的增加。同时适宜气候区域与次适宜气候区域发生明显的变化趋势,适宜气候区域与 次适宜气候区域在缓慢的减少。说明未来5年在这些区域的桑树种植面积以及养蚕场地可以 适当的增加,在维持现状的基础上,可以适当的增加种植面积和场地。

以上所述,仅为本发明的具体实施方式,但发明的保护范围并不局限于此,任何熟悉本 领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在发明的 保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号