法律状态公告日
法律状态信息
法律状态
2020-03-27
授权
授权
2017-07-14
实质审查的生效 IPC(主分类):G06F17/50 申请日:20170119
实质审查的生效
2017-06-20
公开
公开
技术领域
本发明涉及一种基于EPR进化多项式回归的管网漏失预测模型的建立方法,属于城市供水管网领域。
背景技术
供水管网是城市的“生命线”,负责为城市输送新鲜的“血液”,是保障城市稳定转动的前提。供水管网漏失的发生,将会带来巨大的社会影响及经济损失。因此,提前判断漏失发生的高风险管道,对供水管网的漏失状况进行预测,降低漏失发生的可能性,有着十分重要的意义。
目前常用于供水管网漏失预测的模型主要有两大类:一类是基于实验室试验的物理研究模型,一类是计算机模拟的数据分析模型。第一类模型的研究需要对造成管道漏失的各影响因素间的关系有着明确的认知,而实际各影响因素间关系复杂。第二类模型主要包括两个内容,一是基于老化机制的物理模型,此模型的构建需要对特定的研究管道进行时间跟踪,数据的获取比较困难,耗费大量的时间精力;二是基于历史漏失数据的统计模型,该模型的研究可以得到漏失次数与各影响因素间明确的数学关系,是当前研究的热点。
我国城市供水管网的基础数据量大,漏失数据记录不完善,导致管道漏失的原因众多且关系复杂非线性。已有精度较高的模型存在无明确模型公式的问题,而有明确公式表示的模型的精度有待提高,公式结构有待简化,公式获取效率有待提升。同时目前尚无明确的理论方法对模型建立后的预测效果进行评价,并对误差影响进行纠正。
发明内容
鉴于以上问题,本方法的目的是提供一种新的可处理大量漏失数据、挖掘非线性关系、构建明确模型表达式、提高建模效率的基于EPR进化多项式回归的管网漏失预测模型的建立方法,并对模型建立后的预测误差影响的纠正提供方法,以提高模型的预测精度,最后将各模型预测的漏失次数加权得到区域漏失次数。模型的建立和区域漏失次数的确定能够在日常管理中尽早发现具有漏失风险的管道,降低事故发生的概率,减少经济损失。
本方法的技术方案如下:
一种基于EPR进化多项式回归的管网漏失预测模型的建立方法,其特征在于该方法包括如下步骤:
第一步:预测模型建立的前期数据准备。
(1)信息完善:在城市供水管网的地理信息系统(Geographic InformationSystem,GIS)的漏失系统中,完善漏失管道的相关信息,包括管材、管径、管道埋设时间、管道编号、管长、漏失事件接报时间等。
(2)信息编码:根据影响因子的属性不同,管道管材作为不连续变量,管道管材分别为:钢管、球墨铸铁管、普通铸铁管、镀锌管、钢塑复合管;
(3)信息初步处理:将同一根管道的漏失事件接报时间(如2015年2月23日)减去管道埋设时间(如1988年3月21日),得到该管道发生漏失时的年龄,即管龄;
第二步:影响因子的确定
根据发生漏失管道的完整信息,本方法选定管长L、管龄A和管径D为影响因子,每年漏失发生次数Z(以下简称:年漏失次数)随影响因子而改变;
第三步:数据分组处理方法
(1)选定GIS中n年完整的漏失管道信息作为原始数据,其中前(n-1)年原始数据用于预测模型的建立,第n年的原始数据用于预测模型的验证;
(2)根据管材的不同,对五种管材分别建立各自的漏失预测模型,具体方法见第四步;
(3)根据不同管材在供水管网中实际铺设的管径D不同,在每一种管材内按照管径大小再进行分组,相同管径的为一组;
(4)根据不同管材管径分组内每一组管径的管道每年漏失发生次数的不同,按照公式(1)分别计算每一种管材管径分组内每一组管径所有管道总的年漏失次数;
式中:Z为每一组管径年漏失次数,次/年;i为每一相同管径的管道编号;Zi为管道i的前(n-1)年总漏失次数,次;n-1为研究所用原始数据的年数;
(5)根据不同管材管径分组内的每一组管径的管道在发生漏失时的管龄的不同,按照公式(2)计算该管材管径分组内每一组管径所有管道的加权管龄;
式中:A为(n-1)年管材管径分组内每一组管径所有管道的加权管龄,年;Ai为(n-1)年管材管径分组内每一组管径内某管道i的管龄,年。
(6)根据不同管材管径分组内每一组管径管道长度,即管长的不同,按照公式(3)分别计算每一组管径所有管道总的长度L;
L=∑li>
式中:L为每一组管径对应管道的总长,km;li管道i的长度,km。
最终得到每一种管材的对应的每一组管径、管长、平均加权管龄、年漏失次数,每一管材分为m组不同的管径,则有为m组的相应分组数据;
第四步:采用EPR建立漏失预测模型。
(1)EPR的参数设置:对每一种管材漏失管道进行EPR建模,EPR建模采用的自变量为管长L、管龄A和管径D,因变量为Z;表达式中多项式的项数小于等于3;函数类型为指数函数f(x)=ex,指数选取范围为-2、-1、-0.5、0、0.5、1、2;偏差项a0取值为0;基于以上设置,建立管网漏失预测模型;
(2)拟合精度衡量指标:漏失预测模型拟合程度优劣按照公式(4)采用决定系数(Coefficient of Determination,CoD)来判断,CoD取值范围为[0,1],值越大对应的拟合精度越高:
式中:
第五步:漏失预测模型的验证
漏失预测模型预测程度的优劣按照公式(5)采用均方根误差(Root Mean SquareError,RMSE)表示,RMSE值越小,预测精度越高;
式中:
第六步:区域供水管网漏失次数
以上各步骤得到了某一管材的每一分组管径漏失预测模型后,再用相同方法建立其余四种管材的漏失预测模型,采用各管材模型根据某一年的管网数据,分别预测以后某年各对应管材的漏失次数,加和得到该区域管网漏失次数总数,即每种管材的每一种管径的年漏失次数均进行加和。
进一步优选,所采用的管网漏失预测模型为所建立的管网漏失预测模型中CoD取值最接近1的和RMSE值最小的模型。
根据上述一种基于EPR进化多项式回归的管网漏失预测模型的建立方法,先对建模的原始数据进行处理,确定管径、管长和管龄为影响因子;然后分别对五种管材建模,每种管材按照管径、管长、平均加权管龄和年漏失次数为内容进行分组,建立以管径、管长、管龄为自变量,年漏失次数为因变量的漏失预测模型,采用CoD判断模型的拟合程度;并用实际漏失数据对漏失预测模型进行验证,采用RMSE评判模型的预测能力;最后将五种管材根据的各自建立的漏失预测模型预测出的年漏失次数,加和得到最终该区域管网漏失次数总数。
与现有供水管网漏失预测模型相比,本发明的有益成果为:(1)模型的建立采用EPR软件,该方法运行界面简洁,操作简便,能够根据需要快速拟合得出模型公式,并且公式结构简单;(2)模型公式建立采用EPR软件中的指数形式,确定的模型形式更有针对性,提高了模型拟合的效率;(3)将各管材根据各自建立的不同漏失预测模型预测出的年漏失次数,按照n年各管材实际总漏失次数比,加权得到最终的区域供水管网漏失次数,此举保留了各管材年漏失次数的差异的同时,将年漏失次数加权得到了区域漏失次数,结果更准确。
具体实施方式
为更好的理解和实施本发明,下面结合实施例进行详细阐述。
鉴于以上问题,本方法的目的是提供一种新的可处理大量漏失数据、挖掘非线性关系、构建明确模型表达式、提高建模效率的基于EPR进化多项式回归的管网漏失预测模型的建立方法,并对模型建立后的预测误差影响的纠正提供方法,以提高模型的预测精度,最后将各模型预测的漏失次数加权得到区域漏失次数。模型的建立和区域漏失次数的确定能够在日常管理中尽早发现具有漏失风险的管道,降低事故发生的概率,减少经济损失。
本方法的技术方案如下:
一种基于EPR进化多项式回归的管网漏失预测模型的建立方法,其特征在于该方法包括如下步骤:
第一步:预测模型建立的前期数据准备。
(1)信息完善:在城市供水管网的地理信息系统(Geographic InformationSystem,GIS)的漏失系统中,完善漏失管道的相关信息,包括管材、管径、管道埋设时间、管道编号、管长、漏失事件接报时间等。
(2)信息编码:根据影响因子的属性不同,管道管材作为不连续变量,管道管材分别为:钢管、球墨铸铁管、普通铸铁管、镀锌管、钢塑复合管;
(3)信息初步处理:将同一根管道的漏失事件接报时间(如2015年2月23日)减去管道埋设时间(如1988年3月21日),得到该管道发生漏失时的年龄,即管龄。
第二步:影响因子的确定。
根据发生漏失管道信息的完整性等,本方法选定管长L、管龄A和管径D为影响因子,每年漏失发生次数Z(以下简称:年漏失次数)随影响因子而改变。
第三步:数据分组处理方法。
(1)选定GIS中10年完整的漏失管道信息作为原始数据,其中前9年原始数据用于预测模型的建立,第10年的原始数据用于预测模型的验证。
(2)根据管材的不同,对五种管材分别建立各自的漏失预测模型,本实施例以镀锌管的漏失预测模型建立方法为例进行说明。
(3)根据镀锌管在供水管网中实际铺设的管径D不同,将镀锌管的漏失数据按照管径大小进行分组,分为DN15、DN20、D25…等7组。
(4)根据镀锌管7组不同管径分组内的管道每年漏失发生次数的不同,按照公式(6)分别计算镀锌管7组管径分组内各组所有管道总的年漏失次数。
式中:Z为年漏失次数,次/年;i为管道编号;Zi为管道i的9年总漏失次数,次。
(5)根据镀锌管7组不同管径分组内的管道在发生漏失时的管龄的不同,按照公式(2)计算镀锌管7组管径分组内各组所有管道的加权管龄。
式中:A为9年管材管径分组内每一组管径所有管道的加权管龄,年;Ai为9年管材管径分组内每一组管径内某管道i的管龄,年。
(6)根据镀锌管7组不同管径分组内管道长度,即管长的不同,按照公式(3)分别计算镀锌管7组管径分组内各组所有管道总的长度L。
L=∑li(3)
式中:L为管径对应管道的总长,km;li管道i的长度,km。
最终得到镀锌管的以管径、管长、平均加权管龄、年漏失次数为内容的7组分组数据。
本实施例的部分分组数据如表1所示
表1 镀锌管漏失次数与相关属性
第四步:采用EPR建立漏失预测模型。
(1)EPR的参数设置:EPR建模采用的自变量为管长L、管龄A和管径D,因变量为年漏失次数Z;表达式中多项式的项数小于等于3;函数类型为指数函数f(x)=ex,指数选取范围为-2、-1、-0.5、0、0.5、1、2;偏差项a0取值为0。基于以上设置,建立管网漏失预测模型。
(2)拟合精度衡量指标:漏失预测模型拟合程度优劣按照公式(4)采用决定系数(Coefficient of Determination,CoD)来判断,CoD取值范围为[0,1],值越大对应的拟合精度越高:
式中:
第五步:漏失预测模型的验证。
漏失预测模型预测程度的优劣按照公式(5)采用均方根误差(Root Mean SquareError,RMSE)表示,RMSE值越小,预测精度越高。
式中:为第10年漏失次数的预测值;y为第10年漏失次数的真实值;m为分组数据的组数,根据镀锌管分组的实际情况,在此取7。
本方法针对镀锌管建立的最优自变量为管长L、管龄A和管径D、因变量为Z的漏失模型为公式(7),CoD为0.9164,RMSE为54.7257。其他四种管材的漏失预测模型建立方法相同。
Z=5.69×103AD-2L-0.5exp(D0.5L0.5A-1)(7)
第六步:区域供水管网漏失次数。
以上各步骤得到镀锌管的漏失预测模型后,再用相同方法分别建立钢管、球墨铸铁管、普通铸铁管和钢塑复合管的漏失预测模型,各管材模型预测2016年该管材的总漏失次数分别为21,19,176,1697,79,加和得到该区域管网漏失次数总数为1992。
根据上述一种基于EPR进化多项式回归的管网漏失预测模型的建立方法,先对建模的原始数据进行处理,确定管径、管长和管龄为影响因子;然后分别对五种管材建模,每种管材按照管径、管长、平均加权管龄和年漏失次数为内容进行分组,建立以管径、管长、管龄为自变量,年漏失次数为因变量的漏失预测模型,采用CoD判断模型的拟合程度;并用实际漏失数据对漏失预测模型进行验证,采用RMSE评判模型的预测能力;最后将五种管材根据的各自建立的漏失预测模型预测出的年漏失次数,加和得到最终该区域管网漏失次数总数。
机译: 基于深度学习的页岩气产量预测模型建立方法
机译: 基于深度学习的页岩气产量预测模型建立方法
机译: 基于脑核磁共振图像多维纹理的预测模型建立方法