首页> 中国专利> 移动源污染排放主要影响因素预测方法、系统及存储介质

移动源污染排放主要影响因素预测方法、系统及存储介质

摘要

本发明的一种移动源污染排放主要影响因素预测方法、系统及存储介质,以机动车为研究对象,步骤如下:首先,将收集的车辆年检数据和尾气遥测数据预处理;然后,利用Spearman相关性分析排除与移动源排放气体中主要成分CO、HC、NO气体浓度不存在相关性的因素;再使用Lasso算法确定各成分的关键影响因子,并采用神经网络构建污染物排放预测模型;最后,在测试集上验证该模型用于移动源污染排放主要成分预测的有效性。本发明模型预测的结果表明,基于特征筛选的移动源污染排放数据预测神经网络模型,具有较高的预测精度,可以降低移动源污染排放检测成本以及为相关部门制定相关政策提供理论依据。

著录项

说明书

技术领域

本发明涉及环境监测技术领域,具体涉及一种移动源污染排放主要影响因素预测方法、系统及存储介质。

背景技术

随着我国经济的发展,城市机动车、飞机、轮船数量不断增多,在提升全民幸福度同时,这些移动源排放的有害气体也对人民的健康造成损害。因此,有必要对移动源尾气中有害气体的排放建立一套科学完善的分析与预测方法,以便有关部门对移动源尾气排放进行高效的管控。

由于在实际的移动源排气检测工作中,移动源的行驶速度、加速度,测量点的风力、风向,环境温度、湿度、气压及日照角度等都对测量结果有着或多或少的影响,而现有的污染物浓度预测方法,只是从污染物本身出发,没有考虑到移动源污染排放检测受到外部因素的影响,造成对移动源污染排放评估不够准确、可靠,给有关部门对移动源污染排放各成分的针对性管控造成困难。

发明内容

本发明提出的一种移动源污染排放主要影响因素预测方法、系统及存储介质,提供了一种基于特征选择和神经网络的移动源污染排放主要影响因素预测方法。

为实现上述目的,本发明采用了以下技术方案:

一种移动源污染排放主要影响因素预测方法,包括以下步骤:

(1)收集城市目标路段机动车尾气遥测数据和相应车辆年检数据;

(2)对收集的数据进行预处理;

(3)对预处理后的数据,采用Spearman系数对尾气排放中主要成分——CO、HC、NO与外部影响因素进行相关性分析;

(4)对步骤(3)中得到的与尾气排放中与各成分间存在相关性的因素,使用Lasso算法对这一系列因素筛选出影响尾气CO、HC、NO各自排放浓度的主要因素;

(5)根据步骤(4)得到的影响各主要成分排放浓度的主要因素,采用BP神经网络对CO、HC、NO分别建立预测模型并于其它预测模型进行对比检验。

进一步的,所述步骤(1)中,抽取机动车尾气遥测数据的过程如下:

(11)从遥测系统采集的数据包括有:设备号,检测车辆通过时间,车牌号码,车辆颜色,识别置信度,车辆行驶速度,加速度,车身长度,CO实测浓度,HC实测浓度,NO实测浓度,烟度值,是否动态/静态测量,数据是否有效,是否通过,比功率,烟度值,风速,风向,气温,湿度,大气压;

(12)从车检中得到的数据包括:车牌号码,最大质量,变速器形式,档位数,燃油规格,车辆类型,使用性质,基准质量,驱动方式,驱动轮胎气压,发动机型号,发动机生产企业,发动机排量,是否有催化转化器,排气后处理装置。

进一步的,所述步骤(2)中,机动车尾气遥测数据和车检数据预处理如下:通过车牌号将遥测数据与车检数据记录的不同特征属性合并成一条信息更加全面的尾气数据记录;然后,找出数据段中缺失值进行丢弃处理,再用箱线图找出异常值进行丢弃处理,并删除无关属性,如设备号,检测车辆通过时间,车牌号码,车辆颜色,识别置信度等。无效属性删除后,剩余基准质量,行驶速度,行驶加速度,比功率,风速,风向,气温,湿度,大气压,车身长度,使用年限这11项属性为本发明所研究的相关外部属性。

进一步的,所述步骤(3)中,各尾气成分和基准质量,行驶速度,行驶加速度,比功率,风速,风向,气温,湿度,大气压,车身长度,使用年限这11项外部影响因素之间进行Spearman相关性分析处理如下:

(31)计算尾气成分与影响因素的Spearman系数ρ的公式如下:

其中,x

(32)然后使用Spearman系数ρ计算相应的统计量p,公式如下:

其中,n为样本数目,p为影响因素与排放物的统计量。

(33)将系数p与t=1.645(α=0.05)进行比较,小于t的值则说明对应属性与尾气成分间没有相关性。

进一步的,所述步骤(4)中,使用Lasso算法对筛选主要因素步骤如下:

(41)使用Lasso算法计算与各尾气成分存在相关性的系数

其中λ为非负正则化参数,y为尾气浓度值,x

(42)筛选出与对应尾气成分的系数为0的属性,将对应尾气相关系数为0的属性和步骤(3)中不存在相关性的变量删除。

进一步的,所述步骤(5)中,模型建立及对比步骤如下:

(51)构建尾气主成分浓度预测模型如下:对步骤(4)中得到的各成分的主要因素进行零均值归一化后,将其作为神经网络的输入,建立三层BP神经网络,且将数据按8:1:1划为训练集,验证集和测试集,其中训练集和验证集来训练网络,测试集用来衡量模型的预测效果。

另一方面,本发明还公开一种移动源污染排放主要影响因素预测系统,包括以下单元,

数据收集单元,用于收集城市目标路段机动车尾气遥测数据和相应车辆年检数据;

数据处理单元,用于对收集的数据进行预处理;

相关性分析单元,用于对预处理后的数据,采用Spearman系数对尾气排放中指定成分——CO、HC、NO与外部影响因素进行相关性分析;

因素筛选单元,用于对得到的与尾气排放中与各成分间存在相关性的因素,使用Lasso算法对这一系列因素筛选出影响尾气CO、HC、NO各自排放浓度的因素;

预测单元,用于根据得到的影响各特定成分排放浓度的特定因素,采用BP神经网络对CO、HC、NO分别建立预测模型并与其它预测模型进行对比检验。

与其它预测模型对比操作如下:将本发明所提出的模型的平均绝对误差(MeanAbsolute Error,MAE),均方根误差(Root Mean SquareError,RMSE)与已筛选变量的支持向量回归预测模型(SVR)和随机森林预测模型(RandomForest),以及为筛选相关变量的神经网络预测模型(ANN)进行对比。

本发明与现有方法相比的优点在于:传统尾气预测,不考虑数据监测受到的影响,预测精度较低。本发明对各尾气成分,利用Spearman相关性分析和Lasso特征筛选找出各自的影响因子,以此建立神经网络模型进行预测,本发明的预测结果稳定性与准确性更优。

相比其他方法,本发明综合考虑外部因素对检测的影响,对不同的尾气成分筛选出主要影响因素,再分别建模进行预测,有效的提高了预测精度,为有关部门制定相关政策提供强有力的科学技术依据。

附图说明

图1为本发明流程图;

图2为各尾气成分与影响因素的Spearman系数;

图3为各尾气成分与影响因素基于Spearman系数的统计量;

图4为三层BP神经网络模型;

图5为CO预测模型的对比;

图6为HC预测模型的对比;

图7为NO预测模型的对比。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。

如图1所示,本实施例所述的移动源污染排放主要影响因素预测方法,具体实现如下:

(1)收集城市目标路段机动车尾气遥测数据和相应车辆年检数据;

(11)从遥测系统采集的数据包括有:设备号,检测车辆通过时间,车牌号码,车辆颜色,识别置信度,车辆行驶速度,加速度,车身长度,CO实测浓度,HC实测浓度,NO实测浓度,烟度值,是否动态/静态测量,数据是否有效,是否通过,比功率,烟度值,风速,风向,气温,湿度,大气压;

(12)从车检中得到的数据包括:车牌号码,最大质量变速器形式,档位数,燃油规格,车辆类型,使用性质,基准质量,驱动方式,驱动轮胎气压,发动机型号,发动机生产企业,发动机排量,是否有催化转化器,排气后处理装置。

(2)对收集的数据预处理,主要包括尾气遥测数据和车检数据的融合,尾气数据清洗,异常值处理。

(21)数据融合:将具有同一车牌号码的遥感监测尾气数据记录与车辆年检数据记录的不同特征属性合并形成一条信息更加全面的尾气数据记录;

(22)尾气数据清洗:删除无效(汽车公比大于20kW/t)尾气数据记录,删除无关属性字段,如设备号,检测车辆通过时间,车牌号码,车辆颜色,识别置信度等。

(23)异常值处理:使用箱线图判断数据是否异常,将异常值抛弃。具体实现如下:

[1]分别计算各属性的下四分位数(Q1)上四分位数(Q3)及中位数(Q2);

[2]计算四分位距IQR=Q3-Q1;

[3]计算最大值max=Q3+1.5IQR,最小值min=Q1-1.5IQR,大于max或小于min的数值即为该属性样本的异常值。

(3)尾气排放成分与影响因素的Spearman相关性分析。

基于步骤2,剩余与机动车尾气检测相关的因素:行驶工况(速度、加速度)、车辆使用年限、风速、气温、基准质量、比功率、风向、湿度、大气压、车身长度等。采用Spearman相关性分析判断各因素与尾气成分是否有相关性;

利用式

其中ρ为某因素与排放物的Spearman系数,x

然后利用式

其中n为样本数目,此处样本数为3560,ρ为影响因素与排放物的Spearman系数,p为影响因素与排放物的统计量。此处样本数为3560,得到p值如图3。

将系数p与t=1.645(α=0.05)进行比较,小于t的值则说明对应属性与尾气成分间没有相关性,不在纳入研究。从图3可知,CO浓度与车长没有统计学意义;HC浓度和基准质量、速度、风向没有统计学意义;NO浓度和风速、温度、大气压没有统计学意义

(4)使用式

其中λ为非负正则化参数,y为尾气浓度值,x

(5)根据步骤(4)得到的影响各主要成分排放浓度的主要因素,采用BP神经网络对CO、HC、NO分别建立预测模型并于其它预测模型进行对比检验。

(51)采用BP神经网络模型预测

基于步骤(3)(4)的基础上,删除与各尾气无相关性属性和Lasso计算的权值系数为0的属性。

对CO的建模中,将使用年限,行驶速度,行驶加速度,比功率,风速,温度,湿度,大气压这8项属性作为CO的影响因子,将CO的浓度作为预测输出;对HC的建模中,将使用年限;风速,温度,湿度,大气压这5项属性作为HC的影响因子,将HC的浓度作为预测输出;对NO的建模中,将基准质量,行驶速度,车长,湿度,大气压,风向这6项属性作为NO的影响因子,将NO的浓度作为预测输出。

模型采用三层BP神经网络,利用公式

神经网络采用基于TensorFlow的Keras库搭建线性叠加模型。将预处理后的数据零均值归一化后,数据集按照8:1:1的比例,将数据(3560条)划分为训练数据集(2848条)、验证数据集(356条)和测试数据集(356条)。

零均值归一化:通过中心化和标准化处理,最终得到均值为0,标准差为1的服从标准正态分布的数据。本发明将所有属性按式

其中x为某一属性的一个样本值,x

下表为各模型参数

将本发明提出的预测模型与其它模型对比检验

完成归一化处理,最终输出模型的预测结果。将预测结果的平均绝对误差(MeanAbsolute Error,MAE),均方根误差(Root Mean Square Error,RMSE)两项指标与同样输入属性的支持向量回归(SVR),随机森林(RandomForest),以及未进行特征筛选的神经网络ANN进行对比。

图5、图6、图7分别是CO预测模型对比、HC预测模型对比和NO预测模型对比,总体来看,本发明设计的L-ANN模型的绝对误差和均方根误差比其他预测模型都要小,性能最好;其次为SVR回归模型,在绝大部分情况下优于其它两种模型;RandomForest回归模型和ANN模型的各项性能最差。可见,在本发明中的各项移动源污染排放成分预测中,L-ANN模型的预测结果有着较高的准确性和稳定性。

另一方面,本发明还公开一种移动源污染排放主要影响因素预测系统,包括以下单元,

数据收集单元,用于收集城市目标路段机动车尾气遥测数据和相应车辆年检数据;

数据处理单元,用于对收集的数据进行预处理;

相关性分析单元,用于对预处理后的数据,采用Spearman系数对尾气排放中指定成分——CO、HC、NO与外部影响因素进行相关性分析;

因素筛选单元,用于对得到的与尾气排放中与各成分间存在相关性的因素,使用Lasso算法对这一系列因素筛选出影响尾气CO、HC、NO各自排放浓度的因素;

预测单元,用于根据得到的影响各特定成分排放浓度的特定因素,采用BP神经网络对CO、HC、NO分别建立预测模型并与其它预测模型进行对比检验。

第三方面,本发明还公开一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。

可理解的是,本发明实施例提供的系统与本发明实施例提供的方法相对应,相关内容的解释、举例和有益效果可以参考上述方法中的相应部分。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号