首页> 中国专利> 一种基于对应分析和多元线性回归的污染源识别方法

一种基于对应分析和多元线性回归的污染源识别方法

摘要

本发明公开了一种基于对应分析和多元线性回归的环境中有污染物源解析方法,该方法包括以下步骤:首先,基于污染源样本数据,利用对应分析法对污染源进行识别,确定主因子的个数;其次,利用多元线性回归实现因子荷载的污染源贡献率的计算,实现特征污染物的源解析。本发明提供的基于对应分析和多元线性回归的污染源识别方法,利用对应分析方法对污染源进行识别,复合多元线性回归方法计算污染源贡献率,将因子荷载识别过程看作是一个非线性分类过程,是一个多因子综合分类问题,是一个模式识别过程,实用性强,有广泛的推广应用价值,为环境管理部门应对污染事故、控制污染风险提供了可靠的技术保障。

著录项

说明书

技术领域

本发明涉及污染源识别技术领域,特别是涉及一种基于对应分析和多元线性回归的污染源识别方法。

背景技术

污染源识别技术是对污染物的来源进行判别、解析与评价的一种方法。当前的污染源识别技术大体可以分为三种:清单分析法、扩散模型和受体模型。清单分析法是通过观测和模拟污染物的源排放量、排放特征及排放地理分布等,建立列表模型的一种源解析方法;扩散模型属于预测式模型,它是通过输入各个污染源的排放数据和相关参数信息来预测污染物的时空变化情况;受体模型则通过对受体样品的化学和显微分析,确定各污染源贡献率的一类技术,其最终目的是识别对受体有贡献的污染源,并且定量计算各污染源的分担率。在基于受体模型化学法的各类源解析方法中,多元统计法应用简单,且不需要预先知道各个污染源的指纹谱图,不需要事先对研究区域污染源进行监测,仅需要受体样品监测数据。正定矩阵因子分解模型属于污染物源解析技术中的多元统计方法,是一种基于分解矩阵中元素非负,利用数据标准偏差来进行优化的因子分析方法。该技术的核心思想是主成分分析,传统的基于最小二乘法的主成份因子分析(PCA),由于采取基于行或列对受体样品数据D进行标准化,这将导致因子分析过程的数据失真。他们同时认为基于最小二乘法的PCA隐含地假定样本数据存在非现实的标准偏差,从而导致PCA不能得到最小方差的最优解。利用正定矩阵因子分解模型开展源解析研究,核心环节在于非负约束因子分解,以及利用因子荷载矩阵进行的污染源识别。

当前针对污染源识别的研究很少,主要的污染源识别方法就是通过对源谱和因子荷载的图形观察实现定性比较,或通过计算源谱和因子荷载的偏差实现半定量比较。这些方法多没有考虑污染源谱的非线性特征,识别结果不能真实反映因子荷载与污染源谱的对应关系。

发明内容

本发明的目的是提供了一种基于对应分析和多元线性回归的污染源识别方法,利用对应分析方法对污染源进行识别,复合多元线性回归方法计算污染源贡献率,将因子荷载识别过程看作是一个非线性分类过程,是一个多因子综合分类问题,是一个模式识别过程。

一种基于对应分析和多元线性回归的污染源识别方法,包括以下步骤:

步骤一:基于污染源样本数据,利用对应分析法对污染源进行识别,具体包括:

对污染源样本数据进行标准化处理;

计算污染源样本的相关系数矩阵;

计算相关系数矩阵的特征值和相应的特征向量;

取特征值大于1的所有因子作为主因子,确定主因子的个数;

步骤二:利用多元线性回归实现因子荷载的污染源贡献率的计算,实现特征污染物的源解析,具体包括:

建立多元现象回归模型:

y表示污染源的总浓度,P表示提取的主因子个数,X

要求X

Z为污染源的正太标准偏差,X

依据公式:t

可选的,所述对污染源样本数据进行标准化处理,

依据公式如下:

其中,

i表示监测点个数,j表示监测点的第几类污染物位置,x

所述计算污染源样本的相关系数矩阵,

依据公式如下:

其中,

可选的,所述污染源样本包括多环芳烃或重金属。

与现有技术相比,本发明提供的基于对应分析和多元线性回归的污染源识别方法具有以下有益效果:

第一,该方法能够快速、准确的追溯污染物的来源,实用性强,有广泛的推广应用价值,为环境管理部门应对污染事故、控制污染风险提供了可靠的技术保障;

第二,传统的污染物源解析技术只能大致给出对环境受体贡献较大的污染源类别,而不能给出具体排放源对受体贡献的大小,缺乏对污染防治工作的实际指导意义,通过本发明所述方法,全面揭示污染源排放组成特征,筛选能够指示污染来源的特征标识物;

第三,本发明为制定区域污染控制对策及区域环境质量改善提供技术支持,使今后环境管理部门面对污染问题时,可以通过系统、完整的源解析方法和相应的数据信息系统,迅速识别污染源,从而进行有污染防控。

具体实施方式

基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供了一种基于对应分析和多元线性回归的污染源识别方法,利用对应分析方法对污染源进行识别,复合多元线性回归方法计算污染源贡献率,将因子荷载识别过程看作是一个非线性分类过程,是一个多因子综合分类问题,是一个模式识别过程。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合具体实施方式对本发明作进一步详细的说明。

一种基于对应分析和多元线性回归的重金属污染源识别方法,包括如下步骤:

步骤一:应用对应分析方法进行重金属污染源计算,确定主成分因子数,所述的应用对应分析方法进行污染源计算,包括以下步骤:

数据标准化处理,依据公式如下:

其中,

计算样本的相关系数矩阵,依据公式如下:

其中,

计算相关系数矩阵的特征值和相应的特征向量:

特征值:λ

特征向量:a

取特征值大于1的所有因子作为主因子,确定主因子的个数;

步骤二,利用多元线性回归实现因子荷载的污染源贡献率的计算,实现特征污染物的源解析,包括以下步骤:

建立多元线性回归模型:

y表示污染源的总浓度,P表示提取的主因子个数,X

要求X

Z为污染源的正态标准偏差,X

依据公式:t

其中,步骤一中,主因子的确定过程由对应分析实现,具体包括:

(1)由原始资料阵X,计算规格化的概率矩阵

(2)计算过渡矩阵

Z=(z

其中,i=1,...,n;j=1,...,p

x

x

(3)进行因子分析

①R型因子分析

计算斜差阵A=Z'Z的特征根,并按其累计百分比大于等于85%,提取前m个特征根,并计算相应的单位特征向量,得到新因子荷载矩阵;

②Q型因子分析

对上述所求的m个特征根,计算其对应与矩阵B=ZZ'的单位特征向量,从而得到Q型因子荷载阵;

(4)综合R-Q分析判断出主因子。

利用本发明的方法对晋江流域沉积物中的重金属污染源进行识别,用抓斗式采样器采集了10个站位表层沉积物样品。本次数据分析主要对As、Hg、Cd、Cr、Pb进行分析,结果如表1所示。

表1

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号