基于主成分分析的逐月环境空气质量综合指数计算方法.docx

基于主成分分析的逐月环境空气质量综合指数计算方法.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于主成分分析的逐月环境空气质量综合指数计算方法 环境空气综合评价方法的选择对环境管理起着重要的决策和指导作用。目前的综合评价方法主要包括综合指数法、灰色聚类法、模糊综合评价法、主成分分析法、人工神经网络法等。其中, 综合指数法具有计算简单、指标覆盖全面的优点, 在环境管理中被广泛应用于不同城市间空气质量的比较或同一城市空气质量的变化趋势分析;其他几种方法在科学研究中有所使用, 但在环境管理中的实际应用并不多见。由于与空气质量标准相关联, 综合指数法中的单项指数还可应用于制定空气质量分级标准。在《环境空气质量标准》 (GB 3095—2012)发布前, 环境空气质量综合指数主要包括二氧化硫、二氧化氮、可吸入颗粒物等3项指标, 对于当前新开展监测的细颗粒物、臭氧、一氧化碳等指标应如何纳入综合指数, 仍缺乏充分的研究论证。在综合指数法中, 各污染物均使用评价浓度除以质量标准中的浓度限值进行标准化, 再按照等权重进行求和。但由于不同污染物间具有一定的关联性, 因此综合指数法会有一定的信息冗余, 部分污染物的实际权重可能会被放大。另外, 综合指数计算过程中各项污染物评价浓度选取方法和评价标准的差异也会影响污染物的实际权重和信息冗余情况, 有必要对这一现象进行深入分析, 使得所采用的评价方法符合环境管理的需求。主成分分析法与其他方法相比的优点是指标权重的确定较为客观, 在环境空气质量综合评价中有不少应用。研究提出了4种备选综合指数计算方法, 并采用主成分分析技术对不同综合指数计算方案下污染物的权重系数进行了分析, 提出了适合中国当前环境管理需要的综合指数计算方法, 为有关科学研究和环境管理提供借鉴。 1 实验部分 1.1 污染物统计《环境环境监测工作》 数据来自74个实施环境空气质量新标准城市2013年6项污染物逐月统计数据, 污染物浓度统计方法依据《环境空气质量评价技术规范 (试行) 》中有关规定。污染物统计指标如表1所示, SO2、NO2、PM10、PM2.5的统计指标均为月均值浓度, CO的统计指标为月均值或日均值95百分位数浓度, O3统计指标为日最大8 h值的月均浓度或90百分位数浓度。6项污染物统计指标分别按照各自在《环境空气质量标准》 (GB 3095—2012) 中的浓度限值进行标准化。根据统计指标和参比标准的差异, 共提出4种备选标准化方案。 1.2 不同综合指数的计算方案和步骤 定义单项指数占综合指数比例最大的污染物为主要污染物, 对不同的综合指数计算方案分别统计逐月的主要污染物情况。同时对各项污染物统计指标间的相关关系进行全年和逐月分析。 为了研究不同计算方案下各污染物的最优权重系数, 以主成分分析方法的结果为参比进行比选研究。主成分分析技术主要被用于在保证较小的信息损失下通过选择较少的新指标来代替原始指标, 经过线性变换以较少的综合变量来代替原来的多维变量, 从而起到减少信息冗余和信息噪音的目的。分析方法:设有n个样本, 每个样本有p项污染物, 构成n×p阶矩阵Xi×j(i=1, 2, …, n;j=1, 2, …, p) 。首先对矩阵Xi×j的p个列向量进行标准化, 使其成为均值为0、方差为1的列向量, 记为Zij(i=1, 2, …, n;j=1, 2, …, p) 。然后求出其相关系数矩阵R, 并求R的p个特征根λj(j=1, 2, ……, p) 和对应的特征向量Ej= (e1 j, e2 j, ……, ep j)T。构造的新特征向量彼此不相关。以特征根为权重计算各特征向量的贡献率: 在经典主成分分析方法中, 通常是选取累积贡献率大于85%的最少数量的特征变量为指标来进行综合评价, 从而起到减少指标维度的目的。但研究的目的是对不同综合指数计算方案的信息冗余情况进行比较, 并不是用于降低指标维度, 因此将累积贡献率设为100%, 即保留所有的特征向量信息。将p个特征向量按照其权重不同, 进行列向量加权求和, 得出新的综合向量: 该综合向量代表了给定的统计指标下各项污染物的最优系数, 以最优系数为权重计算综合指数能够在不损失信息的前提下去除冗余信息。将主成分分析中的标准化方法与表1中标准化方法进行简单数值变换后就可以得出不同计算方案下的优化系数。各项污染物的优化系数均以PM2.5系数为1进行归一化得出最优权重系数。 数据分析和处理使用Matlab、SPSS、Excel软件完成。 2 结果与分析 2.1 主要污染物频率 图1为不同综合指数计算方案下74个城市逐月主要污染物的分布情况。 从图1可以看出, 以SO2为主要污染物的频率很小, 仅在1、2、11、12月的个别城市出现过。以CO为主要污染物的频率也很小, 仅方案3中个别城市在2、3、11、12月出现过。说明SO2、CO污染物浓度较低, 在不同计算方案下都不

文档评论(0)

xlwkyc + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档