基于深度学习的雾霾质量浓度预测研究.docx

基于深度学习的雾霾质量浓度预测研究.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

基于深度学习的雾霾质量浓度预测研究

?

?

王梓霖

摘??要:為有效地预测雾霾污染程度的主要评价指标PM2.5质量浓度,文章使用Blending集成学习策略并行连接CNN与LSTM,并建立基于CNN-LSTM集成学习的PM2.5质量浓度预测模型。经过真实数据验证,该模型对PM2.5质量浓度预测具有有效性,且相较于串联CNN-LSTM预测模型具有优越性。

关键词:卷积神经网络;长短时间记忆网络;集成学习;PM2.5质量浓度预测

我国雾霾污染问题日益严重,对人们健康造成巨大威胁,因此,雾霾质量浓度预测至关重要。PM2.5是评价雾霾质量浓度的首要指标,目前已有研究针对PM2.5质量浓度进行预测。余辉等[1]使用空气污染物数据和气象数据,建立了差分整合移动平均自回归模型预测PM2.5质量浓度。但统计学方法适用于线性关系问题,不适用于高维非线性问题。Biancofiore等[2]使用带有和不带递归结构的神经网络模型对PM2.5质量浓度进行预测,并取得了较好结果。但人工神经网络无法刻画PM2.5质量浓度在时间维度上的特征。近年来,深度学习快速发展并被用于PM2.5质量浓度预测中。Chiou-Jye等[3]串联卷积神经网络(ConvolutionalNeuralNetworks,CNN)和长短时间记忆网络(Long-ShortTermMemory,LSTM)预测PM2.5质量浓度,提高了PM2.5质量浓度预测的准确性,但此模型会损失部分时序特征。针对上述问题,本文使用Blending集成学习策略并行结合CNN和LSTM预测PM2.5质量浓度。

1??基于CNN-LSTM集成学习的PM2.5质量浓度预测

1.1?卷积神经网络

卷积神经网络是受生物的视知觉机制启发而发展出来的一种有卷积运算的前馈神经网络,可提取数据之间隐藏的拓扑结构即空间维度上的特征。其核心结构为卷积层、池化层和全连接层,卷积神经网络通过卷积层对输入数据进行局部特征提取,并使用池化层对提取的特征进行压缩,随着卷积层的增加,提取的特征越来越抽象,最后将这些特征进行一维展开,并使用全连接层对其进行学习,最后输出结果。

1.2?长短时间记忆网络

长短时间记忆网络是循环神经网络的改进版本[4],核心为记忆细胞结构和3个门结构:遗忘门ft、输入门it和输出门ot。对于时刻t,ct-1为从上一时刻传来的记忆细胞信息,at-1为上一时刻的输出数据,xt为当前时刻的训练数据,其经过遗忘门、输入门、输出门,更新了记忆细胞信息ct并输出了当前时刻的输出at。LSTM模块中各门结构以及状态传递过程的计算公式如下:

LSTM的记忆细胞中包含了到当前时刻为止所有历史时刻中有用的信息,并通过门结构决定多少当前时刻信息被加入到记忆细胞,然后传递到下一时刻。

1.3?基于CNN-LSTM集成学习的PM2.5质量浓度预测模型

PM2.5质量浓度影响因素众多,数据之间不仅具有时序关系,还蕴含空间维度上的特征。CNN可以提取高维数据在不同层次上的特征,LSTM能够很好地刻画数据在时间维度上的特征,但串联结合CNN与LSTM会在一定程度上损失特征因子在时间维度上的特征,因此本文使用Blending集成学习策略并行连接CNN与LSTM,以此构建基于CNN-LSTM的PM2.5质量浓度预测模型,其结构和参数如图1所示。

2??实验结果与分析

2.1?数据集选取

数据来源为西安市2015年1月1日0:00~2018年5月31日23:00逐小时PM10,CO,NO2,SO2,O3质量浓度以及温度、湿度、风速、气压和露点数据。

2.2?数据预处理

均值补全数据:获取到的数据会有缺失情况,因此使用均值补全法对缺失数据进行补全。其计算表达式为公式(7)所示:

构造时间序列特征图:CNN网络模型的输入数据要求为网格数据,因此,需要构造时间序列特征图。本文将时间步特征数据按时间顺序依次排列,组成二维数据矩阵,以滑动窗口截取方式构造时间序列特征图。

2.3?实验结果分析

本文使用串联CNN-LSTM预测模型进行对比实验,并使用均方根误差作为评价标准。表1为两种模型在测试集上的均方根误差。

图2—3分别为串联CNN-STM预测模型和CNN-LSTM集成学习预测模型预测结果。

由均方根误差以及预测结果的对比图可以看出,基于CNN-LSTM集成学习的PM2.5质量浓度预测模型在真实数据集上得到了良好的运行效果,且比基于串联CNN-LSTM的PM2.5质量浓度预测模型均方根误差有所降低,预测效果有所提高。

3??结语

本文利用CNN和LSTM各自在空间维度和时间维度上的特征提取能力,使用Blending集成学习策略并行连接CNN和LSTM的PM2.5质量浓度预测模型。并通过实验表明基于CNN-L

文档评论(0)

134****4355 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档