当前我国空气污染形势日益严峻,空气质量的急剧下降致使人们的身体健康受到严重地危害,同时也妨碍了社会和经济的可持续发展。对pm_(2.5)浓度进行预测,从而监督空气污染状况,防止严重污染的发生受到我国及世界各国人民的广泛关注。因此提出有效的模型对pm_(2.5)浓度进行准确预测成为时下一个重要问题。本文提出了pls-m5p(partial Least Square-m5p)模型用于pm_(2.5)浓度预测。实验结果表明,在空气质量预测方面,与传统的预测模型如Bp神经模型相比,pls-m5p模型树有以下几个优势:(1)能提供直观的数学方程,并能够从获得的数学方程中更深入地理解预测结果。(2)使用pls-m5p模型生成的树状图可以显示因素的重要性,并且树状图的建立能使决策者更清晰地认识预测过程。(3)建模和预测所用时间很短,而且总是收敛的。(4)预测的精度更高。
当前我国空气污染形势日益严峻,空气质量的急剧下降致使人们的身体健康受到严重地危害,同时也妨碍了社会和经济的可持续发展。对pm2.5浓度进行预测,从而监督空气污染状况,防止严重污染的发生受到我国及世界各国人民的广泛关注。因此提出有效的模型对pm2.5浓度实施准确预测成为时下一个重要问题。本文提出了pls-m5p(partial Least Square-m5p)决策树模型用于pm2.5浓度预测,该方法首先使用偏最小二乘法(partial Least Square,pls)对空气质量数据进行分析,得到影响pm2.5浓度的主要因素,然后将这些空气质量因素作为m5p算法的输入向量,从而得到pm2.5的模型树浓度预测模型。利用北京市海淀新区的空气质量历史数据,对未来空气中pm2.5的浓度水平进行预测,同时本论文对所讨论的模型进行了在线网络的系统设计,系统基于J2EE,采用了Struts2等开源框架并运用了HTmL5技术进行了前台展示,HTmL5的运用增强了系统的交互性,也提升了用户的网络体验。本论文所包含的研究工作主要有:1、提取有关pm2.5浓度的空气质量数据:本文以北京市海淀新区为研究区域,数据集包括每天空气污染物的时间序列数据:pm2.5(ug/m3),pm10(ug/m3),二氧化硫(ug/m3),二氧化氮(ug/m3),一氧化碳(mg/m3),臭氧(ug/m3),温度(°C),相对湿度(%),空气压强(mbar),风速(m/s),风向(Dir)。选取2014年12月1日到2015年1月15日连续46天的天气数据作为实验数据。运用偏最小二乘法提取空气质量数据的主成分,得到影响pm2.5浓度的主要因素,分别是pm10、NO2、CO、SO2、湿度、风速作为pm2.5预测模型的重要输入参数。同时也利用了主成分分析方法作为对比,从偏最小二乘法提取的主要因素来看,对pm2.5浓度的预测精度有较好的提升。2、建立基于pls-m5p的pm2.5浓度预测模型:为了解决pm2.5预测精度不高以及预测过程不透明的问题,本文提出了pls-m5p模型,利用北京市海淀新区的空气质量历史数据,对未来空气中pm2.5的浓度水平进行预测。使用偏最小二乘法提取影响pm2.5浓度的主要因素,将提取的主要因素作为m5p模型树的输入向量,建立预测模型。实验结果表明,同Bp神经网络和pCA-m5p(principal Component Analysis-m5p)模型相比,pls-m5p模型用于pm2.5浓度水平的预测具有更高的准确度。在空气质量预测方面,与传统的预测模型如Bp神经模型相比,pls-m5p模型树有以下几个优势:(1)能提供直观的数学方程,并能够从获得的数学方程中更深入地理解预测结果。(2)使用pls-m5p模型生成的树状图可以显示因素的重要性,并且树状图的建立能使决策者更清晰地认识预测过程。(3)建模和预测所用时间很短,而且总是收敛的。(4)预测的精度更高。3、pm2.5Web预测系统的设计:为了实现pm2.5实时预测与空气污染数据的实时展示,建立了pm2.5在线网络预测系统。该系统首先利用Sql Server 2012建立空气质量数据的数据库,存储空气质量数据,然后在Web服务器上搭建Tomcat,用于对于前端页面的运行与解析,最后利用my Eclipse Java EE开发系统的后台与前端页面,在后台中插入已训练好的pls-m5p决策树模型,由HTmL5前端页面进行数据请求,Servlet处理前端的数据请求,调用后台从数据库中提取所需数据传输至Tomcat服务器,再由Servlet取出数据送至前端页面进行显示,可以实现空气质量数据和pm2.5预测值的实时显示,并依据空气质量数据和pm2.5预测值的大小给出相应的身体健康和出行防护提示,利于人们更便捷的获取空气污染状况与生活小提示。
暂无评论