张顺顺 卢彦希 罗崴 李东旭 马凯
(1 广西科技大学自动化学院 广西柳州 545000 2 北京交通大学电气工程学院 北京 100044 3 桂林电子科技大学信息与通信学院 广西桂林 541004)
受经济快速发展的影响,我国大气污染问题较为突出[1]。大气污染是指大气中一些物质的含量达到有害程度,以致破坏生态系统和人类正常生存和发展的条件,对人或物造成危害的现象[2]。大气污染具有污染物种类多样的特点。由于大气污染来源广泛,其中包含的污染物种类也较多,如悬浮颗粒、可吸入颗粒等[3]。随着“十四五”规划的实施,全国城市空气质量持续向好,相比于2022 年提高了0.5 个百分点[4-5]。空气质量与污染物浓度息息相关,而污染物不仅是全球气候变暖的关键影响因素之一,还会影响人类的身体健康[6]。目前主要是利用空气质量预报模型,提前预报空气中污染的主要成分,达到预防改善的效果。杨卫芬等[7]利用耦合气象模式的通用多尺度空气质量(The Weather Research and Forecasting coupled with the Community Multiscale Air Quality,WRF-CMAQ)模式对常州市空气质量预报效果进行评估。陈敏等[8]基于WRF-CMAQ 模式对银川市空气质量预报效果进行检验分析。陈欣昊等[9]基于WRFCMAQ 对江苏省2014 年冬半年雾霾日的模拟与评估。但上述的研究利用传统WRF-CMAQ 模型对污染物进行预报,由于生成机理不完全明晰,导致模型预报的结果不理想。对于传统算法来说,BP 神经网络收敛速度慢容易陷入局部最优,K 均值的K 值大小不易把握,容易影响预测的精度[10-11]。针对上述存在的问题,本文提出利用主成分分析的支持向量机(Support Vector Machines for Principal Component Analysis,PCA-SVM)算法的二次预报模型,最后用气象与污染物数据来优化预报模型。
根据《环境空气质量标准》(GB 3095—2012),用于衡量空气质量的常规大气污染物分别是二氧化硫(SO2)、二氧化氮(NO2)、粒径<10 μm 的颗粒物(PM10)、粒径<2.5 μm 的颗粒物(PM2.5)、臭氧(O3)、一氧化碳(CO)6 种。近年来,我国的PM2.5浓度一直高居不下,O3日最大8 h 平均值第90 百分位数浓度一直呈上升态势,污染形势异常严峻[12-13]。O3最大8 h 滑动平均是指1 个自然日内8∶00—24∶00 的所有8 h 滑动平均浓度中的最大值,其中8 h 滑动平均值指连续8 h 平均浓度的算术平均值。其计算公式见式(1)。
式中:Ct为臭氧在某日t-1 时至t 时的平均污染物浓度。
CO、SO2、NO2、PM10、PM2.5计算24 h 的平均值见式(2)。
然后计算各项污染物的空气质量分指数(Individual Air Quality Index,IAQI),其计算公式见式(3)。
空气质量指数(Air Quality Index,AQI)取各分指数中的最大值,见式(4)。
式中:IAQI1,IAQI2,…,IAQIn为各污染物项目的分指数。
最后计算出6 种污染物的AQI 取最大值,见式(5)。
AQI 是基于6 项常规监测污染物计算所得出的、用来衡量空气质量综合情况的指标[10]。
根据上述公式建立模型,不同污染物的IAQI 值的结果如图1 所示。
图1 不同污染物的IAQI 值
从图1 可以得知,O3的IAQI 值在不同的时刻都是最大的,所以O3为首要污染物。2020 年8 月25—28 日在监测点A 的首要污染物都是O3,其中IAQI 值分别为79、47、109、138,则说明在25 日,O3成为首要污染物。26 日时空气质量为优,则当天无首要污染物。而在27 日和28 日IAQI 值超过100,O3成为了超标污染物,空气质量较差。
为了实现空气污染物的精确预报,需要对气象条件的原始数据进行标准化处理,然后分别计算相关系数矩阵、计算特征值和特征向量,其次选择P 个主成分,计算综合评价值,再次对于给出的原始数据进行数据的预处理,最后利用SVM 建立模型。建模步骤流程如图2 所示。
图2 PCA-SVM 算法的建模流程图
首先需要对天气的原始数据进行标准化,假设进行主成分分析的指标变量有m 个:x1,x2,…,xm,共有n 个评价对象,第i 个评价对象的第j 个指标的取值为aij。将各指标值aij转换成标准化指标,见式(6)。
计算各个特征的相关系数矩阵R=(rij)m×m,见式(7)。
式中:rii=1,rij=rji,rij是 第i 个指标与第j 个指标的相关系数。
计算综合得分,见式(8)。
式中:bj为第j 个主成分的信息贡献率,根据综合得分值就可进行评价。
通过主成分分析法得到的特征,用SVM 算法进行空气污染物浓度预测,建立SVM 的数学模型见式(9)。
求得最优值对应的ω*、b*,可以得到分类函数,见式(10)。
通过观察所给的数据并进行分析,发现预报数据和实测数据都有缺失的问题,如表1 所示。预报数据采用逐月寻找的方式,缺失程度较大的实测数据采用填充后平滑处理。首先对A、B、C 3 个监测点2020 年7 月23 日—2021 年7 月12 日的预报数据和实测数据使用2 种方法进行相应的预处理操作,并将3 个监测点处理后的预报数据和实测数据输入PCA-SVM 模型进行训练,最后预测出2021 年7 月13 日—7 月15 日3 d 污染物单日浓度值。
表1 缺失数据情况
6 项常规监测项目浓度及AQI 预测结果见图3。从图3 可知,边界层高度的综合得分最高为327.64,验证了建立模型的可靠性,并通过主成分分析法,可以得出NO2、SO2、PM10、PM2.5、CO、O3对空气质量影响较大,而温度、湿度、气压等对空气质量的影响较小。最后通过建立的PCA-SVM 模型得到监测点A、B、C 在2021 年7 月13—15 日的污染物浓度及AQI 预测结果如图4 所示,可以看出NO2、SO2、PM10、PM2.5、CO、O3二次预测值和实测值能够很好的吻合,预测准确率能达到93.8%,说明PCA-SVM 算法能很好的对空气的污染物进行预报,O3和PM10对空气质量的影响较大。
图3 综合评价值
图4 污染物浓度及AQI 预测结果
本文通过计算各项污染物的空气质量分指数,可以确定当天首要污染物,并通过对数据进行挖掘找出了气象条件与污染物浓度之间的关系。由于WRF-CMAQ 模式结果并不理想,所以在一次预报模型模拟结果的基础上,结合更多的数据源运用PCA-SVM 算法进行预测来提高预报的准确性,具有非线性映射能力、自学习等优点。
猜你喜欢 分指数见式空气质量 低温下船用钢材弹塑性曲线研究河南科技(2023年1期)2023-02-1110 中电联:电煤供需两弱 库存缓慢提升电力设备管理(2022年8期)2022-11-25Effects of Landau damping and collision on stimulated Raman scattering with various phase-space distributionsChinese Physics B(2022年5期)2022-05-16桥(门)式起重机起升机构高速浮动轴设计黑龙江交通科技(2020年5期)2020-01-13二氟乙酰氯在含氟医药中的应用进展有机氟工业(2019年2期)2019-08-12竞争力飙升三联生活周刊(2017年26期)2017-06-29“空气质量发布”APP上线环境保护与循环经济(2017年3期)2017-03-03车内空气质量标准进展汽车与安全(2016年5期)2016-12-01重视车内空气质量工作 制造更环保、更清洁、更健康的汽车汽车与安全(2016年5期)2016-12-01开展“大气污染执法年”行动 加快推动空气质量改善中国环境监察(2016年11期)2016-10-24