en
×

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。
通讯作者:

陈以祺,E-mail:cyqnuist@163.com

引用:吴香华,陈以祺,官元红,等,2023.基于CEEMDAN-SE-ARIMA组合模型的东北夏季降水预测[J].大气科学学报,46(2):205-216.

Quote:Wu X H,Chen Y Q,Guan Y H,et al.,2023.A hybrid CEEMDAN-SE-ARIMA model and its application to summer precipitation forecast over Northeast China[J].Trans Atmos Sci,46(2):205-216.

目录contents

    摘要

    针对传统时间序列模型无法有效预测模态混叠数据的不足,本文提出了一种基于CEEMDAN-SE-ARIMA的组合模型,并且对东北地区2016—2020年夏季降水量进行了实证分析。首先,基于完全自适应集合经验模态分解方法,将降水时间序列分解为多个本征模态分量,并根据不同分量样本熵的计算结果进行分量序列重构。然后,针对每一个重构分量,构建自回归移动平均预测模型。最后,将各分量的预测值进行叠加,得到组合模型的预测值。此外,还构建了ARIMA单一模型和其他组合模型,旨在与CEEMDAN-SE-ARIMA组合模型对比。结果表明:CEEMDAN-SE-ARIMA组合模型考虑了时间序列的模态混叠特征,能有效提高东北地区夏季降水时序模型的预测能力,具有良好的预测应用价值。预测结果较单一模型和其他组合模型均有所提高,MASE降低了0.02~0.91 mm,RMSE降低了0.80~130.49 mm,MAE降低了2.52~129.84 mm,MAPE降低了1.08~35.53 mm。CEEMDAN-SE-ARIMA模型在降水变率较小的西北部区域预测效果更好,对东南部区域的极值分布中心预测较为准确。

    Abstract

    This paper proposes a combination model based on CEEMDAN-SE-ARIMA that aims to address the shortcomings of traditional time series models that cannot effectively predict modal aliased data.The proposed modelcombines the advantages of the complete ensemble empirical mode decomposition with adaptive noise (CEEMDAN),the high short-term prediction accuracy of an auto-regressive integrated moving average model (ARIMA),and the fast efficiency of sample entropy (SE) reconstruction.The model is empirically analyzed for summer precipitation in Northeast China from 2016 to 2020.First,based on the fully adaptive ensemble empirical mode decomposition method,the precipitation time series is decomposed into multiple eigenmode components,and the component sequence is reconstructed according to the calculation results of the entropy of different component samples.Then,for each reconstruction component,an autoregressive moving average forecast model is constructed.Finally,the predicted value of each component is superimposed to obtain the predicted value of the combined model.Additionally,the ARIMA single model and other combined modelsare constructed to be compared with the CEEMDAN-SE-ARIMA combined model.The results show that the CEEMDAN-SE-ARIMA combined accounts for the time series’ modal aliasing characteristics,effectively improves the forecasting ability of the summer precipitation time series model in Northeast China,and has good forecast application value.Compared with the single model and other combined models,the forecast results are improved.MASE decreases by 0.02—0.91 mm,RMSE decreases by 0.80—130.49 mm,MAE decreases by 2.52—129.84 mm,and MAPE decreases by 1.08—35.53 mm.The CEEMDAN-SE-ARIMA model has a better prediction effect in the northwest region,where the precipitation variability is small,and the prediction of the extreme value distribution center in the southeast region is more accurate.

  • 全球气候变暖是目前气候变化的主要特征,直接影响到大气中水汽含量和降水结构的变化。在此背景下,与降水相关的极端天气事件频发,每年都会给我国造成重大的经济损失。因此,对降水进行科学准确预测,尤其是夏季汛期降水的变化,是目前亟待解决的问题(沈皓俊等,2020)。东北地区位于我国东北部,地处东北亚的核心位置,拥有高原、平原和山地3类地形单元,自南向北跨越暖温带、中温带和寒温带。复杂独特的气候特征和地理位置,导致东北地区夏季降水的成因与其他气候区有着本质区别,是我国较为典型的气候“脆弱区”之一(赵俊虎等,2020)。东北夏季降水一直是短期气候预测的重难点,对其进行预测研究具有重要的实际意义和必要性(廉毅等,2003; 贾小龙和王谦谦,2006)。

  • 目前,降水时间序列的预测方法主要有传统的移动平均法(Moving Average,MA)、自回归法(Auto Regressive,AR)、自回归移动平均法(Auto-Regressive Moving Average,ARMA)和基于机器学习的人工神经网络法(Artificial Neural Network,ANN)等(田俊武等,2005; 刘莉和叶文,2010; 陈沪生等,2019; 余洋和万定生,2019)。然而,降水的随机性和复杂性(苏京志,2019)会大大降低ANN的收敛速度和预测精度,并且训练过程极易陷入局部最小值(贺玉琪等,2019)。MA、AR和ARMA等线性方法对数据的平稳性有较高要求,难以适应降水序列的非线性和非平稳性。相比于以上几种方法,差分自回归移动平均法(Auto Regressive Integrated Moving Average model,ARIMA)能够处理非平稳序列,在降水预测中应用广泛,且在短期降水预测中精度较高(李宁等,2019)。

  • 由于降水受到水文、大气环流、季风、地形和人类活动等多方面的影响(王文等,2014),降水时间序列容易产生很强的非平稳随机波动,同时展现出模态混叠、多时间尺度等复杂特征(郭品文和郎丽玲,2017; 陈国鼎等,2018; 顾伟宗等,2018)。基于以上原因,传统时间序列方法的预测误差通常比较大。Huang et al.(1998)提出了一种处理非线性、非平稳时间序列的新方法——经验模态分解(Empirical Mode Decomposition,EMD)方法,该方法可以凭借数据自身的局部时变特征,自适应地分解时频,对序列进行平稳化处理。相比小波分析和傅立叶分解变换而言,EMD具有更好的时频分辨率和自适应的优点(李智强等,2020),并且打破了傅立叶和小波分析平稳、线性的前提局限(马佳佳等,2021),已经被成功且广泛地应用于水文时间序列的分析中。但是,EMD不可避免地容易产生本征模态函数(Intrinsic Mode Function,IMF)混叠现象,而模态混叠不仅使各时间尺度的IMF分量无法准确体现,甚至会导致个别IMF分量丧失物理意义。为了尽可能消除模态混叠问题,使分解产生的各IMF分量在物理上保持唯一性,Wu and Huang(2009)提出了集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)滤波方法,该方法在一定程度上抑制了模态混叠问题,并在气候预测中取得良好的效果。但是EEMD分解后的IMF分量噪声有残留,并且每一次需要主观选择加入不同幅值的白噪声(韩庆阳等,2015)。因此,Torres et al.(2011)提出了一种完全自适应集合经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN),该方法通过在每一阶段添加自适应白噪声,有效地克服了EEMD重构误差非零等问题,保证了分解的完整性,同时还减少了迭代次数,提高了计算效率(黄金等,2020)。

  • 综上所述,传统方法和单一方法难以对复杂的非线性、非平稳降水序列进行准确度较高的预测(黄春艳等,2017)。因此,本文基于“分解-重构-集成”的思想,结合CEEMDAN分解完整性较好、ARIMA短期预测精度较高和SE重构效率较快的优势,提出了CEEMDAN-SE-ARIMA组合预测模型。利用1970—2015年6—8月东北地面气象观测资料建立组合预测模型,并通过独立检验期(2016—2020年6—8月)的观测资料评估模型的预测性能。为了验证CEEMDAN-SE-ARIMA模型的有效性,以独立检验期的评估指标为基准,与其他模型进行对比分析。该模型的提出可以为东北夏季降水预测和人工增雨效果检验的自然降水量估算提供一种新思路(王婉和姚展予,2009)。

  • 1 资料和方法

  • 1.1 研究区域和资料

  • 东北地区指我国东北部的辽宁省、吉林省、黑龙江省和内蒙古东四盟(包括呼伦贝尔市、兴安盟、通辽市、赤峰市)构成的区域,地处欧亚大陆东端,东面和北面与朝鲜和俄罗斯两国接壤,南临渤海、黄海,与山东半岛隔海相望,地域辽阔且地形多样完整,地理位置为115.52°~135.09°E、38.72°~53.55°N。

  • 东北夏季降水量预测所采用的资料来源于国家气象科学数据中心(http://data.cma.cn)提供的1970—2020年中国地面气候资料月值数据集。选用东北地区104个地面基本气象观测站及自动站的逐月观测数据,资料选取时段为1970—2020年夏季(6—8月)。将观测数据缺失间断以及类型不一致的站点去除,最终用于本研究的资料是100个气象站点的夏季累积降水数据。

  • 图1 东北地区夏季累积降水及气象站点分布(单位:mm)

  • Fig.1 Distribution of accumulative summer precipitation and meteorological stations in Northeast China (unit:mm)

  • 1.2 研究方法

  • 1.2.1 基于CEEMDAN的多尺度分解

  • CEEMDAN是目前最新的一种经验模态分解方法,该方法在IMF分量的分解过程中自适应地加入白噪声,有效地解决了EMD模态混叠和EEMD重构误差非零等问题,在保证分解完整性的基础上,节约了计算时间(王书平和魏晓萌,2017; 陈璐,2019),尤其适合非平稳降水时间序列的分析处理。

  • CEEMDAN是经验模态分解,集成经验模态分解和互补集成经验模态分解的改进方法(朱利明等,2020),具体算法如下:

  • 1)在原始的降水量时间序列xt)中添加一系列服从正态分布的自适应白噪声β0ωit:

  • xi(t)=x(t)+β0ωi(t),i=1,2,I
    (1)
  • 式中: xit为第i次添加白噪声后形成的时间序列; β0为白噪声的系数; ωit为第i次添加的白噪声; I为试验次数。

  • 2)对每一个添加白噪声后的xit进行EMD分解,得到第一个本征模态分量IMF1和余量r1t):

  • IMF1=1Ii=1I E1xi(t)
    (2)
  • r1(t)=x(t)-IMF1
    (3)
  • 式中:E为EMD分解的运算符。

  • 3)对r1t)添加β1E1ωit后继续进行EMD分解,得到IMF2:

  • IMF2=1Ii=1I E1r1(t)+β1E1ωi(t)
    (4)
  • 4)对于k=2,3,···,K,计算出第k个余量rkt):

  • rk(t)=rk-1(t)-IMFk
    (5)
  • 5)在每一个阶段都加入白噪声形成新的时间序列,并且计算出该时间序列的第一本征模态分量作为原时间序列新的模态分量,则第k个阶段模态分量IMFk+1:

  • IMFk+1=1Ii=1I E1rk(t)+βkEkωi(t)
    (6)
  • 6)重复4)、5),直到rkt)不能再被EMD继续进一步分解,或者是满足IMF条件,或者值少于3个局部极值,算法结束,此时已经找出所有的IMF分量。

  • 1.2.2 基于样本熵的分量重构

  • CEEMDAN分解后有可能产生大量的IMF分量,这些IMF的实际意义通常很难判定。为了解决这个问题,引入了样本熵(Sample Entropy,SE)算法。SE是一种基于近似熵的用于度量非平稳时间序列复杂性的改进方法,反映了时间序列中新信息发生的概率,时间序列越复杂,其对应的SE就越大(Pincus,1991; 杨斌等,2019)。与近似熵相比,SE具有计算不依赖数据长度、一致性更好、计算简单等优点。利用SE算法计算出分解得到的各个IMF分量的熵值,可以定量判断各个分量的随机性程度,并以此为依据对分量进行合并重构,得到高频分量、低频分量和趋势分量,达到减少分量提高计算效率的目的(崔金鑫和邹辉文,2020)。

  • 对于时间长度为n的IMF分量时间序列{IMF(t)}={IMF(1),IMF(2),···,IMF(n)}(赵会茹等,2021),SE的计算步骤如下:

  • 1)按照序列号排成一组维数为m的向量序列,Xm(1),···,Xmn-m+1),其中:

  • Xm(i)={IMF(i),IMF(i+1),,IMF(i+m-1)},1in-m+1
    (7)
  • 这些向量序列代表从第i点开始的m个连续的IMF的值。

  • 2)定义向量Xmi)和Xmj)之间的距离为两者对应元素中最大差值的绝对值。即:

  • dXm(i),Xm(j)=max0km-1 |IMF(i+k)-IMF(j+k)|
    (8)
  • 3)对于给定的某一Xmi),统计Xmi)与Xmj)之间距离小于等于rj(1≤jn-mji)的数目,并记为Bi。对于1≤in-m,定义:

  • Bim(r)=1n-m-1Bi
    (9)
  • 在此基础上,定义:

  • Bm(r)=1n-mi=1n-m Bim(r)
    (10)
  • 4)增加维数到m+1维,统计Xm+1i)与Xm+1j)(1≤jn-mji)之间距离小于等于r的个数,记为Ai,并定义Aimr为:

  • Aim(r)=1n-m-1Ai
    (11)
  • 在此基础上,定义:

  • Am(r)=1n-mi=1n-m Aim(r)
    (12)
  • 这样,Bmr是两个序列在相似容限r下匹配m个点的概率; 而Amr是两个序列在相似容限r下匹配m+1个点的概率。

  • 5)SE定义为:

  • SE(m,r)=limn -lnAm(r)Bm(r)
    (13)
  • n有限时,IMF分量时间序列样本熵的估计为:

  • SE(m,r,n)=-lnAm(r)Bm(r)
    (14)
  • 根据上述步骤计算出所有IMF分量的SE,并根据其数值大小将IMF分量进行合并重构。

  • 1.2.3 基于自回归移动平均的预测

  • 基于SE对分量序列进行重构后,分别对各个重构分量建立预测模型。差分自回归移动平均模型(Auto Regressive Integrated Moving Average model,ARIMA)由AR、MA和差分(Difference,Diff)三部分结合在一起,通过将非平稳时间序列进行一次或多次差分转换成平稳序列,再进行ARMA拟合(李智强等,2020),其构成如下:

  • ARIMA(p,d,q)=AR(p)+Diff(d)+MA(q)
    (15)
  • 式中:AR(p)表示自回归模型、Diff(d)表示差分模型、MA(q)表示移动平均模型; pdq是三个模型对应的参数,ARIMA模型预测方程如下:

  • C(t)=φ0+φ1Ct-1+φ2Ct-2++φpCt-p+εt+γ1εt-1+γ2εt-2++γqεt-q
    (16)
  • 式中:Ct)表示经过SE算法后形成的重构分量时间序列; εt表示当期随机误差干扰; φiγj表示模型参数; p表示自回归项数; d表示时间序列平稳的差分次数; q表示移动平均的项数; Ct)表示前pxt-1xt-2,···,xt-p和前qεt-1εt-2,···,εt-q的多元线性函数。

  • 1.2.4 组合预测模型评估指标

  • 综合以上理论分析,首先将夏季降水数据利用CEEMDAN信号分析方法进行分解和处理; 其次利用SE熵值计算方法重构序列分量; 然后对重构后的各个分量建立ARIMA预测模型; 最后将预测值叠加,得到组合模型的预测值。

  • 为了评估本文模型预测结果的优劣,引入平均绝对误差(MAE)、平均绝对缩放误差(MASE)、均方根误差(RMSE)和平均绝对百分误差(MAPE)四种统计学指标来评价模型的预测性能。MAE通过放大预测误差较大的值,可以比较不同预测模型的稳定性; MASE用于比较不同尺度的时间序列的预测准确性; RMSE代表模型预测结果的标准偏差; MAPE不仅考虑了预测值和实测值之间的误差,还考虑了误差与实测值之间的比例,是一个衡量预测准确性的指标。

  • 2 结果与分析

  • 2.1 东北夏季降水分区

  • 掌握东北地区不同区域夏季降水的一致性和差异性,有助于更加客观高效地评估组合模型的预测准确性、稳定性。因此,对东北近51 a夏季降水进行区划和区域代表性站点选取是非常有必要的。运用经验正交函数分解(EOF)分析东北地区夏季降水的主要空间振荡型及变化敏感区域(赵春雨等,2009; 潘留杰等,2018; 王丽娟等,2020),运用旋转经验正交函数分解(REOF)对降水量场进行客观区划(江志红和丁裕国,1994)。

  • 本文对东北地区100个气象台站1970—2020年6—8月标准化的累积降水量做EOF分析。通过North准则检验(North et al.,1982),发现前5个空间主模态通过了95%置信水平检验,表明特征根误差范围不重叠,其分解得到的5个模态具有相对明确的物理意义信号。通过EOF分析发现:东北地区夏季降水既有全区一致(第一模态)的分布特点,也有南北反相(第二模态)的分布差异。为了进一步揭示东北地区夏季降水的地域特征,对EOF分析的前5个特征向量做REOF分析。表1列举了EOF和REOF前5个模态的方差贡献率和累计方差贡献率,可以看出前5个模态的累计方差贡献率超过了一半,为56.35%,故前5个模态的特征向量可以较好地解释东北地区夏季降水分布类型。

  • 表1 1970—2020年东北夏季标准化降水场的EOF分析和REOF分析

  • Table1 Results of the EOF analysis and the REOF analysis on the standardized precipitation fields over Northeast China from 1970 to 2020

  • 注:只给出了前5个模态的方差贡献率和累计贡献率.

  • 由REOF的空间分布(图2)可见,前5个空间主模态中的高值中心几乎涵盖了整个东北区域。结合色标尺,按照载荷分量绝对值大于0.16作为标准将东北地区夏季降水量分为5个区,分别为:第Ⅰ区域,即南部地区(辽宁和吉林东南部); 第Ⅱ区域,即东北部地区(黑龙江东南部和吉林北部); 第Ⅲ区域,即西南部地区(内蒙古东四盟南部、辽宁西部、吉林西北部); 第Ⅳ区域,即东南部地区(黑龙江南部、吉林东部); 第Ⅴ区域,即西北部(黑龙江北部、内蒙古东四盟西部)。结合东北夏季累积降水空间分布(图1)可知,东北西部地区夏季降水量较为匮乏,南部地区夏季降水量较为充沛,夏季降水量自东南向西北从700 mm逐渐降低至200 mm以下。因此,划分的5个区域在降水量空间分布上具有明显差异。

  • 图2 1970—2020年东北夏季标准化降水量场REOF分析的前5个模态空间分布:(a)REOF1;(b)REOF2;(c)REOF3;(d)REOF4;(e)REOF5

  • Fig.2 Spatial distributions of the first five modes based on REOF analysis of the standardized precipitation fields over Northeast China from 1970 to 2020: (a) REOF1; (b) REOF2; (c) REOF3; (d) REOF4; (e) REOF5

  • 结合区划结果、气候特征和地理位置,本文选取了5个代表站点:瓦房店、绥化、索伦、白城和嫩江。瓦房店位于辽东半岛中西部,属于暖温带大陆性季风气候,夏季降水量的标准差为99.88 mm; 绥化位于松嫩平原的呼兰河流域,属于中温带湿润气候,夏季降水量的标准差为91.41 mm; 索伦位于大兴安岭南麓,属于温带大陆性季风气候,夏季降水量的标准差为99.59 mm; 白城位于嫩江平原西部,属于中温带半干旱季风气候,夏季降水量的标准差为125.31 mm; 嫩江位于松嫩平原连接大、小兴安岭山地的过渡地带,属于中温带亚湿润季风气候,夏季降水量的标准差为111.32 mm。相较而言,白城和嫩江的夏季降水量离散程度较大,瓦房店、绥化和索伦的离散程度较小。分别对5个典型站点进行组合模型的预测,预测模型的预测时效被设为1 a。

  • 表2 各区域典型代表站点

  • Table2 Representative stations in different regions

  • 2.2 东北夏季降水预测及对比分析

  • 以东北地区5个典型站点1970—2020年共51 a的实测夏季降水量序列作为研究对象,分别采用单一ARIMA模型,基于EEMD、CEEMDAN的ARIMA预测模型和基于CEEMDAN-SE的ARIMA模型对东北夏季降水进行预测分析。为了更好地检验模型的外推能力,本文使用滚动预测的方式对模型进行训练和预测,即:分别用1970—2015年、1970—2016年、1970—2017年、1970—2018年和1970—2019年的夏季降水量资料构建预测模型,将2016—2020年的资料用于预测效果的检验。

  • 2.2.1 降水时间序列的分解和重构

  • 以瓦房店站为例,运用EEMD和CEEMDAN分解方法对夏季降水时间序列进行分解,两种方法均得到4个本征模态函数(IMFii=1,2,3,4)即不同时间尺度特征的子序列和一个趋势项RES(图3a、b)。两种分解方法的分量频率均逐渐降低,并且某些分量呈现出周期性。从趋势项RES能够看出,瓦房店站夏季降水有上升趋势。计算5个分量的样本熵,并将熵值接近的分量作为一组来重构,重构后的高频分量、低频分量和趋势分量如图3c所示。

  • 2.2.2 降水时间序列的预测

  • 完成以上降水时间序列的分解和重构以后,首先将各分量分别进行ARIMA预测,然后将各分量预测值叠加,计算未来一年的预测值。本文采用4个统计指标评估CEEMDAN-SE-ARIMA模型的降水量预测性能,并与单一ARIMA模型、基于EEMD分解的ARIMA模型进行比较,独立检验期的预测结果如图4所示,比较结果如表3所示。从预测结果可以看出:组合模型比单一的ARIMA模型预测效果好。特别地,由于ARIMA模型无法直接地识别出非平稳降水量时间序列的季节性、周期性等多时间尺度特征,从而导致模型在独立检验期的预测结果近乎同一数值,预测结果较差,这也从一个侧面反映出非平稳时间序列分解的重要性与必然性。此外,根据预测结果与实测值的相关性检验,CEEMDAN-SE-ARIMA模型在5个站点的相关系数分别为:0.90、0.89、0.84、0.62、0.89。可以看出,白城的相关系数较小(>0.6),这可能与白城夏季降水量较少,数据离散程度较大有关。除了白城外,模型在检验时段内的相关系数较高,普遍高于0.84,且均通过0.1的显著性检验。可以表明CEEMDAN-SE-ARIMA模型对东北夏季降水变化趋势的预测性能较为可靠,对降水预测具有一定的参考价值。

  • 由表3可知,CEEMDAN-SE-ARIMA的性能最佳,其次是CEEMDAN-ARIMA和EEMD-ARIMA,最后是ARIMA。特别地,CEEMDAN-SE-ARIMA在瓦房店的效果最好,其次是绥化、索伦和嫩江,最后是白城。除此之外,在白城、索伦和瓦房店,不同预测模型的标准偏差和稳定性差异较小,偏差差异最小仅为24.68 mm,稳定性差异最小仅为17.60 mm; 而绥化和嫩江的偏差差异和稳定性较大,偏差差异最大可达130.49 mm,稳定性差异最大可达129.84 mm。索伦、瓦房店和绥化不同预测模型的准确性差异较小,差异最小仅为7.42 mm,白城和嫩江差异较大,最大可达35.53 mm。由此可见,新的组合模型在降水量不同的区域效果提升程度不尽相同。

  • 图3 瓦房店站各分量序列:(a)EEMD;(b)CEEMDAN;(c)CEEMDAN-SE

  • Fig.3 The sequence diagram of each component at Wafangdian station: (a) EEMD; (b) CEEMDAN; (c) CEEMDAN-SE

  • 图4 2016—2020年各区域代表站点的预测结果

  • Fig.4 Forecasting results during 2016—2020 at representative stations

  • 2.3 组合预测模型性能评估

  • 科学可靠的性能评估是模型在实际预测应用中至关重要的前提。为了评估CEEMDAN-SE-ARIMA组合模型在整个东北地区的适用性和稳定性,利用东北地区100个气象站点的夏季累积降水数据,分别对各个站点构建CEEMDAN-SE-ARIMA组合预测模型,并从评估指标的统计特征以及实测值与预测值的空间分布两个角度对模型的预测性能进行分析。图5给出了该组合模型独立检验期(2016—2020年)各个站点的MASE、RMSE、MAE和MAPE箱线图。就中位数而言,MASE和MAPE分别为0.62 mm和25.93 mm,MAE和RMSE分别为69.24 mm和82.09 mm。除了个别异常站点外,其余站点对应的MASE均小于1.52 mm,MAPE均小于67.31 mm。总体来说,作为一种客观预测方法,CEEMDAN-SE-ARIMA组合模型对东北地区绝大部分站点的夏季降水预测准确性较高,预测性能较好,说明该模型具有一定的区域适用性和稳定性。

  • 图6为独立检验期的实测值和预测值的空间分布对比。从图6可以看出各年实况与预测的雨带分布位置基本对应,大值中心走向基本一致。其中,西北部区域的预测效果最好,这可能是由该区域降水量较少,降水变率较小导致的; 其次,组合模型对东部和南部区域的降水极值分布中心预测较为准确; 最后,该模型对东北夏季降水量的空间分布特征有着较好的预测效果,但在具体数值的预测程度上略显不足。总体而言,CEEMDAN-SE-ARIMA组合模型在东北地区100个站点夏季降水预测中仍然有着良好的效果。

  • 表3 2016—2020年不同模型在各代表站点夏季降水的预测性能

  • Table3 Forecasting performances of the different models on summer precipitations during 2016—2020 at representative stationsmm

  • 注:*表示最小值.

  • 3 结论

  • 本文构建了一个新的多尺度组合预测模型,首先基于CEEMDAN方法对站点夏季降水时间序列进行分解,其次计算分解得到的各本征模态分量的样本熵,根据熵值大小将相近的分量进行重构,然后对重构得到的新分量序列进行ARIMA建模,最后将各分量预测值叠加得到模型预测值。对东北地区5个典型站点夏季降水量进行预测分析和效果评估,并将该组合模型推广到东北地区其他站点,结果表明:

  • 1)REOF分析将东北地区划分为南部、东北部、西南部、东南部和西北部5个夏季降水量变化特征区域。相对而言,第Ⅰ区域夏季降水量较多,第Ⅱ区域和第Ⅲ区域次之,第Ⅳ区域和第Ⅴ区域较少。

  • 2)CEEMDAN方法能够有效地分解出降水的随机扰动响应、周期性响应和整体趋势响应。相较EEMD分解,能显著提高模型的预测效果。提高的程度在降水量偏少的地方比降水量偏多的地方要大,例如:绥化CEEMDAN-ARIMA模型的RMSE比EEMD-ARIMA模型降低了6.27 mm,而嫩江则降低了19.17 mm。

  • 3)SE算法通过重构分量,不仅可以大大地减少预测计算量,而且也可以提高模型的预测准确性和稳定性。特别地,经过SE算法重构,模型的MAE降低了4.02~18.40 mm; MAPE降低了1.08~3.54 mm。

  • 4)基于不同区域、不同气候类型的夏季降水序列,本文提出的CEEMDAN-SE-ARIMA组合模型与其他模型相比,预测准确性提高了1.08~35.53 mm,稳定性提高了3.33~129.84 mm。比较5个站点的MAE和MAPE,新模型在降水量较大的区域稳定性和准确性更好。

  • 5)将CEEMDAN-SE-ARIMA组合模型应用到东北100个站点夏季降水预测中,绝大部分站点的预测性能较好。模型对东北地区夏季降水基本空间分布和雨带位置的预测较为准确,泛化能力较强。

  • 图5 独立检验期(2016—2020年)东北地区各站点组合模型评估指标箱线图:(a)MASE;(b)RMSE;(c)MAE;(d)MAPE

  • Fig.5 Box plot of combined model assessment indicators for each station in Northeast China during the independent inspection period (2016—2020) : (a) MASE; (b) RMSE; (c) MAE; (d) MAPE

  • 图6 独立检验期(2016—2020年)降水实测值与预测值对比(单位:mm):(a、c、e、g、i)实测值;(b、d、f、h、j)预测值

  • Fig.6 Comparison of measured and predicted precipitation values (unit:mm) during the independent verification period (2016—2020) : (a, c, e, g, i) the measured value; (b, d, f, h, j) the predicted value

  • 参考文献

  • 参考文献

  • 地址:江苏南京宁六路219号南京信息工程大学    邮编:210044

    联系电话:025-58731158    E-mail:xbbjb@nuist.edu.cn    QQ交流群号:344646895

    大气科学学报 ® 2024 版权所有  技术支持:北京勤云科技发展有限公司