基于卷积神经网络的湖南盛夏高温过程延伸期智能预报
doi: 10.13878/j.cnki.dqkxxb.20241011004
张祎1 , 谭桂容1 , 赵辉2,3 , 曾玲玲1 , 黄超2 , 费琪铭1
1. 南京信息工程大学 气候系统预测与变化应对全国重点实验室/气象灾害教育部重点实验室/气象灾害预报预警与评估协同创新中心,江苏 南京 210044
2. 湖南省气候中心,湖南 长沙 410119
3. 洞庭湖国家气候观象台,湖南 岳阳 414000
基金项目: 湖南省气象局创新发展专项(CXFZ2024-FZZX36) ; 国家自然科学基金项目(42175034;42175035)
Extended-range intelligent forecasting of regional heat wave events in Hunan Province during midsummer (July-August) using convolutional neural networks
ZHANG Yi1 , TAN Guirong1 , ZHAO Hui2,3 , ZENG Lingling1 , HUANG Chao2 , FEI Qiming1
1. State Key Laboratory of Climate System Prediction and Risk Management (CPRM)/Key Laboratory of Meteorological Disaster,Ministry of Education (KLME)/Collaborative Innovation Center on Forecast and Evaluation of Meteorological Disasters (CIC-FEMD),Nanjing University of Information Science and Technology,Nanjing 210044 ,China
2. Hunan Provincial Climate Center,Changsha 410119 ,China
3. Dongting Lake National Climate Observatory,Yueyang 414000 ,China
摘要
本研究旨在提升湖南省盛夏(7、8月)高温过程的延伸期预报技巧。本文利用1999—2022年湖南省97个站点逐日最高气温资料以及次季节-季节(sub-seasonal to seasonal prediction,S2S)模式数据中欧洲中期天气预报中心(ECMWF)和美国国家环境预报中心(NCEP)两种模式预报产品,并基于模式温度与环流预报产品提取物理因子,结合卷积神经网络(convolutional neural network,CNN)构建了湖南省盛夏高温过程的预报模型(high temperature prediction model,HTPM);对订正后的S2S模式和构建的预报模型结果进行集成,以实现对区域高温过程较为稳定的相对高技巧预报。结果表明:S2S模式的原始预报技巧较低,偏差订正能显著提高预报效果,但存在较高的空报率;基于ECMWF的S2S数据训练的高温预报模型(HTPM-ECS2S)和基于NCEP的S2S数据训练的高温预报模型(HTPM-NCEPS2S)能有效捕捉高温事件,在高温预报中具有较高的预报技巧;集成方案有效整合了多模型优点,可提升预报的准确性和可靠性。
Abstract
Hunan Province,located in central China,features a terrain dominated by mountains and hills,with plains enclosed by mountains on three sides.The region experiences a subtropical monsoon climate,with frequent high-temperature events during summer,particularly in the peak summer months of July and August.Research indicates that a rising trend in extreme heat events in Hunan,with the southeastern region experiencing the highest occurrence.Accurate fine-scale temperature forecasting remains a key challenge in regional weather prediction,while effective forecasting and timely warnings of severe weather are essential for disaster prevention and mitigation.Unlike short-term weather forecasts,extended-range forecasts (10—30 days) provide a longer decision-making window,allowing government authorities to implement proactive measures to enhance public safety and reduce disaster losses.However,current temperature forecasting studies in Hunan primarily focus on nowcasting and short-term model corrections,with limited research on extended-range forecasting.Furthermore,existing extended-range high-temperature forecasts in Hunan largely rely on sub-seasonal to seasonal (S2S) models,which often exhibit insufficient accuracy.Therefore,developing a dedicated forecasting model for extended-range high-temperature forecasting is crucial.The study aims to develop an extended-range forecasting model for heat wave events in Hunan Province during the peak summer period (July-August).The model integrates physical predictors derived from S2S model temperature forecasts and their corrections with a convolutional neural network (CNN) approach to enhance forecasting skill.Daily maximum temperature data from 97 meteorological stations in Hunan Province (1999—2022) and S2S model outputs from ECMWF and NCEP are utilized.Physical forecast factors are extracted from temperature and circulation forecast products using singular value decomposition (SVD) and the spatiotemporal projection model (STPM).These factors are then integrated into a CNN-based high-temperature prediction model (HTPM).Additionally,the maximum temperature forecasts from the S2S models undergo bias correction,and the corrected forecasts are combined with predictions from the HTPM to create an ensemble forecasting scheme.This approach aims to enhance the stability and accuracy of regional high-temperature forecasts.Results indicate that while the original S2S model forecasts exhibit low predictive skill,bias correction significantly improves their performance,though false alarm rates remain high.The CNN-based high-temperature forecasting model trained on ECMWF S2S data (HTPM-ECS2S) and NCEP S2S data (HTPM-NCEPS2S) effectively capture high-temperature events,demonstrating improved forecasting skill.The ensemble scheme successfully integrates multiple model outputs,further enhancing forecast accuracy and reliability.
随着全球气温增加,近年来气象灾害事件频发,国际上对极端灾害事件的关注日趋增加。中国作为世界上受气象灾害影响较大的国家之一,每年因各种气象灾害造成的直接经济损失占GDP总值的1%~3%,占GDP增加值的10%以上(金荣花等,2019)。20世纪90年代以来,中国高温日数超历史同期(王荣等,2023),屡创新高(崔童等,2023),严重影响经济生产、生态环境和人体健康。
灾害天气的有效预测和及时预警是防灾减灾工作中的关键环节。相比短期天气预报,10~30 d的延伸期能够提供更长的决策时间窗口,有助于政府部门更加有效实施防灾减灾措施,保障公众安全,减少灾害损失(章大全等,2019; 雷蕾等,2022)。然而,延伸期业务预报起步较晚,传统短期天气预报方法,如数值模式和统计方法,能提供的有效预报时长十分有限,且在准确性和稳定性方面也存在着挑战。此外,随着气候变化加剧,天气的复杂性和多变性不断增加,使得在极端事件频发的背景下对更长时效预报的需求愈发迫切。
目前,天气预报主要依靠数值模式,数值天气预报模式在过去的40年里已有显著发展(Bauer et al.,2015; Rasp and Lerch,2018)。在延伸期降水、气温等要素的预报对象方面,目前国际主流数值预报中心的预报产品形式大多以逐周平均的距平为主。逐周预报一方面考虑到逐日天气预报的理论上限,另一方面通过平均滤除了逐日天气噪音,提升了气候信号的可预报性。各模式(ECMWF、美国CFSv2和日本TCC模式等)对延伸期的预报技巧仅限于1周,在第2—4周时均明显衰减,热带地区部分变量的预报技巧可延伸至第3—4周(章大全等,2019)。由于直接利用数值模式结果进行延伸期预报与实际业务需求还存在一定差距,基于动力模式有效预测信息和物理统计方法的动力统计相结合预测方案在业务中发挥着重要作用。Jones et al.(2004)利用经验正交函数(empirical orthogonal function,EOF)分解方法建立的预测模型,对低频热带对流的预报技巧可达4候,对北太平洋部分地区的风场可提供2~3候的有效预报。Hsu et al.(2015)建立了一套基于奇异值分解(singular value decomposition,SVD)的时空投影模型(spatial temporal projection models,STPM),其对5~30 d的低频降雨事件的有效预报可达20 d。STPM在气温、降水、热浪的延伸期预报中也有广泛的应用。然而,当前期预报因子产生较大的时空变率时,其与预报量的时空耦合关系可能会改变,导致模型无法准确反映随后的预报量场,从而产生误差。针对数值模式初始场不确定性及模式固有缺陷所导致的不可避免的误差问题,偏差订正方法被提出,以减少模式误差(Hsu et al.,2015; Xia et al.,2020)。模型输出统计方法(model output statistics,MOS)和完全预报法(perfect prognostic,PP)是常用的两种方法(Marzban et al.,2006)。MOS主要是利用观测数据匹配数值模式的输出,然后得到基于线性回归的预测方程(Glahn and Lowry,1972)。PP方法类似于MOS,但它通过建立观测值与数值模式预测值之间的线性统计关系来完成校正(Klein et al.,1959)。Marzban(2003)引入一种人工神经网络来代替地表观测数据后处理中的线性关系并进行温度预测。以上几种校正方法都仅侧重于校正单个气象站的预报资料,而如今精细网格预报在天气预报模型中越来越重要(Vannitsem et al.,2021)。Peng et al.(2013)提出了一种基于网格点的预测偏差校正方法(anomaly numerical-correction with observations,ANO),该方法将观测值和数值预报都分解为气候平均值和扰动值。ANO可以通过将建模的偏差应用于每个网格单元来输出网格化的偏差校正结果。
近年来,由于气象观测和模式数据的大量增加以及计算机效能的大幅提升,机器学习方法在气象研究和预报中的应用受到了大量关注。卷积神经网络(convolutional neural network,CNN)因为具有强大的图像识别和非线性模拟能力,所以在气象预报领域受到广泛的应用(曾玲玲等,2025)。Shi et al.(2015,2017)提出结合卷积神经网络(CNN)和长短时记忆网络(long short-term memory,LSTM)的ConvLSTM网络,以提高降水临近预报性能。Han et al.(2020)使用门控循环单元取代LSTM,以降低计算复杂度。相对而言,由于CNN方法更容易移植到各种问题中,所以其在气象中的应用较广(Tao et al.,2016; Lagerquist et al.,2019; Lebedev et al.,2019)。Tao et al.(2016)提出了堆桑降噪自动编码器(stacked denoising autoencoder,SDAE),以降低卫星降水估计偏差。Lagerquist et al.(2019)使用CNN重建了降水预报的卫星图像。Lebedev et al.(2019)使用CNN识别网格数据中的锋面,并用于天气尺度锋面的空间显式预测。雷蕾等(2022)通过CNN对大量历史数据进行训练,构建了灾害天气的延伸期预报模型。在各种先进预测方法的比较评估中,基于机器学习的模型普遍优于模式,具有较高的精度(Xu et al.,2022; Sabat et al.,2023)。深度学习作为大数据规律挖掘和非线性建模工具,在气象领域的应用具有广阔的前景。
湖南地形呈马蹄状,具有平原和三面环山的地形特点,并受到复杂天气系统的影响,故精细化温度预报成为湖南区域天气预报的难点之一(兰明才等,2023)。湖南省的高温热浪主要集中于湘中偏东地区,且近年来其影响范围逐渐扩大,强度不断增强。南亚高压的东伸和西太平洋副热带高压的异常偏西偏北是持续性高温热浪发生的主要原因(张曦和黎鑫,2017)。目前,关于湖南地区温度预报的研究主要集中在临近预报的模式订正方面(陈龙等,2022),针对延伸期预报的研究相对较少。目前湖南省延伸期高温预报主要依赖现有模式数据的次季节-季节预测(sub-seasonal to seasonal prediction,S2S),故导致预报结果的准确性不足。因此,建立一套针对延伸期高温的预报模型尤为必要。
本文拟在模式气温预报及订正的基础上,提取物理因子,并结合CNN方法,针对湖南省盛夏(7、8月)高温天气过程建立一套延伸期预报模型,以提高对湖南地区高温过程的预报能力,为湖南省防灾减灾工作提供参考。
1 资料和方法
1.1 资料
本文采用了1999—2022年湖南省97个气象观测台站(图1)盛夏(7、8月)逐日最高温度观测资料以及美国国家环境预报中心和国家大气研究中心(NCEP/NCAR)提供的全球逐日再分析资料,包括500 hPa位势高度场以及200、700和850 hPa风场,空间分辨率为2.5°×2.5°。通过双线性插值将其插值成1.5°×1.5°的分辨率,以方便预报因子的投影。
1湖南97个气象观测台站分布(a)以及湖南省地形高度(b; 单位:m)
Fig.1(a) Distribution of 97 meteorological observation stations in Hunan Province and (b) topography of Hunan Province (units:m)
S2S模式资料来自S2S数据集(Vitart et al.,2017)中欧洲中期天气预报中心(ECMWF)和美国国家环境预报中心(NCEP)回报数据的控制预报以及两种模式最新的实时预报。模式信息如表1所示。由于ECMWF的次季节预报系统仅在每周一和周四进行回报,每次回报试验的开始时间不连续,所以本文通过插值重组连续的未来10~30 d的预测数据(Yang et al.,2018)。
1.2 数据预处理
在训练模型前,需要对S2S预报数据和再分析资料做标准化处理。标准化方法的计算式如下:
Z=X-μσ
(1)
其中:X是标准化前的数据; Z是标准化之后的数据; μσ分别是Z在训练集上计算的均值和方差。通过标准化,使得Z的均值为0,方差为1,更有利于神经网络在训练中收敛,而对于验证集和训练集的标准化,则是减去训练集的均值和方差。
1.3 预报技巧评估指标
1)偏差(Bias; Bias)为:
Bias=1ni=1n Vpre,i-Vobs,i
(2)
2)均方根误差(root mean square error,RMSE; ERMS)为:
ERMS=1ni=1n Vpre,i-Vobs,i
(3)
式中:Vpre,ii样本点的模式回报值或温度数据模型预报值; Vobs,ii样本点的温度数据实际观测值; n为实际参加评估的区域格点数。
3)技巧评分(technique skill score,TS评分; ST)用于评估模式对高温事件的预测技巧,ST为:
ST=NhNh+Nf+Nm
(4)
4)空报率(false alarm rate,FAR; RFA)为:
RFA=NfNh+Nf
(5)
1S2S模式资料简介
Table1Overview of S2S model data
式中:Nh表示对高温预报正确的次数; Nf为空报次数; Nm为漏报次数。ST数值越大,代表模式对高温事件发生的概率预测越准确。RFA数值越大,说明空报次数越多。
5)区域高温预报过程评分:参考湖南省区域降水过程评分,定义单站日最高温度≥35℃计1个高温日,否则视为非高温日。全省高温过程按照单日有超过20站出现高温且持续1 d以上来判定,分为短过程和长过程两种。短过程是指持续时间在2 d及以下的过程,长过程是指持续时间在3 d及以上的过程。预报评分规则如下。
对于实际过程是短过程的情况:短过程统计时段是预报时段初日的前一天起至预报时段终日的后一天止。预报高温过程为1 d时,短过程统计时段(共3 d,含预报过程前后各1 d,下同)内任意单日出现高温日的站数多于等于20站,视为该过程预报正确,高温过程评分记100分,否则为空报,记0分。预报高温过程为2 d时,短过程统计时段(共4 d)内任意单日出现高温日的站数多于等于20站,视为该过程预报正确,发生日只要在预报时段内,高温过程评分记100分,若发生日仅在前后所跨时段内,则高温过程评分记70分; 短过程统计时段内未出现20站及以上高温的视为空报,记0分。
对于实际过程是长过程的情况:长过程统计时段就是预报时段,即预报时段初日起至预报时段终日止; 在长过程统计时段内,出现高温日站数多于等于20站的天数大于等于该预报时段的1/3天数(预报时段天数出现小数时进行四舍五入处理)时,视该过程预报正确,高温过程评分记100分,否则为空报,记0分。
预报有高温以外的时段均视为预报无高温时段。在该时段内,连续的逐日全省20站及以上出现高温日,则视为漏报1次高温过程。
高温过程预报质量Pr评分评定计算公式为:
Pr=i=1r PiN+Nf
(6)
式中:Pi为预报正确的高温过程评分; r为预报正确的高温过程次数; Nf为漏报的高温过程次数; N为预报有高温过程的次数。
6)时间相关系数(temporal correlation coefficient,TCC; CTC; 定量评估模式对高温时间变率的预报能力,TCC值越大表明预报技巧越高),CTC为:
CTC=t=1n Xt-X-Yt-Y-t=1n Xt-X-2t=1n Yt-Y-2
(7)
式中:XtYt分别是两个时间序列在时间点t的值; X-Y-分别是两个时间序列的均值; n是时间序列的长度。
2 湖南省气温背景
湖南省地处中国中部,地形以山地丘陵为主,属于亚热带季风气候区域,夏季特别是7月和8月,高温天气频繁发生。湖南省山地丘陵地形不仅影响当地气候的形成,而且导致地区气温的显著变化,夏季高温天气尤为显著,对农业生产、人民生活和健康有重要影响。因此,科学有效地预测和应对夏季高温天气对湖南省具有重要意义。
图2a给出了湖南地区盛夏平均最高气温的年际变化。可见,大部分年份平均最高气温在33℃上下波动,2013年达到35℃,而1999、2002年相对较低(约31℃)。总体来看,平均最高温度呈现出上升趋势。图2b显示,盛夏高温日数平均占比为30%,但10年来大部分年份的高温日数占比均超过平均水平。受气候变暖影响,高温的出现呈上升趋势。图2c给出了湖南省1981—2022年盛夏(7、8月)高温日数的变化。可见,大部分年份高温日数为16~20 d,最多的是2022年(达43 d),最低的是1993年(仅1 d); 且近40年高温日数呈上升趋势。
2湖南省1981—2022年盛夏平均最高温度(a; 单位:℃)、平均高温日数占比(b; 单位:%)和平均高温日数(c; 单位:d)
Fig.2Spatial distribution of (a) average maximum temperature (units:℃) , (b) proportion of average high-temperature days (units:%) , and (c) average number of high-temperature days (units:d) in Hunan Province during midsummer from 1981 to 2022
图3a给出了1981—2022年湖南省盛夏高温平均日数的空间分布。可见,大部分地区的高温平均日数为16~20 d,其中湖南东南部分地区的高温日数超过28 d,最高可达33 d以上。这表明,湖南省在盛夏期间高温天气较普遍,尤其在东南部地区(图3a)。高温日平均气温在湖南的东南部地区也较高(图3b)。
3 基于S2S模式数据的延伸期预报模型的建立
3.1 因子的选取
模型的技术路线如图4所示。预报因子的选取考虑了高中低层天气系统的影响,包括低层水汽输送、中层高压系统、高层风的辐合辐散等因素对高温及强降水的影响。根据对不同因子的筛选,最后确定了湖南省高温与强降水的可预测性源和每个预测因子的投影域(限于篇幅,这里只展示选取的因子及范围)。图5图6显示了奇异值分解(SVD)第一模态的各预测因子与湖南省高温场的关联模式。可见挑选的投影域内预测因子与湖南省高温场的关联性较强。
考虑基于SVD的时空投影模型方法来提取预测因子。该方法利用“同期”大尺度环流特征和气象要素的耦合关系来提取预测因子。选取500 hPa位势高度场以及200、700和850 hPa风场,并运用风场计算850 hPa势函数场作为基本因子场。
先对历史因子场(Xob)和目标温度场的观测数据进行SVD分解,得到历史因子的空间场(Vob)和时间场(Tob),选取第一模态的空间场(除势函数外方差贡献率均超过80%),再将S2S模式预测的各因子场(Xpre)投影到空间场(Vob)上,得到对应的时间系数(Ppre),即因子,计算公式如下:
Xob=VobTob,
(8)
Ppre =Vob Xpre
(9)
3.2 Conv1d模型结构
基于提取得到的预测因子集和实际温度场的关系,构建一维CNN模型,该网络由2个卷积层、2个池化层、2个全连接层和1个Dropout层组成,旨在从输入的预测因子中提取有用特征,以进行温度场的预测。具体模型架构如下:
模型的第一层是一个一维卷积层,其输入通道数为8,输出通道数为4,卷积核大小为7,填充大小为3,以保证输入输出的时间步长一致。接着是一个池化层,其池化核大小和步长都为1,目的是保持数据的尺寸,并进一步提取局部特征。第二个卷积层将通道数从4增加到6,卷积核大小同样为7,填充为3。再次应用池化层来进一步处理数据。卷积操作后,数据通过Flatten层展平,并传递给两个全连接层。第一个全连接层将特征映射到2个输出节点,第二个全连接层输出最终的预测值。模型中的激活函数使用了ELU,ELU有助于加速训练并解决ReLU激活函数的“死神经元”问题,同时具有平滑的负值输出,有助于更好地梯度传播,适用于深层网络的训练。在训练过程中,为了避免过拟合,还引入了Dropout层(概率为0.1)对神经元进行随机丢弃。模型的训练通过均方误差作为损失函数进行优化,使用Adam优化器自适应调整学习率。在训练过程中,损失函数逐渐下降,表明模型在不断拟合数据。采用分批训练方法,批次的大小设定为256。
3湖南省1981—2022年盛夏平均高温日数(a; 单位:d)和高温日平均气温(b; 单位:℃))的空间分布
Fig.3Distribution of (a) average number of high-temperature days (units:d) and (b) the average temperature of high-temperature days (units:℃) in Hunan Province during midsummer from 1981 to 2022
4技术路线图
Fig.4Technical roadmap
51999—2018年各预测因子与湖南省日最高温度场经奇异值分解的各预测因子的第一奇异向量场:(a)500 hPa位势高度;(b)200 hPa纬向风;(c)700 hPa纬向风;(d)850 hPa纬向风;(e)200 hPa经向风;(f)700 hPa经向风;(g)850 hPa经向风;(h)850 hPa势函数
Fig.5First singular vector field of each predictive factor, obtained through singular value decomposition of each predictive factor and the daily maximum temperature field in Hunan Province from 1999 to 2018: (a) 500 hPa potential height; (b) 200 hPa zonal wind; (c) 700 hPa zonal wind; (d) 850 hPa zonal wind; (e) 200 hPa meridional wind; (f) 700 hPa meridional wind; (g) 850 hPa meridional wind; (h) 850 hPa potential function
由于NCEP数据存在断档(2011—2014年数据缺失,故在NCEP模型中去除了该时间段的训练),且温度的年际变化趋势呈上升态势(图3a),为了有效检验模型训练的合理性以及在数据间断情况下提取特征的能力,所以本文将数据分为3部分:验证期(2010、2019年盛夏; 124 d); 独立预报期(2015、2020—2022年盛夏; 248 d); 剩余数据为训练期(ECMWF数据为1 054 d,NCEP数据为868 d)。选择2010、2019年作为验证期,并将2015、2020、2021和2022年作为独立预报期,旨在应用不同气象模式在不同气候变化背景下的样本,以验证模型的稳健性和泛化能力,同时确保数据的完整性与时效性。在具体的实施过程中,输入预报因子集和湖南省97站的目标气温场作为训练数据,并为每个站点分别进行训练搭建了模型,使每个站点对应一个独立的模型。模型的基本框架见图7
6各预测因子与湖南省最高温度场奇异值分解的第一模态时间系数的相关系数(所有相关系数均通过了0.01信度的显著性检验)
Fig.6Correlation coefficients of the time series for the first mode of singular value decomposition between each predictive factor and the highest temperature field in Hunan Province (all coefficients are statistically significant at the 0.01 level)
4 结果分析
4.1 订正及集成方案
图8a可见,基于ECMWF的S2S数据训练的高温预报模型(HTPM-ECS2S)和基于NCEP的S2S数据训练的高温预报模型(HTPM-NCEPS2S),在预报值与实际观测值之间的偏差评分接近于0,表明这两个模型的训练效果良好,能够有效捕捉数据特征。而ECMWF的S2S模式预报数据(ECS2S)和NCEP的S2S模式预报数据(NCEPS2S)与观测值的评分则显示,模式预测值与实际观测值之间存在较大偏差,且普遍表现为预报值低于实际观测值。图8c进一步说明,两种S2S模式的预报能力相较于训练的预报模型技巧低,具体表现在HTPM-ECS2S优于ECS2S,HTPM-NCEPS2S优于NCEPS2S。由图8b可见,HTPM-ECS2S和HTPM-NCEPS2S展现了较S2S模式更高的预报技巧。因此,有必要对两种S2S模式的预报结果进行修正。通过原S2S模式的偏差对两种S2S模式的预报值进行订正。订正方式如式(10)、(11)所示,预报阶段利用训练期内得到的预报偏差订正预报:
Bias=1ni=1n Vpre,i-Vobs,i,
(10)
Vpre ,i'=Vpre ,i+Bias
(11)
式中:Vpre,ii样本点的模式回报值或温度数据模型预报值; Vobs,ii样本点的温度数据实际观测值; Vpre,ii样本点偏差订正后的预报值; n为实际参加评估的区域格点数。
7卷积神经网络架构
Fig.7Convolutional neural network architecture
图8d—f是偏差订正后各模型的效果。由图8d可见,偏差订正后,ECS2S及NCEPS2S模式最高温度的预报与观测值的偏差显著减小,接近于0。由图8e可见,两种S2S模式的预报技巧也得到明显提高,虽仍低于HTPM-ECS2S和HTPM-NCEPS2S模型,但相较于这两者的均方根误差已减小至0.5以内。图8f显示,经过订正后,两种S2S模式的TS评分已经超越训练模型,表明经过修正的S2S模式在高温事件的预测能力上表现更优。
鉴于4种方法的均方根误差(RMSE)均处于可信赖的范围内(4种方法的RMSE评分均在4以下,低于现有大部分模式的同期温度预测),且对预报高温事件的能力各有优势,为提升整体预测性能,将这4种预报结果进行集成。本文采用贝叶斯思想来确定集合方案:先将训练阶段的结果作为先验知识,假设训练阶段的最优组合与独立预报中的最优组合一致。具体步骤为:首先,选取阈值。4个模型的RMSE评分均值为3.46,TS评分均值为0.098,因此选择RMSE评分范围为3~4、TS评分范围为0.1~0.2进行组合筛选。综合比较后,最终确定阈值为RMSE评分3.5、TS评分0.15。在训练阶段,针对每个预报时效和每个站点,选取RMSE小于3.5且TS评分大于0.15的模型,并将符合条件的模型组合为一组。对于独立预报,取对应各组的平均值作为最终预报值。如果没有满足两个条件的模型,则选择RMSE最小且TS评分最高的两个模型,将其预报结果求平均,得到最终的预报值。
4.2 最高气温预报效果
图9是独立预报阶段模型和模式预报值与观测值的均方根误差。可以看出,HTPM-ECS2S和ECS2S在2015、2020、2021、2022年的预报中表现相对较好,集成方案的综合表现最优。集成方案虽然在2022年的预报效果相比ECS2S模式预报结果稍差,但与S2S模式的RMSE差距也仅在0.2左右,其在2015、2020、2021年均有比较好的表现。由此可见,该集成方案吸收了各模式预报上的优点,综合预测效果最佳。
8训练阶段两种训练模型和两种S2S模式与观测值的偏差(BIAS)评分(a)、均方根误差(RMSE)(b)和TS评分(c),以及两种训练模型和两种经过偏差订正的S2S模式与观测值的偏差(BIAS)评分(d)、均方根误差(RMSE)(e)和TS评分(f)
Fig.8Performance comparison between the two training models and the two S2S models: (a) BIAS score, (b) RMSE, and (c) TS score during the training stage compared with observed values, and (d) BIAS score, (e) RMSE, and (f) TS score after bias correction with observed values
9独立预报阶段各预报模型的RMSE评分:(a)2015年;(b)2020年;(c)2021年;(d)2022年
Fig.9RMSE scores of each forecasting model during the independent forecasting stage: (a) 2015; (b) 2020; (c) 2021; (d) 2022
从独立预报阶段各模型与集成方案的RMSE空间分布(图略)可以看出,各模型对湖南西北部的预报效果较差,对湖南南部的最高温度的预报能力相对较好。这可能与湖南地区的南部平原、西北部山地地形有关(图1)。HTPM-ECS2S和ECS2S及集成方案的表现较好,且在预报时效为10 d的时候预报技巧较高,在预报时效达20 d、30 d时,预报技巧虽有所下降,但其对湖南南部仍有一定预报技巧。由前述可知,湖南省东南部地区多发高温,集成方案在预报时效为10~30 d时,对湖南东南部地区均有较好的预报技巧,这对湖南地区高温灾害的预测及预防有重要意义。
独立预报阶段各预报模型10 d以上低频分量的TCC评分(图略)显示,HTPM-ECS2S和HTPM-NCEPS2S预报模型的TCC评分要优于S2S模式的TCC评分,这表明基于CNN方法建立的预报模型对最高气温的预报有更高的预报技巧,其能更有效地捕捉到影响最高气温的关键因素。ECS2S模式2022年的TCC评分较好,但仍低于HTPM-ECS2S和HTPM-NCEPS2S预报模型。此外,集成方案在各个独立预报年份中均展现出较为稳定的预报能力,其TCC评分普遍高于单一模型。2020年的TCC评分相对较高,因此选择2020年做进一步分析。
图10给出了各预报模型10 d以上低频分量在2020年盛夏高温预报的TCC空间分布。可见,在预报时效为10 d时,HTPM-ECS2S与HTPM-NCEPS2S在湖南北部的预报技巧最高,而ECS2S则在除湖南西部外区域有较高的预报技巧。集成方案综合了各模型的优势。在预报时效为20 d时,各预报模型均在湖南西北部与东南部有较高技巧。在预报时效为30 d时,各模型仍能在湖南东南部维持较高技巧,且以集成方案效果最佳。
总体来看,各预报模型在不同预报时效和不同年份上的预报技巧存在差异,但均优于模式原始预报。HTPM-NCEPS2S模型表现效果较差,可能原因是HTPM模型从原有S2S模式数据中提取有用因子,其预报结果与其因子提取对象有关联,当S2S模式预报性能较好时,HTPM模型的预报结果也较好,NCEPS2S模式预报性能较差则会导致HTPM-NCEPS2S模型表现效果较差。各模型对不同年份的预报侧重点有所不同,各有好坏,集成方案通过综合不同模型的优势,对区域最高气温具有稳定的较高的预报技巧。
4.3 高温过程预报效果
上述分析表明,模型集成方案在最高气温的预报技巧上具有明显的优势。下面将进一步评估该集成方法在高温过程预报中的表现。
图11是独立预报阶段各年份对高温日的TS评分。可以看出,2020和2022年各模型对高温日的预报能力较为优秀,2015和2021年预报能力稍差。这一差异源于模型对最高气温的预报技巧在后两年相对较弱(图9),从而影响了其对高温日的预测能力。总之,HTPM-NCEPS2S对高温日的把握能力最差,而订正后的ECS2S模式表现出最佳的预测能力。集成模型对高温日的预测能力也较高,其在2020年的TS评分超越了ECS2S模式。但从空报率(图12)来看,S2S模式相较于其他两个预报模型有更高的空报率。虽然2022年ECS2S的表现较为突出,空报率最低,但从4年的综合数据来看,其整体空报率仍高于相应的CNN预报模型。因此,尽管S2S模式在高温日预报方面具有较高的TS评分,但其较高的空报率可能会对实际应用造成影响。相对而言,CNN预报模型的低空报率使其对高温事件预报的可靠性更好。集成方案则兼有较高的TS评分和较低的空报率,能够更好地捕捉高温日。
10各预报模型10 d以上低频分量在2020年预报时效为10 d、20 d、30 d的TCC空间分布及其均值
Fig.10TCC spatial distribution and mean values of low-frequency components (> 10 d) for each forecasting model with lead times of 10, 20 and 30 d in 2020
2022年出现了极端高温事件,湖南地区出现了一段长达40 d的连续区域高温过程; 结果显示,模型对2022年的预报效果较好。在此提取了2022年7月23日对8月2—11日高温过程的预报结果(提前10 d预报未来10~19 d的温度; 图13)。由图13可见,各预报模式对此次高温过程的预测较为保守。本次高温过程具有高温中心多、高温区域范围大等特点。由图13可以看出,HTPM-ECS2S模型和ECS2S模式的预报效果较好。尽管HTPM-ECS2S模型和HTPM-NCEPS2S模型对高温区域的范围和强度预测偏保守,但其对高温中心的定位较为准确,这为预报工作确定区域高温中心提供了帮助。ECS2S模式和NCEPS2S模式(订正后)虽然预报出的高温区域范围较大,但在高温中心的把握上有所不足。集成模式则融合了各个模式的优点,成功预报出了较大的高温区域范围,并较为准确地定位了高温中心。
不同模型在独立预报阶段对区域高温过程的预报评分如表2所示。ECS2S模式在所有模型中表现最佳,评分为67.81。HTPM-ECS2S和NCEPS2S次之,仅与ECS2S模式差2~6分。集成方案评分为67.56,其通过集成多模型的优势,能够有效提升整体预报技巧及其稳定性。HTPM-NCEPS2S的评分仅为49.19,显著低于其他模型。
11独立预报阶段各预报模型的TS评分:(a)2015年;(b)2020年;(c)2021年;(d)2022年
Fig.11TS scores of each forecasting model during the independent forecasting stage: (a) 2015; (b) 2020; (c) 2021; (d) 2022
12独立预报阶段各预报模型的FAR评分:(a)2015年;(b)2020年;(c)2021年;(d)2022年
Fig.12FAR scores of each forecasting model during the independent forecasting stage: (a) 2015; (b) 2020; (c) 2021; (d) 2022
2区域高温过程预报评分
Table2Regional high-temperature forecast scores
5 结论
本文基于多种S2S数值模式产品和人工智能方法,建立了结合CNN的区域高温过程的预报模型(HTPM),旨在提升湖南省盛夏延伸期高温过程的预报能力。主要结论如下:
1)S2S模式对延伸期高温预报的技巧相对较低,通过实施偏差订正,ECMWF和NCEP S2S模式在湖南省高温过程预报中的技巧较原模式未订正结果得到显著提高。
2)基于奇异值分解的时空投影提取预报因子,并结合模式数值预报产品和CNN,建立了湖南省区域高温过程的延伸期预报模型(HTPM-ECS2S和HTPM-NCEPS2S)。结果显示,HTPM-ECS2S和HTPM-NCEPS2S模型在高温预报方面具有更高的预报技巧,展示了它们在捕捉高温事件特征上的优势。
132022年8月2—11日的一次区域高温过程的观测和预报(提前10 d预报未来10~19 d; 单位:℃)
Fig.13Regional high-temperature observations and forecast from August 2 to August 11, 2022 (10-day lead time, forecast for days 10—19; units:℃)
3)集成方案成功整合了多个模型的优点,进一步增强了高温预报的准确性与可靠性,证明了模型组合策略在气象预测中的有效性。
本文通过订正模式预报,基于模式产品和CNN构建了区域高温事件预测模型。当前,湖南省的业务预报主要依赖模式的初始预报; 而本研究表明,在此基础上,各模型均显著提升了预报性能。尽管各模型展现了较强的预报能力,但从独立预报的结果来看,不同模型在不同年份的预报技巧表现不一,且在地形上的表现差异较大:模型的预报性能在平原区域较好,在山地区域相对较差,表明模型存在一定不足。因此,为了获得更加稳定且具有较高预报技巧的结果,未来需要针对具体预测目标,构建多种模型并进行集成。极端气温预报具有较大的挑战性,为了进一步提升预报技巧,仍需深入探讨极端气温的成因,分析其物理机制,并优化模型组合,探索不同权重分配方案对预报效果的影响。同时,可结合其他更复杂的深度学习模型,挖掘更深层次的时空特征,以进一步提升预测能力。
1湖南97个气象观测台站分布(a)以及湖南省地形高度(b; 单位:m)
Fig.1(a) Distribution of 97 meteorological observation stations in Hunan Province and (b) topography of Hunan Province (units:m)
2湖南省1981—2022年盛夏平均最高温度(a; 单位:℃)、平均高温日数占比(b; 单位:%)和平均高温日数(c; 单位:d)
Fig.2Spatial distribution of (a) average maximum temperature (units:℃) , (b) proportion of average high-temperature days (units:%) , and (c) average number of high-temperature days (units:d) in Hunan Province during midsummer from 1981 to 2022
3湖南省1981—2022年盛夏平均高温日数(a; 单位:d)和高温日平均气温(b; 单位:℃))的空间分布
Fig.3Distribution of (a) average number of high-temperature days (units:d) and (b) the average temperature of high-temperature days (units:℃) in Hunan Province during midsummer from 1981 to 2022
4技术路线图
Fig.4Technical roadmap
51999—2018年各预测因子与湖南省日最高温度场经奇异值分解的各预测因子的第一奇异向量场:(a)500 hPa位势高度;(b)200 hPa纬向风;(c)700 hPa纬向风;(d)850 hPa纬向风;(e)200 hPa经向风;(f)700 hPa经向风;(g)850 hPa经向风;(h)850 hPa势函数
Fig.5First singular vector field of each predictive factor, obtained through singular value decomposition of each predictive factor and the daily maximum temperature field in Hunan Province from 1999 to 2018: (a) 500 hPa potential height; (b) 200 hPa zonal wind; (c) 700 hPa zonal wind; (d) 850 hPa zonal wind; (e) 200 hPa meridional wind; (f) 700 hPa meridional wind; (g) 850 hPa meridional wind; (h) 850 hPa potential function
6各预测因子与湖南省最高温度场奇异值分解的第一模态时间系数的相关系数(所有相关系数均通过了0.01信度的显著性检验)
Fig.6Correlation coefficients of the time series for the first mode of singular value decomposition between each predictive factor and the highest temperature field in Hunan Province (all coefficients are statistically significant at the 0.01 level)
7卷积神经网络架构
Fig.7Convolutional neural network architecture
8训练阶段两种训练模型和两种S2S模式与观测值的偏差(BIAS)评分(a)、均方根误差(RMSE)(b)和TS评分(c),以及两种训练模型和两种经过偏差订正的S2S模式与观测值的偏差(BIAS)评分(d)、均方根误差(RMSE)(e)和TS评分(f)
Fig.8Performance comparison between the two training models and the two S2S models: (a) BIAS score, (b) RMSE, and (c) TS score during the training stage compared with observed values, and (d) BIAS score, (e) RMSE, and (f) TS score after bias correction with observed values
9独立预报阶段各预报模型的RMSE评分:(a)2015年;(b)2020年;(c)2021年;(d)2022年
Fig.9RMSE scores of each forecasting model during the independent forecasting stage: (a) 2015; (b) 2020; (c) 2021; (d) 2022
10各预报模型10 d以上低频分量在2020年预报时效为10 d、20 d、30 d的TCC空间分布及其均值
Fig.10TCC spatial distribution and mean values of low-frequency components (> 10 d) for each forecasting model with lead times of 10, 20 and 30 d in 2020
11独立预报阶段各预报模型的TS评分:(a)2015年;(b)2020年;(c)2021年;(d)2022年
Fig.11TS scores of each forecasting model during the independent forecasting stage: (a) 2015; (b) 2020; (c) 2021; (d) 2022
12独立预报阶段各预报模型的FAR评分:(a)2015年;(b)2020年;(c)2021年;(d)2022年
Fig.12FAR scores of each forecasting model during the independent forecasting stage: (a) 2015; (b) 2020; (c) 2021; (d) 2022
132022年8月2—11日的一次区域高温过程的观测和预报(提前10 d预报未来10~19 d; 单位:℃)
Fig.13Regional high-temperature observations and forecast from August 2 to August 11, 2022 (10-day lead time, forecast for days 10—19; units:℃)
1S2S模式资料简介
Table1Overview of S2S model data
2区域高温过程预报评分
Table2Regional high-temperature forecast scores
Bauer P, Thorpe A, Brunet G, 2015. The quiet revolution of numerical weather prediction[J]. Nature, 525(7567): 47-55. DOI: 10. 1038/nature14956.
陈龙, 陈静静, 兰明才, 等, 2022. 华南区域模式在湖南省的2 m温度预报检验与订正研究[J]. 中低纬山地气象, 46(5): 64-70. Chen L, Chen J J, Lan M C, et al., 2022. Bias analysis and correction method for the 2 m temperature forecast in Hunan of region model in South China[J]. Mid Low Latitude Mt Meteor, 46(5): 64-70. (in Chinese).
崔童, 孙林海, 张驰, 等, 2023. 2022年夏季中国极端高温事件特点及成因初探[J]. 气象与环境科学, 46(3): 1-8. Cui T, Sun L H, Zhang C, et al., 2023. Characteristics and causes of extreme heat events in China in summer 2022[J]. Meteor Environ Sci, 46(3): 1-8. DOI: 10. 16765/j. cnki. 1673-7148. 2023. 03. 001. (in Chinese).
Glahn H R, Lowry D A, 1972. The use of model output statistics (MOS) in objective weather forecasting[J]. J Appl Meteor, 11(8): 1203-1211. DOI: 10. 1175/1520-0450(1972)011<1203: tuomos>2. 0. co;2.
Han L, Sun J Z, Zhang W, 2020. Convolutional neural network for convective storm nowcasting using 3-D Doppler weather radar data[J]. IEEE Trans Geosci Remote Sens, 58(2): 1487-1495. DOI: 10. 1109/TGRS. 2019. 2948070.
Hsu P C, Li T, You L J, et al., 2015. A spatial-temporal projection model for 10—30 day rainfall forecast in South China[J]. Climate Dyn, 44(5): 1227-1244. DOI: 10. 1007/s00382-014-2215-4.
金荣花, 马杰, 任宏昌, 等, 2019. 我国10~30天延伸期预报技术进展与发展对策[J]. 地球科学进展, 34(8): 814-825. Jin R H, Ma J, Ren H C, et al., 2019. Advances and development countermeasures of 10—30 days extended-range forecasting technology in China[J]. Adv Earth Sci, 34(8): 814-825. (in Chinese).
Jones C, Carvalho L M V, Wayne Higgins R, et al., 2004. A statistical forecast model of tropical intraseasonal convective anomalies[J]. J Climate, 17(11): 2078-2095. DOI: 10. 1175/1520-0442(2004)017<2078: asfmot>2. 0. co;2.
Klein W H, Lewis B M, Enger I, 1959. Objective prediction of five-day mean temperatures during winter[J]. J Meteor, 16(6): 672-682. DOI: 10. 1175/1520-0469(1959)016<0672: opofdm>2. 0. co;2.
Lagerquist R, McGovern A, Gagne D J, 2019. Deep learning for spatially explicit prediction of synoptic-scale fronts[J]. Wea Forecasting, 34(4): 1137-1160. DOI: 10. 1175/waf-d-18-0183. 1.
兰明才, 唐杰, 周莉, 等, 2023. 基于逐步回归模型的华南区域模式气温预报产品释用技术研究[J]. 气象与环境科学, 46(5): 86-95. Lan M C, Tang J, Zhou L, et al., 2023. Research on interpretation and application of temperature forecast products of regional model in South China based on stepwise regression model[J]. Meteor Environ Sci, 46(5): 86-95. DOI: 10. 16765/j. cnki. 1673-7148. 2023. 05. 011. (in Chinese).
Lebedev V, Ivashkin V, Rudenko I, et al., 2019. Precipitation nowcasting with satellite imagery[C]//Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. Anchorage AK USA: ACM: 2680-2688. DOI: 10. 1145/3292500. 3330762.
雷蕾, 徐邦琪, 高庆九, 等, 2022. 基于卷积神经网络的长江流域夏季日最高温度延伸期预报方法研究[J]. 大气科学学报, 45(6): 835-849. Lei L, Hsu P C, Gao Q J, et al., 2022. Extended-range forecasting method of summer daily maximum temperature in the Yangtze River basin based on convolutional neural network[J]. Trans Atmos Sci, 45(6): 835-849. DOI: 10. 13878/j. cnki. dqkxxb. 20211101001. (in Chinese).
Marzban C, 2003. Neural networks for postprocessing model output: ARPS[J]. Mon Wea Rev, 131(6): 1103-1111. DOI: 10. 1175/1520-0493(2003)131<1103: nnfpmo>2. 0. co;2.
Marzban C, Sandgathe S, Kalnay E, 2006. MOS, perfect prog, and reanalysis[J]. Mon Wea Rev, 134(2): 657-663. DOI: 10. 1175/mwr3088. 1.
Peng X D, Che Y Z, Chang J, 2013. A novel approach to improve numerical weather prediction skills by using anomaly integration and historical data[J]. J Geophys Res: Atmos, 118(16): 8814-8826. DOI: 10. 1002/jgrd. 50682.
Rasp S, Lerch S, 2018. Neural networks for postprocessing ensemble weather forecasts[J]. Mon Wea Rev, 146(11): 3885-3900. DOI: 10. 1175/mwr-d-18-0187. 1.
Sabat N K, Pati U C, Das S K, 2023. ABTCN: an efficient hybrid deep learning approach for atmospheric temperature prediction[J]. Environ Sci Pollut Res Int, 30(60): 125295-125312. DOI: 10. 1007/s11356-023-27985-0.
Shi X J, Chen Z R, Wang H, et al., 2015. Convolutional LSTM network: a machine learning approach for precipitation nowcasting[J]. arXiv: 1506. 04214v2. DOI: 10. 48550/arXiv1506. 04214.
Shi X J, Gao Z H, Lausen L, et al., 2017. Deep learning for precipitation nowcasting: a benchmark and a new model[J]. arXiv: 1706. 03458v2. DOI: 10. 48550/1706. 03458.
Tao Y M, Gao X G, Hsu K, et al., 2016. A deep neural network modeling framework to reduce bias in satellite precipitation products[J]. J Hydrometeorol, 17(3): 931-945. DOI: 10. 1175/jhm-d-15-0075. 1.
Vannitsem S, Bremnes J B, Demaeyer J, et al., 2021. Statistical postprocessing for weather forecasts: review, challenges, and avenues in a big data world[J]. Bull Amer Meteor Soc, 102(3): E681-E699. DOI: 10. 1175/bams-d-19-0308. 1.
Vitart F, Ardilouze C, Bonet A, et al., 2017. The subseasonal to seasonal (S2S) prediction project database[J]. Bull Amer Meteor Soc, 98(1): 163-173. DOI: 10. 1175/bams-d-16-0017. 1.
王荣, 王遵娅, 高荣, 等, 2023. 1961—2020年中国区域性高温过程的气候特征及变化趋势[J]. 地球物理学报, 66(2): 494-504. Wang R, Wang Z Y, Gao R, et al., 2023. Climatology and changing trend of the regional high temperature process in China during 1961—2020[J]. Chin J Geophys, 66(2): 494-504. (in Chinese).
Xia J J, Li H C, Kang Y Y, et al., 2020. Machine learning-based weather support for the 2022 Winter Olympics[J]. Adv Atmos Sci, 37(9): 927-932. DOI: 10. 1007/s00376-020-0043-5.
Xu G N, Lin K H, Li X T, et al., 2022. SAF-Net: a spatio-temporal deep learning method for typhoon intensity prediction[J]. Pattern Recognit Lett, 155: 121-127. DOI: 10. 1016/j. patrec. 2021. 11. 012.
Yang J, Zhu T, Gao M N, et al., 2018. Late-July barrier for subseasonal forecast of summer daily maximum temperature over Yangtze River basin[J]. Geophys Res Lett, 45(22): 12610-12615. DOI: 10. 1029/2018GL080963.
曾玲玲, 谭桂容, 赵辉, 等, 2025. 湖南省主汛期5—8月降水过程延伸期智能预报[J]. 大气科学学报, 48(3): 486-498. Zeng L L, Tan G R, Zhao H, et al., 2025. Extended-range intelligent forecasting of precipitation processes during the main flood season (May-August) in Hunan Province[J]. Trans Atmos Sci, 48(3): 486-498. DOI: 10. 13878/j. cnki. dqkxxb. 20250105002. (in Chinese).
张曦, 黎鑫, 2017. 湖南省夏季高温热浪时空分布特征及其成因[J]. 气候与环境研究, 22(6): 747-756. Zhang X, Li X, 2017. Spatial-temporal characteristics and causes of summer heat waves in Hunan Province[J]. Climatic and Environmental Research, 22(6): 747-756. DOI: 10. 3878/j. issn. 1006-9585. 2017. 17025. (in Chinese).
章大全, 郑志海, 陈丽娟, 等, 2019. 10~30 d延伸期可预报性与预报方法研究进展[J]. 应用气象学报, 30(4): 416-430. Zhang D Q, Zheng Z H, Chen L J, et al., 2019. Advances on the predictability and prediction methods of 10—30 d extended range forecast[J]. J Appl Meteor Sci, 30(4): 416-430. (in Chinese).

地址:江苏南京宁六路219号南京信息工程大学    邮编:210044

联系电话:025-58731158    E-mail:xbbjb@nuist.edu.cn    QQ交流群号:344646895

大气科学学报 ® 2025 版权所有  技术支持:北京勤云科技发展有限公司