受全球气候变化的影响,近年来高温、严寒等极端天气事件频发,公众和政府对气温预报的精准度提出了更高需求(樊仲欣等2019;
陶云等,2024),气温的精准预报不仅对霜冻、热浪等灾害性天气的防灾减灾起重要的指导作用,在诸多公共服务领域也不可或缺(
刘莹等,2021)。湖南地形呈马蹄状,向北开口的平原与三面环山的地形特点以及复杂的天气系统影响(
周莉和江志红,2017;
周莉等,2019),使精细化温度预报成为湖南区域天气预报的难点之一。
随着数值预报和资料同化技术的发展,数值预报准确率越来越高,在天气预报业务中发挥着越来越重要的作用(
盛春岩等,2020;
夏旻惠和智协飞,2020)。但由于模式自身的系统误差以及特殊地形和下垫面等的影响,对数值预报产品进行订正释用是提高气温预报准确率的重要手段(
李超等,2016;
张成军等,2017;
肖瑶等,2020)。模式气温预报偏差的原因分析一直是学术界和数值模式应用部门热衷探讨的问题(
罗聪等,2012;
王婧等,2015;
朱文达等,2019;
齐铎等,2020),并围绕数值预报产品释用技术开展了大量研究,包括模式输出统计法(model output statistics,MOS)、BP神经网络(back propagation neural network)、卡尔曼滤波、递减平均法等多种技术已取得显著进展并得到较好应用(
李佰平和智协飞,2012;
白永清等,2013;
马旭林等,2015;
吴启树等,2016;
陈迪等,2019;
王秀娟等,2019)。但随着观测数据和模式产品种类的增多,基于统计方法的传统温度客观预报技术对海量数据利用有限,造成数据资源极大浪费。
随着计算机技术和应用数学的发展,机器学习在气象领域得到迅速应用,并逐渐在众多任务中取得超越传统方法的效果(
韩丰等,2019;
门晓磊等,2019;
刘娜等,2023),尤其是以人工神经网络(artificial neural network,ANN)、长短期记忆网络(long short-term memory,LSTM)、卷积神经网络(convolutional neural network,CNN)等为代表的深度学习方法,随着样本量越来越丰富,模型对数据特征的挖掘更深入,预报的精度和准确度具有较大的提升空间(
Misra et al.,2018;
Ham et al.,2019)。
Shi et al.(2015)提出了将 LSTM 与 CNN 相结合进行预报的方法,取得了很好的预报效果。
陈昱文等(2020)对人工神经网络(artificial neural network,ANN)模型、长短时记忆-全连接(long short term memory-fully connected network,LSTM-FCN)模型进行集成,得到ANN-LSTM-stacking(ALS)集成学习模型,提升了站点气温预报整体准确率。
以上技术各具特点,但仍然存在一定的局限性。气温等要素预报在时序上具有明显的连续性特征,LSTM类模型在训练时,每个时间节点的数据信息只能根据训练结果被保留一部分,容易丢失某些重要特征(
LeCun et al.,2015;
Schmidhuber,2015)。卷积类模型则受到网络的深度限制,尽管理论上网络深度的增加可以提取更加复杂的特征,从而取得更好的预报效果,但在实际试验中网络深度增加到一定程度时,准确度不再增加甚至出现下降现象,即“网络退化”(
周祥全和张津,2017)。
He et al.(2016) 提出了残差网络(residual networks,ResNets),较以往卷积类神经网络,实现在加深网络层数的同时,增加各层之间的信息流动,解决了“网络退化”问题,提升模型泛化能力,此外残差结构的跳层连接,加强了特征传播和特征重用,缓解了层间迭代时的“梯度消失”问题,使神经网络模型开始向深度发展。
湖南地形呈现南高北低的特点,东、西、南三面环山,北面为洞庭湖平原,这种地形对湖南省的气温分布、变化及预报具有多个方面的影响。受海拔、植被覆盖、冷空气堆积效应以及湖泊调节作用的影响,导致湖南气温的时空分布具有显著的区域性和复杂性(
彭晶晶等,2019),这种复杂性对气温的精准预报提出了更高要求。目前,深度学习在数值模式产品释用方面应用广泛,其中,由计算机图形识别发展而来的ResNets架构在降水预测和强对流识别方面取得了较好的效果(
Song et al.,2019;
兰明才等,2021),能有效捕捉数据的空间关联特征,特别是在复杂地形区域,ResNets具备非线性特征的高效提取能力。然而,尽管 ResNets 在气象预测中取得了一定进展,其在气温预报领域的应用仍然较为稀少。此外,深度学习在气象领域的应用思路仍然局限于仅依赖数值模式要素预报产品本身与观测资料来实现该要素的预报,与物理量预报产品的融合应用研究甚少。本文应用ECMWF-IFS模式地面和高空要素产品以及实况资料,创新性改进了ResNets,设计了Res-STS(residual spatio-temporal stacking)气温预报订正模型,利用时空特征堆叠技术尽可能保留大尺度环境背景场和时序特征对单点气温的影响,为深度学习在气温预报领域的应用和数值预报后处理技术的发展提供了新思路。
1 数据与方法
1.1 数据
本文使用的资料包括:1)气温格点实况资料,来源于中国气象局陆面数据同化系统(China Meteorological Administration Land Data Assimilation System,CLDAS)实时产品数据集,空间分辨率为0.05°×0.05°,时间分辨率为 1 h。2)欧洲中期天气预报中心-综合预报系统(European Centre for Medium-Range Weather Forecasts-Integrated Forecast System,ECMWF-IFS)模式地面(EC-SFC)和高空(EC-LEV)全要素产品,时间分辨率为3 h,地面层分辨率为 0.125°×0.125°,高空层分辨率为 0.25°×0.25°,起报时间为08时、20时(北京时,下同)。模式预报与格点实况数据选取时段为2017年1月—2023年12月,建模数据范围为103.75°~119.5°E、19.5°~35.25°N。
利用地面气象自动站对CLDAS气温数据的评估表明,CLDAS气温可以较好反映气象站气温的实况(
刘莹等,2021),此外参照中国气象局预报司2023年《第三届全国智能预报技术方法交流大赛检验方案》,格点实况采用国家信息中心CLDAS分析资料。
ECMWF-IFS模式预报产品为规则的网格化数据,由于地面和高空数据分辨率不一致,本文采用反距离权重法将高空要素插值至0.125°×0.125°分辨率以实现与地面要素的统一。
为充分挖掘不同特征数据对气温预报的影响,同时避免信息冗余和噪声干扰,需要对ECMWF-IFS模式物理量进行筛选。本文一方面根据热力学方程挑选出影响气温局地变化的物理量,另一方面基于专家预报员经验,筛选出在业务预报实践中对湖南本地气温影响较大的物理量,最终形成显著因子集合(表1)。
表1选取的因子场
Table1Selected factor fields
1.2 Res-STS模型
Res-STS模型是基于ResNets架构的一种创新性改进模型,专门设计用于复杂地形区域的气温预报订正问题。ResNets和Res-STS模型的核心架构均基于卷积层设计,为避免因网络加深而导致的梯度消失或梯度爆炸问题,提高模型的稳定性和收敛速度,在卷积部分引入残差连接,通过跳跃连接(skip connection),将浅层输出直接传递到深层网络,在加深网络的同时保留了浅层特征的表征能力。
由于气温是具有时间序列变化的要素,在时间的尺度上,ResNets需要叠加时序网络模型(如LSTM、RNN等)将不同的时序数据进行串联。相比于传统的ResNets,Res-STS模型针对气象数据的时空特征和复杂性进行了优化,引入时空堆叠技术,以增强对气温变化的捕捉能力。从空间尺度上,考虑到大尺度环境背景场特征对单点气温的影响,将EC-LEV和EC-SFC数据堆叠在一起,采用“面-点”的结构方式(即通过单个预报格点周围250 km×250 km的矩形区域数据预报该格点气温)进行建模,跳出传统的“点对点”建模的局限,同时也规避“面对面”建模时的样本不足问题。对于矩形区域的范围选择非常重要,范围过大会造成计算成本增大,范围过小,会造成更大尺度系统特征难以捕捉。过大量试验,设置了一个以单个网格点为中心点,距离中心点250 km的正方形区域,约为中β天气系统范围,在计算资源得到保证的前提下,最大程度保留更多更大的天气系统背景场特征对单点气温的影响。从时间尺度来看,气温具备一定的周期性、趋势性和波动性规律,为最大程度保留时序特征,将连续多个时间节点的数据进行堆叠,具体操作如下:ECMWF-IFS数据的时间分辨率为3 h,设起报时刻为T0,3 h预报时刻为T1,以此类推,24 h预报时刻为T8,利用连续的两个时刻的EC-SFC和EC-LEV数据预报包括后一时刻在内的3 h逐小时气温,如利用T0和T1的EC-SFC和EC-LEV数据预报1~3 h逐小时气温,利用T1和T2的EC-SFC和EC-LEV数据预报4~6 h逐小时气温,以此类推,得到1~24 h逐小时气温预报(图1)。
Res-STS模型包含两个模块(图1和表2)。第一个模块为ECMWF-IFS特征融合模块(EC feature fusion,ECFF),按照输入序列的时间顺序,将EC-LEV和EC-SFC堆叠在一起,对数据块进行卷积得到若干特征层。ECFF网络结构设置了3个卷积残差块,每个残差块由2个Conv2D卷积层构成,卷积核大小均为3×3,每个残差块之间设置一个最大池化层maxPool2D,减少计算量的同时对特征进行压缩,加强局部特征的提取能力。第二个模块是降尺度模块(downscaling module,DM),经过反卷积运算将分辨率从0.125°×0.125°降为0.5°×0.5°,得到最终的逐小时气温预报格点场。DM模块设置了两个反卷积层实现上采样,卷积核大小为2×2,卷积步长为2。每个反卷积层后面都设置1个BatchNorm层,用来对数据进行归一化处理。第二个反卷积结束后设置3层conv2d卷积层控制输出维度与尺寸,其中前两个卷积层后也加入一个BatchNorm层。激活函数选择ReLU。
2 结果分析
本文基于两个起报时次的ECMWF-IFS模式逐3 h气温预报产品利用Res-STS模型得到逐1 h气温和日最高、低气温预报产品(逐1 h气温中取温度最高、低的时刻气温为日最高、低气温)。由于ECMWF-IFS模式预报产品数据在到达预报平台时大概滞后7 h,为满足预报员业务应用需求,利用ECMWF-IFS模式滞后12 h的预报产品进行订正释用,模型预报时间为ECMWF-IFS模式起报时间往后的13~36 h预报(为方便对结果进行分析,下文以1~24 h代称)。以2017年1月—2022年12月数据作为数据集,其中随机筛选80%的数据作为训练集用于模型训练,剩余20%的数据作为验证集,用于模型的超参数调整和实时评估; 2023年数据作为测试集,用于检验模型性能(使用湖南省境内共7 750个格点进行检验)。
图1Res-STS模型结构
Fig.1Architecture of the Res-STS model
表2ECFF和降尺度模块网络结构参数
Table2Network structure parameters of the ECFF and downscaling modules
本文选取平均绝对误差(mean absolute error,MAE)、平均误差(mean error,ME)和2℃准确率(A)来评估模式和模型的预报性能。MAE能够提供预报误差的大小信息,但它不考虑误差的方向(即高估或低估); ME是通过计算预报值与观测值之间差异的平均数来衡量预报准确度的指标,它反映了预报误差的平均趋势,正值表示预报系统性高估,而负值则表示系统性低估; 2℃准确率是一个指示预报值与观测值在±2℃范围内一致性的指标,直接反映了预报的可靠性,即预报值落在实际观测值±2℃范围内的频率(常见的气温预报业务的评估指标)。公式如下:
其中:TMAE为气温平均绝对误差; TME为气温平均误差; Fi为第i格点预报温度; Oi为第i格点实况温度; N为参评格点数; Y为预报与实况的误差绝对值小于等于2℃的格点数。
2.1 整体表现
表3对ECMWF-IFS、国家气象中心指导预报、Res-STS以及人工订正4种不同预报结果的整体性能进行了比较,其中“人工订正”由智能网格预报平台调出,为预报员基于任意预报数据源订正的结果。ME反映了产品的系统性误差,结果显示在逐时气温预报中,国家气象中心指导预报的ME最小(0.01℃)。在最高气温预报上,除了Res-STS偏高0.25℃外,其他产品均偏低,国家气象中心指导预报的平均误差为-0.23℃,幅度略小于ECMWF-IFS的-0.81℃,人工订正产品ME幅度最小(-0.03℃)。最低气温预报中,所有产品的ME都是偏高,其中国家气象中心指导预报的平均误差幅度最小(0.07℃)。不同预报产品在不同统计量上表现各异,一般遵循高温预报偏低(Res-STS除外)、低温预报偏高的特征。Res-STS模型MAE(TMAE)分别以1.21、1.38、1.07℃的逐时、最高、最低气温最小误差优于其他方法,国家气象中心指导预报误差略高于Res-STS模型。从2℃准确率不难看出,在逐时气温预报中,Res-STS以81.87%的2℃准确率领先,而人工订正的准确率为67.71%,其次是国家气象中心指导预报。在最高气温预报中,Res-STS的准确率高达76.39%,远超其他方法。最低气温预报的准确率中,Res-STS以86.01%的成绩位居第一。
从整体上看,Res-STS在逐时预报以及最高、最低气温预报中的整体准确性最高,其次是中央台指导预报。人工订正在选择数据源时,会综合考虑当前所在季节、天气形势的变化,选择不同的来源,从气温预报整体误差分析,Res-STS模型已经全面优于人工订正预报。
表32023年2 m气温预报整体表现
Table3Overall performance of 2 m temperature forecasts in 2023
2.2 预报误差随时间的变化
图2对比分析了ECMWF-IFS、国家气象中心指导预报、Res-STS及人工订正4种预报结果在不同月份的平均绝对误差,特别关注Res-STS模型的表现。
逐小时误差曲线显示,08时和20时起报的Res-STS产品在大多数月份的MAE相对较低,不同起报时间的误差范围差异不大,展现出良好的稳定性。特别是在7—10月,Res-STS的MAE只有1℃左右,显著低于其他预报产品,尤其在9月,其达到了全年最低误差水平,显示出该模型在夏、秋季的优势。在1月、6月和12月,Res-STS的MAE误差表现相对较高,其中20时起报的产品在6月略高于国家气象中心指导预报,说明在冬季,以及春夏之交,该模型的预报能力受到了一定限制,这与气象条件的复杂性以及模型参数的适应性有关。与之相比,ECMWF-IFS的MAE在所有月份中均高于Res-STS,尤其在1月和3月,MAE值显著高于其他时间,显示出全球预报模式其在这些特定月份的预报准确性不足。国家气象中心指导预报的误差趋势,1—6月与数值模式(ECMWF-IFS)相似,其MAE在3月达到全年的最高,尤其是20时起报的误差明显高于其他月份; 而在7月开始的下半年,其误差变化又更接近客观模型(Res-STS)。
不同预报产品在预测日最高气温时的MAE在各月份中存在明显的差异。在所有月份中,ECMWF-IFS的MAE整体较高,在4月、8月,误差达到了2次高峰,尤其是8月MAE在2.5℃左右; 国家气象中心指导预报的MAE在不同起报时间区别较大,08时起报的产品但在4月、10月误差较大,其中4月达到2.2℃,20时起报的产品分别在1、10月MAE达到峰值,整体来看7月和8月表现较好,MAE低于1.5℃; Res-STS模型在所有月份表现出最低的MAE,尤其在7月、8月,MAE仅为1℃左右,远低于其他预报产品,Res-STS在冬季(1月、12月)的MAE略有上升,高于其他月份,但其不同起报时间的MAE按月变化折线接近,显示出良好的稳定性和精度。
图22023年08时(a1、b1、c1)和20时(a2、b2、c2)起报的气温MAE在不同月份的变化(单位:℃):(a)逐时气温;(b)最高气温;(c)最低气温
Fig.2Monthly variation in the MAE of temperature forecasts in 2023, initialized at (a1, b1, c1) 08:00 BST and (a2, b2, c2) 20:00 BST (units:℃): (a) hourly temperature; (b) daily maximum temperature; (c) daily minimum temperature
从各个产品日最低气温预报的MAE按月变化曲线中可以发现,MAE大体呈现出冬半年较大、夏半年较小的趋势。ECMWF-IFS总体表现误差较大,不同起报时间的产品差异较大,1月、3月、11月和12月,08时起报的MAE均超过了2℃,说明冬季和早春时节该模式的预报准确性不佳,可能与季节性温度波动较大有关,20时起报的MAE略低于08时; 国家气象中心指导预报表现较为稳定,MAE在大多数月份中均低于1.5℃,特别是在夏季月份(如8月),冬季(1月、11月和12月)误差略有上升,其中08时起报的产品MAE超过了2℃; Res-STS在的整体表现较为突出,大部分月份在对比产品中的MAE最低,尤其在夏季和秋季(如5—9月)MAE低于1℃,表明模型在处理较为稳定的气温变化时具有优势,然而08时起报的产品1月的MAE比国家气象中心指导预报高0.4℃。Res-STS的MAE变化曲线与ECMWF-IFS存在一定相关性,受模式产品误差影响,其1月MAE较高。
图3分别展示了春(3—5月)、夏(6—8月)、秋(9—11月)、冬(1月、2月及次年12月)四季各类预报产品逐时气温的MAE(平均绝对误差)日变化特征。从整体上看,四个季节中各预报产品的误差在每日午后至傍晚(15—17时)最大,可能与午后气温快速上升、天气系统复杂性增加有关。每个季节,Res-STS的MAE在大多数时间低于国家气象中心指导预报,且其日变化较为平缓。日出前后,所有预报产品的MAE较小,可能是由于夜间天气系统相对稳定,模型能够提供更为准确的预测。
图32023年四季逐时气温预报MAE的日变化(单位:℃):(a)春季;(b)夏季;(c)秋季;(d)冬季
Fig.3Diurnal variation in the MAE of hourly temperature forecasts across the four seasons in 2023 (units:℃): (a) spring; (b) summer; (c) autumn; (d) winter
从季节差异来看,春季、秋季和冬季国家气象中心指导预报的MAE日变化呈现双峰趋势,通常在日出前缓慢上升,日出后下降,随后随气温上升而增大,在午后时段达到最大值。而夏季则未明显出现日出前的峰值。春季、夏季午后是强对流天气的高发时段,对气温预报造成较大影响。国家气象中心指导预报在春季午后时段的MAE超过2.3℃,为全年最大值,而此时段Res-STS的MAE仅为1.6℃,表现出明显的优势,但夏季午后到傍晚Res-STS的表现也存在一定波动,相对中央台的优势较小。
2.3 预报误差的空间分布
湖南省位于中国中南部,地形以山地、丘陵为主,兼有平原和盆地。北部洞庭湖平原地势低平,是重要的农业区; 中部和南部丘陵起伏,湘江流域多盆地和谷地; 西部和南部山区高峻,以雪峰山、武陵山等山脉为主,地势由东向西逐渐升高(图4)。图5对各个预报产品在湖南省范围内的误差空间分布进行了分析。在逐小时预报的误差分布上,ECMWF-IFS在大部分高海拔地区达到1.5℃; 国家气象中心指导预报表现较好,只在部分高海拔地区达到1.5℃,其他大部分地区低于1.5℃; Res-STS模型在MAE指标上的表现优于国家气象中心的指导预报,仅少数高海拔网格点的MAE 超过 1.5℃,而中部平原地区部分网格的MAE甚至低于1℃。日最高气温误差分布上,各个产品的差别较明显。ECMWF-IFS在大部分地区MAE达到1.5℃以上,高海拔地区超过了2℃; 国家气象中心指导预报除了北部的平原外,大部分地区MAE超过1.5℃,部分高海拔地区超过2℃; Res-STS模型大部分地区MAE在1~1.5℃,少部分高海拔地区超过了1.5℃。日最低气温误差分布上,国家气象中心指导预报大部分地区MAE在1~1.5℃,湖南省北部、中东部部分地区MAE低于1℃,部分山区高于1.5℃; Res-STS模型MAE在湖南中部部分地区低于1℃,少数地区高于1.5℃,整体表现略好于国家气象中心指导预报。
Fig.4Elevation map of Hunan Province (outlined in black; units:m; cited from Hu et al. (2024) )
图52023年ECMWF-IFS(a1—c1)、国家气象中心指导预报(a2—c2)、Res-STS模型(a3—c3)、人工订正(a4—c4)预报的气温MAE空间分布(单位:℃):(a)逐时气温;(b)最高气温;(c)最低气温
Fig.5Spatial distribution of MAE in temperature forecasts for 2023 (units:℃) , shown for (a1—c1) ECMWF-IFS, (a2—c2) National Meteorological Center Guidance, (a3—c3) Res-STS model, and (a4—c4) manual correction: (a) hourly temperature; (b) daily maximum temperature; (c) daily minimum temperature
整体上看,数值模式ECMWF-IFS受其预报分辨率的限制,在湖南省各个地区的预报MAE都最大,Res-STS在绝大部分地区误差最小。数值模式的MAE大小分布与湖南省的地形相关密切,湖南省北部的洞庭湖平原MAE最低,在湖南省西部的武陵山脉、雪峰山脉,南部的南岭,东部的罗霄山脉等高海拔地区MAE较高。
本研究对湖南全省网格点的观测气温进行处理后,得到每个网格点全年的观测最高、最低气温平均值(图略),可以明显看出湖南省省内所有网格点的观测最高、最低气温值随海拔高度增加呈下降趋势,符合地理学中气温随海拔升高而降低的一般规律。
图6为省内所有格点的气温预报平均误差随海拔高度的分布。颜色越深,表示该区域内的数据点越密集。从图中可以发现,不同预报方法在不同海拔高度上的预报误差分布密度存在差异。部分高海拔地区误差有所增加,表明预报误差的不确定性有所增大。
图62023年ECMWF-IFS(a1—c1)、国家气象中心指导预报(a2—c2)、Res-STS(a3—c3)预报的气温MAE随海拔高度的变化(单位:℃):(a)逐时气温;(b)最高气温;(c)最低气温
Fig.6Variation in temperature MAE with elevation in 2023 for (a1—c1) ECMWF-IFS, (a2—c2) National Meteorological Center Guidance, and (a3—c3) Res-STS model (units:℃) : (a) hourly temperature; (b) daily maximum temperature; (c) daily minimum temperature
逐小时误差分布的散点密度图(图6a)显示,ECMWF-IFS的平均MAE分布范围较大,100 m以下区域主要分布于1~2℃,随海拔高度的增加,散点分布范围明显加大,特别是1 000 m以上地区MAE区间上探至3℃以上。国家气象中心指导预报和Res-STS的MAE密度分布接近,扩散程度明显小于ECMWF-IFS,大部分网格点平均MAE分布在1~2℃,较为集中,Res-STS在200 m以下地区MAE分布“质心”更接近1℃,误差更小。最高气温误差分布(图6b)规律与逐小时误差接近,可以看出ECMWF-IFS在高海拔地区MAE不确定性增大,整体呈三角形。国家气象中心指导预报大部分网格点MAE分布在1.1~2℃,分布较均匀。Res-STS整体表现较好,平均误差分布最低,但也能看到有个别网格点的高温MAE达到3℃左右,可能是模型带来的系统误差。最低气温误差分布(图6c)上,ECMWF-IFS分布轮廓接近扇形,分布较广。国家气象中心指导预报与Res-STS产品表现较好,特别在海拔200 m以下地区,国家气象中心指导预报MAE更接近1℃(更加集中),而Res-STS则分布较为均匀。最低气温MAE二者差异较小,印证了上文提到的MAE整体平均值以及空间分布的比较接近的结论。
为对比不同预报方法在高海拔地区的预报误差,本研究挑选出海拔1 000 m以上格点MAE,分别按照逐时、最高、最低气温进行了分析(图7)。从逐时预报MAE分析,ECMWF-IFS的中位数(箱体内的横线)位于2℃左右,大多数预报误差集中在1~3℃,箱线图箱体上下边界表示第1个与第3个四分位数,上下边界以外为异常值,ECMWF-IFS的误差分布范围较宽,大致从1℃延伸至超过4℃,表明其在高海拔地区的预报误差波动较大,有少数网格点预报误差较大,超过了4℃; 国家气象中心指导预报的中位数为1.5℃,预报误差主要分布在1~2℃,离群点较少,预报误差较为稳定; Res-STS中位数最低,误差分布最集中,存在少部分离群点。从最高温预报MAE分析,ECMWF-IFS的误差主要分布在1~3℃,中位数较高,在部分地区误差较大; 国家气象中心指导预报和Res-STS的误差中位数较低,表现出更高的精度和稳定性,其中Res-STS的误差范围最小,有少部分离群点,说明其在较高海拔区域的最高气温预报表现出色。人工订正各个地区误差略小于ECMWF-IFS。从最低气温预报MAE分析,ECMWF-IFS的平均误差及分布范围比逐时、最高气温更大,说明其在高海拔地区低温预报有一些缺陷; Res-STS和国家气象中心指导预报表现则更为出色,尤其是Res-STS,误差中位数和范围最小,具有极高的稳定性和准确性。
2.4 天气过程评估
本研究选取了2次天气过程,分别检验Res-STS模型在寒潮和高温天气过程中的预报性能。2023年1月13日20时开始,受强冷空气及中低层切变共同影响,湖南省内有一次寒潮大风、低温雨雪冰冻过程,湘中地区将会有明显的降温,本文对13日20时起报的未来24 h最低气温、逐小时气温预报进行检验。多个预报源都把握住了此次降温过程,从24 h最低气温ME(图8,蓝色为预报偏低,橙色为预报偏高)上可以看到,ECMWF-IFS、国家气象中心指导预报ME分布相似,西部、南部预报偏低,东部、北部预报偏高,整体偏低; Res-STS和人工订正ME分布相似,西部、北部偏高,其他地区偏低,整体偏高。定量分析(表4)上看,MAE上各个产品都接近1℃,其中Res-STS最小(1.04℃),2℃准确率Res-STS最高(85.81%)。从图形上看,人工订正应是在Res-STS基础上进行了修改。此外,在全省逐1 h预报方面,Res-STS获得了最高的2℃准确率(86.49%),以中部地区长沙站网格点的预报与观测对比(图略)来看,Res-STS的预报也较为成功,大部分时间比国家气象中心指导预报、人工订正更接近实况曲线。
图72023年海拔1 000 m以上网格点气温预报MAE的箱线图:(a)逐时气温;(b)最高气温;(c)最低气温
Fig.7Box plots of MAE in temperature forecasts at grid points above1 000 m elevation in 2023: (a) hourly temperature; (b) daily maximum temperature; (c) daily minimum temperature
表42023年1月13日寒潮天气过程最低气温检验
Table4Verification of minimum temperature forecasts for the cold wave event on January 13, 2023
7 月12日晚至13日省内大部分地区受副高控制,仍维持晴热高温天气,部分地区将达36~38℃,其中湘西北受副高边缘低层弱辐合影响,多阵雨或雷阵雨天气。由ME分布(图9)和定量评估结果(表5)可见,ECMWF-IFS预报大部分地区明显偏低,平均误差ME达-1.94℃,2℃准确率只有55.6%; 国家气象中心指导预报在西北部、南部山区偏低,其他地区略微偏高,ME为-0.95℃,大部分地区在±2℃以内,准确率为82.12%; Res-STS在湘西北预报略微偏低,其他大部分地区各项误差较小,2℃准确率高达97.88%,远高于其他产品。此外,在全省逐1 h预报上(图略),Res-STS获得了最高的2℃准确率(98.38%)以及最低的MAE(0.60℃),其中长沙站网格点的预报与观测对比(图略)来看,Res-STS的预报大部分时间比国家气象中心指导预报、人工订正更接近实况曲线。
无论从寒潮还是高温天气预报评估结果上看,Res-STS都是表现最优的产品,预报业务实践中,可以作为最优的预报产品提供给预报员作为参考。
3 结论与讨论
本文应用历史CLDAS格点实况资料与ECMWF-IFS模式最优因子集,建立了基于Res-STS网络的气温预报订正模型,得到了逐1 h和日最高、低气温预报,并与ECMWF-IFS模式、国家气象中心指导预报、人工订正结果进行对比分析以评估模型订正效果,得到以下主要结论:
1)Res-STS模型是在ResNets基础上改进的深度学习模型,通过引入残差结构解决过拟合和梯度消失问题,同时采用时空堆叠技术保留时序特征,无需LSTM等时序模型。该模型包含EC特征融合模块(ECFF)和降尺度模块(DM),前者通过卷积残差块提取特征,后者通过反卷积层实现分辨率降低,最终输出逐小时气温预报。Res-STS模型采用“面-点”的结构方式进行建模,在保留环境背景场特征和时序特征方面具有优势,适用于气温预报。
图82023年1月13日寒潮天气过程最低气温ME分布(单位:℃):(a)ECMWF-IFS;(b)国家气象中心指导预报;(c)Res-STS模型;(d)人工订正
Fig.8Spatial distribution of minimum temperature ME (units:℃) during the cold wave event on January 13, 2023: (a) ECMWF-IFS; (b) National Meteorological Center Guidance; (c) Res-STS model; (d) manual correction
图92023年7月12日高温天气过程最高气温ME分布(单位:℃):(a)ECMWF-IFS;(b)国家气象中心指导预报;(c)Res-STS模型;(d)人工订正
Fig.9Spatial distribution of maximum temperature ME (units:℃) during the high-temperature event on July 12, 2023: (a) ECMWF-IFS; (b) National Meteorological Center Guidance; (c) Res-STS model; (d) manual correction
表52023年7月12日高温天气过程最高气温检验
Table5Verification of maximum temperature forecasts for the high-temperature event on July 12, 2023
2)湖南省逐小时气温预报产品的误差表现上,ECMWF-IFS在高海拔地区误差较大,国家气象中心指导预报在大部分地区误差低于1.5℃,而Res-STS模型平均MAE为1.21℃,在中部地区误差甚至低于1℃; 日最高气温误差分布中,Res-STS模型平均MAE为1.38℃,在所有产品中表现最佳,大部分地区MAE在1~1.5℃,相较于国家气象中心指导预报降低了23.8%; 日最低气温方面,Res-STS模型平均MAE为1.07℃,整体表现略优于国家气象中心指导预报。在不同月份,Res-STS模型在高温、低温、逐1 h气温预报都有一定优势,在不同季节的逐1 h气温预报误差日变化上,该模型误差更小。
3)对比在高海拔地区的误差表现,ECMWF-IFS误差分布广。逐时预报中,而国家气象中心指导预报和Res-STS误差较低,Res-STS中位数最低,误差最集中; 最高温预报方面,国家气象中心指导预报和Res-STS精度高,Res-STS误差范围最小; 最低气温预报中,Res-STS和国家气象中心指导预报表现更好,尤其是Res-STS,误差中位数和范围最小,显示出高稳定性和准确性。
4)对Res-STS模型在寒潮和高温天气过程中的预报性能进行的检验可以看出,在寒潮天气过程中,Res-STS模型在最低气温预报中整体偏高,但与其他预报产品相比,其MAE表现最优,2℃准确率达到85.81%; 在高温天气过程中,Res-STS模型的预报误差最小,2℃准确率高达97.88%,远高于其他客观产品; 从不同天气个例长沙地区的逐1 h气温对比上看,Res-STS预报更接近实况。
以上表明Res-STS模型改善了数值模式对气温的预报能力,尤其是提升了在海拔较高的山区气温的预报效果。但仍有一些问题值得讨论。
尽管Res-STS模型通过引入时空堆叠技术和残差结构来保留时序特征,但在处理复杂地形和特定区域的局部气候特征时,模型依赖的训练数据集的局限性可能导致误差增大。例如,如果训练集中的高海拔地区数据较少或不足,模型可能无法充分学习到该区域特有的气温变化规律,从而导致误差增大; 实况数据集CLDAS分辨率为0.05°×0.05°,可能对某些地形进行了平滑,模型对这些地形的预报也会受平滑后的实况影响。Res-STS模型虽然通过降尺度模块(DM)降低了分辨率以适应局地特征,但过度的降尺度可能导致细节丢失,尤其在高海拔地区,地形影响和局地小尺度天气系统可能未被充分捕捉,导致误差增大。 “面-点”的建模结构虽然可以保留时序特征和环境背景场特征,但在高海拔地区,气温受地形、气压等因素的影响较大,传统的数值预报背景场可能无法很好地适应这些局地气候特征,导致误差增大。
由于在建模过程中将ECMWF-IFS模式逐3 h的2 m气温作为了关键因子,使得Res-STS对于数值模式本身的气温预报有较强的敏感性。当模式预报能力较差时,尽管Res-STS的预报效果在模式基础上有提升,但提升幅度有限,不能完全满足实际业务需求。如何减弱模型对于模式的依赖性是后期有待解决的关键问题。
受算力限制,Res-STS在湖南以外地区的适用性暂未进行试验,此外,模型在极端天气(特别是强降温)过程中,并非每次都是表现最优,针对极端气温的特征提取还可以进行优化。