en
×

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。
通讯作者:

徐邦琪,E-mail:pangchi@nuist.edu.cn

引用:雷蕾,徐邦琪,高庆九,等,2022.基于卷积神经网络的长江流域夏季日最高温度延伸期预报方法研究[J].大气科学学报,45(6):835-849.

Quote:Lei L,Hsu P C,Gao Q J,et al.,2022.Extended-range forecasting method of summer daily maximum temperature in the Yangtze River Basin based on convolutional neural network[J].Trans Atmos Sci,45(6):835-849.

目录contents

    摘要

    长江流域是我国夏季高温热浪灾害的多发区之一,该地区日最高温度(T max)具有显著的低频(10~30 d和30~60 d周期)变化特征,超前-滞后相关分析和气温方程诊断的结果显示,影响长江流域T max低频变化的大尺度环流/对流信号包含:自欧亚大陆东移南下的低频波列,自东北亚向西南方向传播的异常环流,以及由西太平洋向东亚传播的低频对流;这些低频对流/环流活动通过改变辐射加热过程及绝热过程,导致长江流域T max的低频变化。为了客观且有效地辨识和捕捉这些先兆信号,并考虑长江流域T max与大尺度因子间的非线性作用,本文采用机器学习方法中的卷积神经网络(Convolutional Neural Network,CNN)对大量历史数据进行训练,并构建了长江流域T max的延伸期预报模型。在独立预报阶段,CNN预报模型对长江流域区域平均T max的预报时效达30 d,提前5~30 d预报的T max与观测T max的时间相关系数介于0.63~0.70(通过99%置信度的显著性检验),量级偏差(均方根误差)小于1个标准差,显示出CNN在延伸期灾害天气预报的应用潜力。

    Abstract

    The Yangtze River Basin(YRB) is one of the areas with a high frequency of heatwave occurrences in China.The daily maximum temperature (T max) in this area shows significant low-frequency oscillation signals for (10—30 d and 30—60 d) time periods.Based on the results of the lead-lag correlation analysis between the YRB T max and the 10—30 d/30—60 d convection and circulation anomalies,we identify the main low-frequency signals affecting the YRB T max.There are three types of signals that travel in different directions:1) the eastward and southward signals from the Eurasian continent;2) circulation anomalies propagating southwestward from Northeast Asia;and 3) low-frequency convective signals propagating from the western Pacific toward East Asia.The temperature diagnostic equation results show that when the low-frequency convection/circulation anomalies approach the YRB,both the diabatic (clear-sky radiative heating) and adiabatic (associated with sinking motion) heating processes lead to variations in the YRB temperature.To identify these precursory signals objectively and efficiently,as well as consider the nonlinear interaction between YRB T max and the large-scale predictors,we use Convolutional Neural Network (CNN),a type of deep neural network,to train the historical data,and then develop an extended-range forecast model for YRB T max.The independent forecast results show that the CNN-based forecast model is capable of predicting the YRB T max at a 30-day lead time,with the temporal correlation coefficient between the forecast and observed T max of 0.63—0.70 (exceeding the 99% confidence level).The current results suggest the potential of CNN in the application of extended-range forecasting as the magnitude of error (root-mean-square error) is less than one standard deviation.

  • 全球变暖的背景下,高温热浪加剧且频繁发生(Perkins-Kirkpatrick and Lewis,2020),严重影响经济生产、生态环境和人体健康(Horton et al.,2016)。在2016—2019年夏季,我国饱受持续性高温天气的影响,中暑患者增多; 区域用电负荷增大,城乡供水出现困难,蔬果作物生长和公共建设等均受到影响,导致人民生命财产和生产生活的严重损失(中国气象局,2017,2018,2019,2020)。

  • 灾害天气的有效预测和及时预警是防灾减灾的关键,但如何延长预报时效和提高预报准确率是当今业务面临的重大挑战。相比于短期天气预报,10~30 d延伸期预报提供了更充裕的决策时间窗口,有利于政府部门防灾减灾工作的开展。然而,相较于发展成熟的天气预报和气候预测,延伸期业务预报起步较晚,数值模式所提供的有效预报时长十分有限(章大全等,2019),难以满足极端事件频发背景下对更长时效预报的迫切需求。目前数值模式对热带季节内振荡模态具有较高的预报技巧(任宏利等,2015; Jie et al.,2017),但对于热带外的降水和气温的延伸期预报,多数模式仅能提供1~3周的有效预报。ECMWF和CMA等11家模式的降水回报试验结果显示(de Andrade et al.,2018),高预报技巧仅限于1周内,2~4周的预报技巧骤降。S2S模式对我国冬季气温的预报技巧可达3~4候(Zhou et al.,2019),而对夏季降水和气温的预报技巧为2~4候(李成程,2018)。Liang and Lin(2018)评估加拿大环境和气候变化部门的月预报系统发现,该系统对中国东部部分地区的气温预报时效高达4周,但仅能提前5~11 d有效预报降水。除了动力模式预报外,学者们考虑了大气低频振荡对天气系统的调控作用,基于统计方法研发了不同的延伸期统计预报模型,部分模型显示出良好的预测效果和应用前景(杨秋明,2018,2021; 徐邦琪等,2020),有效地延长了降水和气温的延伸期预报时效。

  • 近年来,由于气象观测和模式数据的大量增加,以及计算机效能的大幅提升,机器学习方法在气象研究和预报上的应用受到大量关注。机器学习方法众多,其中卷积神经网络(Convolutional Neural Network,CNN)因为具有强大的图像识别和非线性模拟能力,在气象预报领域受到广泛的应用。在短临预报方面,Shi et al.(2015)提出以CNN和长短时记忆网络(Long Short-Term Memory,LSTM)相结合的ConvLSTM方法,识别雷达回波图的时空演变特征,并进一步预报降水,预报效果超过了传统的光流法。在季节预报方面,Ham et al.(2019)和贺圣平等(2021)分别将CNN应用到ENSO和东亚冬季气温的预报中,通过CNN识别前期要素场的时空信号进行建模并预报,回报试验显示其预报效果超过了动力模式。另外,Weyn et al.(2020)采用CNN预报500 hPa位势高度和2 m气温,其2~14 d的中短期预报性能接近ECMWF预报系统; Weyn et al.(2021)又进一步提出基于CNN的次季节集合预报模型,其对未来2~6周的气温预报技巧已十分接近ECMWF集合预报。由此可见,CNN具有应用于天气气候预测的强大潜力,然而目前对CNN应用于10~30 d延伸期预报的研究较少。如何充分发挥其识别图像的优势性能,并在物理的基础上构建基于CNN的延伸期预报模型,是亟待开展的工作

  • 科学家已指出大气季节内振荡是延伸期天气预报的主要可预报性来源(丁一汇和梁萍,2010),季节内振荡的周期变化和空间移动特征可为10~30 d延伸期预报提供前兆信号。但影响东亚天气气候的季节内振荡复杂多变,包括来自赤道地区的30~60 d季节内振荡、西太平洋的准双周振荡以及中高纬的低频信号(Chen et al.,2015; Yang and Li,2016; 陈栋杰,2018; Li et al.,2020; 杨双艳和李天明,2020),导致我国不同地区高温热浪的低频信号来源也不尽相同。Chen et al.(2018)指出华南地区高温热浪的发生和维持分别与热带西太平洋向西北传播的5~25 d和30~60 d振荡有关。Hsu et al.(2017)的研究表明长江流域高温热浪的发生概率受10~30 d的BSISO活动的影响,而2018年夏季东北亚的热浪和西太平洋暖池的MJO对流所激发的30~90 d扰动有关(Hsu et al.,2020)。Gao et al.(2018)发现长江流域大部分热浪事件是中高纬和西太平洋的准双周振荡活动相互作用的结果。高庆九和尤琦(2019)指出江南的极端高温可能和中纬度10~15 d及20~25 d波列的移动有关。有效辨识影响区域灾害天气的关键低频信号,并将其应用在延伸期预报方法中,是提高预报技巧的关键。

  • 长江流域是高温热浪的多发区(Hsu et al.,2017; Gao et al.,2018),本研究聚焦长江流域夏季日最高温度变化机理和延伸期预报方法研究,通过观测数据明确影响长江流域夏季日最高温度的低频信号来源,并基于CNN方法客观辨识信号、建立延伸期统计预报模型,经由一系列预报试验和技巧检验,给出此新方法的预报能力和应用前景。

  • 1 资料和方法

  • 1.1 观测数据

  • 为了研究高温热浪的统计特征和发生机制,我们采用来自美国气候预测中心(Climate Prediction Center,CPC)的全球逐日日最高气温(T max)资料(Pan et al.,2019),空间分辨率为0.5°×0.5°。大尺度对流和环流数据分别来自NOAA逐日OLR资料(Liebmann and Smith,1996)和NCEP/NCAR的逐日再分析数据(Kalnay et al.,1996),变量包含三维风场、高度场、气温场、地表辐射和热通量,空间分辨率为2.5°×2.5°。数据长度为1979—2019年,本研究主要关注夏季(5—9月,MJJAS)。

  • 高温热浪事件通常指持续时间长的极端高温过程,采用百分位阈值和持续时间来定义局地事件强度。极端高温热浪事件的定义为T max超过该格点第95百分位阈值并持续3 d及以上; 而中等强度但持续时间长的热浪事件定义为T max超过该格点第75百分位阈值并持续10 d及以上(Hsu et al.,2017)。

  • 1.2 机器学习和卷积神经网络原理简介

  • 机器学习指计算机从历史数据中学习知识、获取规律,这种学习过程通过特定的程序模块和算法来实现(Alplaydin,2014; Goodfellow et al.,2016)。神经网络是实现机器学习的算法之一,利用多层次的神经网络实现机器学习的方式又称为深度学习(Goodfellow et al.,2016)。CNN是常用于图像特征识别的神经网络模型,由输入层、卷积层、池化层、全连接层和输出层构成。卷积是一种提取数据特征的加权运算,假设采用尺寸为m ×n的卷积核f对气象场gxy)进行卷积,则卷积后的结果hxy= m n gx-my-nfmn(Goodfellow et al.,2016)。卷积运算可看作一个维度小于输入数据的二维权重数组,以固定的步长在输入数据上滑动并截取数据子集,然后与之相乘再求和的过程(贺圣平等,2021)。特征将经过非线性激活函数(如ReLU; Nair and Hinton,2010)映射到非线性空间,再作为池化层的输入。池化是指使用某一位置相邻数据的总体统计特征来代替该位置的特征,即对特征进行降维,运算时将按照一定的池化窗口大小(“池化核”)检索输入数据,以池化核范围内输入特征的最大值(“最大池化”)或平均值(“平均池化”)作为输出。全连接层则负责对卷积、池化运算得到的高级特征进行整合并连接到输出层。数据在输入到全连接层前需要变换为一维数据a,假设全连接层有i个计算节点(“神经元”)并记为y,计算节点执行运算yi=τ wiτaτ+biwb为该计算节点的参数。通过堆叠含有多个神经元的全连接层(隐藏层)并在层间添加非线性激活函数,可以提高CNN的非线性拟合能力。

  • 在机器学习(或称训练)的过程中,卷积核的权重参数和网络各层之间的连接参数将据特定的优化算法自动更新,使得CNN的预测值和真实值的误差(“损失函数”)逼近最小值; 一旦训练结束,CNN的各类参数锁定,可对未接触过的新数据进行预测(LeCun et al.,2015; 贺圣平等,2021)。

  • 1.3 温度诊断方程

  • 为了明确局地气温变化的物理过程,采用三维温度方程和地表能量平衡方程进行诊断。温度方程表明温度的变化来自水平平流过程、绝热和非绝热加热过程:

  • Tt=-VT+ωσ+Q1cp
    (1)
  • 其中:T为气温; t表示时间; V是水平风矢量; 表示水平梯度; ω为垂直速度; σ=-Tθdθdp是静力稳定度; θ是位温; Q 1表示非绝热加热(Yanai et al.,1973),cp是定压比热容。

  • 近地表的Q 1和辐射加热、潜热释放和地表扰动热通量有关,地表向上净通量Fs收支方程可表示为:

  • Fs=SSR+STR+SHF+LHF+G
    (2)
  • 其中:S SRS TR分别表示地表净短波辐射和净长波辐射通量; S HFL HF表示感热和潜热通量; 地表储存的热通量G通常都很小,在我们的研究中不考虑。正值表示净向上的通量。

  • 1.4 统计方法

  • 不同尺度(10~30 d和30~60 d)的低频分量通过Lanczos带通滤波方法(Duchon,1979)得到。

  • 对相关系数进行显著性检验时考虑了低频数据的自相关性,采用有效自由度(Davis,1976; Chen,1982),有效自由度E dof定义如下:

  • Edof=nj=-+ Rxx(j)Ryy(j),Rxx(j)=1n-jt=1n-j xt*xt+j*,Ryy(j)=1n-jt=1n-j yt*yt+j*
    (3)
  • 其中:n为时间序列的长度; RxxRyy分别为变量xy的自相关系数; j为滞后时间; 通常取为n的一半; *表示标准化。

  • 2 夏季长江流域T max的低频特征和物理机制

  • 图1显示了夏季(MJJAS)欧亚大陆地区的T max气候平均值、方差变率和高温热浪发生概率的分布。我国中东部地区夏季温度高(图1a),其中,长江流域地区(Yangtze River Basin,YRB)为温度变率大值区(图1b),显示该地区较易出现极端气温事件。统计结果发现,YRB确实是持续时间长的中等热浪事件(图1c)和极端高温热浪事件(图1d)的高发区,因此,选取该地区(105°~122°E,26°~32°N)作为研究区域。该区域与Hsu et al.(2017)、Gao et al.(2018)、Xie et al.(2020)定义的长江流域高温热浪区域范围基本相符。作为中国人口密集和经济发达的地区,提高YRB地区的T max延伸期预报能力,对于保障人民生命健康、提高政府决策效率以及防灾减灾工作的开展具有重要的意义。

  • 我国夏季持续性高温的发生与大气低频系统活动有关(Hsu et al.,2017; Chen et al.,2018; Gao et al.,2018),进一步确认YRB区域低频T max的主要变率周期(图2),YRB的日最高气温具有显著的10~30 d和30~60 d的低频振荡信号,通过带通滤波将此两频段滤出后,分别计算10~30 d和30~60 d T max标准差与夏季逐日T max标准差的比值,发现10~30 d和30~60 d振荡周期均是YRB夏季T max的主要变化模态,两者(10~30 d和30~60 d变率)在YRB区域T max的解释方差分别为46.84%和26.90%(图3)。

  • 图1 1979—2019年夏季(MJJAS)T max的平均值(a)和标准差(b)分布(单位:℃),以及中等但持续时间长的热浪事件(c; 超过75th阈值持续10 d以上)和极端高温热浪事件(d; 超过95th阈值持续3 d以上)的发生概率(单位:%); 方框表示长江流域地区(105°~122°E,26°~32°N)

  • Fig.1 (a) Mean, (b) standard deviation distribution of summer (MJJAS) T max from 1979—2019 (unit:℃) . (c) and (d) are the probabilities of the modest but long-duration heat wave events (daily T max exceeding the 75th threshold for 10 days or more) and of the extreme high temperature heat waves (daily T max exceeding the95th threshold for more than 3 days) , unit:%.The boxes delineate the area of the Yangtze River Basin (26°—32°N, 105°—122°E)

  • 为了了解YRB地区T max变化的空间型态,分别对10~30 d和30~60 d 的T max距平场进行EOF分析(图4)。图4显示了1979—2019年夏季期间YRB的低频(10~30 d和30~60 d)T max主要模态:两个频段的T max模态分布相似,第一模态呈现出YRB区域一致特征,解释方差可达66%~72%; 第二模态的解释方差约为12%~14%,呈现出西北-东南偶极型分布; 第三模态则呈现东北-西南偶极型分布,解释方差约为6%~7%。10~30 d和30~60 d T max前3个EOF模态的总方差贡献率都超过了85%,均通过了统计检验(North et al.,1982),显著区别于其余模态。

  • 为了有效建模并进行独立预报试验,自此处开始,前25 a的数据(1979—2003年)为分析和诊断的时段,并基于此时段的分析结果及得出的潜在预报因子进行建模,以避免与预报试验(2004—2019年)的数据发生重叠,造成过拟合的误差。为了明确影响YRB T max的关键低频信号,将10~30 d和30~60 d T max前三个模态的时间序列(PCs)分别与低频大尺度对流(10~30 d/30~60 d OLR)和中、高层高度场(10~30 d/30~60 d H500及H200)进行超前-滞后相关分析。由于图形众多,部分信号演变复杂,总结了影响YRB低频气温(包含10~30 d和30~60 d T max)的显著大尺度信号来源及其传播方向(表1):1)由欧亚大陆西北部向东南传播的低频波列(图5a; Yang and Li,2016; Gao et al.,2018; 杨秋明,2018; Zhu and Yang,2021); 2)西太平洋向东亚传播的低频对流(图5b; Chen et al.,2018; Zhu and Li,2018); 3)自东北亚向西南传播的环流扰动(图5c; Zhu and Li,2018)。当这些地区的低频对流或环流扰动的对流/下沉位相移至YRB地区时,可能通过云-辐射过程(上升对流区多云、下沉位相为晴空)对局地T max产生影响,也可能通过温度平流、绝热/非绝热加热等过程引起气温的变化甚至导致高温热浪的发生。

  • 图2 1979—2019年夏季(MJJAS)YRB区域平均日最高温度的功率谱合成(黑色实线,单位:℃2; 首先计算每年夏季的功率谱,再计算功率谱的气候平均; 红色实线表示红噪声谱; 蓝色虚线和绿色虚线分别表示红色噪声的95%和5%置信水平; 在功率谱计算前去除了年循环分量(逐日气候平均值和前3个谐波分量),并通过5 d滑动平均去除天气尺度高频变化)

  • Fig.2 The power spectrum (black solid line, unit:℃2) of the YRB T max in the summers (MJJAS) from 1979—2019.The power spectrum of each summer from 1979—2019 is calculated separately and then added to the climatological composite.The red line represents the red noise spectrum, while the blue and green dashed lines represent the 95% and 5% confidence levels of red noise, respectively.The annual cycle, defined as the summation of daily climatology and the first three harmonics, is removed prior to spectrum analysis.Then, using a 5-day running mean, the synoptic-scale variation is also removed

  • 对YRB地区10~30 d/30~60 d升温个例(T max /t>0)的气温方程合成诊断分析(图6)表明,YBR地区10~30 d(图6a)与30~60 d(图6b)T max升温的发生机制相似,主要来自绝热(与大气垂直运动和静力稳定度有关)和非绝热加热过程,而水平气温平流呈现微弱的负贡献。近地表的非绝热过程包含辐射和热通量过程,通过地表能量平衡方程诊断(图略),进一步确认了向下短波辐射增加有利地表升温,温暖的地表面又导致向上的长波辐射和感热通量加强,加热近地表大气。综上所述,低频对流和环流传播至YRB地区时,异常垂直运动引发的绝热加热作用,以及相关的云-辐射反馈过程,是导致局地低频增温的主要物理过程。由此可见,大尺度对流/环流场的低频信号与长江流域T max演变之间存在着重要的物理联系,是本研究将低频环流/对流场引入延伸期预报模型的物理基础。

  • 3 基于CNN的YRB T max延伸期预报模型

  • 3.1 建模思路和CNN模型结构

  • 前一节的统计分析可知,影响YRB T max变化的前兆信号包括来自热带和中高纬的低频对流/环流扰动(图5),其可作为延伸期预报的潜在预报因子,对YRB T max进行建模预报。由于每一次引发T max异常的信号来源(起源地)、传播方向和强度并不一致,假若采用基于区域平均气象变量的多元线性时滞回归模型(黄世成等,2014; Yang and Li,2016)或是考虑基于预报因子和预报量的时空耦合模态的统计模型(徐邦琪等,2020),这些模型采用的预报因子区域范围固定(例如:固定于热带某个海域范围,或是固定于欧亚大陆某个区域范围),当某些预报时刻的预报因子起源和传播特征改变时,则预报因子无法提供有效信息(提供的预报信息与建模所选取的区域范围不一致),而导致预报效果偏低。再者,气候数据的超前-滞后相关分析(图5)仅显示出两个变量的线性关系,无法解析复杂的非线性作用,以此分析仅能辨识出与预报量线性相关的先兆信号。CNN方法则可通过特殊的卷积、池化和非线性映射的运算弥补以上统计方法的弱点:1)卷积有助于提取数据特征,池化则能对特征进行降维,卷积和池化运算综合而成的深层神经网络可以使CNN提取到丰富的数据特征,提高了微小形变的鲁棒性,使得数据特征具有平移和尺度不变性,不随细微的位置平移和范围缩放而改变,即便发生偏移或变形也能对预报有贡献; 2)激活函数(如ReLU; Nair and Hinton,2010)可以对数据进行非线性映射,CNN能在历史数据的训练和学习中探索数据间的非线性关系(贺圣平等,2021)。因此,本研究在传统相关分析和物理诊断的基础上,进一步利用CNN方法,通过对大量历史数据的学习,在大尺度空间范围内(42.5°~150°E,0°~67.5°N)客观辨识出影响YRB气温的低频对流和环流信号,并进行建模预报。

  • 图3 1979—2019年夏季(MJJAS)的10~30 d(a)和30~60 d(b)滤波的T max标准差与逐日原始T max标准差的比值(单位:%; YRB区域平均的数值列于黑框旁)

  • Fig.3 The ratio of the standard deviations of the (a) 10—30-day and (b) 30—60-day filtered T max to the original daily T max in the summers (MJJAS) of 1979—2019 (unit:%) .The YRB area-averaged values are listed next to the black boxes

  • 图4 1979—2019年夏季(MJJAS)YRB 10~30 d(a、c、e)和30~60 d(b、d、f)T max的EOF模态(右上角标示了各模态的方差贡献率):(a、b)EOF1;(c、d)EOF2;(e、f)EOF3

  • Fig.4 The first three leading EOF modes for the (a, c, e) 10—30-day and (b, d, f) 30—60-day T max in the summers (MJJAS) of 1979—2019, respectively.The spatial distributions of the (a, b) EOF1, (c, d) EOF2, and (e, f) EOF3 modes are shown respectively, from top to bottom.The upper right corner indicates the explained variance for each mode

  • 为了合理构建基于CNN的延伸期预报模型,需要依据气象预报问题的物理基础和CNN的数理原理设定CNN的框架。CNN主要由输入层、卷积层、池化层、全连接层和输出层构成(各层次的功能和原理已在资料和方法一章中介绍),对于回归类深度学习问题,输入和输出对应着预报因子和预报量,它们的设定直接决定了CNN对哪些输入数据提取特征,以及输出什么样的预报结果。为了让CNN识别前期低频场的时空特征并用于预报,以一个预报时次当前(t)和前期(t-25 d,t-20 d,t-15 d,t-10 d,t-5 d)的大范围(42.5°~150°E,0°~67.5°N)的低频10~30 d及30~60 d OLR、H500、H200作为CNN的输入(预报因子)。为了提高CNN模型训练效率,采用EOF方法对YRB的10~30 d及30~60 d T max距平场进行降维(见第2节),对其前三个模态(方差贡献率超过了85%)的时间系数(PCs)分别进行建模预报。由于仅对T max低频分量进行延伸期尺度的预报,并不关注高频天气尺度的变化,因此选取未来6个时间节点(t +5 d,t +10 d,t +15 d,t +20 d,t +25 d,t +30 d)的PCs作为预报结果(一个PC建立一个CNN模型)进行输出。输入和输出确定后,通过历史数据的训练来找到两者的关系(图7),即确定CNN中有关卷积层、全连接层等关键参数。为了检验CNN的预报能力,在训练前将数据分为三部分:训练期(1979—2003年夏季,2 300 d)、验证期(2004—2011年夏季,736 d)、独立预报期(2012—2019年夏季,736 d)。首先,基于训练时期(1979—2003年)数据以训练CNN得到预报量和预报因子间的关系,并用验证期数据(2004—2011年)进行预报检验,用以观察模型的训练情况并辅助筛选CNN模型的最优参数。最后,再基于较优参数的CNN模型对2012—2019年夏季的T max空间场进行独立预报试验:先采用CNN预报得到10~30 d及30~60 d前3个EOF模态的时间系数,然后据该时间序列与观测的10~30 d及30~60 d EOF空间模态分别进行重构(i=1i=K EOFi×PCiK表示EOF的前K个模态,本研究K的选取依据EOF方差贡献率和North检验,K =3),得到低频T max距平场的预报结果,最后将气候平均场叠加至低频T max距平场,以获得T max总场的空间分布(图7)。为了与预报场的时间尺度匹配,用以评估T max预报技巧的观测场采用的是5 d滑动平均后的逐日数据。

  • 表1 与长江地区低频(10~30 d和30~60 d)T max前三个模态变化(PC1-PC3)有关的先兆信号

  • Table1 Precursor signals for the first three EOF modes of YBR T max

  • 本文参照Ham et al.(2019),采用卷积层和池化层交错堆叠的网络框架,设定3层卷积层和2层池化层以及一个具有6个输出节点的全连接层。各卷积层中卷积核个数分别定为6、12、24,卷积核的大小为3×3,池化核的大小为2×2,采取最大池化方式,使用ReLU激活函数。为了使CNN中间层的输出更稳定并提高训练速度,每个卷积层后连接一个批归一化层; 对数据边缘采用0填充以保证卷积前后特征图大小不变。用预报量和观测量之间的平均绝对误差MAE =ypred -yobs 作为模型的损失函数。优化算法选择通用性高的Adam方法,学习率设定为0.01,采用分批训练方法,批次的大小设定为16。另外,由于CNN受初始化参数的影响较大,我们将采用鲁棒性较强的Kaiming初始化方法(He et al.,2015),各PC都基于20个不同的初始化方案得到20个CNN参数模型,然后取集合平均进行集合预报。

  • 训练的过程中采用以下两种方法防止过拟合问题。第一,在全连接层前嵌套一层Dropout层。在训练过程中,每一个CNN提取出的特征输出到该层后有50%的概率被丢弃。第二,给定模型训练的总轮数,每隔5轮计算模型在验证集上的误差(Weyn et al.,2021),当验证集的误差上升时,停止训练,保存使得验证集误差最小的CNN参数(Mayer and Barnes,2021)。一般而言,当训练集和验证集的误差都下降时,说明模型欠拟合; 当训练集的误差下降,而验证集的误差上升时,模型过拟合,因此验证集上的误差有助于判断模型的拟合性能。

  • 3.2 CNN预报模型的技巧检验

  • 验证阶段集合预报的结果(图8a)表明,CNN对10~30 d T max的第一模态(PC1)和30~60 d T max前三个模态(PC1-PC3)有最高的预报技巧,提前5~30 d预报结果与观测数据进行时间相关系数(TCC)检验显示,TCC技巧均通过95%置信度的显著性检验。而CNN预报10~30 d的PC2及PC3技巧欠佳,TCC通过显著性检验的预报时次较少,未能提供稳定可行的预报。基于此,在独立试报阶段中,对这4个模态分别进行预报,并进行低频T max的空间形态重构,得到最终预报量。独立试报阶段的技巧检验结果显示,CNN能有效预报出这4个低频模态,提前5~30 d预报两种低频分量第一模态的TCC预报技巧都通过了95%置信度的显著性检验,且模型对30~60 d模态的预报技巧较高(图8b)。

  • 图5 1979—2003年夏季(MJJAS)低频对流(OLR)和环流(H500、H200)与YRB低频T max主要模态的超前-滞后相关分析(1—7为lag30 d至lag0 d,lagN d代表低频大尺度场超前PC时间序列N d; 填色区域通过95%置信度的显著性检验; 绿线标示出低频对流/环流的传播/演变):(a)10~30 d T max PC1与10~30 d H500的超前-滞后相关系数分布;(b)30~60 d T max PC1和低频OLR的超前-滞后相关系数分布;(c)30~60 d T max PC2和低频H200的超前-滞后相关系数分布

  • Fig.5 The lead-lag correlation maps obtained from the time series of YRB low-frequency T max modes against large-scale low-frequency variables using data from the summers of 1979—2003. (a) The lead-lag correlation coefficient map between T maxPC1 and H500 at 10—30 d.1—7 is the result of lag30 to lag0 days, and lagN day indicates that the low-frequency fields lead PC time series by N days. (b—c) the same as in (a) , except for correlations between (b) 30—60 d T max PC1 and OLR and (c) 30—60 d T max PC2 and H200, respectively.Only the regions with the significant (95% confidence level) correlation coefficient are shown.The green lines mark the propagation/evolution characteristics of low-frequency signals

  • 图6 1979—2003年夏季YRB地区10~30 d(a)及30~60 d(b)T max于升温期间的近地表(925 hPa)温度收支情况(单位:10-7K·s-1; 由左至右分别为近地表温度趋势、水平平流、绝热和非绝热加热作用)

  • Fig.6 The near-surface (925 hPa) temperature budget results from (a) 10—30 d and (b) 30—60 d warming events (T max/t>0) during the summers of 1979—2003 (unit:10-7K·s-1; from left to right:near-surface temperature tendency, horizontal advection, adiabatic and diabatic heating processes)

  • 图7 基于CNN的YBR T max延伸期预报模型的建立流程(X(低频大尺度场)和PC(EOF的时间系数)分别为预报因子和预报量。K为所选取的10~30 d和30~60 d长江流域T max的前K个EOF模态(本文中,K =3),fk为CNN所学习得到的预报量和预报因子的关系式; 黑色实线表示独立试报阶段t时次的预报流程)

  • Fig.7 Flow chart for the CNN-based extended-range YRB T max forecast model.The predictor and predictand are X (large-scale low-frequency fields) and PC (the time coefficient of EOFs) , respectively.K is the number of EOF modes considered, and K =3 in this study.fk is the function between predictor and predictand derived from the CNN training.The black solid line represents the forecasting process at time t during the independent forecast period

  • 为了对长江流域T max空间分布进行预报评估,将预报的低频PCs和相对应的EOF模态进行重建后加总,再将年循环分量加回,得到逐日T max的空间分布。由于该延伸期预报产品中未考虑天气尺度分量,因此,用来评估预报技巧的观测数据为经过5 d滑动平均的T max。图9显示,该模型对YRB区域T max皆有较高的预报技巧,在延伸期预报尺度上(提前5~30 d),YRB区域平均TCC在0.63~0.70,且超过半数格点的TCC技巧通过了99%信度检验。模型对T max的量级预报误差(RMSE)则在0.77到0.85标准差之间。由图9可见,CNN模型对YRB的西部和东部区域T max预报能力较高(有较高的TCC值和较低的RMSE偏差),这2个高预报技巧的地区与T max方差变率大值区一致(图1b)。一般而言,方差大值区代表影响该区气象要素的因素和信号较为复杂,导致气象要素出现较大的变率; 从预报的角度而言,该区的潜在可预报性来源较多,若预报模型能够较高效能地掌握可预报性来源,则能更好地预报局地气象要素的变化。本研究的结果显示,得益于历史大数据的训练和学习,基于CNN方法建立的延伸期统计预报模型能在复杂多变的数据中,有效地提取和识别预报因子信号及其与预报量之间的联系(LeCun et al.,2015)。

  • 图8 CNN模型对YRB T max不同模态时间系数的集合预报(基于20个集合成员的平均)技巧(不同颜色代表对不同低频分量和模态的预报; 用以验证预报技巧的观测数据为对应这些模态的逐日PCs; 虚线表示30~60 d PCs通过95%置信度的显著性检验的临界值,点划线表示10~30 d PC1通过95%置信度的显著性检验的临界值; 图a中橙色星号标示了验证阶段中具有高TCC技巧的预报结果):(a)验证阶段;(b)独立测试阶段

  • Fig.8 Ensemble prediction of the CNN model for different low-frequency YRB T max modes obtained from the average of 20 members. (a) and (b) show the results of TCC during the validation period and the independent forecast period, respectively.The reference data used to calculate the prediction accuracy are the corresponding PCs of each mode that are derived from observation.The dash line represents the 95% confidence level for the accuracy of 30—60 d PCs, while the dot-dash line represents the 95% confidence level for the accuracy of 10—30 d PC1.The orange asterisks in (a) mark the skillful forecast results with high TCC accuracy during the validation period

  • 为了验证模型参数的稳定性和适用性,我们也进行了一系列的敏感性试验,包括:提高卷积核的分辨率(由3×3格点提高到2×2格点)和增添EOF预报模态的个数(由3个提高到5个),结果显示,这些改变对预报技巧并无显著的改变(图略),然而却需要更多的计算资源。基于目前的结果,我们建议对于长江流域夏季T max的延伸期预报可采用目前的模型架构、EOF降维和重构方法,以及相关参数设定,有利于节省计算资源和提高运算的效率。

  • 3.3 CNN模型预报信号来源:热力图分析

  • 图8、9显示CNN预报模型可在延伸期尺度上对YRB T max进行有效预报。为了在物理上解释CNN提取的前兆信号(预报因子)和预报量之间的关系,挑选不同预报结果的个例进行热力图(heat map)合成分析(Ham et al,2019; Tang and Duan,2021)。首先,选取独立试报阶段中预报技巧最高的集合预报子成员,挑选预报PC数值超过第95百分位和低于第5百分位的样本进行热力图合成,再计算两者的差值(图10),以探讨CNN模型在输出不同预报结果(预报量偏高/偏低)时大尺度预报因子的信息来源,图10中数值的大小表示各个区域预报因子的贡献度,颜色越深,代表该区域所提供的低频信号对预报量的影响越大。

  • 对于长江流域10~30 d T max第一模态的预报,CNN模型捕捉且采用的前兆信号主要来自欧亚大陆经贝加尔湖东传南下的低频信号,与超前-滞后分析的结果相似(图5a),此外,东北亚/华北地区南传的信号和热带西北太平洋向西北传播的信号也被CNN模型采用为预报信息(图10a); 对于30~60 d T max前两个模态的预报而言(图10b和图10c),主要预报信息集中于东北亚和西北太平洋,这些信号与线性统计相关的结果大致相同(图5b、c)。经过历史大数据的学习,CNN模型辨识的前兆预报信息与预报因子和预报量的超前-滞后相关分析一致,主要的预报信号来源仍是中高纬和热带低频波列的传播和演变,显示具有物理意义的大尺度信息仍是延伸期可预报性的重要来源。通过CNN的热力图分析,进一步明确了这些潜在预报因子在实际预报中的相对贡献。

  • 图9 CNN预报模型于独立预报(2012—2019年夏季)期间T max的预报技巧检验(每个子图的右上角标注了区域平均值):TCC(a; 黑色实线表示通过99%置信度的显著性检验的临界值)、RMSE(b; 单位:标准差)在提前5、10、15、20、25、30 d(1—5)的预报结果

  • Fig.9 Prediction of YRB T max using the CNN-based forecast model during the independent forecast period (the summers of 2012—2019) .The results of (a) TCC and (b) RMSE (unit:standard deviation) are shown from 1 to 5 with lead times of 5, 10, 15, 20, 25, and 30 days, respectively.The black solid lines in the left panel indicate the 99% confidence level, while the regional average value is indicated at the upper right corner of each panel

  • 图10 CNN模型对不同预报量的热力图分析(该结果基于集合预报最优子成员,是所有预报提前时间(5~30 d)的合成结果; 热力图数值大小表示了该区域低频场所提供的信号对预报的贡献度; 填色区均通过99%置信度的显著性检验):(a)10~30 d T max PC1;(b)30~60 d T max PC1;(c)30~60 d T max PC2

  • Fig.10 CNN model composite heat maps for different forecasts (average of all forecast lead times (5 to 30 days) based on the best member of the ensemble forecast.The magnitude of the value indicates the contribution of the signals produced by low-frequency fields to the predicted PCs.All shaded regions exceed the 99% confidence level) : (a) 10—30 d T max PC1; (b) 30—60 d T max PC1; (c) 30—60 d T max PC2

  • 4 总结和讨论

  • 近年来我国高温热浪频发,长江流域地区为高温热浪的多发地区,了解该区域夏季T max变化的物理机制和可预报信号来源,进一步借助机器学习方法客观识别先兆信号,建立延伸期预报模型以提高T max预报能力,对政府部门及时决策、高温防灾工作顺利开展具有重要意义。

  • 长江流域地区T max变率呈现出10~30 d和30~60 d周期低频振荡的特征。超前-滞后相关分析显示出影响YRB地区低频T max模态的3种先兆信号来源,包括源于热带西太平洋向北/西北传播的信号、来自欧亚大陆向东/东南传播信号,以及从东北亚向南/西南传播的信号(Yang and Li,2016; Chen and Zhai,2017; Gao et al.,2018; 杨秋明,2018; Zhu and Li,2018; Zhu and Yang,2021)。当这些低频对流和环流扰动抵达YRB时,通过绝热和非绝热过程导致YRB T max的变化。在这些物理基础上,我们将前期低频对流(OLR)和环流(H500,H200)作为预报因子,以YRB T max的低频空间模态的时间系数(PCs)作为预报量,将CNN应用于历史数据的训练,找到预报因子和预报量之间的关系,实现客观且智能地识别预报因子所提供的前兆信号,并据此预报YRB T max的变化。预报技巧检验的结果表明,基于CNN的预报模型对10~30 d T max的第一模态(PC1)和30~60 d T max的第一模态(PC1)具有最高的预报能力,20个集合成员的集合预报技巧可达30 d(TCC均通过95%置信度的显著性检验)。进一步将预报的PCs与观测的EOF模态进行重构,并叠加气候态空间场,得到未来5~30 d的YRB地区T max预报产品。此最终产品与观测相比(独立试报期间),YRB区域平均的TCC均超过了0.62(通过99%置信度的显著性检验),区域平均的量级误差(RMSE)均在1个标准差以下。经过热力图的合成分析,揭示了中高纬和热带低频波列的传播和演变是CNN模型的延伸期可预报性来源。

  • 本研究的结果显示,CNN方法具有应用于延伸期预报的潜能,但在业务化过程仍须进一步优化和改进,例如:需采取非传统带通滤波法来实时获取低频分量(Hsu et al.,2015)和考虑更多源的有效预报因子。目前CNN模型采用的预报因子局限于大气低频系统,地球其他圈层(海洋、陆面)及其间的相互作用过程也可提供延伸期天气预报的可预报性来源(章大全等,2019; 徐邦琪等,2020)。在CNN方法技术方面,目前的CNN模型主要参照Ham et al.(2019),采用了较为简单的网络结构和数据训练方法,虽然回报试验的技巧良好,但未来仍有巨大的改进空间,深度学习模型仍可进一步优化。例如,采用提取时序特征较优的LSTM模型,或是采用ConvLSTM或U-Net等网络架构,在训练时考虑学习率衰减、迁移学习等。此外,深度学习模型受初始化参数和人为设定参数(如学习率、卷积核的大小和步长)的影响,需要通过建模时期和回报试验的敏感性试验来确认最优方案,如何有效确认最优的参数方案,也是本研究的未来工作。

  • 参考文献

  • 参考文献

  • 地址:江苏南京,宁六路219号,南京信息工程大学    邮编:210044

    联系电话:025-58731158    E-mail:xbbjb@nuist.edu.cn    QQ交流群号:344646895

    大气科学学报 ® 2022 版权所有  技术支持:北京勤云科技发展有限公司