en
×

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。
通讯作者:

马旭林,E-mail:xulinma@nuist.edu.cn

引用:马旭林,何佩仪,周勃旸,等,2021.集合变换卡尔曼滤波局地化对区域集合初始扰动的影响[J].大气科学学报,44(2):314-323.

Quote:Ma X L,He P Y,Zhou B Y,et al.,2021.Impact of localization of ensemble transform Kalman filter on initial perturbation of regional ensemble forecast[J].Trans Atmos Sci,44(2):314-323.

目录contents

    摘要

    集合变换卡尔曼滤波(ensemble transform Kalman filter,ETKF)是一种有效的集合预报初始扰动构造方案。但是,有限的集合样本、相同的集合成员设置以及预报模式误差等可能会使两个距离较远的状态变量产生虚假相关,从而影响ETKF集合扰动的质量。为了有效解决远距离虚假相关问题,将局地化思想引入ETKF方案。本文针对GRAPES区域集合预报系统(GRAPES REPS),对ETKF初值扰动局地化方案的效果进行了试验分析,为进一步改善和优化局地化方案(LETKF方案)提供依据。通过一周的连续试验,从暴雨个例、集合预报多种评分检验等方面分析了LETKF初始扰动方案所产生的集合预报质量。结果表明,区域集合预报中集合变换卡尔曼滤波初始扰动的局地化方案能够更加合理地捕捉到快速增长的分析误差的物理结构,更准确地再现数值模式预报误差的线性与非线性传播和演变特征。该局地化方案可以较好地改进预报质量,提高降水预报的准确率,尤其是针对小雨、中雨、暴雨量级的预报。相对于现有区域集合预报的业务系统GRAPES REPS,基于局地化ETKF初始扰动方案的区域集合预报具有较明显的优势。总体来看,LETKF初始扰动方案可更好地改善区域集合预报的质量。

    Abstract

    The ensemble transform Kalman filter (ETKF) is an effective ensemble prediction initial perturbation scheme and is widely used.However,the finite ensemble sample size,the same ensemble member setting in ETKF and the forecast model error may make the two remote state variables have higher spurious correlation,thus affecting the quality of ETKF ensemble perturbation.The reason why ETKF generates spurious correlation is that each ensemble member is an estimate of the atmospheric state,while the degree of atmospheric freedom is too high,and the limited ensemble members are difficult to fully express.On the other hand,due to the effect of the forecast model error,the same size of members may lead to convergence of different ensemble members in the prediction process,resulting in spurious correlation.In order to solve this problem,the localization of ETKF,called LETKF,is proposed.By means of localization,the spurious correlation of error variance can be truncated in the localized radius,thus improving the quality of error variance.That is to say,only the observation data in the local radius are absorbed and aimed at a grid point,and the observation outside the radius is not taken into account so as to avoid the spurious correlation at a distance.Based on the GRAPES regional ensemble prediction system (GRAPES REPS),the localization scheme of ETKF initial perturbation is developed on the basis of the ETKF initial perturbation scheme,in order to solve the problem of the range spurious perturbation and the divergence of the filter in the regional ensemble prediction.Through the continuous experiments for 7 days,this paper analyzes the ensemble prediction quality of LETKF initial perturbation scheme from the case of rainstorm and multiple scoring methods of ensemble prediction.Results show that the localization scheme of ensemble transform Kalman filter initial perturbation in regional ensemble prediction can more reasonably capture the physical structure of the rapidly growing analysis error,and more accurately reproduce the linear and nonlinear propagation and evolution characteristics of the forecast error in the numerical model.The localization scheme can improve the quality of forecast and increase the accuracy of precipitation forecast,especially for the forecast of magnitude of light rain,moderate rain and rainstorm.Compared with the existing regional ensemble prediction business system GRAPES REPS,the regional ensemble prediction produced by LETKF initial perturbation scheme has obvious advantages.In general,the LETKF initial perturbation scheme can improve the quality of regional ensemble prediction.

  • 集合预报能够描述数值天气预报中大气状态的不确定性,并定量给出概率密度函数(Bowler,2006),在数值天气预报中具有愈加重要的意义,其研究和应用也得到迅速发展(马旭林等,2015)。集合预报初始扰动的构造是集合预报研究的核心内容之一,对集合预报的质量和性能具有决定作用(马旭林等,2018)。集合变换卡尔曼滤波(ensemble transform Kalman filter;Bishop et al.,2001)是近年来迅速发展并得到广泛应用的一种集合预报初始扰动方法,借助资料同化中的观测信息将预报误差和分析误差建立联系。该方法最初是为了更好地解决适应性观测的问题,它利用集合变换和归一化方法可以快速获得预报误差协方差矩阵,逐渐发展成为一种有效的集合预报初始扰动构造方案(Wang and Bishop,2003;Ma et al.,2009a)。ETKF集合初始扰动方案通过变换矩阵,在集合子空间内将预报扰动变换为分析扰动(马旭林等,2008),其突出优点是能够有效反映观测资料的空间分布对初值不确定性的影响。同时,也具有扰动在观测空间正交、易于实施等优点。但是,在ETKF方案中,由于集合样本数的限制以及相同的集合成员设置,可能导致距离相对较远、本没有相关性或者相关性极低的状态变量产生虚假相关,即远距离虚假相关,这可能导致集合扰动质量的虚假结构。

  • 依据资料同化中观测要素的相关尺度,逐步提出了基于截断半径的集合扰动局地化方法,使得观测信息只对一定范围内的状态变量产生影响,以避免或减弱虚假相关。Houtekamer and Mitchell(1998)研究指出,正是由于使用比较少的集合成员来估计背景误差协方差,使得两个相距很远的格点之间可能产生虚假相关,而这种虚假相关在集合成员较大时则很小。较小的集合成员数对应的截断半径较小,反之则截断半径较大。据此,Ott et al.(2002,2004)针对集合均方根滤波(EnSRF)方法提出了局地化集合卡尔曼滤波(LEKF)。在此基础上,Hunt et al.(2007)将ETKF应用到LEKF方案,发展了局地化集合变换卡尔曼滤波,简称为LETKF,其特点是利用各自独立的局地化区域可以在并行结构下高效运行(Miyoshi and Yamane,2007)。实际上,LEKF的局地化通过背景误差协方差局地化实现,而LETKF是通过每个局地区域内的变换矩阵实现局地化处理。

  • 局地化思想可以有效消除因滤波发散而导致的远距离虚假扰动问题,进一步提高ETKF初始扰动方案构造的集合初始扰动的性能。在LETKF方法正式提出之前,Bowler(2006)研究指出ETKF初始扰动方案的局地化是一种有效的集合初始扰动方法。随着研究的深入,正式将LETKF应用到集合预报的初始扰动构造方案,充分验证了在集合预报初始扰动方案中引入局地化方法确实可以改善集合预报初始扰动的质量(Bowler et al.,2009),能够有效地消除远距离虚假相关对集合扰动的影响。目前,局地化方法已成功应用于业务集合预报ETKF初始扰动方案中,并取得良好的效果。我国在深入研究ETKF初始扰动构造方案的基础上,已成功发展建立了基于ETKF初始扰动方案的全球和区域集合预报系统(马旭林等,2008),其中区域GRAPES REPS集合预报系统已投入业务预报应用。但是,基于ETKF初始扰动的区域GRAPES REPS集合预报系统尚未建立初始扰动局地化方案,难以消除因远距离虚假相关而产生的虚假扰动,从而降低了集合扰动合理描述大气可能状态的能力。本文基于GRAPES区域集合预报系统(GRAPES REPS),针对ETKF初值扰动方案发展的局地化ETKF初始扰动方案(LETKF),通过个例试验和批量试验以及集合预报性能的多角度检验,分析讨论了局地化方案对集合预报性能的影响,为进一步改善集合预报质量和业务应用提供依据。

  • 1 集合变换卡尔曼滤波局地化(LETKF)方案

  • ETKF之所以会产生虚假相关,是因为每个集合成员都是对大气状态的一种估计,而有限的集合成员难以完全解释实际大气的所有可能状态;另一方面,数值预报模式存在误差,相同的集合成员设置可能导致不同集合成员在预报过程中产生趋同性,从而产生虚假相关(韩培等,2016)。因ETKF在观测空间计算分析扰动,局地化方案难以直接应用。但是,将观测资料的空间分布划分为若干局地区域,从而事实现将观测资料分块,分别计算局地化变换矩阵,可以方便实现ETKF的局地化(Bowler,2006)。这与Hunt et al.(2007)提出的LETKF方法类似,但Bowler的方法仅用于计算集合扰动。LETKF局地化方法利用局地化半径以截断误差方差的虚假相关,从而改善误差方差的质量。亦即,针对一个格点只吸收局地化半径内的观测资料的有效信息,不考虑半径外的观测的影响。这里的局地化半径是指根据观测误差相关尺度和模拟区域大小,确定圆形局地化区域范围的设定半径。在对格点的扰动值进行更新时,仅考虑以该格点为圆心、局地化半径形成的圆形区域内的所有观测信息。

  • 对于确定的模式区域,理想情况是对该区域内每个格点进行局地化求解最为准确,但这样导致计算量大,实际操作难以实现。为了减小计算量提高计算效率,将整个模拟区域均匀划分为N个小方块,每个方块的中心点选定为“局地化中心”(如图1星号所示),并试验设定合适的局地化半径,利用该局地半径内的观测(图中小圆点为模拟观测站点的分布)计算该中心点对应的变换矩阵。该中心点所在局地区域内的其他格点都利用相同的变换矩阵更新扰动,即由ETKF线性扰动变换关系Xa=XfTLΠ和局地化算子L(h)有:

  • Xa=XfTLΠ

  • 其中: Xa是分析扰动; Xf是预报扰动;T为变换矩阵;Π为调节集合离散度的放大因子;h为高度。局地化算子L是包含局地化方案中模式水平空间内局地化区域的划分、局地化半径及其随高度的变化等参数。为了简化问题,这里将随高度变化的局地化算子L简化为不随高度变化的定常值。

  • 2 数值试验方案

  • 试验的区域集合预报系统除初始扰动方案外,其他与业务系统一致,即GRAPES区域预报模式和模式面三维变分资料同化系统(Ma et al.,2009b)。模式模拟的水平区域为71.5°~133.6°E、16.5°~58.35°N,分辨率为0.15°。控制预报中背景场为T639模式的12h预报场,同化的观测资料为探空、地面、船舶报与飞机报等常规观测,以及COSMIC反演大气温湿资料,观测误差与GRAPES三维变分资料同化系统中所设置的实际观测误差一致,预报长度为72h。为了考察局地化初始扰动方案消除远距离虚假扰动而改善集合预报质量的效果,设计三组试验(表1)。第一组试验为业务GRAPES区域集合预报,简称为REPS。该组试验是中国气象局数值预报中心业务运行的区域集合预报;第二组试验采用优化的ETKF初始扰动方案(马旭林等,2014),其余均与第一组试验相同;第三组试验为LETKF初始扰动方案,该区域集合预报系统中除初始扰动外,其余配置均与第一组和第二组相同。

  • 图1 模拟观测站点的分布

  • Fig.1 Distribution of observation stations used in simulation

  • 表1 数值试验方案

  • Table1 Schemes of numerical experiment

  • 区域集合预报启动时,最初由T639全球集合预报构造启动时刻的初始扰动,包括1个控制预报和14个扰动预报,共15个集合成员。然后利用LETKF初始扰动方案更新并得到新的集合扰动,最后制作72h预报。集合预报系统的起报时间为每日00、12时(世界时,下同)。为了消除集合预报初期初始扰动适应过程的影响,选取7月13日00时开始的为期一周的集合预报结果进行分析。在局地化试验中,根据模拟区域大小,将整个模拟区域划分为6×5(纬向×径向)个规则的矩形局地区域,局地化半径为700km,这里不考虑垂直方向上局地化半径的变化,即整层相同。为避免局地化后的扰动场边界处可能存在的不连续对全场集合扰动结构的影响,对全场集合扰动进行九点二次平滑。

  • 3 LETKF方案的效果分析

  • 3.1 典型降水天气个例结果

  • 选取2015年7月14—16日的降水过程,该过程的主要影响系统是高空槽、低层切变、低涡。从7月16日00时24h的累积降水实况(图2a)可以看出,雨区主要落在湖北大部、河南中南部、湖南北部以及安徽西部,大暴雨中心位于湖北东部。

  • 图2 2015年7月16日00时24h累积降水量实况(a)以及ETKF方案(b)、LETKF方案(c)的集合平均24h累积降水量(单位:mm)

  • Fig.2 (a)Observed 24h cumulative precipitation,and(b,c)simulated ensemble average24h cumulative precipitation with(b)ETKF scheme and(c)LETKF scheme at 0000UTC 16July 2015(units:mm)

  • 从图2b、c可知,相比于实况,ETKF和LETKF两个方案集合平均预报对河南中南部和湖北大部的降水落区模拟效果较好。这与集合平均预报通常比单个确定性预报、甚至比更高分辨率模式所产生的确定性预报准确(杜钧,2002)相一致。但是,ETKF方案空报了山西南部和北京西部的中雨,LETKF方案对此有一定效果的修正,减小了空报的雨区范围。就降水量级而言,相对于ETKF方案,LETKF方案报出了湖北北部的暴雨中心,但二者对于河南北部的降水量级均偏小。总体来看,LETKF方案的模拟结果较ETKF方案更接近实况。究其原因,与局地化方案生成的初始扰动有密切关系。改善后的初始扰动减少了虚假相关的影响,可以更合理地描述真实大气状态的可能分布,更准确地刻画中小尺度天气系统。

  • 为了进一步检验局地化方案对降水预报的改善效果,对本次过程的24h累积降水进行BS、ETS和TTS三组评分检验。从BS(图3a)评分来看,对于小雨量级,两组试验在预报时均存在空报,相比而言,LETKF方案的BS评分效果更好,中雨量级评分与小雨类似。两组试验的大雨BS评分都近似等于1,预报准确。两方案的暴雨预报都出现了漏报,但LETKF方案明显比原方案的预报效果相对更好。两组试验的大暴雨评分均为0,出现漏报,这可能与模式的预报能力有直接关系。ETS(图3b)评分结果与TS类似。特别是对于小雨和中雨,局地化方案的ETS评分均明显高于ETKF方案,即预报准确度更高。从TSS评分(图3c)可以看出,对于小雨、中雨和暴雨来说,LETKF方案的预报效果均明显优于ETKF方案,对于大雨来说,ETKF方案的预报效果优于LETKF方案。而对于大暴雨,两组试验方案均无预报技巧。

  • 3.2 批量试验结果分析

  • 3.2.1 预报与观测的一致性分析

  • 理想集合预报中,各集合成员与观测之间满足一致性特征,即所有的统计值理论上应该相同,呈水平均一状态,这反映了集合离散度代表观测不确定性的程度(Wilks,2006)。图4为REPS、ETKF、LETKF三个试验方案的850hPa位势高度、温度、纬向风、径向风的Talagrand分布,可以看出,REPS的850hPa高度场Talagrand分布成倒L型(图8a),反映了集合预报的高度场预报值偏小,具有明显的负偏差同时离散度偏小;而850hPa温度场的Talagrand分布成L型(图4b),则说明温度预报值偏大,也就是存在正偏差同时离散度偏小。总体来看,ETKF和LETKF方案的高度和温度预报的Talagrand分布更加趋于水平均一,即正偏差或负偏差明显减小。相对而言,LETKF更进一步改善了这两个变量的偏差,使得其分布更加趋向平缓;850hPa的纬向风(图4c)和经向风(图4d)的Talagrand分布均近似为U型,说明集合成员之间区分度较小,且与观测值不同,反映了该集合预报的离散度偏小,难以合理的描述观测的不确定性特征。ETKF和LETKF方案的风场预报则略有改善,而LETKF更加明显。这反映了优化的ETKF初始扰动方案产生的集合扰动的质量有了提高,而在此基础上发展的局地化方案能够有效消除远距离虚假扰动,使得集合扰动的物理结构更加合理,从而得到质量更高的集合扰动,其集合离散度的质量也得到合理改善。

  • 图3 24h降水评分:(a)BS;(b)ETS;(c)TSS

  • Fig.3 24h precipitation scores:(a)BS;(b)ETS;(c)TSS

  • 图4 REPS、ETKF、LETKF初始扰动方案24h预报的850hPa位势高度(a)、温度(b)、纬向风(c)和经向风(d)的Talagrand评分

  • Fig.4 Talagrand scores of 24h forecasts with REPS,ETKF and LETKF initial perturbation schemes at 850hPa:(a)geopotential height;(b)temperature;(c)zonal wind;(d)meridional wind

  • 异常值(Outliers)主要衡量集合预报中异常值的百分比,也可以反映集合预报的可信度(Wilks,2006)。理想情况下,集合预报的异常值百分比通常接近2/(n+1),n为集合成员数。因文中三个方案的试验均为15个集合成员,则合理的异常值为125%(图中横线所示)。由各预报时刻高度、温度和风场预报的异常值占总观测数的百分比(图5)可以看出,3个方案850hPa位势高度的异常值百分比随着预报时效的增加仍表现出明显偏高的趋势,但与REPS方案相比,ETKF和LETKF方案异常值的大小有所降低,尤其是局地化方案的异常值更加接近于理想情况。对850hPa温度来说,三个方案的异常值百分比在0~72h整个预报时效内升降幅度变化不大,但与ETKF方案相比,LETKF方案的异常值大小更接近于理想情况。经过局地化后的风场异常值大小都有所降低。综合来看,LETKF初始扰动方案在一定程度上改善了集合预报的效果,提高了集合预报的质量。

  • 3.2.2 集合预报的可信度与可辨识度

  • 图6为可靠性评分,其横纵坐标分别代表P(f)和P(x|f),可以反映集合预报的可信度。可信度曲线表示相应预报概率分类中检验阈值对观测事件发生频率的统计属性。预报结果完美的情况下,预报概率与观测的频率相同,也就是说理想的可信度曲线与图形中对角线相重合。由图6可以看出,ETKF和LETKF方案相对于REPS方案,都不同程度改进了三个不同变量的可信度,尤其是850hPa温度场,其可信度曲线分布更加合理。24h温度预报的可信度曲线表明,大于0℃变温预报概率为0.5~1时,LETKF方案的可信度曲线更趋于对角线,具有更大的预报可信度;而预报概率为0~0.5之间的变温预报,ETKF方案与LETKF方案的预报可信度基本相当(图6a)。对于大于2℃以上的增温事件(图6b),在预报概率为0.2~0.7时,ETKF方案的预报可信度大于LETKF方案;而在0~0.2和0.7~1的预报概率中,LETKF方案的可信度曲线更靠近对角线,预报可信度更大。对于纬向风大于4m/s的天气事件(图6c),ETKF的预报概率大于观测频率,存在着正偏差,LETKF方案在06~1的预报概率中减少了这种偏差,使得可信度曲线更接近对角线,提高了预报可信度。在经向风大于4m/s的天气事件中(图6d),两个方案的结果类似,说明局地化方案对经向风的改善效果不明显。

  • 图5 REPS、ETKF、LETKF初始扰动方案预报的850hPa位势高度(a)、温度(b)、纬向风(c)和经向风(d)的异常值

  • Fig.5 Outliers of the forecast variables with REPS,ETKF and LETKF initial perturbation schemes at 850hPa:(a)geopotential height;(b)temperature;(c)zonal wind;(d)meridional wind

  • 图6 REPS、ETKF、LETKF初始扰动方案的850hPa温度和风场24h预报的可信度曲线:(a)升温大于0℃;(b)升温大于2℃;(c)纬向风速大于4m/s;(d)经向风速大于4m/s

  • Fig.6 Reliability curves of 24h temperature and wind forecasts with REPS,ETKF and LETKF initial perturbation schemes at 850hPa:(a)temperature rise greater than 0℃;(b)temperature rise greater than 2℃;(c)zonal wind speed greater than 4m/s;(d)meridional wind speed greater than 4m/s

  • 不同检验阈值的命中率与误报率形成ROC曲线,与XY轴共同构成的面积称为ROC面积(理想值为1),它能够综合反映集合预报中各成员区分不同天气事件的能力,即集合预报的可辨识度。ROC面积越大,说明预报的可辨识度越好。从24h预报的850hPa温度场对应ROC评分可以看出,对于增温0℃以上的天气变温事件(图7a),ETKF方案的ROC面积明显大于REPS,而LETKF方案的ROC面积又大于ETKF,说明LETKF方案的辨识度最大。对于增温2℃以上的天气变温事件(图7b),虽然三种方案的辨识度相同,但是可以看到ETKF和LETKF方案的ROC曲线更为光滑,没有出现奇异点;纬向风大于7m/s和经向风大于7m/s的天气事件(图7c、d)的LETKF方案ROC面积明显大于ETKF。总体来看,LETKF方案较好地提高了集合预报的辨识度。

  • 图7 REPS、ETKF、LETKF初始扰动方案的850hPa温度和风场24h预报的ROC曲线:(a)升温大于0℃;(b)升温大于2℃;(c)纬向风速大于7m/s;(d)经向风速大于7m/s

  • Fig.7 ROC scores of 24h temperature and wind forecasts with REPS,ETKF and LETKF initial perturbation schemes at 850hPa:(a)temperature rise greater than 0℃;(b)temperature rise greater than 2℃;(c)zonal wind speed greater than 7m/s;(d)meridional wind speed greater than 7m/s

  • 3.2.3 预报准确性评估

  • 不同天气事件预报的准确性是衡量集合预报质量的另一种有效方式,即CRPS评分,通常预报准确性越高其值越小。从ETKF与LETKF两组连续试验的CRPS统计结果来看,ETKF方案在很大程度上改进了CRPS评分随着预报时效延长而增加的趋势,使增加趋势变慢,尤其是850hPa位势高度(图8a),温度(图8b)和纬向风(图8c)的改善也较显著,但径向风的改善却略显不足(图8d)。对于LETKF方案而言,850hPa高度场、温度场和风场的CRPS评分总体上比ETKF方案略好,除位势高度的改进不明显外,温度场和风场相对显著。从CRPS检验来看,ETKF初始扰动的局地化方案整体上提升了集合预报的性能。

  • 4 结论与讨论

  • 本文针对区域集合预报系统GRAPES REPS的局地化ETKF初值扰动方案,通过个例试验和批量预报试验,对其集合预报效果进行对比分析,进一步验证了局地化方案对集合预报中远距离虚假相关对集合初始扰动质量改善的效果。个例试验结果说明,引入局地化方案的LETKF方案相对于ETKF,因消除了远距离虚假相关较好地改善了降水预报质量,尤其对小雨、中雨、暴雨预报效果有较明显改善。连续7d的集合预报批量试验结果表明,相对于原业务集合预报和没有引入局地化方案的集合预报初始方案而言,局地化方案生成的集合预报具有更高的可信度与可辨识度,同时CRPS综合评分最优,反映了ETKF初始扰动局地化方案通过消除远距离虚假扰动的影响,具有合理改善原集合预报综合性能的能力,特别对高度和温度预报效果更为显著,充分体现了局地化方案改善区域集合预报捕获初始扰动物理结构的能力。但是,局地化对集合预报风场预报质量的影响偏小,其可能原因需要进一步分析研究。

  • 图8 REPS、ETKF、LETKF初始扰动方案的850hPa模式变量的CRPS评分:(a)位势高度;(b)温度;(c)纬向风;(d)经向风

  • Fig.8 CRPS scores of the forecast variables with REPS,ETKF and LETKF initial perturbation schemes at 850hPa:(a)geopotential height;(b)temperature;(c)zonal wind;(d)meridional wind

  • 本文讨论了LETKF局地化方案对集合预报整体质量的影响,进一步确认了该方案对调整集合扰动结构、消除远距离虚假相关的有效性,以及使之能够更加合理的再现实际大气的可能状态的能力。但是,局地化方案中最优相关尺度的选取及其与预报模式、集合成员数量等之间的关系,以及局地化区域的合理划分等,还需要进一步的探讨和分析。

  • 参考文献

  • 参考文献

  • 地址:江苏南京宁六路219号南京信息工程大学    邮编:210044

    联系电话:025-58731158    E-mail:xbbjb@nuist.edu.cn    QQ交流群号:344646895

    大气科学学报 ® 2024 版权所有  技术支持:北京勤云科技发展有限公司