中国东南地区复杂地形下降水概率预报的订正研究

智协飞，霍自强; ZHI Xiefei; HUO Ziqiang

引 en

中国东南地区复杂地形下降水概率预报的订正研究

智协飞^1,2

机构：

1. 南京信息工程大学气象灾害预报预警与评估协同创新中心/气象灾害教育重点试验室,江苏南京 210044

2. 天气在线应用气象研究所,江苏无锡 214000

×
，霍自强¹

机构：

1. 南京信息工程大学气象灾害预报预警与评估协同创新中心/气象灾害教育重点试验室,江苏南京 210044

×

1. 南京信息工程大学气象灾害预报预警与评估协同创新中心/气象灾害教育重点试验室,江苏南京 210044；
2. 天气在线应用气象研究所,江苏无锡 214000；

Calibration of the probabilistic forecast of precipitation over complex terrain in Southeast China

ZHI Xiefei^1,2

Affiliation：

1. Collaborative Innovation Center on Forecast and Evaluation of Meteorological Disasters/Key Laboratory of Meteorological Disasters,Ministry of Education,Nanjing University of Information Science & Technology,Nanjing 210044 ,China

2. WeatherOnline Institute of Meteorological Applications,Wuxi 214000 ,China

×
， HUO Ziqiang¹

Affiliation：

1. Collaborative Innovation Center on Forecast and Evaluation of Meteorological Disasters/Key Laboratory of Meteorological Disasters,Ministry of Education,Nanjing University of Information Science & Technology,Nanjing 210044 ,China

×

1. Collaborative Innovation Center on Forecast and Evaluation of Meteorological Disasters/Key Laboratory of Meteorological Disasters,Ministry of Education,Nanjing University of Information Science & Technology,Nanjing 210044 ,China；
2. WeatherOnline Institute of Meteorological Applications,Wuxi 214000 ,China；

通讯作者:

智协飞,E-mail:zhi@nuist.edu.cn

DOI:10.13878/j.cnki.dqkxxb.20210128001

引用：智协飞,霍自强,2023.中国东南地区复杂地形下降水概率预报的订正研究[J].大气科学学报,46(2):230-241.

Quote：Zhi X F,Huo Z Q,2023.Calibration of the probabilistic forecast of precipitation over complex terrain in Southeast China[J].Trans Atmos Sci,46(2):230-241.

全文
评论
参考文献
出版信息

目录contents

摘要Abstract
关键词Keywords
1 资料与方法
1.1 资料
1.2 研究方法
1.2.1 左删失的非齐次Logistic回归
1.2.2 标准化的模式后处理（SAMOS）
1.3 评估方法
1.3.1 平均绝对误差（Mean Absolute Error，MAE）
1.3.2 连续分级概率评分（Continuous Ranked Probability Score，CRPS）
1.3.3 布莱尔评分（Brier Score，BS）
1.3.4 布莱尔技巧评分（Brier Skill Score，BSS）
2 结果分析
3 结论和讨论
参考文献

摘要

使用TIGGE (the THORPEX interactive grand global ensemble)资料集下欧洲中期天气预报中心(the European Centre for Medium-Range Weather Forecasts,ECMWF)逐日起报的预报时效为24~168 h的日降水量集合预报资料,集合预报共包括51个成员,利用左删失的非齐次Logistic回归方法(left-Censored Non-homogeneous Logistic Regression,CNLR)和标准化的模式后处理方法(Standardized Anomaly Model Output Statistics,SAMOS)对具有复杂地形的中国东南部地区降水预报进行统计后处理。结果表明:采用CNLR方法能够有效改进原始集合预报的平均绝对误差(Mean Absolute Error,MAE)和连续分级概率评分(Continuous Ranked Probability Score,CRPS),提升了降水的定量预报和概率预报的预报技巧。而使用SAMOS方法对数据进行预处理,考虑地形等因素的影响,能在CNLR方法的基础上进一步订正由于地形影响造成的预报误差,并得到更加准确的全概率的降水概率预报。

Abstract

This study is based on the daily 24-to 168-hour ensemble precipitation forecast datasets derived from the European Centre for Medium-Range Weather Forecasts and extracted from the TIGGE (The Interactive Grand Global Ensemble) dataset.The ensemble forecast comprises 51 ensemble members.The study applies the left-censored non-homogeneous logistic regression method (CNLR) and the standardized model post-processing method (SAMOS) to calibrate the precipitation forecasts in Southeast China.The results show that the CNLR method can effectively reduce the mean absolute error (MAE) and continuous ranked probability score (CRPS) of the raw ensemble forecast,and improve the forecasting skills of quantitative and probabilistic precipitation forecasts.Using the SAMOS method to preprocess the data and considering the impact of topography and other factors,the forecast error caused by the terrain influence can be further corrected on the basis of the CNLR method,thereby obtaining a more accurate probabilistic forecast of precipitation.

关键词

复杂地形；降水；概率预报；统计后处理

Keywords

complex terrain ； precipitation ； probabilistic forecast ； post-processing

地形与大气之间的相互作用非常复杂，地形对于降水的动力、热力和微物理过程具有重要的影响（钟水新，2020）。不同的地形对于局地中小尺度降水、锋面降水以及台风降水等不同尺度降水的影响方式也不尽相同（王凌梓等，2018）。Smith（1979）指出迎风坡的降水较多，降水量主要取决于山体的大小和降水效率。Hua et al.（2020）则揭示了多尺度地形之间在降水过程中的小尺度地形触发中尺度地形维持的接力作用。在地形复杂的山区，降水可能会引发严重的山洪和地质灾害，因此准确的降水预报对于经济发展和人民生命安全具有至关重要的作用。
数值天气预报在近几十年里得到了长足的发展，但数值预报结果对于地形十分敏感（范广洲和吕世华，1999; 张玲等，2017; 赵滨和张博，2018; 智协飞等，2019），因此降水预报依然是数值模式预报最困难的挑战之一（Novak et al.，2014）。沈玉伟等（2007）在模式中考虑了地形对气流的动力抬升作用，从而改进了模式对复杂地形区域的降水模拟效果。杨婷等（2017）利用数值模式研究了不同地形对降水形态和分布的影响。杨仁勇等（2013）指出地形对模式预报的台风降水具有增幅作用。Tselioudis et al.（2012）研究得出全球气候模式中使用经过平滑处理的地形导致降水比实际的偏少。而对于模式预报使用统计方法进行后处理，已经成为现代化降水预报的重要流程（毕宝贵等，2016）。徐燚等（2019）使用地形降水诊断方程来对台风过程中的地形降水进行订正，显著地改进了大尺度地形区域的强降水。Fang and Kuo（2013）使用概率匹配平均法降低了台湾地区由台风和地形增强引发的强降水的模式预报误差。黄旋旋等（2017）发展了一种利用雷达垂直反射率因子廓线改进复杂地形下台风降雨的雷达定量估测方法，较好地解决了复杂地形区域的强降水低估问题。
随着社会的发展，大众对于降水概率的预报产生了更大的需求。目前的概率预报主要来自集合预报系统。集合发散度定量地描述了降水位置和强度的预报不确定性（Bauer et al.，2015）。但集合预报不能提供降水预报的全概率分布，为了减少系统误差或得到全概率分布，通常采用统计后处理方法进行订正（王姝苏等，2018; 智协飞和黄闻，2019）。有研究提出了降水概率预报校正的Analog法（Hamill et al.，2006，2015）。Sloughter et al.（2007）使用了贝叶斯模式平均法（Bayesian model averaging，BMA）订正了降水的概率预报。Ji et al.（2019）在BMA方法的基础上提出了雨量分级BMA订正方法，有效改进了模式在大量级降水的预报能力。许多学者使用多个不同的模型和方法来对降水量概率分布进行建模，得到了可用于累积降水的完整预测概率分布模型（Scheuerer，2014; Scheuerer and Buermann，2014; Scheuerer and Hamill，2015; Scheuerer et al.，2020）。Schlosser et al.（2019）提出了一种基于回归树和回归森林的框架，这种新的分布回归森林与传统订正方法相比具有更好的订正效果。Stauffer et al.（2016）提出了一种适用于研究复杂地形区域的日降水的气候特征分布的统计模型，结果表明这种模型能很好地表现地形和季节变化对日降水量气候概率分布的影响，并将其拓展运用到集合预报的后处理上（Stauffer et al.，2017）。
中国东南部地区年平均降雨量达1 400~2 000 mm，是中国雨量最丰富的地区之一，同时该地区下垫面条件较为复杂，地形对降水量的分布具有气候影响（庞茂鑫和斯公望，1993）。有研究表明东南沿岸复杂的山地造成的热力环流对对流降雨的触发以及海陆风环流在山地对流雨带组织发展中具有重要作用（赵玉春和王叶红，2020），而目前的数值预报产品在华南地区的降水预报能力仍然有限。杨瑞雯等（2017）使用贝叶斯平均和统计降尺度对中国东南地区降水预报进行了订正，结果表明订正后的预报范围和量级与实况更接近，但对大量级降水订正效果仍然不显著。目前在该区域内针对地形因素的预报订正研究较少，因此本文利用TIGGE资料中欧洲中期天气预报中心1~7 d预报时效的日累计降水集合预报进行试验，考虑地形等因素的影响，讨论标准化的模式后处理方法（Standardized Anomaly Model Output Statistics，SAMOS）对复杂地形的降水概率预报的改进效果，以期能对由于地形带来的数值模式的预报误差进行有效的订正。
1 资料与方法
1.1 资料
1）观测及地形资料。本文所用的观测资料包括中国756个站点的日降水观测数据，时段为1980年1月—2014年6月; 中国2 472个站点的降水实况观测数据，时段为2014年9月—2015年9月; 美国地质勘探局/美国宇航局（USGS/NASA）的SRTM（Shuttle Radar Topography Mission）数字高程模型，空间分辨率为0.01°×0.01°。
2）预报资料。TIGGE资料集中欧洲中期天气预报中心（European Centre for Medium-Range Weather Forecasts，ECMWF）每日00时（世界时，下同）起报的地面累积降水预报，包含50个集合成员的集合预报和1个控制预报，共51个集合成员，时段为2014年9月7日—2015年9月30日，预报时效为24~168 h，间隔24 h，预报的空间范围为（115°~122.5°E，23.5°~30°N）。
1.2 研究方法
1.2.1 左删失的非齐次Logistic回归
Stauffer et al.（2017）最早将左删失的非齐次Logistic回归方法（left-Censored Non-homogeneous Logistic Regression，CNLR）应用于研究复杂地形区域的日降水的气候特征分布。下面简单介绍一下此方法。
假设有一时间序列为N的日降水量观测数据y={y_i}，i=1，2，···，N，和与之对应的包含M个预报成员的集合预报数据x={x^m_i}，i=1，2，···，N，m=1，2，···，M，使用p为对日降水量数据进行幂转换来校正日降水量频率分布的正偏度，使之更符合假定的概率分布。假设经幂转换后降水值 $y_{i}^{1 / p}$ 符合左删失的Logistic分布（本文中采用p=2），删失（Censored）是指在某一阈值以下或以上，或者某一范围之间没有数据，对于有降水产生的情况下，日降水量值应全部为非负的，所以日降水量分布的删失点即为零，可表示为 $y_{i}^{1 / p} \sim L （ μ ， σ ）$ 。由 $y_{i}^{1 / p} \sim L （ μ ， σ ）$ 可知，其形状和位置μ、σ参数决定了 $y_{i}^{1 / p}$ 的概率分布情况，因此对μ和σ进行线性假设:

μ_{i} = β_{0} + β_{1} \cdot \bar{x_{i}^{1 / p}} \cdot (1 - z) + β_{2} \cdot z,

(1)

l o g (σ_{i}) = γ_{0} + γ_{1} \cdot l o g (SD ⟨x_{i}^{1 / p}⟩) \cdot (1 - z)

(2)

其中: $\bar{x_{i}^{1 / p}}$ 是集合预报的平均值; $SD ⟨x_{i}^{1 / p}⟩$ 是集合预报的标准差; 当所有集合预报成员均预报无雨时，z=1，其余情况下取z=0，这种假设允许以不同的方式处理有雨和无雨的情况，同时也解决了 $SD ⟨x_{i}^{1 / p}⟩$ =0时无法取对数问题，同时利用对数变换来保证标准差非负。
通过使用最大似然函数对系数 $\hat{θ}$ =（β₀，β₁，β₂，γ₀，γ₁）进行估计:

\hat{θ} = \underset{θ}{a r g m a x} (\prod_{i = 1}^{N} f (\frac{y_{i}^{1 / p} - μ_{i}}{σ_{i}}));

(3)

f = \{\begin{matrix} Λ (\frac{- μ_{i}}{σ_{i}}), y_{i} = 0; \\ λ (\frac{y_{i}^{1 / p} - μ_{i}}{σ_{i}}), y_{i} \neq 0 。 \end{matrix}

(4)

其中:Λ和λ分别表示标准Logistic分布的概率密度函数（Probability Density Function，PDF）和累积分布函数（Cumulative Distribution Function，CDF）。
1.2.2 标准化的模式后处理（SAMOS）
由于不同站点有不同的日降水量的概率分布，CNLR模型扩展到不同站点时，需要重新计算模型参数，这样不仅增加了计算成本，同时也会丢失空间一致性的信息。为了克服这个问题，对使用的数据进行预处理，把各自站点和季节的特征基本上都剔除，再使用预处理后的数据不区分站点统一进行训练建模，这样所有站点只需要一个模型，而不需要为每个站点单独训练模型。
于是，对降水量的观测值 $y_{i}^{1 / p}$ 和预报值 $x_{i}^{1 / p}$ 进行标准化处理使之无量纲化:

y_{i}^{1 / p, *} = \frac{y_{i}^{1 / p} - μ_{i}^{clim, o b s}}{σ_{i}^{clim,obs}},

(5)

x_{i}^{1 / p, *} = \frac{x_{i}^{1 / p} - μ_{i}^{clim, obs}}{σ_{i}^{clim obs}} 。

(6)

CNLR回归参数假设的线性关系（公式（1）和公式（2））替换如下:

μ_{i}^{*} = β_{0} + β_{1} \cdot \bar{x_{i}^{1 / p, *}} \cdot (1 - z) + β_{2} \cdot z,

(7)

l o g (σ_{i}^{*}) = γ_{0} + γ_{1} \cdot l o g (SD ⟨x_{i}^{1 / p, *}⟩) \cdot (1 - z)

(8)

训练得到系数 $\hat{θ}$ =（β₀，β₁，β₂，γ₀，γ₁）后，再进行反标准化即可得到订正后的降水预报的概率分布:

L \sim (μ_{i}^{*} \cdot σ_{i}^{clim,obs} + μ_{i}^{clim, obs}, σ_{i}^{*} \cdot σ_{i}^{clim, obs})

(9)

因此引入形状比例位置广义可加的线性模型（Generalized Additive Models for Location，Scale and Shape，GAMLSS）对转换后的观测日降水量 $y_{i}^{1 / p}$ 的形状和位置参数 μ_clim，obs，σ_clim，obs进行模拟。GAMLSS是单变量分布回归模型，其中可以将假定的因变量的所有分布参数建模为自变量的可加函数，能更好地反映一些随机过程和概率分布状况（Stauffer et al.，2017），对μ_clim，obs和σ_clim，obs分别进行广义可加模型的假设:

\begin{matrix} μ_{i}^{clim obs} = β + s_{1} (h g t) + s_{2} (y d a y, l a t, l o n) + \\ s_{3} (h g t, l a t, l o n), \end{matrix}

(10)

\begin{matrix} l o g (σ_{i}^{clim obs}) = γ + t_{1} (h g t) + t_{2} (y d a y, l a t, l o n) + \\ t_{3} (h g t, l a t, l o n) 。 \end{matrix}

(11)

其中:β是全局截距;（hgt）是海拔高度的影响;（yday，lat，lon）代表经纬度影响受季节周期性变化带来的影响;（hgt，lat，lon）表示海拔高度随经纬度变化的三维空间效应。除了海拔高度影响使用薄板样条函数作为平滑函数外，其他所有平滑项都使用张量平滑函数来表示多个自变量的相互作用带来的影响。这样得到的模型理论上可以用于空间任何一点，即只依赖于数字高程模型的分辨率精度。
1.3 评估方法
1.3.1 平均绝对误差（Mean Absolute Error，MAE）

MAE = \frac{1}{N} \sum_{i = 1}^{N} |f_{i} - o_{i}|

(12)

其中:N是参与预报的站点数; f_i是第i个站点的模式预报值; o_i是第i个格点的观测值。
1.3.2 连续分级概率评分（Continuous Ranked Probability Score，CRPS）

C R P S = \frac{1}{N} \sum_{i = 1}^{N} \int_{0}^{\infty} {(f (y_{i}) - H (y_{i} - o_{i}))}^{2} d x

(13)

其中:N是参与预报的站点数; y_i是原始的预报值; f是预报的CDF函数; H是Heaviside跃阶函数，y_i-o_i＜0时，H（y_i-o_i）=0，其他H（y_i-o_i）=1（Stauffer et al.，2017）。
1.3.3 布莱尔评分（Brier Score，BS）

B S = \frac{1}{N} \sum_{t = 1}^{N} {(p_{t} - y_{t})}^{2}

(14)

其中:p_t表示预报某一事件发生的概率; y_t为一个二元函数，如该事件观测是发生，y_t为1，未发生为0。
1.3.4 布莱尔技巧评分（Brier Skill Score，BSS）

B S = \frac{1}{N} \sum_{t = 1}^{N} {(p_{t} - y_{t})}^{2} 。

(15)

其中:F_cal表示订正后的BS评分值; F_raw表示原始预报的BS评分值（Friedli et al.，2021）。
2 结果分析
本研究选取的中国东南部地区的（115°~122.5°E，23.5°~30.0°N。）的地形如图1所示。相比于实际地形分布（图1a），ECMWF集合预报系统使用的地形数据（图1b，分辨率0.5°×0.5°）只能显示出主要地形的东北-西南的走势，地形较为平滑，不能刻画精细的地形分布。本文将1980年1月—2014年6月中国756个站点逐日降水量观测数据作为数据集1，研究区域内包含41个站点，连续观测时间段较长，因此用来模拟该区域内的日降水的气候概率分布。将2014年9月—2015年9月中国2 472个站点的逐日降水实况观测数据作为数据集2，区域内包含188个站点，可用于检验的站点数较多，因此作为预报的训练及验证数据; 两个数据集站点的分布情况如图1所示。在对模式预报的结果进行订正时，使用2014年9月7日—4月31日长度为235 d的数据作为训练的窗口期，对2015年5月1日—9月31日共5个月的24~168 h预报时效的逐24 h累积降水量集合预报结果进行订正并检验。本文对四种预报结果进行了对比试验，来研究CNLR和SAMOS方法对中国东南部地区降水预报的订正效果。四种预报结果分别是:1）原始的ECMWF集合预报（RAW）; 2）为数据集中的188个站点分别单独计算了各自的CNLR模型参数（STN）; 3）为数据集中的188个站点不区分站点统一训练得到的CNLR模型参数（REG）; 4）对所有站点的训练数据使用SAMOS预处理后再统一训练得到的概率预报（SAMOS）。
首先对验证期2015年5—9月的原始ECMWF集合预报的预报误差进行分析（图2）。图2a为预报验证期各站点的预报MAE和模式地形与实际地形高度差的绝对值的散点图，并对其做简单线性回归，可以发现，模式预报的MAE和模式地形与实际地形高度差的绝对值存在一定的关联，模式地形与实际地形高度差的绝对值越大，模式预报的MAE越大，这表明模式地形与实际地形的偏差，在一定程度上会影响模式的预报，偏差越大，预报技巧越低。图2b为在该时段内各站点的观测值与模式预报值的平均差值的分布，并用不同的形状表示不同的模式地形高度差区间的站点。可以看到，研究区域内多数站点与模式的地形误差绝对值在200 m以内，这些站点主要分布在山脉、丘陵等起伏地形的两侧，而较为复杂的地形区域也是模式地形误差较大的区域。93.1%的站点的观测值与模式预报之差的平均值为负值，即这些站点实际观测的降水值平均小于模式预报的降水值，模式预报存在正偏差，模式会过度预报降水的发生及数值; 同时可以看到地形高度误差越大的站点，总体模式预报的正偏差要大于地形高度误差较少的区域。
对模式的预报结果进行订正，首先要通过数据集1的观测值，使用GAMLSS计算研究区域内降水的气候概率分布。假设模型（公式（10）和公式（11））的参数通过拟合得到后，就可以计算研究区域内任一日任一点的日降水量的气候概率，即使该站点不存在历史的观测记录。对训练好的模型，使用USGS/NASA的SRTM数字高程模型，随机选取7月11日，即一年中第192天，来研究该模型对研究区域的日降水量的气候概率分布参数值的模拟结果。如图3所示，可以看到分布参数μ_clim，obs（图3a）和σ_clim，obs（图3b）都受到海拔高度的影响，展示出明显的山谷和山脊的地形分布特征，这与实际的地形分布（图1a）状况一致，说明海拔高度对降水量的气候分布具有重要的影响。而山脊的μ_clim，obs明显高于山谷和平原地区，而山脊的σ_clim，obs反而较小，这说明在山地地区日降水的概率期望相对于平原地区更大，并且降水量的频率分布更集中。同时发现，除了地形变化的影响，分布参数μ_clim，obs和σ_clim，obs都具有明显的从西北向东南变化的趋势，即经纬度变化的影响，随着经纬度的增加，μ_clim，obs和σ_clim，obs也随着增加，说明海陆分布等地理因素也影响降水量的气候分布。
图1 实际地形（a）和ECMWF模式中的地形（b）以及数据集1的41个站点（白色）数据集2（黑色）的188个站点的分布
Fig.1 (a) The actual topography, and (b) the topography in the ECMWF model (The 41 stations of Dataset 1 are shown with white dots, and the 188 stations of Dataset 2 are shown with black dots)
图2 各个站点的预报MAE和模式地形与实际地形高度差的绝对值的散点图，红色实线表示线性回归拟合曲线（a）; 观测值与模式预报值之差的空间分布（b; 单位:m）
Fig.2 (a) Scatter plot of the prediction's MAE and the absolute value of the difference between the model terrain and the actual terrain of each station.The red line represents the linear regression fitting curve. (b) The difference (in meters) between the observation and the model's forecast
由上述分析可得该降水概率气候分布模型能够模拟出地形等因素对降水概率分布的影响，因此使用该模型对数据集2中的188个站点的降水气候概率分布进行模拟，并使用模拟结果对数据进行预处理，来评估SAMOS方法对于预报的订正效果。图4是1~7 d预报时效下三种订正方案对于原始预报改进程度的比较，并且取概率分布的中位数值作为确定性预报。可以看到三种订正方案在各个预报时效的平均CRPS和MAE相比于原始集合预报都有显著的减小，24 h预报改进最为明显。除了24 h和72 h预报时效外，REG方法的CRPS评分都要比STN方法好。而在各个预报时效下，SAMOS方法的CRPS评分和MAE都是最优的。在具有相同长度的训练样本下，SAMOS方法能在REG方法的基础上进一步改进预报效果，随着预报时效的增加，SAMOS方法相对于REG方法的改进效果也逐渐减小，到168 h改进程度几乎为零。可见在训练前对数据使用标准化的预处理，以及考虑加入地形等因素的影响后，可以进一步改进预报技巧。
图3 模拟得到的7月11日降水气候概率参数μ_clim，obs（a）和σ_clim，obs（b）的空间分布
Fig.3 The spatial distribution of parameters (a) μ_{clim, obsand} (b) σ_{clim, obs} of the simulated precipitation probability on July 11
图4 1~7 d预报时效下三种订正方案与原始预报的预报误差:（a）CRPS;（b）MAE
Fig.4 The forecast errors of three calibration methods and the raw forecast with lead time from 24 h to 168 h: (a) CRPS; (b) MAE
由以上分析可知，SAMOS订正方法在所有预报时效均表现出更好的订正效果。进一步分析在24 h和96 h预报时效SAMOS订正方法相对于REG订正方法对于不同站点的CRPS的改进程度。如图5所示，无论对24 h预报还是对96 h预报，SAMOS方法相对于REG方法，对大多数站点都显示出了明显的正技巧，尤其在浙江南部及沿海地区改进效果最为明显。对于24 h预报，183个站点中有172个站点为正改进，效果最好的站点相比于REG方法订正效果CRPS评分减小了10.51%。随着预报时效的增加，对于96 h预报，SAMOS方法的改进程度下降，183个站点中仅有128个站点有改进，改进效果最好的站点相比于REG方法订正效果CRPS评分能减小6.79%。相对平原地区对降水预报的改进效果仍然为正技巧，而在丘陵地区有些站点改进不明显，甚至变差。
图5 24 h预报时效（a）和96 h预报时效（b）下SAMOS订正方法对于REG方法的CRPS评分提高百分比分布
Fig.5 The percentage increase of the CRPS of the raw forecast by the SAMOS method for the (a) 24-hour forecast and (b) the 96-hour forecast
进一步研究分析72 h和96 h预报时效下，SAMOS方法对于不同模式地形误差的站点预报改进效果。如图6所示，分别为两个预报时效下，对于模式地形高度差小于100、100~200、200~300、大于300 m四个区间内的站点，使用三种订正方法后相对于原始预报的CRPS评分的平均改进程度。可以看到在两个预报时效下，STN订正方法在地形误差小于100 m的站点中订正能力要比REG订正方法好，但随着地形误差的增大，REG方法的订正技巧要比STN方法更高，而SAMOS订正方法在各个高度差区间内的改进效果都是最好的。对于高度差大于300 m的站点，SAMOS订正方法的改进更为明显，尤其是72 h预报时效下，SAMOS方法能比STN方法相对于原始预报技巧多提升2.53%，是STN方法相对于原始预报提升程度的近2倍，在两个预报时效下SAMOS方法的订正技巧显示出随着地形误差增大改进程度变小的趋势，在96 h预报时效下趋势更加明显。
图7是不同降水阈值下，三种订正方法相对于原始预报的不同时效的BS技巧评分。可以看到不同的降水阈值，随着预报时效的增加，都显示相对于原始集合预报BSS评分逐渐降低，对于预报结果的改进逐渐减小。而三种方法对于原始预报在大于0.1 mm降水，即有无降水的晴雨的概率预报上，以及大于25 mm降水的订正效果在各个预报时效上都显示出了明显的技巧。而SAMOS方法相对于其他的订正方法则有更加显著的改进，晴雨的24 h概率预报的平均BS评分提高了50%以上，而对于大雨及以上量级的降水概率预报在多数站点得到改进，相比于其余两种订正方法具有更高的BSS评分。对于大于5 mm降水和大于10 mm降水的BSS评分，三种订正方法相对于原始集合预报都有一定程度的改进，但改进程度不如晴雨预报明显。SAMOS方法相对于其余两种方法，在这两个降水阈值虽然有更好的平均BSS评分，但改进程度不如晴雨和大雨预报。
对于概率预报，除了评估其CRPS、BS以及BSS，还要对其可靠性进行检验评估。图8是24 h预报不同降水阈值的可靠性曲线，图中虚线表示理想的概率预报，即预报事件发生的概率与实际事件发生的概率应该是一致的。可见三种订正方法在不同的阈值上都能有效地改进原始集合预报的可靠性，对晴雨概率预报的改进最为明显，但订正后还是存在空报现象，即预报的频率高于实际发生的频率。对于晴雨的概率预报，STN方法和REG方法的改进程度相当，在其余阈值中，REG方法的表现略好于STN方法。而SAMOS订正方法得到的结果在各个降水阈值上相对于其余两种方法都有改进，但改进程度不同。同样，对小雨和大雨的预报改进效果最好。
图9是ECMWF24h原始集合预报的Talagrand分布和利用SAMOS和REG方法订正后预报的PIT图。Talagrand分布是集合预报的一种重要检验手段，它是用来检验预报值和观测值是否都是来自相同的概率分布（Hamill and Colucci，1997）。Talagrandet al.（1997）认为一个“好”的集合预报系统的标准是每个集合预报成员应该以相同的概率发生，即观测值也应以相同的概率落在它们附近。概率积分变换（Probability Integral Transform，PIT）和Talagrand分布类似，它认为对于观测值y₁，y₂，···y_n，假设模型预测的累积分布函数分别为F₁，F₂，···F_n，如果模型预测准确，则概率积分变换{F_i（ξ_i）}ⁿ_i=1应当服从标准的均匀分布U（0，1）（Gneiting et al.，2007）。如图9所示，对于24 h预报时效，原始的集合预报不能很好地包括降水事件，而144 h预报时效的原始集合预报分布整体呈“L”型，分布大多低于最小集合成员预报值和最大集合成员预报值，集合预报的离散度不够，不能完整地描述大气运动的各种情况，同时小于等级1的占大多数，表明原始集合预报显著高估了实际的降水量，出现明显空报现象。可以看到在不同预报时效下，REG方法和SAMOS方法两种方法订正后的预报相较于原始集合预报都显示了更加合理的概率分布。订正后的预报显示，虽然在CRPS评分上，SAMOS方法显著地改进了原始预报，但其小概率事件预报的可靠性则仍存在一些问题，可以看到订正后的预报的概率分布的可靠性甚至不及原始预报（图8b、c、d），出现预报概率分布的标准差过大，分布过于离散等问题。当然，总体上REG和SAMOS方法订正后的预报的可靠性仍然要优于原始集合预报。
图6 72 h预报时效（a）和96 h预报时效（b）下三种订正方法相对于原始预报对于不同高度差区间下站点的CRPS评分提高百分比分布
Fig.6 The percentage increase of the CRPS of the raw forecast by the three methods in different intervals for the (a) 72-hour forecast and (b) the 96-hour forecast
图7 不同降水阈值下，三种订正方法相对于原始预报的不同预报时效的BSS评分:（a）降水大于0 mm;（b）降水大于5 mm;（c）降水大于10 mm;（d）降水大于25 mm
Fig.7 Under different precipitation thresholds, the BSS scores of the three calibration methods with respect to the raw forecast with a lead time of 24 h to 168 h: (a) precipitation＞0 mm; (b) precipitation＞5 mm; (c) precipitation＞10 mm; (d) precipitation＞25 mm
3 结论和讨论
基于TIGGE资料集下欧洲中期天气预报中心2014年9月—2015年9月中国东南部地区逐日起报的为24~168 h的日降水量预报，使用SAMOS方法将观测和集合预报数据进行标准化预处理，从数据中删除了与位置有关的气候特征，再使用气候的空间分布作为背景信息来为复杂地形上的日降水量创建校正后的全概率预报，对具有复杂地形区域的降水概率预报进行订正，得到以下结论。
图8 不同降水阈值下，三种订正方法和原始预报在24 h预报时效的可靠性曲线:（a）降水大于0 mm;（b）降水大于5 mm;（c）降水大于10 mm;（d）降水大于25 mm
Fig.8 Under different precipitation thresholds, the reliability diagram of the three calibration methods and the raw forecast with a lead time in 24 h: (a) precipitation＞0 mm; (b) precipitation＞5 mm; (c) precipitation＞10 mm; (d) precipitation＞25 mm
图9 24 h（a、b、c）和144 h（d、e、f）预报时效的ECMWF原始集合预报的Talagrand分布（a、d）和使用REG（b、e）和SAMOS（c、f）订正方法对预报进行订正后的PIT（虚线表示理想情况下呈现均匀分布的集合预报）
Fig.9 (a, d) Rank histograms of the RAW ensemble, (b, e) PIT histograms of the REG forecasts, and (c, f) the SAMOS forecasts, with lead times of 24 h (top panel) and 144 h (bottom panel) .The dashed lines in the figures represent the ideal Talagrand distribution of the ensemble forecasts
1）假设日降水量的分布符合左删失的Logistic分布，使用非齐次的逻辑回归对原始集合预报进行订正后，结果显示三种基于CNLR的订正方法在各个预报时效下都能有效地改进预报结果。使用CNLR对集合预报结果进行订正，不仅提供完整的降水概率分布，还能保留集合预报的不确定信息，对于晴雨和大雨预报的订正效果要优于小雨和中雨预报的订正效果。
2）使用GAMLSS模型对日降水的气候概率分布进行拟合，结果表明该模型能较好地反映地形高度和经纬度变化对于日降水量气候分布的影响，使用该模型模拟的结果对数据进行预处理后，能在增加训练样本，不损失空间一致性的情况下保留站点各自的气候特征，从而进一步提升预报技巧，并且SAMOS订正方法在模式地形高度误差较大的站点的订正效果较模式地形误差较小的站点的订正效果更加明显。
综上所述，SAMOS方法在复杂地形条件下，尤其是模式地形误差较大的区域对降水概率预报能取得更好的订正效果，优于不考虑地形影响的订正方法，对降水确定性预报和概率预报都有明显改进。但SAMOS方法只是对数据增加预处理程序，该预处理程序能否在其他订正方法中更好地改进复杂地形地区的降水预报，有待进一步研究。
参考文献

基本信息

DOI: 10.13878/j.cnki.dqkxxb.20210128001

基金信息

国家自然科学基金资助项目(42275164)；

引用信息

智协飞,霍自强,2023.中国东南地区复杂地形下降水概率预报的订正研究[J].大气科学学报,46(2):230-241.

Zhi X F,Huo Z Q,2023.Calibration of the probabilistic forecast of precipitation over complex terrain in Southeast China[J].Trans Atmos Sci,46(2):230-241.

稿件历史

收稿日期: 2021-01-28

参考文献

地址：江苏南京宁六路219号南京信息工程大学邮编：210044

联系电话：025-58731158 E-mail：xbbjb@nuist.edu.cn QQ交流群号：344646895

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。

中国东南地区复杂地形下降水概率预报的订正研究

Calibration of the probabilistic forecast of precipitation over complex terrain in Southeast China

摘要

Abstract

关键词

Keywords

1 资料与方法

1.1 资料

1.2 研究方法

1.2.1 左删失的非齐次Logistic回归

(1)

(2)

(3)

(4)

1.2.2 标准化的模式后处理（SAMOS）

(5)

(6)

(7)

(8)

(9)

(10)

(11)

1.3 评估方法

1.3.1 平均绝对误差（Mean Absolute Error，MAE）

(12)

1.3.2 连续分级概率评分（Continuous Ranked Probability Score，CRPS）

(13)

1.3.3 布莱尔评分（Brier Score，BS）

(14)

1.3.4 布莱尔技巧评分（Brier Skill Score，BSS）

(15)

2 结果分析

3 结论和讨论

参考文献

基本信息

基金信息

引用信息

稿件历史

参考文献