再分析基于一个固定的数值天气预报系统,以后报(以过去的某个时间为起点进行预报)而不是预报(以现在为起点预报未来)的方式运行,并同化提供给它的观测数据。它以符合模式物理的方式综合了所有观测结果。再分析提供了完整的空间和时间覆盖,对数据空白区域进行物理而非统计插值,并提供了关于未观测变量的估计。在这个意义上,再分析补充了历史观测数据集,有时被称为“没有缝隙的地图”。再分析通常是全球性的,也可以是区域性的,在小时尺度上变量之间具有物理一致性。再分析过程还可以提供关于所同化观测数据的质量信息,包括对一些观测系统的偏差和关键缺陷的估计。
再分析是最常用的数据集之一。再分析将可用的历史观测和不断增长的计算能力结合起来,并利用最新的科学进展(包括数学、物理学和信息科学与技术),将所有这些融合在一起。仅靠现场观测无法有效地开展气候研究,因为观测站点太稀疏且分布不规则。卫星遥感具有更好的覆盖范围,但受到其他限制,特别是时间和空间不均一性。再分析使我们能够将当前天气事件置于气候背景中,并使我们能够重温过去,即便在直接观测稀少的地区,也可以监测地球气候。
1 再分析的基本概念和早期历史
再分析的概念可以追溯至早期人工天气预报中的天气图分析。天气图分析是指利用稀疏台站观测构建全球或区域天气图以推断大气的当前状态,它是人工天气预报的基础。直到20世纪中叶,天气图分析都是主观的,依赖气象学家在确定气压、温度、风向和风速以及其他气象特征方面的经验。进入数值天气预报时代,出现了被称为数据同化的客观方法,使世界各地的气象中心能够每天例行生成数千张天气图。数据同化通过使用数值天气预报模式生成的短期预报获得该状态的先验估计(即背景值或初猜场),并结合从气象站、船舶、浮标、气球、无线电探空仪、飞机、卫星和其他测量平台获取的观测数据,对特定时间的大气状态进行分析(通过加权平均获得最优估计),即分析值(
Compo et al.,2011)。资料同化是当今数值天气预报业务的重要组成部分,不仅可以分析当前的情况,还可以作为下一个数值预报周期的起点; 同化系统提供了一个完整的网格状态估计,为所有网格点的所有数值天气预报模式变量提供初始条件(
Parker,2016)。
数据同化方法的进步显著提升了数值天气预报的准确性。尽管这些现代天气学分析对生成准确的实时预报至关重要,但由于数据同化方法以及数值天气预报模式频繁变化导致产生不均一性,所以这些现代天气学分析在气候研究中的作用受到限制。因此,提出了再分析的概念,其核心是使用固定的数据同化系统和数值天气预报模式对历史数据进行重新计算,并进行天气学分析,以生产时空完整的长时间序列供科学界和公众使用(
Compo et al.,2011)。
作为全球大气研究计划的一部分,欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts,ECMWF)和美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)的地球物理流体动力学实验室(Geophysical Fluid Dynamics Laboratory,GFDL)使用了开创性的数据同化系统,为1979年的协调研究年制作再分析场。这一开创性的成果奠定了现代全球大气再分析的基础。这些系统同化了再分析时可用的所有观测,基于固定的数值天气预报系统,以符合模式物理的方式融合所有观测结果,提供了完整的空间和时间覆盖,对数据空白区域进行物理而非仅统计插值,同时可以对未观测变量进行估计。
再分析依赖模式来解释、关联和整合不同来源的观测结果。数据同化包括一系列分析步骤,其中短时间(通常为6 h)的背景信息与该时间段的观测结果相结合,以生成特定时间段的大气状态估计。生成再分析所必需的背景信息来自序列中最近的短期预报。以各自的误差估计值为权重将观测值和模式预报相结合。在变分同化中,它通过最小化分析值与观测值和背景值的差值的加权平均来实现,权重与模拟和观测的不确定性有关。背景预报在时间上向前推进,并在空间上传播来自早期同化周期中使用的观测信息。由此产生的初始状态序列提供了基于可用观测的大气状态演变记录。
再分析数据质量与基础模式、数据同化方案和观测数据质量密切相关。观测问题包括:一些区域缺乏基本观测、观测系统随时间的变化(例如空间覆盖率变化、新卫星数据的引入)以及基本观测或边界条件的误差,这些误差可能随时间变化。稀疏或不一致观测的同化可能导致质量或能量的不守恒。尽管用来生产再分析的数值预报模式和数据同化算法是固定不变的,但观测系统发生了明显变化。全球观测系统的主要变化有:从20世纪40年代到1957年国际地球物理年的“早期”时期,当时建立了第一次探空观测; 1958—1978年的“现代探空网络”的逐渐建立,探空数据成为全球大气再分析的观测基础支柱; 1979年至今的现代卫星时代,卫星观测成为全球大气同化的主要数据来源。这就是为什么大部分全输入再分析系统开始的年份为1979年,而最新一代的全输入再分析仅能将历史数据延伸到20世纪40年代。
为降低观测系统演变对再分析数据均一性的影响,也为了把再分析数据扩展到100年以上,有人提出了20世纪再分析的概念(
Compo et al.,2011)。这一类再分析一般仅同化地面气压(包括陆地和海洋)和海洋风观测,不同化高空常规观测和卫星观测。因为所同化的数据有限,20世纪再分析很难做到最优估计,特别是在卫星时代,其数据的可靠性严重依赖所使用的模式以及数据同化算法。
预报模式在数据同化过程中起着至关重要的作用。通过使用物理方程,模式能够以有物理意义的方式将信息从局地已观测的变量外推到未观测的变量,并且还可以及时将这些信息向前推进。预报模式的技巧和准确性决定了同化信息能够保留的程度; 更高质量的预报意味着,随着时间的推移,只需要进行更小的调整即可保持与观测结果的一致性。此外,在进行预报时,模式会估计各种未同化的变量,如降水量、湍流通量、辐射、云特性及土壤湿度等。即使没有直接观测,这些变量也会受到用于初始化预报的观测结果的约束(
Dee et al.,2011)。
目前可用于再分析的观测数据收集整理和同化算法的研发,都是在资源充足的情况下,在国家数值天气预报中心进行的。这些中心主要关注近实时的天气和气候预报业务,而非利用历史观测来重建气候记录,因此再分析不是它们的研究重点,发展缺乏相应的优先权(
Buizza et al.,2018)。
2 全输入全球大气再分析
2.1 美国NOAA系列再分析
第一个全球大气再分析是美国国家环境预报中心(National Centers for Environmental Prediction,NCEP)和国家大气研究中心(National Center for Atmospheric Research,NCAR)合作开展的一个项目,被称为NCEP-R1再分析,目标是生产50 a以上全球大气场的回溯分析记录以支持气候变化研究(
Kalnay et al.,1996)。NCEP-R1数据可以追溯到1957年,目前仍然保持近实时更新(
表1)。这项工作包括整理陆面、船舶、雷达、探空、飞机、卫星和其他数据,对这些数据进行质量控制,并利用在再分析期间保持不变的数据同化系统进行同化。其大气模式为TL62全球谱模式(水平分辨率为2.5°×2.5°),垂直分28层。该模式在边界层内有5层,在100 hPa以上约有7层。模式最低层距离地表约5 hPa,模式最高层在3 hPa。使用三维变分方法进行数据同化。
表1主要完全输入全球大气再分析
Table1Global atmospheric reanalysis with complete input
再分析过程不仅可以把观测和模式融合,给出时空完整的估计值,还可以对观测数据进行质量控制和检查。这里以NCEP-R1对探空数据的质量控制为例进行说明。首先检查观测值和该观测的期望值之间的差,然后进行静力气压检查、6 h预报增量检查、水平插值检查和垂直插值检查等。在再分析时还提供了进行时间插值检查的可能性。统计数据显示,此检查具有与增量检查相当的价值。结果发现大约7%的探空观测结果有至少一个错误。在标准等压面高度和温度的静力检查中,有75%的数据得到了可靠的校正,同时有60%的数据通过基准检查所检测到的误差也得到了校正(
Kalnay et al.,1996)。
NCEP-R2使用了新的预报模式和数据同化系统,并修复了模式中人为错误,特别是数据质量控制和预处理部分(
Kanamitsu et al.,2002)。改进预报系统主要是为了在陆面进行简单的降雨同化以改善土壤湿度估计,降雨同化即使用地基雨量计观测和卫星日平均降水5 d合成产品来约束土壤含水量,这一同化方法使得模式在陆面参数和陆地-海洋通量方面有了显著的改进。虽然NCEP-R2相比NCEP-R1更好,但它不应该被视为下一代的再分析。NCEP-R1与NCEP-R2具有相同空间分辨率,NCEP-R1数据覆盖了1948年至今,而NCEP-R2仅覆盖了1979年至今。
CFSR是美国第二代再分析产品,是第一个基于大气、陆面、海洋和海冰耦合模式的全球大气再分析(
Saha et al.,2010)。它的数据同化方案是弱耦合的,因为它只使用耦合模式来生成每个分析周期的背景值。分析本身是不耦合的,即对每个耦合模块以单独和独立的步骤执行。另一个重要特征是,它利用外部数据集对海面温度、海冰浓度、雪深和降水量进行先验估计,以约束模式漂移。大气模式水平分辨率约为38 km(TL382谱模式),垂直分64层; 海洋模式在赤道处水平分辨率为0.25°×0.25°,热带以外区域为0.5°×0.5°,垂直分64层; 陆面模式有4层,海冰模式有3层。大气模式包含观测到的二氧化碳(CO
2)变化。相对于上一代NCEP再分析,CFSR有明显改进,包括改进的模式、更高的分辨率、更先进的数据同化方案、大气-陆面-海洋-海冰耦合、直接同化卫星辐射观测而不是反演结果。
CFSR的第二个版本(CFSv2)于2011年3月投入运行(
Saha et al.,2014)。该版本对数据同化和预报模式都进行了升级,着重于季节和次季节预报能力的提高,其数据从2011年以来一直延续到现在。全球陆地2 m气温预报有了显著改善,这主要是通过增加模式中规定的温室气体含量。1998年后,由于引入了改进的TIROS业务垂直探测器(AMSU)卫星数据,热带海洋初始状态显示出变暖。在此之前,该地区的海面温度过于寒冷,因此系统误差校正是一个挑战。但北半球陆地夏季平均降水量从每日3.2 mm(CFSR)减少到每日2.7 mm(CFSv2),这给蒸发、径流和地表气温的预报带来了实际问题。
美国宇航局现代研究与应用回顾性分析(modern-era retrospective analysis for research and applications,MERRA)数据集于2009年发布(
Rienecker et al.,2011)。它基于2008年的GEOS-5大气数据同化系统。MERRA数据跨度为1979年至2016年2月,水平格点为0.5°×0.66°,垂直分72层。其主要目标是将美国宇航局地球观测系统卫星观测纳入气候背景,改进前几代再分析中的水循环。由于同化模式以及模式如何与同化数据相互作用的差异,现有再分析在降水量和地表通量等约束较差的量方面仍存在显著误差。这些误差是再分析产品不确定度的重要衡量标准。观测到的系统变化往往通过突然变化或不连续性在再分析时间序列中表现出来,可能会加剧这种误差。因此,必须将观测系统变化产生的这些影响与真实的气候变化区分开来,这可能是下一代再分析面临的最大挑战。
MERRA第二个版本(MERRA-2)是美国宇航局对现代卫星时代进行的最新大气再分析,提供了1980年至今的数据,并取代了MERRA(
Gelaro et al.,2017)。MERRA-2能够同化现代高光谱和微波辐射观测,以及无线电掩星数据,还使用了美国宇航局从2004年末开始的臭氧剖面观测。MERRA-2减少了与观测系统变化相关的一些虚假趋势和跳变,以及减少了水循环方面的偏差和不平衡。MERRA-2的大气模式使用有限体积动力核心,水平离散化使用近似分辨率为0.5°×0.625°的球体,并设有从地表到0.01 hPa的72个垂直大气层。使用三维变分同化方法,更新周期为6 h。
MERRA-2是第一个同化了卫星气溶胶反演(550 nm处气溶胶光学厚度)的全球大气再分析(
Gelaro et al.,2017),目前也是唯一一个能够生产1979年以来全球气溶胶光学厚度的全球大气再分析。气溶胶光学厚度观测数据来源包括:1979—2002年海洋上NOAA AVHRR(甚高分辨率辐射计)的反射率,Terra(2000年至今)和Aqua(2002年至今)MODIS(中分辨率成像光谱仪)的全球地表反射率(亮地表除外),亮地表(沙漠等)的MISR(多角度成像光谱辐射计)的反射率,以及AERONET地基观测网络的气溶胶光学厚度观测。陆地上2000年以前的气溶胶光学厚度来自大气化学模式的模拟,它模拟了5种外部混合气溶胶,包括沙尘、海盐、炭黑、有机碳和硫酸盐。该模式将这5种气溶胶的三维质量混合作为预报气溶胶示踪剂。MERRA-2仅同化了气溶胶光学厚度,并没有同化分布、气溶胶垂直形态和吸收性等特性。
2.2 欧洲中期天气预报中心再分析
欧洲中期天气预报中心于1979年开始开展业务活动。自那时起,该中心的分析和预测档案已成为研究的重要数据来源。欧洲中期天气预报中心的第一个再分析项目,使用最优插值方法生产了1979—1993年期间同化数据集(ERA-15)。该项目始于1993年2月。第一阶段的工作采集和准备了观测值和强迫场。最终的生产系统于1994年固定,随后在1995年和1996年前9个月进行了持续的生产、监测和验证。
ERA-40是欧洲中期天气预报中心进行的第二代全球大气再分析,其目标是在不断变化的观测系统和当时可用计算资源的情况下,产生最好的再分析数据集(
Uppala et al.,2005)。ERA-40系统的大气模式为全球TL159谱模式,水平分辨率约为125 km,垂直分60层,模式最高层位于0.1 hPa,使用三维变分数据同化方法生产了1957—2002年全球地表和大气再分析数据集(
表1)。在此期间,无线电探空仪测量的准确性有所提高,但时间和空间覆盖率有所下降。1967年以前,许多国家的气象数据存在缺失或收集范围有限的问题。通过ERA-40的模拟结果发现,卫星时代以前南半球天气阻塞频率比卫星时代明显较低。虽然这可能代表了气候系统的真实变化,但也很有可能再分析未能捕捉到卫星时代以前南半球大气阻塞的真实情况,这一现象与风暴路径及其热量和水分输送的表现有关。
ERA-40模式系统中没有包括气溶胶趋势或年际变化(例如火山喷发产生的气溶胶),其辐射方案未考虑辐射和臭氧变化之间的相互作用。模式的地表覆盖特征也没有随时间变化。该系统没有施加任何总体水平衡限制。并且,施加在分析场上的动力平衡,无法确保(由非绝热加热和小尺度波浪破碎所驱动的)大气环流的长期平衡。ERA-40产品中诊断出的两个最严重的问题是:热带海洋降水过多,以及布鲁尔-多布森环流过强。云的辐射特性没有得到很好的模拟,导致有云情况下辐射平衡较差。特别是,大气顶部的净冷却不平衡约为7 W·m
-2,这很可能是由于模式中卷云的反射率过高造成的。这一不平衡在南半球尤为突出,但在引入卫星数据后明显变好。在卫星出现之前的几年中,北半球可利用海洋气象船的无线电探空仪数据,因此ERA-40对辐射平衡分析在北半球的表现优于南半球。此外,造成这一差异的另一个更为普遍的原因是,北半球大陆地区无线电探空数据的覆盖范围更广泛(
Uppala et al.,2005)。
后来又推出了ERA-Interim来解决ERA-40遇到的数据同化问题,特别是关于卫星数据同化的问题(
Dee et al.,2011)。ERA-Interim使用四维变分同化方法,它使用预报模式来约束每个分析窗口内的状态演变。它还更新了一组参数估计,这些参数估计定义了大多数基于卫星辐射观测所需的偏差校正。使用四维变分同化进行大气分析是在ERA-40基础上向前迈出的重要一步。四维变分同化可以更有效地使用观测,例如,提取关于质量场趋势的信息。四维变分同化的一个关键特征是使用预报模式约束分析所产生的观测结果的相关影响。数据同化系统利用模式方程中隐含的物理信息的能力是非常有益的,尤其是在观测稀疏的情况下。ERA-Interim大气模式的时间步长为30 min,水平分辨率约为79 km(TL255),垂直分60层,大气顶部位于0.1 hPa。陆面模式中土壤有4层,地表覆盖类型不随时间变化。ERA-Interim包含1979—2018年三维气象变量的6 h网格估计值以及大量地表参数和其他二维场的3 h估计值。
ERA-Interim采用顺序数据同化方案,使用12 h分析周期。在每个周期中,将可用的观测结果与预报模式的模拟相结合,以估计全球大气及其下表面的演变状态。这包括计算基本高空大气场(温度、风、湿度、臭氧、表面气压)的变分分析(
Dee et al.,2011)。与ERA-40一样,ERA-Interim陆地和海洋表面变量的分析是与主要的大气分析分开进行的,分几个步骤进行。首先,最优差值方案将陆地上的天气观测与最新大气分析得出的背景估计相结合,产生6 h的2 m温度和露点温度估计值。随后,通过简单的经验方法,使用2 m温度和湿度的分析增量来更新陆面模式土壤湿度和土壤温度估计值。
对站点观测雪深的分析和卫星的积雪数据(如可用),ERA-Interim利用Cressman插值更新预报模式生成的雪深、雪水当量和雪密度估计值。自2003年7月以来,NOAA日积雪产品一直被用于约束ERA-Interim的积雪分析。这个卫星数据集的空间分辨率为24 km,仅在北半球有数据(
Dee et al.,2011)。最后,在可用的情况下,使用来自星载雷达高度计的波高数据对海浪高度进行最优分析。该分析的背景估计值由预报模式生成,该模式包含一个描述海面二维波谱演变的完全耦合波模式。基于对风浪和涌浪谱贡献的假设,分析的波高用于调整模式预报的波浪谱。海面温度和海冰作为大气模式的边界条件,由观测数据预先确定。
基于其质量控制方案,以下数据始终被ERA-Interim排除在外(即黑名单):陆地上的所有近地表风观测; 高海拔地区的地表气压观测; 模式地面以下的无线电探空观测; 夜间或高海拔地区的近地表相对湿度观测; 极端寒冷条件下的无线电探空仪比湿观测(RS-90探空仪的
T<193 K,RS-80探空仪的
T<213 K,其他探空仪的
T<233 K); 高空无线电探空仪比湿观测(RS-80和RS-90探空仪的
p<100 hPa,所有其他探空仪类型的
p<300 hPa)。高海拔地区通常表示海拔高于1 500 m,但这可能因仪器而异(
Dee et al.,2011)。
2019年,ERA5取代了ERA-Interim再分析(
Hersbach et al.,2020)。ERA5受益于10年来在模式物理、大气动力学和数据同化方面的发展,其大气模式为TL639全球谱模式(水平分辨率约为0.25°或31 km),垂直分137层,大气顶在0.01 hPa(约80 km)。ERA5提供了大气、陆地和海洋气候变量的逐小时估计。除了分辨率的显著提高以及近10年模式发展和数据同化技术进步外,ERA5还提供了更多的输出参数,如增加了逐小时输出和3 h不确定性信息估计,不确定信息来自10个集合的四维变分同化系统。ERA5的一大改进是使用了21世纪海洋边界数据集和辐射强迫项,这显著改进了其在大气顶能量平衡的模拟精度(
蔡鸿泽和王开存,2022)。ERA5的数据已经回溯至1940年(
Bell et al.,2021)。增强的时间和空间分辨率使得天气系统的演变过程更加详尽,与ERA-Interim相比,ERA5在预报技能上提高了最多一天。例如全球月平均降水量与全球降水气候计划(GPCP)观测数据的相关性从67%提升至77%,对流层的温度、风和湿度的模拟也有所改善。
ERA5还受益于全天空同化算法的持续发展。该方案最初用于微波成像仪,后来成功扩展到微波探测仪。该方法提升了有云和降水条件下大气辐射传输的模拟能力,并优化了线性化的湿物理方案,首次实现了对全天空(晴空和有云条件)微波观测的同化。全天空同化通过改进对湿度变量的分析,改进了对动力场的分析,这得益于四维变分同化能够从湿度、云和雨等示踪剂的运动中提取风信息。该方案纠正了早期同化受降雨影响的辐亮度的问题,从而改善了ERA5全球降水量的估计(
Hersbach et al.,2020)。
ERA5的四维变分数据同化模块整合了200多个卫星仪器或传统观测数据。该模块从海面10 m高度的风(风向、风速)、陆地2 m高度的湿度以及陆地和海洋气压的现场观测中提取信息。风、温度和湿度的高空观测是通过无线电探空仪、探测仪和飞机测量获得的。此外,ERA5使用了自2009年以来美国地区的地基雷达-雨量计融合降雨数据,并综合了许多卫星观测。关于海洋风和陆地土壤湿度的信息来源于星载散射计,而关于海浪高度的信息则来自卫星高度计。
ERA5包涵一个先进的陆地数据同化系统,用于分析地表变量。该系统与大气四维变分同化系统是弱耦合的。第一猜测场由先前的陆地数据同化系统和大气四维变分同化系统生成的短期预报提供。然而,这两个系统独立运行,它们只会对下一次同化产生影响。陆地数据同化系统由以下部分组成:用于分析地面2 m气温、相对湿度以及雪(深度和密度)的二维最优插值; 用于上层1 m土壤的3个土壤水分层的扩展卡尔曼滤波器,以及土壤、冰雪温度的一维最优插值。这些分析仅适用于陆地占比达到50%或更高的区域(包括岛屿)。全球气象观测网络,包括地面气象观测(如地面气压、四维变分同化中的白天2 m相对湿度,以及陆地部分的温度、相对湿度和雪深),还包括机场天气报告(如地面气压),以及海洋自愿观测船的数据(如温度和相对湿度)。ERA5日最高和最低气温是基于逐小时2 m温度分析计算出来的,而日平均气温是日最高和最低气温的算术平均值,与全球历史气候网络(GHCN)的处理方法一致(
Hersbach et al.,2020)。ERA5观测的数据选择规则和质量控制通过涵盖整个再分析期的黑名单进行预定义,采用与ERA-Interim相同的方法。
与ERA-Interim相比,ERA5的另一个优点是其数据延迟仅为5 d,而非2~3 mon。在ERA-Interim中,为了覆盖超过40 a的再分析,需要使用几个不同的海面温度和海冰数据集,这使得这两个领域的数据相当不均一。ERA5进行了统一,因此ERA5中的海面温度和海冰数据比ERA-Interim的更均一。ERA5使用国际第五次耦合模式比较计划(CMIP5)的模式辐射强迫,比ERA-Interim的模拟结果更真实。因此,ERA5对重大火山喷发的响应有所改善。然而,尽管受益于ECMWF10年的研发,与ERA-Interim相比,ERA5在某些方面并没有改善。例如,在约1 500 m以上的山区,雪的深度大得不切实际。这是因为模式将积雪简化为单层雪,而这种单层雪结果没有产生足够的融化现象。同时,由于启动时间很长以及初始化不理想,一些土壤参数,如根区土壤湿度,在一些过渡点显示出不连续性。此外,在ERA5分析中,地表10 m风速每年最多有一到两次出现风速极高的问题; 迄今为止出现的最大风速约为300 m·s-1,其中大多数靠近大地形。在未来的再分析中,需要更好地理解和改进能量平衡的不闭合问题,特别是这一问题随时间的演变,以及加强对全球物质和水平衡的模拟。
2.3 日本再分析
依托日本气象厅(JMA)的数值同化和预报系统,完成了1979—2004年的全球大气再分析,即日本25年再分析(JRA-25)。其大气模式为TL106全球谱模式(水平分辨率约为120 km),垂直分40层,模式大气顶设定在0.4 hPa。JRA-25使用三维变分同化方法,数据同化周期为6 h,生成每6 h的多种物理变量的大气分析和预报场(
Onogi et al.,2007)。
日本气象厅(JMA)第二代日本全球大气再分析被称为JRA-55,其数据覆盖时间段为1957—2022年(
表1)。相较于JRA-25,JRA-55的主要提高在于修正的长波辐射方案、四维变分同化和卫星辐射的变分偏差校正等方面。它还整合了几个新的观测数据集,包括无线电探空仪的温度观测均一化数据集和主要气象卫星中心提供的卫星数据后处理数据集。这些改进使JRA-55产品明显优于JRA-25产品。JRA-55首次将四维变分同化方法应用于再分析,其主要目标是解决以前再分析中发现的问题,并生成一个适用于气候变化研究的综合大气数据集。JRA-55的大气模式为TL319谱模式(水平分辨率约为55 km),垂直分60层,模式大气顶设定在0.1 hPa(
Kobayashi et al.,2015)。
JRA-55的地面气象变量分析,包括2 m气温、2 m相对湿度和10 m风,其分析过程与大气分析分开进行。这些变量用单变量二维最优插值进行分析处理。在JRA-25中,通过将观测结果与分析时的第一猜测场进行比较来估计偏差。而在JRA-55中,将观测结果与实际观测时间的第一猜测场进行比较,并在分析时间应用相应的偏差。地面气象观测变量的分析场不用作预报的初始条件。陆面分析场是通过使用大气模式模拟作为强迫数据,驱动简单生物圈(simple biosphere,SiB)陆面模式离线生成的,这与JRA-25使用的方法一致。大气强迫参数与JRA-25中使用的参数相同,即大气模式最底层气压、温度、湿度、风、降水、向下太阳短波和长波辐射通量以及总云量。大气强迫场在JRA-55中具有3 h的分辨率,而在JRA-25中具有6 h的分辨率。积雪分析每日更新一次。JRA-55基于气象雪深观测,使用二维最优插值每天生成一次雪深分析场,这与JRA-25使用的方法相同。JRA-55使用与JRA-25相同的方案,在0.25°×0.25°(纬度×经度)网格中从卫星微波成像辐射中反演积雪。对于无法获取积雪的时期,则使用1987—2000年的多年月平均值进行替代(
Kobayashi et al.,2015)。
JRA-25和JRA-55均没有考虑气溶胶年际变化,但JRA-55使用了卫星估计的多年平均月气溶胶光学厚度来估计其短波辐射影响。与大多数再分析产品一样,在其使用时应极其谨慎地处理包括降水和蒸发在内的诊断变量(
Kobayashi et al.,2015)。
日本气象厅(JMA)开发了第三代日本全球大气再分析,即日本四分之三世纪再分析(JRA-3Q)(
Kosaka et al.,2024)。JRA-3Q的目标是解决前一版本——日本55 a再分析(JRA-55)中发现的问题,并将历史数据延长到1947年,同时实现实时更新。JRA-3Q基于截至2018年12月的全球谱模式TL479,水平分辨率约为40 km,垂直层次有100层,模式大气顶设定在0.01 hPa。陆面模式SiB有7层土壤和4层积雪。JRA-55面临的主要问题之一是全球能量不平衡,即大气顶部和地表净能量通量过大,而在JRA-3Q中这一问题已经得到显著改善。
JRA-3Q数据同化系统负责执行全球大气分析和全球陆面、雪深和地面观测变量分析的部分任务,每6 h(00、06、12、18时,世界时)进行一次大气及地面观测变量分析和陆面分析,每天18时(世界时)进行雪深分析。JRA-3Q和JRA-55的地面观测变量分析相同,通过使用单变量二维最优插值对2 m气温、相对湿度和10 m风进行分析。地面观测变量的分析与大气分析分开进行,并且不用于后续循环。在JRA-55中,陆面分析场是通过独立于大气模式的陆面模式离线模拟。而JRA-3Q使用在线模式,可以在每个模式时间步长实现大气和陆面过程之间的相互作用,在大气和陆面之间提供更一致的背景场(
Kosaka et al.,2024)。JRA-3Q与ERA5一样实现了陆面与大气的耦合,而它们的上一代产品JRA-55和ERA-Interim的陆面分析均为离线形式,并且不反馈给后续的大气分析。目前只有JRA-3Q及其上一代JRA-55实现了对地面观测变量10 m风速的分析。
除了“较差”的数据外,不适合同化的观测也被排除在外,例如那些远不如背景场准确的观测,空间代表性与背景显著不同的观测,或者无法足够准确地生成背景等效物的观测(
Kosaka et al.,2024)。
2.4 中国再分析
2013年11月,中国气象局启动了全球大气再分析计划,总体目标是建成中国第一代全球大气再分析业务系统,并建成40 a(1979—2018年)全球大气再分析数据集,质量超过国际第二代,在中国区域接近或达到国际第三代大气再分析水平。依托2015年启动的国家气象科技创新重大核心攻关任务“气象资料质量控制及多源数据融合与再分析”和2014年立项的公益性行业(气象)科研专项“全球大气再分析技术研究与数据集研制”,由国家气象信息中心牵头,生产了中国气象局全球大气再分析临时性产品(简称CRA-Interim)。其大气模式为全球谱模式(TL574),时间分辨率为6 h,空间分辨率为34 km,垂直层次有64层,模式层顶设定在0.27 hPa,使用三维变分数据同化方案。2018年2月,生产了10 a全球大气再分析(2007—2016年),通过融合大气再分析和地基观测降水、气温、气压、湿度、风和辐射观测以驱动NOAH陆面模式,生产了一个10 a的CRA Interim/Land数据集(
Liang et al.,2020)。
中国气象局全球大气再分析CRA-40同化了大量再处理的卫星数据和常规观测数据(
Liu et al.,2023),包括来自FY-2C/D/E/G卫星的大气运动矢量(AMV)产品、中国上空的密集常规观测(约120个无线电探空仪和2 400个国家级气象站),以及来自FY-3C的微波湿度计和无线电掩星观测(
表2)。对比分析表明,随着时间的推移,CRA-40对观测的再分析拟合得到改进,特别是对于表面气压的均方根误差,从1979年的1.05 hPa降低到2018年的0.8 hPa,而表面温度的均方根误差从1979年的1.65 K降低到2018年的1.35 K。CRA-40降水格局与GPCP和其他再分析一致。
表2中国全球再分析(CRA-40)同化的常规观测资料(https://data.cma.cn/CRA/)
Table2Conventional observation data of China’s Global Reanalysis (CRA-40) assimilation (https://data.cma.cn/CRA/)
刚开始提出中国再分析时,中国气象局开发的全球预报系统GRAPES-GFS还不成熟,中国气象局的业务预报基于欧洲中期天气预报中心的TL639谱模式(约31 km)以及美国环境预报中心的网格点统计插值(GSI)同化系统。最初的计划是使用TL639+GSI进行CRA-40大气再分析。然而,在项目执行的早期阶段,发现TL639在模式顶部附近表现出明显的温度偏差,这极大地限制了卫星辐射数据的使用。GRAPES-GFS于2016年6月1日开始运行,采用三维变分同化方案,并于2018年7月1日升级为四维变分同化方案。然而,由于GRAPES-GFS的同化系统无法同化来自旧卫星传感器的卫星辐射数据,GRAPES-CFS的相对较低的模式顶部高度(3 km)也限制了卫星辐射的最佳同化。因此,决定使用美国环境预报中心公开可用的全球谱模式(GSM),同时保留GSI作为CRA-40的大气同化系统。
中国再分析CRA-40使用的大气模式GSM-v14,于2017年7月至2019年6月在美国环境预报中心业务运行。在此期间,GSM-v14配置了TL1534谱分辨率(赤道处约13 km的网格间距),但CRA-40将其配置降低为谱分辨率TL574(赤道处约34 km的网格间距),以降低计算成本。在垂直方向上,该模式有64层,模式顶部设置为0.27 hPa(约55 km)。大气数据同化系统为公开的GSI v3.6,由开发试验中心(DTC)于2017年9月发布(https://epic.noaa.gov/)。尽管GSI中有更先进的同化技术,如集合三维变分或集合四维变分,但CRA-40选择使用三维变分是因为其简单性和计算效率,可以在短时间内生产40 a的再分析产品。CRA-40现在近乎实时运行。中国气象局全球再分析的下一个版本将基于中国气象局全球预报系统(CMA-GFS)和四维变分同化技术,并将包括更多的早期卫星辐射数据以改进温度分析,同时也将包括更多FY-3系列卫星的亮温观测。
CRA-40在陆地上只同化了气压的观测数据,而在海洋区域则同化了表面气压、温度、湿度和风的观测数据。建议用户使用CRA-40/Land产品的2 m气温、湿度和10 m风速、降水,因为这些数据是使用最优插值方法融合地面观测值生产的(
Liu et al.,2023)。
2.5 全球大气再分析驱动的陆面再分析
陆面数据同化融合了陆面模式和陆面观测。陆面模式使用基于物理的控制方程和局地尺度过程的参数化,描述地球系统中的生物地球物理、地球化学过程,这些过程决定了局地、区域或全球尺度上的能量、水和碳的状态及交换。陆地观测提供了用于控制陆面过程的关键变量的测量,如土壤湿度和陆面温度。这些观测数据是在特定的观测时间及其代表的空间内获取的。由于大多数观测数据代表特定的时空尺度,观测的代表空间尺度随着观测变量、参数、方法和时间的不同而变化。将原位观测转换为模式网格时可能存在显著的代表性误差,这与观测变量的空间异质性密切相关。类似地,遥感观测到模式网格的转换也可能引入代表性误差。相对于大气数据同化,陆面数据同化的特点包括:1)高度非线性,并与尺度相关和空间相关的状态、通量及参数相结合; 2)模式和观测误差的非高斯性质; 3)与初始值相比,强迫数据的重要性更高; 4)模式预报对参数的高灵敏度。陆面数据同化已被证明在增强对各种地表特征(包括土壤湿度、积雪、蒸散、径流、地下水、灌溉和地表温度)的理解和预报方面取得了成功,特别是在水分和能量循环领域(
Li et al.,2024)。
陆面数据同化通常采用气象强迫离线陆面模式运行,即不与大气模式耦合。驱动陆面模式所需的大气强迫变量包括:地表向下短波辐射、地表向下长波辐射、降水、温度、湿度和风速和气压等。除降水外,大多数强迫变量来自全球大气数据同化系统,未使用该系统降水数据主要是由于其降水存在显著偏差。降水数据来自融合了卫星降水反演和地基观测的多源融合降水产品(
Meng et al.,2012)。
早期,美国宇航局戈达德航天飞行中心(Goddard Space Flight Center,GSFC)和美国国家海洋和大气管理局(NOAA)国家环境预报中心(NCEP)的科学家联合开发了全球陆地数据同化系统(GLDAS)(
表3)。其目的是利用先进的陆面模式和数据同化技术,同化卫星和地面观测数据,以生成地表状态和通量的最佳场。GLDAS的独特之处在于,它是一个非耦合的陆面模拟系统,可驱动多个陆面模式(Noah、CLM、VIC、Mosaic和Catchment),集成大量基于观测的数据,以高分辨率(0.25°)在全球范围内运行,并产生近实时分析(通常在48 h内)(
Rodell et al.,2004)。
表3全球陆面再分析
Table3Global land surface reanalysis
GLDAS使用基于植被的“平铺”方法用于模拟陆面次网格尺度的变化,以1 km的全球植被数据集为基础。土壤和海拔参数基于高分辨率数据集。降水观测数据与来自大气同化系统的向下辐射和气象场被用作强迫数据。采用了两个气象强迫数据集:第一个是由卫星和地面产品以及再分析数据组合而成,另一个是普林斯顿大学对NCEP再分析进行偏差校正的全球气象强迫数据集。GLDAS提供的高质量全球陆面分析场促进了各种水文气象研究和应用。
MERRA-Land相较于MERRA的改进受益于基于GPCP对降水数据的修正,以及对降雨截流公式的修正。根据观测结果评估了MERRA和MERRA-Land分析地表水文场的技能,并与ERA-Interim进行了比较。以美国85个站点的现场观测做参考,MERRA-Land根区土壤水分的技能明显高于MERRA。在将每小时陆面气象场从标准MERRA大气再分析小时输出插值到20 min模式时间步长后,驱动其陆面模式Catchment Land Surface Model离线模拟(
Reichle et al.,2011)。
CFSR首次在全球再分析中使用全球陆地数据同化系统进行地表分析。该系统使用美国宇航局陆地信息系统创建其陆面分析。这是将陆气耦合数据同化系统纳入全球再分析的首次尝试。使用全球观测的积雪和雪深来约束雪变量模拟。然而,由于大气模式模拟降水存在重大偏差,所以陆气耦合预报和同化系统通常会在土壤湿度、土壤温度、积雪、地表能量和水通量方面产生显著的误差和漂移。为了改进陆面模拟,全球观测到的降水量被用作驱动陆面分析,而不是用来自背景大气模式模拟的降水(
Meng et al.,2012)。
ERA-Interim/Land是由ERA-Interim大气再分析和GPCP v2.1(全球降水气候项目)月降水量调整的气象强迫驱动下的陆面模式模拟结果(
表3)。其水平分辨率约为80 km,时间分辨率为3 h。相对于原始ERA-Interim数据集,ERA-Interim/Land对陆面方案进行了一些参数化改进,使其更适合于涉及陆地水资源的气候研究。ERA-Interim/Land提供了土壤湿度和雪水当量的全球综合一致估计(
Balsamo et al.,2015)。
ERA5-Land是由ERA5再分析数据的降尺度气象强迫场驱动的,包括对近地表热力学状态参量的高程校正。ERA5-Land与ERA5共享大多数参数化,与ERA5相比,ERA5-Land的一个主要优势是水平分辨率由31 km提高到全球9 km(
表3)。ERA5-Land在描述水循环方面具有附加价值,特别是在土壤湿度和河流流量的估计上,与现有观测总体上更为一致。ERA5-Land在能量平衡方面相较于ERA5并没有明显提高(
Muñoz-Sabater et al.,2021)。
ERA5-Land气象状态场是从地面以上10 m的ERA5模式最低层获得的,包括空气温度、比湿、风速和地面气压。地表通量包括向下短波辐射和向下长波辐射以及降水量。通过基于三角形网格的线性插值方法,将这些场从大约31 km的ERA5分辨率插值到大约9 km的ERA5-Land分辨率。以往,陆地再分析包括对降水强迫的校正,以解决大气再分析降水场的局限性。然而,ERA5-Land并没有对大气再分析的降水进行校正,主要原因是:1)与以前的大气再分析相比,ERA5降水模拟质量提高; 2)降低了对外部数据的依赖性,这将限制近实时数据的可用性。但是,气温、湿度和气压会根据ERA5和ERA5-Land网格之间的高度差进行校正。这种校正过程包括4个步骤:1)根据插值后的未校正场计算相对湿度; 2)使用源自ERA5低对流层温度垂直剖面的每日环境递减率场,针对海拔差异调整空气温度; 3)根据海拔差和空气温度校正地面气压; 4)假设相对湿度不变,使用校正的温度和压力来计算比湿(
Muñoz-Sabater et al.,2021)。
2.6 全输入大气再分析同化的观测数据
2.6.1 能够同化的观测数据
大气再分析同化的观测主要包括现场观测和卫星遥感(
表4)。现场观测包括气象站的陆表气温、湿度、气压和风观测,商业飞机以及无线电探空仪的温度、风和湿度剖面观测,以及浮标、船舶和钻井平台上的海面温度、相对湿度、气压和风观测,也包括地基全球导航系统接收器的大气柱总水汽反演。卫星观测包括从极地轨道和地球静止轨道卫星搭载的可见光和红外成像仪进行的大气运动矢量观测、无线电掩星、红外高光谱、微波探测仪、成像仪和海面散射计观测等。其中质量高、重要性强的数据,被称为锚定数据。这些锚定数据包括:海面温度、海冰密度和厚度、Argo浮标廓线数据、全球定位系统无线电掩星数据、无线电探空数据、地面气压、散射计测量的风速矢量(海洋)和土壤湿度(陆地)(
Buizza et al.,2018)。
再分析工作基本上依赖对大气、海洋、冰冻圈和地表的观测。观测提供了有关大气和海洋状态的信息,这些信息可以被同化到数值模式中,以便进行再分析。然而,在处理链的其他几个步骤中,也使用了观测结果。它们被用于约束数值模式的边界条件,校准处理过程中使用的统计关系(例如,从卫星数据估算地球物理参数),确定和纠正其他观测的误差,以及评估最终再分析产品。因此,再分析的质量直接取决于基础观测数据的可靠性(
Brönnimann et al.,2018)。
可以被同化的观测类型仅限于能够精确模拟的变量(表4)。数据同化利用模式和观测中不确定性的先验信息进行质量检查,得出偏差调整,并为不同数据分配权重。对于再分析而言,探空观测比地面观测重要得多:在缺乏探空观测的情况下,即使有大量的地面观测,再分析结果也不可靠。预报模式中的运动方程和物理过程用于生成空间完整和物理一致的数据产品。本质上,再分析的目的是通过使用尽可能多的信息,对观测到的大气环流进行全面描述。
表4完全输入全球再分析系统同化的观测数据类别
Table4Categories of observation data fully input into the global reanalysis system for assimilation
近期才开始同化关键但不连续的观测,如云或气溶胶。云对天气和气候预报很关键,缺少云的同化,会对初始化后不久的条件发展产生重大影响,从而大大改变预报的结果。与云相关的观测资料的同化相对滞后,原因包括:1)许多数据同化方法很难处理不连续场;2)可观测的量(例如反射率)与物理模拟的云特性没有直接关系;3)模式云表征中的结构误差很大。推进1)和2)的研究对于提高预报精度和减少3)提到的云过程表征中的结构误差至关重要,这些误差是跨尺度天气和气候预报的重要不确定性来源(
Gettelman et al.,2022)。
使用新的观测数据(例如云)的关键挑战之一是观测和模式之间的尺度不匹配。随着模式分辨率的提高,这对连续场(温度和风)来说已经不是一个问题了,但对不连续场(如水凝物)的高度非线性同化问题仍然存在。即使对参数和过程的随机表示增加了分散性,天气预报系统也很难表示由这些非线性过程产生的观测变率。随着模式分辨率和非线性的增加,可能需要重新审视数据同化方法。时间尺度是同化的另一个未被重视的方面。例如,云对气候变化的反应是气候预报的关键不确定因素之一。然而,云的过程发生在快速的时间尺度上,因此用数据同化系统约束云,并进一步应用于气候研究至关重要(
Gettelman et al.,2022)。
2.6.2 数据同化的影响评估
观测数据的同化对预报和再分析精度的影响通常以3种不同的方式进行评估。观测系统实验,也称为数据拒绝实验,用于评估从数值天气预报数据同化系统中删除或添加特定观测子集的效果。这是衡量影响的最直接的方法,本质上是为了证明新的观测类型或新的同化方法适合业务使用。使用业务中心的一系列指标来评估影响,包括对数值天气预报系统短期、中期业务预报技能的影响,并使用观测或数值天气预报分析作为验证预报的“真值”。
使用分析时,它们可以来自同一数值天气预报系统或独立系统; 后者在评估短期预报方面具有优势,因为来自同一数值天气预报系统的分析存在误差,这些误差往往与他们试图验证的预报显著相关。最近,使用另一个非常敏感的指标——“适合背景”,变得很普遍。它能够衡量短期预报与下一批观测值的拟合度,特别是针对与正在测试对象无关的观测(
Eyre et al.,2022)。
另一种用于评估影响的方法是基于预报敏感性的观测影响(forecast sensitivity observation impact,FSOI)方法。该方法衡量观测值(从大型观测子集到单个观测值)在减少短期预报(例如24 h预报)误差方面的作用。它评估在存在所有其他观测值的情况下观测子集的影响,而不衡量从系统中删除此子集的效果。因此,基于预报敏感性的观测影响信息,是对来自观测系统实验的信息和“适合背景”指标的补充。与观测系统实验相比,基于预报敏感性的观测影响相对简单,并且可以从许多数值天气预报系统中以较低的额外成本获得。但是,如果数值天气预报系统假设的观测误差协方差远非其最优值,则可能会给出误导性结果。
观测系统实验方法是评估对数值天气预报影响的“最干净”的方法; 它衡量的是我们真正想要了解的信息。然而,它只能通过现有观测系统提供的观测数据来完成,无法用于估计未来观测系统的影响。为了解决这一问题,使用了两种方法:观测系统仿真实验和数据同化集合。观测系统仿真实验的结果往往是嘈杂的。这是因为,即使是“好的”观测值,加上合理范围内的观测误差,也会在某些地区降低数值天气预报(和后续预报)的质量,主要是发生在那些数值天气预报背景场偶然比观测结果更准确的地区。这反映了数据同化问题中固有的统计性质。经验表明,全球观测系统仿真实验通常需要运行2 mon或更长时间,以便提供具有统计意义的影响估计。此外,给定观测类型的影响越低,预报范围越长,在结果变得具有统计意义之前,必须运行试验的时间就越长。
图1显示了英国气象局基于预报敏感性的方法对观测系统各个部分影响的评估结果。研究发现,卫星微波探测仪和成像仪观测以及高光谱红外辐射观测的贡献最大。此外,大气运动矢量、飞机、探空仪和地面数据也做出了重大贡献。根据这一衡量标准,大约75%的总观测影响来自卫星数据。
图12019年8—10月,基于预报敏感性方法的英国气象局全球数值天气预报系统24 h预报误差中观测系统各部分影响占比评估(单位:%;引自Eyre et al.(2022))
Fig.1Evaluation of the proportion of observation system components in the 24-hour forecast error of the UK Met Office Global Numerical Weather Forecast System based on forecast sensitivity method from August to October 2019 (units:%; cited from Eyre et al. (2022) )
基于预报敏感性的观测影响是衡量不同观测类型相对影响的一种指标,它侧重于(T+24)h的影响。为了获得更广泛直接的结果,可以查看数据拒绝试验的结果。2019年8—11月期间,英国气象局运行了一系列数据拒绝试验。图2显示了一系列预报变量对均方根误差的平均影响。预报根据观测和独立业务分析进行验证。最大的影响来自拒绝卫星红外高光谱和微波辐射、无线电探空仪、飞机观测、无线电掩星和大气运动矢量的试验。然而,所有这些类型对任一验证措施的影响都仅在0.5%到3%的范围内。
2.7 数据同化方法
早期数据同化主要基于最简单的最优插值方法,其直接同化卫星辐射亮温观测的能力受到限制(
Eyre et al.,2020)。首先,最优插值权重方程涉及规模等同于观测值数量的矩阵的逆。因此,最优插值只能使用潜在可用观测的一小部分。当希望同化成千上万的卫星辐射时,这一点尤其受到限制。其次,最优插值基于线性理论,不能轻易地以非线性方式处理与分析变量相关的观测值。变分方法克服了这两个限制。1992年,欧洲中期数值预报中心首次尝试使用一维变分方法直接同化卫星探测仪辐射观测,它充当了辐射和最优插值分析方案之间的中间阶段。与同化温度反演相比,该方法的主要优点是,当测量的辐亮度与预报辐亮度一致时,它不会产生分析增量。1995年,美国国家环境预报中心把一维变分同化发展到三维变分同化; 1997年,欧洲中期数值预报中心首次使用了四维变分同化方法。
尽管直接辐射同化消除了同化反演时遇到的一些困难,但仍有必要确保同化辐射的统计特性与变分方案所做的假设紧密匹配。最重要的3个假设是:同化的辐亮度相对于第一猜测场是无偏的,它们的随机误差可以用高斯分布来描述,并且问题只是弱非线性的。这意味着,当从模式计算的辐射质量不够时,辐射无法被同化。在20世纪90年代后期,这包括云对测量产生辐射影响的所有多云场景。这曾经是,并且在很大程度上仍然是使用红外探测辐射同化的限制因素。这一时期开发了快速辐射传输模型,作为观测算子,提供卫星亮温观测的背景值,实现了微波辐射的全天空同化。此外,还开发了偏差校正方案,以调整辐射观测本身或其观测算子的偏差。事实证明,这对于成功地直接辐射同化至关重要。同时,开发了准确的模型来表示海面的微波发射率。
数据同化为估算地球系统或其组成部分的连续瞬时状态提供了一种基本方法。模式预报将过去观测的信息及时向前传递,以提供状态的背景估计。然后使用最新的观测结果来改进估计。这反过来用于启动数据同化序列中的下一个背景预报,并在需要时进行更长时间范围的预报。除了从过去的观测中获得信息外,背景预报还将这些信息在空间中传播,并从一个变量传播到另一个变量。例如,对一个大气化学变量的观测,可能通过背景预报中变量之间的模拟化学相互作用,来影响未观测变量的值(
Simmons et al.,2016)。
数据同化特别适合整合来自不同精度和覆盖范围的多源观测信息,通过以贴近原始形式的方式同化某些卫星观测。例如,当背景场和其他同化数据能辅助提取观测结果中所包含的地球物理状态信息时,可以特别有效地利用这些观测数据。多种观测类型的联合同化也为估算特定仪器数据中的偏差提供了基础,为卫星仪器的校准活动提供了替代或补充方案。此外,同化过程还能够为观测质量的其他方面提供反馈。例如,当背景场比某类观测更符合另一种观测时,可以揭示该类观测存在的问题。同样,同化过程也能对同化模式的质量进行反馈。因为,当背景能够适配几种类型的观测时,并且其随时间的演变趋势较为一致时,如果出现偏差,往往暗示可能存在模型模拟方面的问题。
图2数据拒绝试验的平均均方根预报误差(a.试验减去观测; b.试验减去ECMWF)的百分比变化(单位:%;每个观测值类型依次被否定,预报与观测结果进行验证; 引自Eyre et al.(2022))
Fig.2The percentage change of mean root mean square prediction error of data rejection experiment (a.experiment minus observation; b.experiment minus ECMWF) (units: %; each observation type is sequentially negated, and the prediction is validated against the observation results; cited from Eyre et al. (2022) )
3 稀疏输入全球大气再分析
直到最近,完全输入再分析的最早时间可以外延至1940年,但这忽略了20世纪许多重要的天气和气候事件,如1930年的沙尘暴。要了解大尺度气候变化趋势和诊断个别历史极端天气事件的影响,需要跨越一个多世纪的历史再分析。为了扩大全球大气再分析的时间范围,美国国家海洋和大气管理局(NOAA)物理科学实验室和科罗拉多大学牵头,在美国能源部的支持下,制作横跨整个20世纪和19世纪大部分时间的再分析数据集,即20世纪再分析(20CR)(
表5)。20CR项目利用当时最先进的数据同化系统,仅同化地面气压观测,使用海面温度和海冰分布观测数据作为边界条件,以估计整个19世纪和20世纪从地面到大气顶部的温度、气压、风速、湿度、太阳辐射和云(
Compo et al.,2011)。
20 CR的主要动机是提供一个具有量化不确定性的数据集,以验证20世纪所有时间尺度的气候模式模拟,重点是逐日天气的统计特性。该项目极大地受益于地球大气环流重建(atmospheric circulation reconstructions over the earth,ACRE)倡议下的国际合作,该倡议承担并促进了全球陆地表面和海洋表面的历史天气仪器观测数据的整理,以支持过去200~250 a的四维天气重建。20CR使用集合卡尔曼滤波数据同化方法,该方法直接估计每3 h全球大气的最可能状态,并估计该分析中的不确定性。该再分析的最新版本(第3版)时间跨度为1836—2015年,水平分辨率约为75 km,输出时间分辨率为3 h(
Slivinski et al.,2019)。
表5主要稀疏输入全球大气再分析
Table5Main sparse input global atmospheric reanalysis
ECMWF20世纪再分析(ERA-20C)是ERA-CLIM项目的第一个再分析产品,该项目提供1900—2010年期间的全球大气数据(
表5)。该再分析的水平分辨率约为125 km。ERA-20C依赖于ECMWF最新版本的综合预报系统(IFS),包括大气环流模式和变分分析方案。ERA-20C同化了表面气压和海洋风观测,通过基于观测的海面温度、海冰覆盖、大气成分变化和太阳强迫分析进行强迫。ERA-20C水循环具有稳定的全球平均降水量减去蒸发量的差值,没有虚假的跃变或趋势。在观测数据丰富的地区,观测资料的同化增加了天气时间尺度的真实性。然而,与夜间船舶观测数据相比,ERA-20C的气温要低约1 K(
Poli et al.,2016)。
相比之下,ERA-20C的水平和垂直分辨率比美国NOAA 20世纪再分析(20CR)更高。同时,在西欧等观测较好的地区,ERA-20C可能比20CR表现更好; 而在南半球中高纬度等观测稀疏的地区,20CR可以更好地利用观测数据,表现可能优于ERA-20C。这两个再分析都没有进行近实时更新,没有同化高空和卫星观测,因此无法提供最佳估计。此外,二者也都受观测覆盖度变化的影响。例如,这两个产品在南半球的变化趋势需谨慎对待。同时,由于20世纪上半叶观测稀疏,这两个产品错过了不少已知热带气旋。此外,二者的大气模式缺少已知的人为强迫因素,比如土地利用和灌溉的变化等。
CERA-20C是20世纪耦合再分析,旨在重建地球系统过去的天气和气候,包括大气、海洋、陆地、海浪和海冰。该再分析是基于ECMWF开发的耦合大气-海洋同化系统。CERA-20C提供了一个由10个成员组成的再分析集合,以解释观测记录中的误差以及模式误差。它充分借鉴了ERA-20C的经验。为了考虑辐射强迫和观测系统的演变,对最初为数值预报开发的动力学模式和数据同化系统进行了修改。为了约束整个世纪观测系统变化的影响,在大气中只使用了常规的地面观测。CERA-20C改进了背景和观测误差规范,这是确保地球物理变量、空间和时间不确定性权重一致的两个关键因素。虽然CERA-20C继承了ERA-20C的一些局限性,例如未能正确表示21世纪上半叶的热带气旋,但与ERA-20C和20CRv2c(由NOAA/CIRES编制的20世纪再分析)相比,它在对流层的表现上取得了显著改善。与之前在ECMWF进行的未耦合海洋和大气历史再分析相比,CERA-20C改进了大气-海洋热通量和平均海平面气压(
Laloyaux et al.,2018)。
CERA-20C重点关注低频气候变化。与ERA-20C类似,它仅同化陆地和海洋表面气压和海洋风观测。但与ERA-20C不同,CERA-20C使用了一种新的同化系统,该系统将大气和海洋观测(温度和盐度)同时纳入耦合地球系统模式。海气耦合导致了一个更平衡的系统,订正了ERA-20C等产品中明显的表面热通量的虚假趋势。此外,CERA-20C基于集合数据同化集成技术,该技术运行由10个独立的扰动同化系统组成的集合来完成,以明确说明观测和预报模式的误差。同化过程中使用来自10个集合的信息来计算与流动有关的背景误差,该误差决定了如何在空间中传播观测信息。集合同化技术可以提供数据置信度的信息。与ERA-20C相比,CERA-20C使用了更新的模式预报系统,比如CERA-20C包括一个海洋和海冰模块,在同化过程中向大气提供动态反馈。总之,改进的误差估计、耦合和更新的模式使CERA-20C的预报技能得分比ERA-20C显著提高。尽管如此,CERA-20C仍没有提供现代时期(1979年后)大气和海洋状态的“最佳估计”(
Laloyaux et al.,2018)。
4 关于再分析数据能否适用于气候变化研究的讨论
虽然大气再分析的目的是为气候变化提供基础数据,但NCEP早在其发布之初就声明,NCEP-R1大气再分析不适合估计趋势。这是因为尽管NCEP-R1再分析系统本身基本不变,但观测系统经历了重大变化。在1979年卫星数据被引入后,一些地区气候态发生了重大变化,特别是在200 hPa以上的高层大气和50°S以南的观测稀疏地区。再分析可用于逐日、季节和年际时间尺度,但由于观测系统的变化,不建议使用再分析来估计趋势(
Kalnay et al.,1996)。
研究也发现了ERA-Interim的各种问题。这些因素包括热带海洋平均降水量的时间一致性。尽管这一问题在ERA-40期间已经有了很大改善,但由于ERA-Interim系统错误使用了受降雨影响的卫星辐射量,所以热带海洋的平均降水量受到了影响。此外,ERA-Interim陆面分析产品都受到输入数据问题以及地表分析方案缺陷的影响,特别是积雪产品。ERA-Interim的地表能量平衡表现很差,特别是在热带海洋上,这与太阳辐射和云量的偏差有关(
Dee et al.,2011)。
再分析数据中低频变化和趋势的表示存在众所周知的困难(
Dee et al.,2014)。再分析不同程度地显示了虚假偏差,这些偏差可归因于存在模式误差、观测结果的不当使用、多个生产流之间转换、观测系统的变化,或在复杂的再分析生产过程中各种潜在错误。其中许多问题本质上是技术性的,但显然,不完整的观测和不完善的模式也为再分析的准确性带来了根本性的限制。ERA-Interim再分析使用更复杂的数据同化系统,基于四维变分同化对卫星观测偏差参数的变分调整(
Dee and Uppala,2009),实现了技术突破,在融合不同生产链条之间没有引入显著的不连续性。经过几代人的努力,再分析产品的质量和有用性稳步提高,得益于分辨率的提高、时间覆盖范围的延长、数据同化方法的升级、过去观测的可用性和质量改进,以及边界条件和大气强迫场质量的提升。然而,创建均一、高质量的再分析产品仍然是一个重大挑战。这是因为观测系统发生了许多突变,除了对历史观测的整理不足,观测、边界条件和大气强迫场也存在很大的不确定性(
Kosaka et al.,2024)。
观测在空间和时间上分布不规则,而再分析数据则具有规则性,但这种规则性是有代价的:在缺乏观测的情况下,分析过程依赖不完善的统计和模式预报信息。现有模式在模拟云和降水方面仍然存在较大误差,也无法对云和降水观测进行同化,大气再分析的云和降水估计主要基于存在重要误差的模式模拟,因此在使用时要保持谨慎。大气再分析另一个主要问题是对参数化的强烈依赖。例如,在对流主导地区,降雨量估计往往不可靠。尽管再分析数据与遥感或原位观测的土壤湿度数据在趋势上通常具有良好的一致性,但二者在量级上仍存在显著差异,导致这一现象的原因之一是土壤湿度等重要生态系统变量被视为大气过程的调节变量和结果(
Baatz et al.,2021)。
5 全球大气再分析地表分析产品在中国的适用性评估
全球大气分析地表分析产品可能是应用最为广泛的资料。但现有全球大气再分析系统在进行地表分析时差异显著。欧洲中尺度天气预报中心(ERA系列)和日本再分析(JRA系列)都同化了地面2 m气温和湿度观测,JRA-55和JRA-3Q进一步同化了陆面风速观测。而美国的再分析包括NCEP、CSFR和MERRA系列都没有进行这样的地面分析。因此当用地面气温、湿度和风速观测对现有全球大气再分析地表分析产品进行检验时,欧洲和日本再分析的表现要好于其他产品,因为它们已经同化了这些地面观测。这些地面观测变量的再分析是与大气再分析分开进行的,除ERA5和JRA-3Q外,并不反馈给下一步的大气再分析。而ERA5和JRA-3Q包含了实时和耦合的陆面分析。
为了提高陆面分析的精度以及时空分辨率,很多全球大气再分析系统还会进行离线的陆面分析,即它们的陆面(Land)版本。一般情况下,这些陆面版本会利用多源融合降水观测数据对大气再分析系统的降水产品进行偏差订正,这是因为大气模式模拟的降水仍然具有显著误差。但ERA5-Land并没有进行偏差订正,主要原因是ERA5降水模拟精度相比其他再分析有所提高,同时偏差订正可能影响产品的实时性,因为多源降水融合产品一般会延迟一个月以上。因为计算需求较小,所以陆面再分析产品可以在更高的时间和空间分辨率上进行,从而对更多的陆面和水文参数进行详细分析。
早在20世纪90年代,第一代全球大气再分析产品就根据其对产品精度的估算,把大气再分析产品根据精度从高到低分为A、B和C三类(
Kalnay et al.,1996)(
表6)。A表示分析变量受到观测数据的强烈影响,因而属于最可靠的类别(例如,高空温度和风)。B类表明,尽管有观测数据直接影响变量的值,但该模式对分析值(如湿度和地表温度)也有很大影响。C类表示没有直接影响变量的观测结果,因此这类变量值主要来自模式模拟(如云、降水和地气通量)。
表6显示了当时地表变量的精度分级。虽然大气再分析产品的精度随着时间有很大提高,但这一分类标准仍然有参考意义。
5.1 地表太阳辐射
MERRA-2是唯一同化了大气气溶胶光学厚度的全球大气再分析,对比发现,相对于没有同化气溶胶的MERRA,其在中国地区的平均偏差从43.86 W·m
-2降低到同38.63 W·m
-2。但偏差依然显著,这是因为MERRA-2与MERRA一样显著低估了云量(
Feng and Wang,2019)。MERRA-2的气溶胶同化提高了其在地表太阳辐射月际和年际变率以及全国平均趋势上的模拟能力(
图3)。观测资料表明,在年际尺度上,中国中部和南部地表太阳辐射的年距平与云量存在显著负相关关系,说明在这些地区云量变化是地表太阳辐射年变化的主控因素; 但这一负相关关系在中国西部干旱区要弱很多,说明在这些区域,气溶胶(特别是沙尘气溶胶)的变化对地表太阳辐射年际变化的影响显著。因为MERRA不包含气溶胶的年际变化信息,所以它模拟的云量和地表太阳辐射的年相关系数基本都接近-1.0。相对于观测结果,MERRA-2模拟的相关系数有所改善,但其空间格局与观测相反。MERRA高估了中国东部地表太阳辐射趋势。由于MERRA-2同化了气溶胶,所以其在华北平原地区的地表太阳辐射趋势偏差有所减少(
图3)。然而在中国南部,MERRA-2的地表太阳辐射趋势模拟仍显示出负偏差,这可能与高估了中国南方地区大气气溶胶以及云与气溶胶的相互作用有关。
表6地表变量精度分级
Table6Precision grading of surface variables
利用中国地区约2 200站点日照时数计算的太阳辐射,对ERA5是否改善了太阳辐射的模拟能力进行了检验(
He et al.,2021)。ERA-Interim和ERA5都没有同化常规或卫星地表太阳辐射、总云量和气溶胶观测。ERA-Interim地表太阳辐射是基于六波段短波参数模式,而ERA5是利用快速辐射传输短波模式进行计算。对于云的模拟,两个再分析产品均是模式模拟,但是ERA5改善了混合相态云的表达。ERA-Interim和ERA5的气溶胶输入均来自全球臭氧化学气溶胶辐射与传输模式的气候平均态。同时,两个再分析产品均使用模式模拟水汽压,但ERA5仍然同化了一些改进的卫星数据。
图31980—2014年中国122个站点地表太阳辐射月异常(单位:W·m-2;辐射观测(黄线)受仪器更换的影响显示出较大的不均一性,利用日照时数可以相对准确地计算月地表太阳辐射(红线),它与卫星反演(CERES EBAF4.0,蓝线)具有很好的一致性,但卫星反演时间较短,本研究利用日照时数计算作为基准,来检验MERRA(绿色)和MERRA2(黑色)再分析; 引自Feng and Wang(2019))
Fig.3Monthly anomalies in surface solar radiation at 122 stations in China from 1980 to 2014.units:W·m-2; The radiation observation (yellow line) shows significant inhomogeneity due to instrument replacement, and the monthly surface solar radiation (red line) can be calculated relatively accurately using sunshine duration.It has good consistency with satellite retrieval (CERES EBAF 4.0, blue line) , but the satellite retrieval dataset is relatively short.This study uses sunshine duration calculation as a benchmark to test MERRA (green) and MERRA2 (black) reanalysis (cited from Feng and Wang (2019) )
从气候态来看,ERA5多年平均的地表太阳辐射偏差(10.1 W·m-2)小于ERA-Interim(15.9 W·m-2),特别是在中国华北和南方地区。从长期变化来看,ERA5和ERA-Interim均低估了20世纪90年代之前的暗化程度,但ERA5更接近观测; 在1994年之后,两者均表现了较强的亮化现象,趋势分别为1.49 W·m-2·(10 a)-1(P<0.05)和2.26 W·m-2·(10 a)-1(P<0.05),但是观测趋势在此期间并不显著(0.30 W·m-2·(10 a)-1)。ERA-Interim和ERA5在1979—1993年间地表太阳辐射变化趋势59%和71%的模拟偏差是受到水汽压的影响; 而在1994—2014年,总云量对两者变化趋势偏差的影响更大(图4)。ERA5明显提高了总云量的模拟能力,但对水汽模拟能力的提高并不明显。此外,由于ERA5仍然忽略了气溶胶年际和年代际尺度上的变化,这也将使得地表太阳辐射变化趋势模拟产生重要偏差。
5.2 地表温度
前期基于观测的研究发现,1961—2003年期间,日最高地温在中国南方和华北平原有明显的降低(
Du et al.,2017)。日最高地温的这种增温格局在日最高气温上也有所表现,但程度较弱。结合日照时数估算地表太阳辐射,进一步研究发现,日最高地温出现冷却效应的最主要原因是地表太阳辐射这几十年在中国的南方和华北平原的显著降低,对日最高地温有明显的冷却效应。
观测结果表明,地温在1979—2003年间呈现显著的异常增暖,增幅为0.34℃·(10 a)
-1(
P<0.05),而再分析资料呈现出0.29~0.42℃·(10 a)
-1(
P<0.05)的增暖趋势(
Zhou et al.,2017)。再分析资料一致地低估了中国东北地区、西北地区和青藏高原的地温变化趋势(
图5)。尤其在青藏高原,NCEP-R1和NCEP-R2重现出地温负趋势,导致NCEP-R1无法准确重现青藏高原气温变化趋势。观测还表明,地温在中国华北地区和南方地区有显著增暖趋势,而地表太阳辐射减少和降水频次减少共同造成这些区域增暖偏弱。但再分析高估了中国华北地区和南方地区地温趋势。其主要原因是再分析忽视了气溶胶持续增加而地表太阳辐射减少对区域增暖的抵消作用(
Zhou et al.,2017)。
我国山区大部分气象站位于山谷地区,这样有利于气象站点的建设和运营维护,因此山地地区观测站点的海拔都明显低于区域的平均海拔。再分析网格点平均海拔和再分析格点对应观测站点平均海拔的差异是导致两者的气温存在差异的重要原因(
图6)。研究发现,再分析气温偏差与台站和模式高程偏差存在极为密切相关,相关系数为0.85到0.94不等(
P<0.05)。模式中高程偏差(Δ
H,3)主要由谱模式高程滤波误差(Δ
f)和复杂地形导致的站点-格网高程误差(Δ
s)两部分组成(
Zhou et al.,2018)。总体来看,模式中高程差可解释80%气温偏差,其中74%来自站点-格网高程误差,6%来自谱模式高程滤波误差。再分析气温偏差对高程偏差的回归系数为6℃/km,这一数值与近地表气温递减率相近。在青藏高原,气温递减率大于6℃/km,这与关于中国气温递减率的研究(
He and Wang,2020)一致。此外,再分析气温偏差对谱模式高程滤波误差的回归系数为4℃/km。以上结果表明,在修正高程带来的误差后,再分析模式能够很好地模拟中国气温的气候态。
图41979—2014年中国地面观测(OBS; 黄色)、ERA-Interim(ERAI; 蓝色)和ERA5(橙色)的地表太阳辐射(a; Rs,单位:W·m-2)、总云量(b; TCC)和水汽压(c;WVP,单位:hPa)的月距平时间序列(计算距平的参考期是1981—2010年; 引自He et al.(2021))
Fig.4The monthly anomalies series of (a) surface solar radiation (Rs, units:W·m-2) , (b) total cloud cover (TCC) , and (c) water vapor pressure (WVP, units:hPa) in China from 1979 to 2014, as observed on the ground (OBS; yellow) , ERA-Interim (ERAI; blue) , and ERA5 (orange) .The reference period for calculating the anomalies is from 1981 to 2010 (cited from He et al. (2021) )
图51979—2003年8个再分析产品的地表温度(a; Ts,单位:℃·(10 a)-1)、地表太阳辐射(b; Rs,单位:W·m-2·(10 a)-1))、降水频率(c;单位:%·(10 a)-1)区域平均趋势误差(误差条表示95%的置信区间;引自Zhou et al.(2017))
Fig.5The regional average trend errors of (a) surface temperature (Ts,units:℃· (10 a) -1) , surface solar radiation (Rs,units:W·m-2· (10 a) -1) , and precipitation frequency (units:%· (10 a) -1) from 1979 to 2003 in eight reanalysis products.The error bars represent the 95% confidence interval (cited from Zhou et al.(2017))
目前已有对再分析地表气温产品的评估主要集中在日平均气温,而忽略了再分析产品估计气温日变化可靠性的评估。对于日平均气温而言,有些再分析同化了近地表平均气温的观测。例如,欧洲ERA系列再分析和日本JRA系列再分析已经同化了2 m气温观测,导致它们与观测数据之间并不独立,从而在评估中占有优势。但是,所有的再分析数据都没有同化日最高气温、日最低气温以及气温日较差,这些变量都是模式模拟结果,能够更好地体现出模式表征相关物理过程的能力。在订正海拔差异导致的偏差后,发现5种再分析产品能够很好地模拟我国日最低气温的1980—2014年间多年平均值,但是对日最高气温与气温日较差多年平均值的模拟存在显著的偏差(
Du et al.,2018)。
在1980—2003年间,再分析产品与观测资料中的日最高气温和日最低气温都呈现显著的升温趋势,但是升温速率则存在显著的差异。观测数据显示,这一时期,中国地区日最高气温与日最低气温的区域平均升温速率分别为(0.28±0.11)℃/(10 a)与(0.34±0.09)℃/(10 a)。对于日最高气温,CFSR的升温速率明显要高于观测,而其他再分析中日最高气温的升温速率则小于观测。其中JRA-55的升温速率与观测最为接近。对于日最低气温,观测的升温速率明显要高于再分析数据。在观测中,由于日最低气温的升温速率明显要高于日最高气温,导致气温日较差呈显著的下降趋势。在这一时期,中国地区气温日较差的平均下降速率为(-0.06±0.05)℃/(10 a)。MERRA-2与JRA-55中的气温日较差呈下降趋势但是下降速率明显小于观测。CFSR、ERA-Interim与NCEP-R2中的气温日较差呈显著的增加趋势(
Du et al.,2018)。
图61979—2010年研究期间,站点和模型高程之间的不一致对模拟的中国地表气温(Ta)多年平均差异(单位:℃)的影响。站点和模型之间的高程差(ΔH)由谱模型中使用的高程的滤波误差(Δf)和地形复杂性导致的站点到网格高程的差异(Δs)组成。Δf是从模型高程减去相应模型网格中的“真实”高程得出的。彩色条表示台站高程(单位:m)(引自Zhou et al.(2018))
Fig.6From 1979 to 2010, the impact of the inconsistency in elevation between stations and models on the multi-year average difference (units:℃) of simulated surface air temperature (Ta) in China.The elevation difference (ΔH) between stations and models consists of the filtering error (Δf) of the elevation used in the spectral model and the difference (Δs) in elevation from stations to grid cells caused by terrain complexity.Δf is obtained by subtracting the “true” elevation in the corresponding model grid from the model elevation.The color bar indicates the station elevation (units:m) (cited frow Zhou et al. (2018) )
5.3 降水
1979—2018年,再分析数据集均能再现中国地区观测所示的年降水天数和降水强度的空间格局,但是大多数再分析资料高估了降水天数,低估了降水强度(
Wu et al.,2021)。观测结果显示,降水量最大的1、5和10 d占全年总降水量的比值的全国平均分别约为9.3%、29.8%和45.1%,而再分析明显低估了这一结果。长期变化方面,观测资料显示,降水量最大的1、5和10 d占全年总降水量的比例呈较小的负趋势,但在再分析资料中却表现为正趋势。JRA-55再分析在量化中国极端降水比例的平均态方面表现最好,而ERA-Interim在反映其趋势方面表现最佳。再分析结果与观测结果在长江流域最为吻合,而在中国西北地区偏差最大(
图7)。
进一步对再分析小时降水表现进行了评估。这里使用中国地区自记式降水观测的电子化产品,自记式降水观测主要来源于1979—2015年间的虹吸式雨量计观测。因为仪器性能的限制,虹吸式雨量计仅能观测液态降水,所以重点分析夏半年的液态降水观测(
Wu et al.,2024)。
图7最大5 d的降水量占全年总降水量的比例(单位:%; 圆点为每年的平均结果,实线为5 a的滑动平均; a—g表示中国及各区域的结果)(引自Wu et al.(2021))
Fig.7The ratio of the maximum 5-day precipitation to the total annual precipitation.The dots represent the annual average results, while the solid line represents the 5-year sliding average. (a—g) represent the results in China and each region (cited from Wu et al. (2021) )
1979—2015年,小时尺度的雨量计观测显示,累积分数在第99、95和90个百分位数(分别为(0.07%±0.03%)/(10 a)、(0.15%±0.030%)/(10 a)和(0.17%±0.03%)/(10 a))上有所增加(图8),但在日尺度上没有显示出明显的趋势(图9)。在小时尺度(图8)上,观察到的最强1%(fPR99)、最强5%(fPR95)和最强10%(fPR90)占年总降水量的比例在中国大陆显示出较小的正趋势,但这一趋势在ERA5中被低估了。在大多数地区,雨量计观测的极端降水累积比例都有所增加,在华北地区(NC)、东北地区(NEC)和西南地区南部(sSWC)观察到显著的正趋势。这主要是因为近几十年来,这些地区的极端降水量有所增加,导致强降水事件在年度总量中的累积比例不断增加。ERA5无法捕捉到大多数地区每小时的降水量变化,甚至在华北地区、东北地区具有相反的趋势。在日尺度(图9)上,观察到的最强1%(fPR99)、最强5%(fPR95)和最强10%(fPR90)占年总降水量的比例在研究期间基本保持不变,而ERA5则表现出强劲的增长趋势。ERA5高估了几乎所有的区域平均趋势,因此产生的趋势比区域平均值的实际观测结果更大。
5.4 地表风速
这里选取JRA-55、MERRA、MERRA2、CFSR以及ERA-Interim来研究现有主要再分析资料在中国地表风速研究中的适用性(
Zhang and Wang,2020)。以观测地表风速以及通过地面气压数据计算所得的地转风作为参考数据。以往很多研究只选择观测地表风速作为参考数据,地转风的引入可以使得我们除了使用观测数据之外更加客观地评估再分析资料地表风速的准确性。
就气候态来说,除了JRA-55外,所有的再分析地表风速数据都要大于观测数据,但是所有的再分析资料都与观测风速有着相似的空间分布:地表风速在中国北方地区较高,而在中国南方地区较小。除JRA-55外,其他4套再分析资料在陆地都没有同化观测地表风速。JRA-55的地表风速在植被覆盖类型为森林的地区有负的偏差,这是由于JRA-55中10 m地表风速是通过插值所得,但是在森林地区插值时森林的高度存在预估过高的问题,导致上层风速插值到10 m地表风速时数值较小,而这一问题在数据同化过程中并没有得到完全的解决。这也解释了为什么JRA-55再分析资料的地表风速数据与观测数据最为接近,但是在东北以及南方地区其数值甚至小于观测地表风速。这一问题可以通过订正森林地区的粗糙度高度以减少插值过程中的误差以及优化再分析系统等方法解决。因为没有同化地表风速观测,所以其他4套再分析资料都系统地高估了地表风速。
图8中国(a)、西北地区(b)、华北地区(c)、东北地区(d)、西南北部(e)、华中地区(f)、华东地区(g)、西南南部(h)和华南地区(i)的雨量计观测和ERA5小时降水量第99、95和90百分位累积比例和区域平均趋势(黑条表示95%置信区间的不确定度范围)(引自Wu et al.(2024))
Fig.8Study area and regional mean trends of the cumulative fraction on 99th, 95th and 90th percentile of hourly precipitation for gauge observations and ERA5 in (a) China, (b) Northwest China, (c) North China, (d) Northeast China, (e) northern Southwest China, (f) central China, (g) East China, (h) southern Southwest China and (i) South China. The black bar represents the uncertainty range of the 95% confidence interval (cited from Wu et al.(2024))
图9中国(a)、西北地区(b)、华北地区(c)、东北地区(d)、西南北部(e)、华中地区(f)、华东地区(g)、西南南部(h)和华南地区(i)的雨量计观测和ERA5日降水量第99、95和90百分位累积比例和区域平均趋势(黑条表示95%置信区间的不确定度范围)(引自Wu et al.(2024))
Fig.9Study area and regional mean trends of the cumulative fraction on the 99th, 95th and 90th percentile of daily precipitation for gauge observations and ERA5 in (a) China, (b) Northwest China, (c) North China, (d) Northeast China, (e) northern Southwest China, (f) central China, (g) East China, (h) southern Southwest China and (i) South China. The black bar represents the uncertainty range of the 95% confidence interval (cited from Wu et al.(2024))
图10显示归一化后的观测地表风速、地转风以及5套再分析资料在中国以及6个分区的年际以及年代际变化。为了保证数据的一致性,所有的风速数据都首先经过了最大最小归一化,然后计算了各风速序列相较于其多年平均值的距平值。年代际变化是通过将年际变化进行10 a滑动平均所得。整体上来看,地转风同观测风速拥有同步的年际以及年代际变化,但是5套再分析资料地表风速的变率相比观测风速和地转风都较小,这说明5种再分析资料在描述大气环流变化时都存在不足,除了JRA-55外,其他再分析资料都不能重现如地表风速和地转风所示的地表风速在最近10多年的恢复现象。
6 结论
再分析的概念可以追溯至人工天气预报时代的天气图分析,数值天气预报时代使用数据同化方法为模式提供初始条件。但由于同化方法以及模式快速更新,限制了这些分析资料在气候研究中的应用。因此提出了再分析的概念,其核心是使用固定的同化方法和数值模式对历史数据进行再分析。它基于物理模式对观测空白区域进行时间和空间插值,并可以提供未观测变量的估计,这解决了观测站点稀疏且分布不规则的问题。
Fig.10Normalized surface wind speed, geostrophic wind, and five reanalysis data for China and six regions from 1980 to 2017, including interannual (solid line) and decadal variations (dashed line) of wind speed anomalies (cited from Zhang and Wang (2020) )
为了提高精度,目前主流的全球大气再分析都同化了尽可能多的观测数据,即全输入大气再分析。虽然模式和同化方法固定,但观测系统一直在演变,主要变化有20世纪50年代以来的现代探空观测以及1979年以来的卫星观测,以及地基和卫星观测仪器的更新换代。这些都会对大气再分析产品造成不均一性误差。因此,有关再分析能否用于气候变化研究的争议不断,也催生了稀疏输入再分析,比如20世纪再分析。为了降低观测系统演变的影响,这类再分析仅同化气压等少量地面观测,也使得再分析延伸至19世纪中期。
对于再分析而言,探空观测比地面观测重要得多。早期数据同化主要基于最简单的最优插值方法,同化卫星探测仪大气廓线反演,但卫星观测垂直分辨率太低,同化带来的效应较低或为负影响。这是因为最优插值基于线性理论,不能以非线性方式处理与分析变量相关的观测值。变分方法允许直接同化卫星探测仪辐射观测,显著提高了卫星观测价值。但可以被同化的观测类型仅限于能够精确模拟的变量。20世纪90年代后期开发了快速辐射传输模型,使模式可以准确地模拟有云条件下微波亮温观测,实现了微波辐射的全天空同化。但近期才开始尝试同化关键但不连续的观测,比如目前仅有一个全球再分析实现了卫星气溶胶光学厚度的同化。但到现在为止还没有全球大气再分析能够真正同化降水观测。
全球大气再分析地表分析产品可能是应用最为广泛的资料。为了提高陆面分析的精度以及时空分辨率,很多全球大气再分析系统还会进行离线的陆面分析,即它们的陆面版本。一般情况下,这些陆面版本会利用多源融合降水观测数据对大气再分析系统的降水产品进行偏差订正,这是因为大气模式模拟的降水仍然具有显著误差。但ERA5-Land并没有进行偏差订正,主要原因是偏差订正影响产品的实时性,因为多源降水融合产品一般会延迟一个月以上。欧洲中尺度天气预报中心和日本再分析同化了地面站气温和湿度观测,后者进一步同化了陆面风速观测,美国的再分析系列都没有同化地面气温、湿度和风速观测。这使得美国的再分析与地面观测相比,一致性更低,而欧洲和日本再分析一致性更高,从而使得它们的应用更广。但现在所有全球大气再分析都没有包含陆面地表覆盖和土地利用以及植被生长的年际变化,限制了其对地表变量的估计精度。