摘要
作为天气预报和大气科学研究的基础参数,大气湿度在天气分析和数值模拟领域具有重要的研究意义和价值。如何提供大范围、高精度的湿度廓线已成为提高数值天气预报准确性的关键问题。本研究采用UNet3+神经网络,以ERA-5再分析资料为基准,利用微波湿度计(microwave humidity sounder,MHS)观测的微波亮温数据,对中国区域300~1000 hPa不同高度层的大气比湿进行反演。2021年全年观测数据的测试结果表明:本研究反演的比湿与ERA-5在空间分布上具有较好的一致性。误差主要集中在东南沿海的陆地区域,海洋区域的误差相对较小。各高度层的比湿均方根误差的区域平均值都在1.53 g/kg以内,相关系数均在0.9以上,整体反演精度较高。对比探空资料,反演结果与探空数据有较好的一致性,反演结果的年际均方根误差在300~1000 hPa高度层上的平均值为0.91 g/kg。与探空数据相比,反演的比湿整体偏低。
Abstract
Atmospheric humidity is a fundamental parameter in weather forecasting and atmospheric science,playing a critical role in weather analysis and numerical simulation. Providing specific humidity profiles with broad spatial coverage and high accuracy remains a key challenge for improving the performance of numerical weather prediction models. In this study,we propose a deep learning approach for retrieving atmospheric specific humidity profiles at multiple pressure levels across China,using microwave humidity sounder (MHS) data and a UNet3+neural network against ERA-5 reanalysis data from the European Center for Medium-Range Weather Forecasts (ECMWF). This method effectively mitigates the ill-posedness and uncertainty commonly encountered in traditional quantitative remote sensing retrievals,enabling robust and accurate humidity profile estimations across long-term series and multiple atmospheric layers. Experiments were conducted at the 700 hPa level,with data from 2011—2019 used for training,2020 for validation,and 2021 for testing. Results show a slight underestimation of specific humidity compared with ERA-5,though seasonal differences in retrieval error were not statistically significant. Spatially,larger retrieval errors were observed in southern China and over land surfaces,while lower errors occurred in northern regions and over oceans. The root mean square error (RMSE) remained below 1.3 g/kg in all seasons,with the lowest average RMSE of 1.15 g/kg in winter. Temporal correlation coefficients exceeded 0.9,with an annual mean of 0.92,indicating strong spatial and temporal consistency with ERA-5. Further analysis was conducted across pressure levels from 300 hPa to 1000 hPa. The retrieved specific humidity showed good agreement with ERA-5 in spatial patterns,with RMSE values across all levels remaining below 1.53 g/kg and correlation coefficients above 0.9. The retrieval accuracy improved with decreasing altitude,showing better agreement near the surface. Comparisons with radiosonde data confirmed these results,with an average annual RMSE of 0.91 g/kg from 300 hPa to 1000 hPa. The inversion results were slightly lower than radiosonde observations overall,particularly above 700,while at near-surface levels (e.g.,1000 hPa) a notable RMSE reduction of approximately 0.6 g/kg was observed. These findings demonstrate the effectiveness and high accuracy of the proposed deep learning-based inversion method for retrieving atmospheric specific humidity profiles from satellite microwave data.
大气中的水汽含量及分布对天气和气候有着重要影响。大气湿度直接影响太阳短波辐射和地球大气系统的长波辐射,从而对全球辐射能量的收支平衡产生深远影响。此外,大气层结的稳定性、对流有效位能、降水过程及云的生成和演变等诸多气象条件也与大气湿度密切相关。因此,大气湿度的观测和反演不仅对数值天气预报模式的初始化和验证至关重要,而且在气候监测、天气分析以及天气预报等众多气象应用领域具有重要的研究价值和实际应用意义(李娟和李国富,2008; 蒋文泽等,2022)。
然而,在全球范围内获得准确的大气湿度廓线的测量结果极具挑战性。目前,大气温湿度廓线的获取主要依赖卫星观测和无线电探空仪。常规的无线电探空是利用探空气球将观测仪器带到高空进行温湿压风等气象要素的测量,该方法获得的大气温湿度参数具有较高的可靠性和代表性。但是常规的无线电探空在时间和空间覆盖范围上都非常有限,尤其在海洋、高原地区,数据量较少,无法满足实际业务需求(李琳和何海燕,2022)。随着遥感技术的发展,卫星探测具有观测连续、不受天气形势影响、覆盖面广等优点,在一定程度上弥补了常规探空数据的不足(姜祈帆等,2025)。尤其是光谱分辨率和空间分辨率的不断提高,为大气探测提供了新的可能。其中,微波遥感因其能够穿透云层和雾霾而备受推崇。微波湿度计(microwave humidity sounder,MHS)主要搭载在欧洲气象探测卫星(EUMETSAT Metop-A/B/C)和极地业务环境卫星(POES NOAA-18/19)等卫星上,可在毫米波段(89~190 GHz)的5个通道内以±50°的视场观测地球,主要用于探测大气水汽的空间变化,其星下点水平分辨率为15 km(李刚等,2023)。但是,目前的卫星传感器无法直接获取空气湿度,需要通过反演得到。在卫星遥感中,大气参数的反演是一个复杂而备受关注的数学物理问题。反演方法可以基于不同的算法理论框架进行分类,包括统计回归、物理反演和神经网络方法等。
统计方法通过建立卫星观测的亮温与大气待反演参数之间的统计回归模型来获取大气参数。Smith and Woolf(1976)利用特征向量法对Nimbus-6卫星观测进行测试,对无云垂直温度、湿度剖面进行估算。王忠一和蒋耿明(2016)基于快速局域线性回归方法,对风云三号(FY-3)卫星搭载的红外探测仪(infrared atmospheric sounder,IRAS)数据进行湿度廓线反演,对比欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts,ECMWF)再分析资料,发现湿度廓线在各高度层的均方根误差(root mean square error,RMSE)小于2.0 g/kg。然而这种方法对样本的质量和代表性要求较高,且缺乏辐射传输的物理意义,因此在数据样本有限的情况下难以应用。
物理反演方法的本质是通过大气辐射传输过程,求解待反演参数。该方法物理意义明确。例如,同时物理反演算法通过求解多参数线性化亮温泛函方程,达到同时反演大气温湿廓线和有关地表参数的目的(Smith,1972)。卡尔曼-布什(Kalman-Bucy)滤波器方法在大气温度廓线反演中也得到了应用,并成功反演了Nimbus-6搭载的扫描微波光谱仪(scanning microwave spectrometer,SCAMS)观测资料,反演性能相比多元线性回归算法有很大的提高(Ledsham and Staelin,1978)。Sun et al.(2017)基于红外高光谱卫星(cross-track infrared sounder,CrIS)和先进技术微波探测仪(advanced technology microwave sounder,ATMS)资料,利用美国国家海洋和大气管理局独特的CrIS/ATMS处理系统(NOAA Unique CrIS/ATMS Processing System,NUCAPS)算法,对大气温湿度廓线进行反演,结果表明与探空资料相比,从地面到400 hPa湿度廓线的反演误差小于20%。Xue et al.(2022)利用一维变分原理(1D-Var)的物理反演算法反演了湿度廓线,并利用中国区域探空站点观测资料和国家卫星气象中心(NSMC)发布的L2级业务产品验证了反演精度,整层平均的比湿RMSE小于2.0 g/kg。物理反演方法虽然概念清晰,但难以反演小尺度的垂直结构,其反演过程本身以及参数化假设常常是一个非定性问题,即存在解的不唯一性和不稳定性,因此需要在求解过程中引入额外的约束条件以获得稳定的解。此外,物理反演方法还受到数据观测条件的影响,如下垫面状况和云量分布等。
近年来,卷积神经网络(convolutional neural network,CNN)已在众多领域得到广泛应用,并取得了显著成就。在计算机视觉领域,一系列卓越的模型应运而生,包括UNet(Ronneberger et al.,2015)、FCN(Hoffman et al.,2016)、SegNet(Badrinarayanan et al.,2017)以及PSPNet(Zhao et al.,2018)。神经网络方法通过规避物理方法的参数假设和回归方法的线性拟合,消除了人为因素的不确定性。神经网络不需要具有解释公式或选择大量参数,从而提高了模型的效率和准确性。刘旸(2011)将反向传播神经网络(back propagation neural network,BPNN)方法应用于大气红外探测仪(atmospheric infrared sounder,AIRS)晴空大气湿度廓线的反演上,结果表明BPNN方法在中国区的反演精度显著高于特征向量统计法,BPNN方法反演的湿度廓线在800~1 000 hPa高度的RMSE为1.5~2.2 g/kg。何杰颖和张升伟(2012)将BPNN方法应用于FY-3A上搭载的微波湿度计资料,反演了中纬度和热带大气水汽,反演结果与探空资料相比一致性较好,且在数据集充足的情况下,晴空和非晴空均有较好的适应性。Zhang et al.(2021)利用FY-3D搭载的红外高光谱大气垂直探测仪(high spectral infrared atmospheric sounder,HIRAS)传感器数据,引入人工神经网络(artificial neural network,ANN)算法,建立大气温湿廓线反演模型,对比一维变分算法,ANN模型反演得到的湿度廓线的RMSE减低了5%,精度更高,适应性更好。此外,三维卷积神经网络(3D-convolution neural network,3D-CNN)方法也在卫星温湿度廓线反演中得到应用。Xue et al.(2022)根据FY-4A数据反演得到湿度廓线,与探空资料对比,100~1 000 hPa的RMSE整层平均在夏季为1.05 g/kg,在冬季为0.72 g/kg,误差高值集中在近地表,800~1 000 hPa的RMSE为2.0~2.2 g/kg,而高空的误差则较低。综上所述,该方法在大气参数反演中具有潜力,尤其适用于处理大气湿度廓线数据。
本研究采用UNet3+神经网络,利用MHS观测的微波亮温数据,对300~1 000 hPa各高度层的大气比湿进行反演。由于常规无线电探空数据时空分布稀疏,所以本文使用ERA-5再分析资料作为真值进行训练、验证和测试,而常规无线电探空资料也被用于对反演结果的统计检验。结果表明,模型整体反演精度较高,可用于实时的大气湿度廓线的反演。
1 资料和方法
1.1 研究区域与数据
本文选定的研究区域覆盖中国中部和东部地区,包括陆地和海洋,经度范围为96.00°~127.75°E,纬度范围为16.00°~47.75°N。
1.1.1 卫星观测数据
MHS是一种自校准微波辐射计,作为AMSU-B(advanced microwave sounding unit B)仪器的升级,主要搭载在EUMETSAT Metop-A/B/C以及POES NOAA-18/19上,可在毫米波段(89~190 GHz)的5个通道内以±50°的视场对地球进行观测。它的主要任务是探测大气湿度的垂直分布、水汽含量、降水等,其扫描带宽为2 250 km,每条扫描线观测像元数为90个,星下点分辨率为15 km(董佩明等,2014)。天顶的无线电波束宽度为1.1°,扫描周期是8/3 s(约2.667 s)。微波湿度计将大气中水汽最强吸收线的183.31 GHz作为主探测频点,以此向两翼扩展,共有5个探测通道:89、157、183.31±1、183.31±3和190.31 GHz。其中3—5通道分别观测大气上层、中层、下层的水汽分布情况,而1、2通道则用来观测地表温度和地表发射率等参数,MHS各个通道的详细参数见表1。根据美国标准大气通用快速辐射传输模式(community radiative transfer model,CRTM)计算得到MHS各通道星下点的权重函数垂直分布,其中3—5通道的权重函数峰值高度分别位于400、600和800 hPa(马原和邹晓蕾,2013)。
表1MHS传感器各通道参数
Table1Channel parameters of the MHS sensor
1.1.2 ERA-5再分析资料
本研究使用ERA-5作为比湿反演的真值样本。ERA-5(ECMWF Reanalysis V5)为最新一代的再分析数据,由欧盟资助的哥白尼气候变化服务(C3S)创建,由ECMWF运营,同化了包括全球范围内不同区域和来源的遥感资料、地表与上层大气常规气象资料。它覆盖了1950年至今的历史时期,数据实时更新。ERA-5在其前身ERA-Interim的基础上进行了大幅升级,尤其是时空分辨率有显著的提高,提供从地面到0.01 hPa(距地面约8 km)的水平分辨率为31 km、共137个模型层的大气变量小时估计数据(Olauson,2018; Rao et al.,2022)。ERA-5将更多的历史观测数据尤其是卫星数据同化进了模式系统中(孟宪贵等,2018)。
本研究选用ERA-5的比湿,高度为300、400、500、600、700、800、850、900和1 000 hPa,共9层,空间水平分辨率为0.25°×0.25°。
1.1.3 无线电探空数据
本研究使用无线电探空观测数据对神经网络反演得到的湿度廓线进行统计检验。每个探空站点每天有00时(世界时,下同)和12时两个时次,通过探空气球观测站点上空的各规定等压面的位势高度、温度、露点温度、风向、风速等气象要素。该数据可在国家气象信息中心下载(http://data.cma.cn/)。本文使用2021年1—12月位于北京、甘肃、浙江和云南的4个探空站一年的探空数据作为验证,分别与ERA-5和MHS反演得到的湿度廓线作对比。对探空资料、ERA-5、反演结果进行时间和空间匹配,统计出每个探空站点位置的ERA-5湿度廓线、深度学习方法反演的湿度廓线。由于探空资料高度层与ERA-5的高度层分布不一致,所以需要将探空资料的比湿插值到ERA-5对应的高度层上。
由于探空数据没有比湿观测量,所以需要根据温度、气压进行计算,其计算式如下:
(1)
(2)
式中:q为比湿(单位:g/kg); p为气压(单位:hPa); e为水汽压(单位:hPa); t为温度(单位:℃)。
1.1.4 数据预处理
本研究基于神经网络模型对湿度廓线进行反演,选用MHS观测亮温和ERA-5比湿数据构建训练样本集。由于模型的构建需要将卫星观测亮温与湿度数据一一对应,所以需要对数据进行预处理,使之形成时间和空间上一致的数据集,用于对本文构建的湿度反演模型进行训练与验证。其中亮温数据受卫星观测角度影响,边缘扫描线透过大气路径更长,受大气衰减影响也更大。为保证数据集的准确性和可靠性,分别剔除边缘两侧的5个像元点,同时根据均值、标准差等指标将异常观测数据剔除掉(董佩明等,2014)。
完成边缘效应去除、质量控制后,再将数据处理成与ERA-5资料空间投影类型、分辨率一致的栅格形式,即完成样本和标签数据之间的空间匹配。除了空间匹配外,还需要保证样本与标签在时间上一致,以ERA-5时间为基准,按照±30 min标准对MHS、ERA-5数据进行时间匹配。完成以上处理后,MHS、ERA-5数据在时间和空间上一一对应。
本研究选择2011—2021共11 a的MHS数据构建样本,其中2011—2019年的数据作为训练数据,共计24 008条数据,2020年作为验证,2021年作为测试。训练、测试、验证样本的比例为9∶1∶1。
1.2 模型构建
1.2.1 UNet3+卷积神经网络模型
本文应用的UNet3+卷积神经网络模型(梁燕等,2023),其名称由“UNet”和“3+”两部分构成,是在经典UNet模型的基础上改进而来。UNet模型分为特征编码器(feature encoder)和特征解码器(feature decoder),模型的左边是特征编码器,由几组下采样(down-sampling)模块组成,每个下采样模块包括2个卷积层(convolution layer)和1个池化层(pooling layer),其对图像进行下采样,获取不同尺度的特征,其结构如图1所示。在提取特征之后,通过模型右边的解码器进行上采样(up-sampling),逐步将特征恢复到原图像大小,同时为了避免下采样过多地损失原图像的精度,每一层的上采样与下采样通过跳跃连接(skip connection)方式连接起来,下采样的特征与上采样的特征结合得到两倍通道的特征值,之后通过随机丢弃一半的特征值来保持通道数不变。解码器也由几组上采样模块组成,每个上采样模块由一个反卷积层、特征拼接和两个卷积层组成。UNet作为一种经典的卷积神经网络,在视觉任务中表现出色。然而,对于大气科学研究任务,特别是反演比湿,更高级的特征融合和上下文感知能力显得尤为关键。为此,本研究将UNet与“3+”部分相融合,以提升其性能。
图1UNet网络结构图
Fig.1Architecture of the UNet network
UNet3+模型结构如图2所示,它是一个编解码器模型,分为下采样路径和上采样路径,其中XiEn为第i层编码层,XiDe为第i层解码层,下采样路径和上采样路径之间通过全尺度的跳跃连接(full-scale skip connection)相关联,上采样路径特征图的具体计算方式如图3所示(以第三层为例)。与UNet模型不同的是,UNet3+模型在下采样路径上的每一层都融合了上采样路径上多层的特征图。UNet3+继承了UNet的卓越特征提取和上下文感知能力,进一步引入了跳跃连接等增强功能。这些改进使UNet3+能够更好地适应大气湿度反演任务的需求,实现了对多尺度信息的有效利用和精准分割(Liu et al.,2023)。因此,本文基于UNet3+基本结构,对湿度廓线进行反演试验。
图2UNet3+网络结构图
Fig.2Architecture of the UNet3+ network
1.2.2 模型评估
本文提出的深度学习模型的性能评估标准包括平均绝对误差(mean absolute error,MAE; Ema)、均方根误差(root mean square error,RMSE; Erms)和相关系数(correlation coefficient; r)。
(3)
(4)
(5)
式中:Tij为(i,j)位置处的参考值;为Tij的平均值;Pij为(i,j)位置处的预测值;n为总像元数。
图3第三层解码器全尺寸跳跃连接特征图
Fig.3Full-scale skip connection feature map of the third-layer decoder in the UNet3+network
1.3 数据通道选择
MHS共计5个光谱通道,其中:3—5通道分别观测大气上层、中层、下层的水汽分布情况; 1、2通道观测地表温度和地表发射率等参数。考虑到1、2通道跟水汽没有直接关系,因此设置对比试验,分别使用1—5通道和3—5通道作为输入,对比研究区域比湿的反演精度。
在模型训练过程中,优化函数和学习率的设置对模型的训练速度和训练结果有着重要影响。本文选择的优化方式为自适应矩阵估计(adaptive matrix estimation,Adam)优化器方案,模型初始学习率设置为0.000 1。模型参数设置如表2所示。
表2模型参数配置
Table2Model parameter configurations used in the inversion experiments
表2中,ReLU为激活函数,其对隐藏层的输出进行非线性映射,使激活后的输出具有非线性的特性,从而提高模型特征提取和分类的性能。Adam优化器用最小化损失函数,使得模型参数与真实参数接近,从而得到最优模型(Kingma and Ba,2015)。
损失函数Mseloss(M)、Weightmseloss(W)和Ssimloss(S)的计算公式如下:
(6)
(7)
式中:y为训练数据样本中的真值;yi为模型预测值;w(y)为权重函数。
(8)
式中:x为训练数据样本中的真值;y为模型预测值;μx为x的平均值;μy为y的平均值;σ2x是x的方差;σ2y是y的方差;σxy是x和y的协方差;C1=(K1L)2;C2=(K2L)2。其中:K1一般取0.01;K2一般取0.03;L是图像像素值的动态范围。
2 结果分析
2.1 试验方案
本文设置不同波段输入数据、不同损失函数的对比试验,对研究范围700 hPa的比湿进行训练,并以2021年数据作为测试,对反演结果进行精度评估,结果如表3所示。
表3不同试验方案的平均绝对误差、均方根误差和相关系数
Table3MAE, RMSE, and correlation coefficients of different experimental schemes
测试结果表明,将1—5通道作为输入数据,即综合考虑各层水汽信息和地表辐射状况,得到的反演误差小于仅使用对水汽敏感的3—5通道的反演误差。同时,不同的损失函数方案对反演结果也有一定影响。以1—5通道为输入、以Mseloss为损失函数的方案最优,该方案的RMSE测试结果为1.15 g/kg。
2.2 不同季节湿度廓线反演
根据第2.1节的试验结果,选择最优模型设置方案,以1—5通道作为输入,损失函数选择Mseloss,对研究范围700 hPa比湿进行训练,以2021年数据为测试,数据按季节分割,对不同季节反演结果进行精度评估,结果如表4所示。与ERA-5对比,反演比湿的各季节RMSE均在1.3 g/kg以内,其中冬季最低,全年为1.15 g/kg。各季节的相关系数均在0.9以上,全年为0.93。2021年不同季节的测试表明,与ERA-5相比,比湿反演效果较好,整体误差较低。
表4不同季节700 hPa比湿的平均绝对误差、均方根误差和相关系数
Table4MAE, RMSE, and correlation coefficients of 700 hPa specific humidity across different seasons
图4为2021年不同季节的比湿反演结果。可以看出,比湿反演结果与ERA-5的空间分布较一致,局部地区存在较小偏差。用ERA-5减去反演结果表示反演误差。从误差分布可见,区域整体误差较小,与ERA-5相比,模型模拟的比湿存在一定程度的低估。
2.3 误差分析
以700 hPa为例,对反演结果进行误差分析。图5为研究区2021年平均反演比湿和ERA-5比湿的分布。可以看出,反演的比湿在空间分布上与ERA-5较一致,整体呈现按纬度带由南向北递减的趋势,最高值出现在云南区域; 两者在数值上也较为接近,高湿度区域的比湿为7~8 g/kg,北部区域的比湿集中为2~3 g/kg。
图6为2021年测试数据的年均相对误差和绝对误差。从误差的空间分布可见,研究使用的反演模型的误差主要集中在东南陆地区域。就相对误差而言,广东北部区域相对误差高值约为12%,甘肃西北区域约为18%,全区域均值为4.5%。就绝对误差而言,其空间分布与相对误差的空间分布相近,呈现出南高北低的趋势。高值区域集中在广东区域,北方整体较低,全区域均值在1 g/kg以内。
2.4 湿度廓线反演
在对700 hPa比湿反演效果较好的基础上,本文对研究区域300~1 000 hPa不同高度层的比湿进行反演,并结合探空资料对反演结果进行评估。
对2021年全年数据进行测试,验证结果表明不同高度层的比湿RMSE均小于1.53 g/kg,r均大于0.9,越接近地表,反演结果与ERA-5的相关性就越高,但RMSE也变大,这是由于近地表水汽含量较高,相对应的误差的绝对值也较大(表5)。
此外,本文使用同一时期的常规探空数据进一步验证反演结果。图7a—d分别显示了北京、甘肃、浙江、云南4个站点2021年平均湿度廓线。不同区域的统计结果表明,在近地表700~1 000 hPa,ERA-5和反演结果普遍高于探空,而在300~700 hPa,ERA-5和反演结果普遍低于探空。同时,不同点位的ERA-5、反演比湿和探空资料均有较高的一致性。
对研究范围内所有探空站点的反演结果和ERA-5湿度廓线进行匹配,并统计其与探空资料的偏差。不同高度层的RMSE如图8所示。可见,RMSE高值主要集中在800~1 000 hPa低层,RMSE为1.1~1.4 g/kg,随着高度的上升,RMSE呈现逐渐减小的趋势。300~1 000 hPa整层的RMSE均值为0.91 g/kg。
对比同类型的研究发现:刘旸(2011)利用统计方法和神经网络方法反演AIRS数据,得到了湿度廓线,相比探空资料,在800~1 000 hPa,神经网络方法的RMSE为1.3~1.8 g/kg,统计方法的RMSE为1.6~2.2 g/kg。王忠一和蒋耿明(2016)将IRAS反演的湿度廓线与探空资料做对比,结果表明1 000 hPa高度层的RMSE为2.0 g/kg,900 hPa高度层的RMSE为1.5 g/kg,各高度层的RMSE均在2.0 g/kg以内。Xue et al.(2022)基于一维变分(1D-Var)算法的物理方法和三维CNN神经网络方法,对静止干涉红外探测仪(GIIRS)大气湿度廓线进行反演,并将反演结果与探空资料进行对比验证,得知物理方法不同季节RMSE在2.0 g/kg范围内,而运用神经网络方法较物理方法有所改进,RMSE在夏季为1.05 g/kg、在冬季为0.72 g/kg,主要改进在近地表范围,但800~1 000 hPa的RMSE均大于1.5 g/kg。
图44个季节700 hPa比湿的反演结果(单位:g/kg)。从左往右分别是反演结果、ERA-5结果、ERA-5与反演的差值。个例时间从上往下分别是2021-04-24T0900、2021-08-02T0900、2021-10-29T2300以及2021-12-29T1100(世界时)
Fig.4Inversion results of 700 hPa specific humidity for four representative seasons (units:g/kg) . From left to right:inversion results, ERA-5 reanalysis, and the difference between them (ERA-5 minus inversion) . The selected cases from top to bottom correspond to 2021-04-24T0900 UTC, 2021-08-02T0900 UTC, 2021-10-29T2300 UTC, and 2021-12-29T1100 UTC
图52021年平均的700 hPa比湿(单位:g/kg):(a)反演结果;(b)ERA-5结果
Fig.5Average 700 hPa specific humidity in 2021 (units:g/kg) : (a) inversion results; (b) ERA-5 reanalysis
图62021年平均的700 hPa比湿相对误差(a; 单位:%)和绝对误差(b; 单位:g/kg)的分布
Fig.6Distribution of the average 700 hPa specific humidity in 2021: (a) relative error (units:%) ; (b) absolute error (units:g/kg)
表52021年不同高度层湿度廓线的测试结果
Table5Evaluation of specific humidity profiles at multiple pressure levels throughout 2021
本研究基于UNet3+神经网络方法,以MHS亮温数据为输入,反演得到湿度廓线,并与探空资料相比,RMSE整层均值为0.91 g/kg,各高度层的RMSE均在1.53 g/kg以内。与前人研究相比,本文近地表的改进更为显著,高空的改进较小,1 000 hPa高度层的RMSE提升约为0.6 g/kg。
3 结论
本文利用UNet3+神经网络,基于MHS卫星观测资料,对研究区域的湿度廓线建立反演模型,该方法避免了定量遥感反演过程中的不确定性问题和病态反演问题,得到了长时间序列、不同高度层的比湿结果。本文首先在700 hPa高度层上进行试验,以2011—2019年数据为训练,以2020年为验证,以2021年数据为测试。测试结果表明,该模型对中国区域比湿变量的反演与ERA-5相比,存在一定程度的低估,而不同季节的误差则无显著差异。就空间分布而言,700 hPa反演误差有显著的空间分布特征,误差高值主要集中在南部地区,北部地区的误差相对较小,且陆地误差大于海洋误差。
图72021年平均比湿廓线(单位:g/kg; 红色为ERA-5,黑色为深度学习反演,蓝色为探空):(a)北京;(b)甘肃;(c)浙江;(d)云南
Fig.7Average specific humidity profiles in 2021 for four regions (units:g/kg. Red:ERA-5; black:deep learning inversion; blue:radiosonde observations) : (a) Beijing; (b) Gansu; (c) Zhejiang; (d) Yunnan
图8UNet3+反演比湿(虚线)、ERA-5比湿(实线)的年平均误差廓线(单位:g/kg)
Fig.8Profiles of annual mean specific humidity error for the UNet3+ inversion (dashed line) and ERA-5 reanalysis (solid line) (units:g/kg)
在700 hPa反演的基础上,对300~1 000 hPa不同高度层进行比湿反演。结果评估显示,不同高度的RMSE均小于1.53 g/kg,同时相关系数均在0.9以上,空间一致性较好。RMSE高值主要集中在水汽含量较高的近地表,水汽含量较低的高空RMSE较低,越接近地表,相关系数越大。结合探空数据,综合对比不同区域的ERA-5湿度廓线、反演湿度廓线可发现,在年均尺度上三者的一致性较好。计算研究区域各探空站反演湿度的RMSE可知,整层平均为0.91 g/kg。对比同类型研究发现,本文反演的比湿廓线在近地表(800~1 000 hPa)的RMSE更小,高空(300~700 hPa)的RMSE与同类型研究相近。这表明本研究所使用的比湿反演方法完全可行,且精度较高。
致谢:NOAA、ECMWF、国家气象信息中心提供了MHS、ERA-5、探空资料的在线下载服务。谨致谢忱!

