en
×

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。
通讯作者:

郭启云,E-mail:feng_cloudy@163.com

引用:程凯琪,郭启云,杨荣康,等,2021.GPS掩星气压的评估及质量控制[J].大气科学学报,44(4):529-539.

Quote:Cheng K Q,Guo Q Y,Yang R K,et al.,2021.Assessment and quality control of GPS occultation pressure[J].Trans Atmos Sci,44(4):529-539.

目录contents

    摘要

    以探空数据为参考,将2014年1月1日—12月31日的COSMIC掩星气压作为GPS掩星试验样本,将中国区域划分为4个气候区,从双权重平均值、双权重标准差及相关系数角度对GPS掩星气压进行评估,并根据其统计结果进行质量控制。结果显示:双权重平均值和双权重标准差相较传统方法统计出的平均值和标准差更不易受异常数据的影响,评估结果更加准确。4个气候区之间气压的双权重平均值差异较小;双权重标准差在亚热带季风气候区的数值较小(小于6 hPa)、在温带季风气候区较大(最大可达15 hPa)。以探空数据为参考,气压偏差的统计表明,亚热带季风气候区从低层到高层都为正偏差(0.8 hPa左右),其他三个气候区在6 km以下多为负偏差、6 km以上为正偏差(0.5 hPa左右)。根据相关系数的统计,将相关系数确定为0.80,并根据各气候区不同的统计结果划分阈值区间;质量控制结果显示,错误点大多分布在GPS掩星气压与探空气压相差较大的区域,两步质量控制的错误数据百分比大部分在5%以内;对比质量控制前后GPS掩星气压与探空气压之间的相关系数表明,质量控制后两者的相关性得到明显改善。

    Abstract

    Using the sounding data as a reference,taking the COSMIC occultation pressure from 1 January to 31 December 2014 as a GPS test sample,China was divided into four climate zones.The GPS occultation pressure was evaluated from the perspectives of double weight average,double weight standard deviation and correlation coefficient,and the quality control was carried out according to the statistical results.Results show that compared with the traditional method,the double weight average and the double weight standard deviation are less susceptible to abnormal data,and the evaluation resultsare more accurate.The differences of double weight average values of atmospheric pressure among the four climate zones are small.The doubleweight standard deviation is smaller in the subtropical monsoon climate zone (less than 6 hPa) and larger in the temperate monsoon climate zone (up to 15 hPa).With the sounding data as a reference,the statistics of atmospheric pressure deviation show that there is a positive deviation from the lower troposphereto the upper troposphere in the subtropical monsoon climate zone(about 0.8 hPa),and there are mostly negative deviation below 6 km and a positive deviation above 6 km in the other three climate zones (about 0.5 hPa).According to the statistics of correlation coefficient,the correlation coefficient is determined to be 0.80.According to the different statistical results in each climate zone,the threshold interval is divided.Quality control results show that the error points are mostly distributed in the areas where there is a big difference between GPS occultation pressure and sounding pressure.The percentage of error data produced by the two-step quality control is mostly less than 5%.Comparing the correlation coefficients between GPS occultation pressure and sounding pressure before and after quality control,it shows that the correlation between them is significantly improved after quality control.

  • 综合气象探测是大气科学的基础,探空、卫星、飞机和地面雷达等是目前主要的高空气象探测手段(魏洪峰等,2012;曹晓钟等,2019)。探空系统探测温度的不确定度为0.3℃,气压在100hPa以上不确定度在2hPa左右,垂直层次可达几千层(郭启云等,2015)。近年来,随着全球定位系统的不断发展以及卫星技术的逐渐成熟,无线电掩星技术已成为一种新兴的高空气象探测手段,其具有全球覆盖、高垂直分辨率、高精度、全天候、自校准等优点(王伯睿等,2013)。在实时天气分析、台风热力结构(丁金才等,2011)、大气边界层和青藏高原研究(周文等,2018)、卫星资料相互验证(何文英和陈洪彬,2017)以及数值天气预报资料同化等(马旭林等,2019)诸多领域得到广泛应用。

  • GPS/LEO(Low Earth Orbit)掩星探测,是指GPS卫星发射的电波信号被地球大气所遮掩,信号经过地球大气和电离层折射后到达LEO卫星,从而可通过相关的科学反演方法反演得到大气参数和电离层剖面(胡雄等,2005)。1988年美国科学家首次提出了利用GPS掩星探测地球大气的设想,并通过1995年4月发射的低轨卫星进行了GPS掩星探测的概念验证。2001年4月,世界气象组织在日内瓦召开的关于全球观测系统的会议上提出了全球观测系统再设计的报告,认为研发GPS掩星资料的应用将对全球观测系统做出新的重要贡献(李国平和黄丁发,2005)。目前,国内外的掩星资料主要有COSMIC-1、Metop-A、Metop-B、KOMPSATS以及我国2013年和2017年发射的FY-3C和FY-3D,2019年6月美国和台湾联合开发的COSMIC-2代,未来可以提供较多的大气观测数据(程凯琪等,2020)。但由于探测过程中的随机误差、探测误差、漂移误差以及反演误差等,也不可避免地存在观测误差(宫晓艳等,2008)。将CHAMP、SAC-C掩星数据与探空数据、ECMWF全球再分析数据进行了对比分析,发现5km以下CHAMP折射率数据有明显的负偏差,在日本地区平均相对误差超过了3%,由其反演得到的气压也会存在误差(Kuo et al.,2005;Wickert,2005)。王洪等(2010)以探空为参考对掩星气压的评估中在5km以下偏差可达6hPa以上,5km以上偏差减小。夏季和冬季各7d的COSMIC反演大气廓线与ECMWF和NCEP分析资料的比较则表明,资料精度与季节无关(臧欣和官莉,2015)。基于误差分析许多学者对GPS掩星数据开展了质量控制,国内外有许多内置的质量控制方法,连续法、贝叶斯法、综合法等(Gandin,1988;Lorenc and Hammon,1988;Ingleby and Lorenc,1993)。Gorbunov(2002)提出了一种依据分析掩星数据使用标准变换或全光谱反演法获取振幅的质量控制方法。Zou and Zhen(2006)通过双权重质量控制方法对GPS掩星的折射率和弯曲角进行了质量控制,郭启云等(2020)也采用此方法对COSMIC、Metop-A、Metop-B三种掩星的折射率数据进行了质量控制,得到了较好的结果。目前,对掩星反演气压的评估多采用传统的计算平均值和标准差的算法,同时也较少地考虑地域及气候区上的差异,不同的气候特征数据具有不同的特点,采用一致的质量控制方法会造成质量控制的不准确。因此,本文将中国区域根据其气候特点划分为不同的气候区,分别对各个气候区的GPS掩星气压数据采用权重的方法从双权重平均值以及双权重标准差角度进行评估,给每个数据都赋予不同的权重,减小离群资料本身对样本资料的平均值和标准差的影响,并根据各个气候区不同的统计结果划分不同的质量控制标准,使质量控制更加准确。

  • 1 数据处理方法

  • 1.1 资料选取

  • 使用2014年1月1日—12月31日一年的GPS掩星二级反演产品数据,以COSMIC掩星为例,包含有大气高度、气压、温度、水汽压等大气参数,垂直分辨率为100m,垂直方向上共400层。为了对掩星多层次数据进行质量控制,提高数据的使用率,采用相同时间段的我国120站探空秒级数据为参考,探空秒级数据主要包含大气温度、气压、高度等信息,垂直方向可达几千层,其分辨率平均约为6~7m。掩星点的变化在百千米的量级,时间间隔几分钟,探空数据的空间间隔在几十千米,时间间隔约1.5h,而地球上1纬度约为实际距离110km,将探空秒级数据和GPS掩星数据的时空匹配窗口设为经度、纬度分别小于1°,时间小于3h(王洪等,2010)。为了更好地反映大气中细微的变化特征,同时充分利用掩星和探空垂直分辨率较高的特点,在0~30km之间每隔100m选取一个数据,共计301层,并对每个层次上的GPS掩星气压都进行质量控制。

  • 1.2 气候背景划分

  • 我国地域辽阔,处于多个气候区划带,而不同气候区的数据具有不同气候特征,其平均值和标准差也存在有较显著的差别。为了更精确地评估数据质量,消除因气候差异导致数据偏差过大的影响,同时也使不同气候区的数据根据其气候特征划分不同的标准,更加准确有效的质量控制。采用气候分区方法,根据多年平均气温、降水量和海拔高度,将中国区域根据气候特点划分成4个气候区(图1),亚热带季风气候区分布在秦岭淮河以南,夏季高温多雨,冬季温和少雨,气压年变化较小;温带季风气候区分布在北方地区,秦岭淮河以北,大兴安岭到太行山一线以东区域,夏季高温多雨,冬季寒冷少雨,冬夏气压差别较大;高原山地气候区则大多分布在海拔较高的山地,高原地区;温带大陆气候区则是分布在广大内陆地区(张大任等,2019),各个气候区的气压分布特征不同。

  • 1.3 质量控制方法

  • 采用双权重标准差法及设置GPS掩星气压与探空气压之间相关系数阈值的方法,主要分为两步,设有n个GPS掩星气压样本(p i,i=1,2,…,n),n个探空气压样本(B i,i=1,2,…,n)。

  • 1)第一步质量控制:计算每个GPS掩星气压的权重

  • wi=pi-Mc×MAD
    (1)
  • 其中:c=7.5代表“被测数据”的参数(Lanzante,1996)。当权重函数|wi|>1时,进行数据递归,取wi=10。M为GPS掩星气压的中位数,M AD为偏差中位数。计算每层GPS掩星气压的双权重平均值和双权重标准差:

  • O-bw=M+i=1n pi-M1-wi22i=1n 1-wi22;
    (2)
  • 图1 中国气候区的划分(B、C、D、E分别是亚热带季风气候区、温带季风气候区、温带大陆气候区、高原山地气候区)

  • Fig.1 Division of climate zones in China(B,C,D and E are subtropical monsoon climate zone,temperate monsoon climate zone,temperate continental climate zone and plateau mountain climate zone respectively)

  • BSD=ni=1n pi-M21-wi240.5i=1n 1-wi21-5wi2
    (3)
  • 根据其统计特征设定具体的阈值区间,挑选出错误数据和可疑数据,并将可疑数据和正确数据进行第二步质量控制。

  • 2)第二步质量控制:

  • 将GPS掩星气压与探空气压的偏差作为样本量,计算每一个偏差的权重和每一层偏差的双权重平均值和双权重标准差,评估其数据质量并划分阈值区间。计算各个气候区每层背景场与GPS掩星气压的相关系数r:

  • r=i=1n pi-p-Bi-B-i=1n pi-p-2×i=1n Bi-B-2
    (4)
  • 对于第一步和第二步质量控制,具体的阈值区间划分标准为:对于大量的气象观测数据,样本符合正态分布,根据3σ准则原理,在平均值±3倍标准差之内的数据概率可达997%,在质量控制中,对于掩星观测数据根据计算到的双权重平均值和双权重标准差,将双权重平均值±4倍双权重标准差范围之外的数据视为错误数据,将双权重平均值±3倍双权重标准差范围之外,双权重平均值±4倍双权重标准差范围之内的数据视为可疑数据,分别挑选出可疑和错误数据(李平,2014)。

  • 相关系数越大,说明该层GPS掩星气压和探空气压相关性越好。在统计检验时,指定为检出可疑值的显著性水平α=0.05,称为检出水平,按照超过阈值的相关系数占所有相关系数的5%计算出相关系数阈值,对可疑数据进一步进行处理。

  • 2 试验结果分析

  • 2.1 GPS掩星气压质量分析

  • 2.1.1 气压特征分析

  • 图2为4个气候区GPS掩星气压的双权重平均值(图2a)和双权重标准差的廓线分布(图2b),可知,4个气候区气压的双权重平均值分布较为一致,气压随着高度的增加呈不断减小的趋势,气压和高度呈线性对数关系。但是4个气候区的双权重标准差在20km以下层次却有较大的差别,亚热带季风气候区的双权重标准差最小,几乎都在6hPa以内,温带季风气候区的双权重标准差最大,数值可以达到15hPa左右。4个气候区双权重标准差相差较大,主要是因为4个气候区气候特征的不同,亚热带季风气候区纬度偏南,一年之内的气压相差较小,所以其双权重标准差小。而在温带季风气候区夏季为热低压,冬季为冷高压,四季较为分明,气压年变化较大,所以气压的双权重标准差也较大。图2c和图2d为使用传统算法统计出的GPS掩星气压的平均值和标准差,每个GPS掩星气压的权重相同,与上述使用不同权重的统计结果进行对比,可以发现平均值与双权重平均值之间的差异较小,而标准差与双权重标准差之间相差较大,传统方法计算出来的标准差可以达到150hPa,是双权重标准差的10倍以上。对各个气压数据的权重进行分析,发现无论是双权重平均值还是双权重标准差,分布在中值点附近的掩星气压数据都比分布在两翼或者尾部的权重更大。双权重平均值和双权重标准差更不易受异常值存在的影响,比传统使用相同权重分布的方法更为适用。

  • 2.1.2 气压质量控制阈值分析

  • 图3为根据其双权重平均值和双权重标准差划分的阈值区间,可知,由于4个气候区气压的双权重平均值和双权重标准差之间存在差异,所以4个气候区的质量控制区间也有所不同。亚热带季风气候区由于双权重标准差较小,所有其可接受为正确气压的区间较小。而温带季风气候区由于四季较为分明,夏季为热低压,冬季为冷高压,气压年变化较大,所以双权重标准差较大,导致其可接受为正确气压的区间较大。根据气候区特点划分成4个气候区,一方面可以使数据更加符合正态分布,同时根据各气候区不同的气候区特征划分不同的质量控制标准,也使质量控制更加准确。采用传统方法计算出来的平均值和标准差划分此阈值区间,其可接受为正确气压的区间要比使用不同权重时大很多,30km层次上正确气压区间分布为-180~180hPa之间,较多的错误气压和可疑气压都无法检测出来(图略),质量控制效果较差。根据图3的阈值区间分别对2014年1月1日—12月31日所有层次的掩星气压数据进行质量控制,挑选出其中的错误气压和可疑气压,将错误气压进行剔除,可疑气压和正确气压再次进行质量控制。

  • 图2 4个气候区GPS掩星气压的双权重平均值(a)、双权重标准差(b)、平均值(c)和标准差(d)的廓线分布

  • Fig.2 Profile distribution of(a)double weight average,(b)double weight standard deviation,(c)average and(d)standard deviation of GPS occultation pressure in four climate zones

  • 2.2 气压偏差分析

  • 2.2.1 气压偏差特征分析

  • 将上述质量控制出的可疑数据和正确数据进行评估及再次质量控制,将GPS掩星气压与探空气压的偏差作为观测量,分析其统计特征。图4a和图4b分别为4个气候区GPS掩星气压偏差的双权重平均值和双权重标准差。由图4可知,亚热带季风气候区偏差较大,从低层到高层都为正偏差,偏差值在0.8hPa左右,而温带季风、温带大陆和高原山地气候区在6km以下多为负偏差,6km以上则为正偏差,值在0.5hPa以内偏差较小。低层3km以下温带大陆性气候区偏差较大,在-1hPa,之后逐渐减小。4个气候区偏差的双权重标准差(图4b)差异较小,整体都是呈随高度增加逐渐减小的趋势,整体都在5hPa以内,高层则较小在1hPa以内,探空气压与GPS掩星气压较为接近。与传统方法计算出的平均值(图4c)和标准差(图4d)进行对比,平均差和双权重平均值之间相差较小,标准差大于双权重标准差,传统方法的统计结果更易受错误值和可疑值的影响,接下来阈值区间的划分采用气压偏差的双权重平均值和双权重标准差的统计结果。

  • 图3 4个气候区GPS掩星气压的可疑阈值和错误阈值标准以及单个时刻的气压分布:(a)温带大陆气候区;(b)亚热带季风气候区;(c)温带季风气候区;(d)高原山地气候区

  • Fig.3 Suspicious threshold and error threshold standards of GPS occultation pressure in four climate zones,and the pressure distribution at a single moment:(a)temperate continental climate zone;(b)subtropical monsoon climate zone;(c)temperate monsoon climate zone;(d)plateau mountain climate zone

  • 2.2.2 气压偏差质量控制阈值分析

  • 根据GPS掩星气压与探空气压偏差的双权重平均值和双权重标准差划定阈值区间,对上述的可疑数据和正确数据进行质量控制(图5)。由于气压偏差的双权重标准差随高度呈逐渐减小的趋势,所以4个气候区接受为正确数据的区间随高度呈现逐渐减小的趋势,在低层气压数值较大,所以可允许的偏差也较大,而在高层气压值较小,可接受的数据区间也较小。4个气候区之间由于偏差的双权重平均值和双权重标准差较为相似,所以阈值区间仅存在略微的差别。不同层次以及气候区根据各自的统计特征划分不同的质量控制标准。根据各个气候区可疑阈值和错误阈值区间,挑选出可疑数据和错误数据,将错误数据进行剔除,可疑数据进行再次的质量控制。

  • 2.3 相关系数及其质量控制效果分析

  • 2.3.1 相关系数阈值分析

  • 为了更加准确地对可疑数据进行处理,保证错误的数据不被保留,正确的数据不被错误地剔除掉,将上述质量控制的可疑数据根据GPS掩星气压与探空气压之间的相关系数进行再次的判断。图6是4个气候区GPS掩星气压与探空气压相关系数的廓线分布,4个气候区在低层6km以下与探空的相关性较差,在0.8以下;而在6km以上相关系数几乎都在0.8以上,探空气压与掩星气压之间的相关性较好。在6km以下由于水汽含量较大,会出现多路径和超折射现象,所以反演精度会偏低一些,与探空之间的相关性也会较差。根据4个气候区GPS掩星气压与探空气压相关系数一年的统计,按照超过阈值的相关系数占所有相关系数的5%计算出相关系数阈值,确定相关系数阈值为0.80,将相关系数大于等于0.80层次上的可疑数据认为是正确数据,将相关系数小于0.80层次上的可疑数据认为是错误的数据,对可疑数据根据每层的相关系数进行质量控制,进一步挑选出错误数据。

  • 图4 4个气候区GPS掩星气压偏差的双权重平均值(a)、双权重标准差(b)、平均值(c)和标准差(d)的廓线分布

  • Fig.4 Profile distribution of(a)double weight average,(b)double weight standard deviation,(c)average and(d)standard deviation of GPS occultation pressure deviation in four climatezones

  • 2.3.2 质量控制效果分析

  • 1)错误数据百分比对比分析

  • 图7为4个气候区GPS掩星气压与探空气压的错误数据散点分布,可以看出,错误数据主要分布在对称轴的两侧,GPS掩星气压与探空气压相差较大的点。在第一步质量控制中剔除与自身气压相差较大的点,第二步质量控制中剔除与探空参考场相差较大的数据,对可疑数据的判断可以避免错误的数据被保留以及正确的数据被误剔除。

  • 从图7只能看到错误点分布的大概的位置,接下来分析错误点在各个层次上所占的比例(图8)。由图8可知,在第一步掩星自身的质量控制中,4个气候区错误数据百分从低层到高层略微有一点增大,相差约1%,亚热带季风气候区的错误百分比最大,在4%左右,其他3个气候区大约都在3%以内,错误数据较少。在第二步加入探空作为参考的质量控制中,整体大多数都在5%以内,温带季风气候区和高原山地气候区的错误数据百分比较大些,亚热带季风和温带大陆性气候区大多都在3%以内,亚热带季风气候区在30km错误点百分比较大,在9%左右,质量控制出的错误点较多。

  • 2)质量控制前后相关系数对比分析

  • 图9为4个气候区质量控制前、第一步质量控制之后和第二步质量控制之后GPS掩星气压与探空气压之间的相关系数。在质量控制之前,两者之间的相关系数很小,相关性较差。分析其原因,相关系数较容易受异常值的影响,对第一步质量控制出的错误点与探空气压进行对比,发现与探空之间的差异可以达到100hPa,两者相差较大,所以在质量控制之前两者之间的相关系数的值较小,几乎都在0.5以下。在经过第一步质量控制之后,剔除其中的错误点,可以发现,两者之间的相关系数值有了很大的提高,几乎都在0.8左右,然后再加入探空作为参考进行质量控制之后,相关系数再一次增大,剔除了数据中的错误数据,质量控制效果较好。

  • 图5 4个气候区气压偏差的可疑阈值和错误阈值标准以及单个时刻的气压偏差分布:(a)温带大陆气候区;(b)亚热带季风气候区;(c)温带季风气候区;(d)高原山地气候区

  • Fig.5 Suspicious threshold and error threshold standards of atmospheric pressure deviation in four climate zones,and the distribution of atmospheric pressure deviation at a single moment:(a)temperate continental climate zone;(b)subtropical monsoon climate zone;(c)temperate monsoon climate zone;(d)plateau mountain climate zone

  • 3 结论与讨论

  • 利用2014年1月1日到12月31日全年的COSMIC掩星反演气压数据作为GPS掩星试验样本,采用同时段内的L波段探空数据作为参考,对GPS掩星气压数据进行了评估及质量控制,并检验了质量控制的效果,结论如下:

  • 1)双权重平均值和双权重标准差相比较传统方法计算出的平均值和标准差更不易受异常数据的影响,使评估和质量控制结果更加准确。

  • 2)4个气候区之间气压的双权重平均值差异较小;双权重标准差亚热带季风气候区数值较小在6hPa以内,温带季风气候区双权重标准差较大,最大可达到15hPa。加入探空作为参考场气压偏差的统计中,亚热带季风气候区从低层到高层都为正偏差,偏差值在0.8hPa左右,温带季风、温带大陆和高原山地气候区在6km以下多为负偏差,6km以上则为正偏差,值在0.5hPa左右,偏差较小。

  • 3)将区域根据气候区特点划分不同的气候区,划分不同的质量控制标准,质量控制效果较好,质量控制出的错误点分布在GPS掩星气压与探空气压相差较大的区域,4个气候区错误数据百分从低层到高层略微有一点增大,整体大都在4%以内,错误数据较少。在第二步加入探空作为参考的质量控制中,整体大多数都在5%以内,对比质量控制前后GPS掩星气压与探空气压之间的相关系数,质量控制之后两者的相关性得到明显改善。

  • 图6 4个气候区GPS掩星气压与探空气压相关系数的廓线分布

  • Fig.6 Profile distribution of correlation coefficient between GPS occultation pressure and sounding pressure in four climate zones

  • 图7 4个气候区GPS掩星气压与探空气压的散点分布图(黑色实线为y=x,散点为错误数据):(a)温带大陆气候区;(b)亚热带季风气候区;(c)温带季风气候区;(d)高原山地气候区

  • Fig.7 Scatter plot of GPS occultation pressure and sounding pressure in four climate zones(Black solid line is y=x,and scattered points are wrong data):(a)temperate continental climate zone;(b)subtropical monsoon climate zone;(c)temperate monsoon climate zone;(d)plateau mountain climate zone

  • 图8 4个气候区第一步质量控制(a)和第二步质量控制(b)的错误数据百分比

  • Fig.8 Percentage of error data in the(a)first and(b)second step of quality control in four climate zones

  • 图9 4个气候区质量控制前后GPS掩星气压与探空气压的相关系数:(a)温带大陆气候区;(b)亚热带季风气候区;(c)温带季风气候区;(d)高原山地气候区

  • Fig.9 Correlation coefficients between GPS occultation pressure and sounding pressure before and after quality control in four climate zones:(a)temperate continental climate zone;(b)subtropical monsoon climate zone;(c)temperate monsoon climate zone;(d)plateau mountain climate zone

  • 此外,本文中选取了GPS掩星气压中较为成熟的COSMIC掩星气压作为样本进行质量控制,此方法同样也适用于我国FY-3C、FY3D掩星气压以及其他掩星气压的质量控制,为GPS掩星气压提供较为精细的质量控制方法,剔除数据中的错误数据,为天气分析、数值预报提供更加准确的观测资料。

  • 参考文献

  • 参考文献

  • 地址:江苏南京宁六路219号南京信息工程大学    邮编:210044

    联系电话:025-58731158    E-mail:xbbjb@nuist.edu.cn    QQ交流群号:344646895

    大气科学学报 ® 2024 版权所有  技术支持:北京勤云科技发展有限公司