摘要
以中央气象台的业务实践为例,深入剖析了气象预报业务向智能化转型进程中所面临的挑战。同时,全面回顾了近10年来人工智能技术在强对流天气、台风等灾害性天气监测预报中的应用情况,以及在气象要素(包括定量降水)、气象灾害风险预报与评估,乃至气象预报服务产品自动化制作等各业务环节中的实际应用。着重介绍了2024年发布的人工智能气象短临预报大模型“风雷”和全球中短期预报大模型“风清”。最后,对大模型等人工智能技术在气象业务中的深入应用展开了探讨。
Abstract
<html><head>Using the operational practices of the National Meteorological Center as a case study, this paper critically examines the technical limitations currently faced in short-term and medium- to long-term weather forecasting as efforts progress seamless forecasting capabilities. Key challenges include improving the accuracy of forecasts for extreme hazardous weather events and transitioning toward intelligent forecasting systems that effectively integrate both subjective and objective methods. Building on the historical trajectory of meteorological forecasting—particularly the advancement of numerical weather prediction through the integration of atmospheric, computational, and information sciences—this study highlights the growing importance of artificial intelligence (AI) as a critical enabler of forecasting capability. The article provides a comprehensive review of AI applications in meteorology over the past decade, including its use in monitoring and forecasting severe convective weather, typhoons, quantitative precipitation, secondary disasters such as mountain floods, intelligent grid-based forecasting of meteorological variables, risk assessments of meteorological disasters, and the automated generation of text and graphic forecast products. Particular attention is given to two AI-based models released in 2024: Fenglei, a nowcasting system for high-impact weather, and Fengqing, a global short- and medium-term forecasting model. The integration of AI with traditional meteorological techniques has significantly improved the accuracy of forecasts for typhoons, heavy rainfall, and severe convection. The deployment of AI across operational systems at the National Meteorological Center has accelerated the digital and intelligent transformation of weather forecasting. The release and application of the Fenglei and Fengqing models represent a substantial step forward, positioning the center at the forefront of meteorological forecasting innovation. Nonetheless, several urgent issues remain from an operational perspective. There is a crucial need to reduce dependency on high-quality foreign datasets by leveraging the China Meteorological Administration's observational capabilities to build long-term, high-quality meteorological datasets. To address the inherent “black box” nature of AI models, effective statistical tools must be developed for interpreting their predictions. Moreover, integrating forecasters' intuitive knowledge into AI systems may enhance model performance in forecasting rare extreme weather events, for which training samples are limited. Finally, advancing intelligent forecasting operations requires the development of integrated AI systems capable of supporting meteorologists across all phases of forecasting. This includes the construction of digital AI forecasting assistants that combine various algorithms—such as numerical models, intelligent grid forecasts, and large language models—into a unified operational framework.
Keywords
现代天气预报业务以数值模式预报为基石,通过预报员对各类气象观测数据进行综合分析与研判,从而发布最终的预报结论。然而,随着气象观测技术的不断进步,观测数据量呈现出爆炸式增长,尤其是卫星、雷达等遥感探测数据。以数值同化手段应用于观测资料的传统数值模式、以人机交互为主要手段的天气业务平台,在面对海量数据的分析与应用时,暴露出了诸多局限性,这使得天气预报精准度的提升步伐逐渐放缓。另一方面,在全球气候变化的大背景下,社会各界对气象预报服务趋利避害的要求日益提高。传统天气预报在满足公众、政府和行业对预报时效、预报精准度以及服务精细度方面的需求时都暴露出诸多局限性。在这样的形势下,人工智能技术凭借其强大的数据处理、高效的模式识别以及精准的预测分析能力,迅速在气象预报领域崭露头角,为应对上述挑战提供了全新的思路与解决方案。近年来,人工智能技术更是成为气象领域研究与应用的热点方向(Reichstein et al.,2019; 黄建平和陈斌,2024)。本文以中央气象台为具体案例,着重从当前天气预报所面临的挑战入手,深入剖析近10年来人工智能技术在提高预报精准度、提升业务效率方面的成功实践,全面回顾了当前人工智能技术在气象预报业务中的应用现状,并对未来人工智能气象大模型在业务应用中的发展趋势展开了探讨。
1 气象预报业务面临的新挑战
1.1 天气预报业务向无缝隙发展面临的两端挑战
从分钟到年代际,从局地到全球全覆盖,无缝隙预报作为地球系统科学前沿的重要指标,被世界气象组织(World Meteorological Organization,WMO)列为重要发展方向。2014年,中央气象台启动了智能网格预报业务建设,通过大力发展数值模式解释应用技术,2018年初步建成一套覆盖全球的无缝隙智能网格客观预报产品体系。在短时临近预报时段,自2015年起,中央气象台便开展了强对流天气短时预报业务探索,尤其在龙卷等强致灾性强对流天气期间,会向下级气象台站提供不定时的强对流天气发生发展趋势的指导(张小玲等,2018)。近几年,短临预报业务系统SWAN(Severe Weather Analysis and Nowcasting)也在不断集成面向雷暴大风、冰雹、短时强降水甚至龙卷的临近预报方法,以提升灾害性天气临近预警落区和强度的精准度,并延长预警时效。在长期预报时段,中央气象台的温度、降水等智能网格预报产品已延长至30 d; 2024年,更是联合国家气候中心和中国气象局公共气象服务中心,开始打造中国气象局的0~60 d智能网格预报产品体系。经过10余年的发展,智能网格预报体系中的气温、降水、风等基本气象要素预报已经能满足10 d内从临近到中期的预报服务需要,但支撑雷暴大风、冰雹等强对流天气短时临近预警的客观指导产品以及极端暴雨事件等重大灾害性天气的中长期预报,仍然是业务技术发展的重点(张小玲等,2018; 金荣花等,2019),也是政府对天气预报的重大需求。人工智能技术正逐步攻克气象预报领域的关键难题,在临近预报方面,有望突破1 h的预测瓶颈,在中长期预报上,力图打破2周的时效局限,甚至在天气气候一体化预报的发展进程中,也展现出了极具创新性的应用前景(孙健等,2021; 周康辉等,2021),这为中央气象台继续发展无缝隙预报业务提供了新的助力。
1.2 预报质量提升出现瓶颈
近10余年,中央气象台的暴雨预报质量稳步提升,TS(threat score)评分显示,相对全球最先进数值模式——欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts,ECMWF)的IFS模式,预报质量提高率在20%以上,近3年的提高率则在30%以上(图1)。反观数值模式的发展,对暴雨等灾害性天气的预报准确率并未有显著改进。如图1中橙色柱体所示,ECMWF在2016年将IFS模式的水平分辨率从25 km升级到9 km,但分辨率的提升并未带来强降水预报质量的提升。此外,深度依赖数值模式预报的台风路径预报和风雹类强对流天气潜势预报也进入了瓶颈期,预报质量在近几年没有明显提升(图2、图3)。
1.3 天气预报作业方式向智能化转变的挑战
中央气象台无缝隙智能网格预报体系的建立,推动了气象预报从传统站点预报和落区定性预报转变为精细定量的网格化预报,为气象服务奠定了数字化基础,也意味着天气预报从劳动密集型向智力聚集型发展。主客观融合,即客观预报技术上附加预报员主观经验,成为主流预报作业方式。以降水为例,2018年,中央气象台启动了主客观融合的定量降水预报业务流程改革,预报员开始在客观定量的降水网格预报和数值模式定量降水预报基础上进行量级和落区的订正(唐健等,2018),这也加速了预报员去研发更多的客观预报技术,这些技术的预报性能基本超越了单一的数值模式,甚至在统计意义上超过了预报员的主观订正预报(图4)。这势必会对未来预报员的作业方式产生链级效应,以天气形势与物理量场分析为主的人机交互预报系统又该如何去适应预报技术的进步呢?
天气预报向无缝隙发展所带来的技术、预报质量、预报作业方式变革等问题,已成为当前中央气象台业务转型发展面临的首要任务。过去100年天气预报,特别是数值天气预报的发展,或许能为转型发展提供一些借鉴和参考。数值天气预报的发展是现代天气预报的基石,这一发展既得益于大气科学的进步,更关键的是,其受益于大气科学与计算科学、信息科学的深度交叉融合(Bauer et al.,2015)。毫无疑问,人工智能气象应用已成为当前大气科学与计算科学、信息科学融合发展的最耀眼明星,且也正成为提升天气预报业务能力的重要支撑手段。
2 人工智能气象预报应用现状
近年来,人工智能被广泛应用于气象预报中(Reichstein et al.,2019; 马雷鸣,2020; 贺圣平等,2021; 周康辉等,2021; 董润婷等,2023)。2022年,英伟达(NVIDA)率先发布全球中短期天气预报大模型FourCastNet(Pathak et al.,2022)。2023年,华为发布的全球中短期天气预报大模型“盘古”(Pangu-Weather)首次从统计意义上超过了ECMWF的大气环流确定性预报(Bi et al.,2023),从而开启了“百模大战”。一些科技公司如DeepMind、谷歌、微软等,以及国内高校和新型研发机构如清华大学、复旦大学、上海人工智能创新中心等发布了涵盖临近预报、短时预报、中期预报和延伸期预报乃至气候预测等不同领域的气象大模型(Zhang et al.,2020; Chen K et al.,2023; Chen L et al.,2023; Lam et al.,2023),这标志着气象学与以人工智能为代表的信息科学的交叉融合迈入了全新阶段。
图12012—2024年24 h暴雨(24 h累计降水量≥50 mm)预报评估时序(蓝色柱体为中央气象台定量降水预报TS评分,橙色柱体为ECMWF的IFS模式预报TS评分,灰色线条为中央气象台主观预报相对数值模式预报的提高率)
Fig.1Time series of 24 h rainstorm forecast evaluations (accumulated precipitation ≥50 mm) from 2012 to 2024. The blue bars represent the Threat Score (TS) of quantitative precipitation forecasts issued by the National Meteorological Center. The orange bars indicate the TS of forecasts from the ECMWF IFS numerical model. The grey line shows the improvement rate of the National Meteorological Cente's subjective forecasts relative to the numerical model predictions
图21991—2023年台风路径预报误差
Fig.2Typhoon track forecast errors from 1991 to 2023
图32010—2024年分类强对流天气潜势预报TS评分
Fig.3TS of categorical severe convective weather potential forecasts from 2010 to 2024
图42023年5—10月24 h暴雨预报评估(粉色阴影区代表预报员预报,其中黑色柱体为预报员在客观预报和数值模式预报基础上的主观订正预报TS评分,其他柱体为预报员研发的客观预报技术的TS评分; 绿色阴影区代表数值模式,柱体代表业务主流数值模式的预报TS评分; 红色实线为BIAS评分,越接近红色虚线表示预报偏差越小)
Fig.4Evaluation of 24 h rainstorm forecasts from May to October 2023. The pink shaded area indicates forecasts issued by forecasters. Within this area, the black bars represent the TS of subjective correction forecasts based on objective guidance and numerical model outputs, while the other bars represent the TS of various objective forecasting techniques developed by forecasters. The green shaded area shows the TS of forecasts from major operational numerical models. The solid red line represents the Bias; the closer it is to the dashed red line, the smaller the forecast bias
人工智能在我国气象预报中的应用可以追溯到20世纪90年代。20世纪90年代—21世纪00年代,支持向量机、决策树、随机森林、BP神经网络等机器学习方法被广泛用于数值模式后处理解释应用(陈永义等,2004; 冯汉中和陈永义,2004; 赵声蓉等,2012),如2004年开始在中央气象台运行的站点温度预报显著优于数值模式直接输出结果,就得益于神经网络方法的引入。21世纪10年代,深度学习技术逐渐成为气象预报中的新热点,深度神经网络、卷积神经网络和循环神经网络等深度学习技术的应用显著提升了灾害性天气监测和预报水平。机器学习等作为模式解释应用的重要方法被广泛应用于降水、气温等常规气象要素预报和强对流、暴雨、台风等灾害性天气预报。2017年,基于深度学习的分类强对流天气预报方法成功预测华北秋季一次罕见的风雹类极端强对流天气事件,引起预报员的广泛关注; 使用该方法的全年强对流天气预报TS评分首次超过预报员的平均水平,极大增强了预报员使用人工智能技术的信心(张小玲等,2018),加速了人工智能气象应用技术在中央气象台的全面开展。目前,人工智能技术已经全面融入中央气象台的天气监测、分析和预报,以及预报服务产品的自动生成等各业务环节。2024年,中国气象局人工智能气象预报大模型“风雷”和“风清”的发布和业务应用,标志着中央气象台正在人工智能气象应用新赛道上加速发展。下面分别从人工智能气象监测分析预报技术和人工智能气象预报大模型两方面介绍中央气象台的相关进展。
2.1 人工智能技术在气象监测预报服务中的应用
2.1.1 强对流天气监测预报
2017年以来,基于深度学习算法的强对流天气监测识别、临近短时和短期预报技术在中央气象台体系化发展,并成为我国强对流天气监测预警的重要技术支撑。在监测方面,周康辉等(2017)在地面气象站观测的大风和其他气象要素基础上,结合雷达、卫星、闪电等多源观测,利用模糊逻辑方法实现了对全国雷暴大风的识别,这为开展分类强对流天气预报奠定了数据基础。2015年,香港科技大学施行健博士等提出的长短记忆卷积神经网络方法在短临预测中很好刻画出强对流系统迅速变化特征,被成功引入香港天文台的短临预报业务系统中(Li et al.,2000; Shi et al.,2015)。受此启发,清华大学的龙明盛团队提出了预测式循环神经网络PredRNN,开展雷达回波预测(Wang et al.,2017),并被成功引入中央气象台的短临预报系统SWAN中。PredRNN在时间记忆模块的循环基础上,增加了空间记忆模块的传播路线,强化空间信息在不同层次和不同时间的神经元中的传播,预测效果较传统的交叉相关外推方法有明显改进,但仍然存在60 min后预报准确率下降明显、强回波预报准确率不高的问题(韩丰等,2019)。随后几年,中央气象台与清华大学在科技部重点专项项目支持下,针对PredRNN模型在实际业务场景中的应用受限于消散和模糊等问题进行了持续研究,先后提出了PredRNN++、MotionRNN,致力于解决强对流天气预报带来的“长尾效应”和长时效预报梯度下降问题(Wang et al.,2018; Wu et al.,2021)。自2018年起,这些方法逐步集成于中央气象台的短临预报系统SWAN中。雷达回波预报统计检验结果显示,代表强对流天气的35 dBZ以上强回波预报明显优于传统外推预报(图5)。但是,1 h以后预报质量显著下降、与强风雹天气相关的50 dBZ以上强致灾性极端强对流天气预报质量不高等问题仍然没有得到根本解决。
PredRNN及其改进模型主要使用雷达资料进行临近预测,中央气象台还尝试融合多源数据构建深度学习短时临近预测模型。例如:构建深度学习三维语义分割模型,从雷达回波、卫星云图、闪电密度等观测数据中提取闪电的时空发生、发展特征,开展0~1 h的闪电预报(Zhou et al.,2020); 基于多源观测数据和业务中尺度模式CMA-MESO,发展0~6 h闪电落区预报(周康辉等,2021)。后一种方法还被迁移到冰雹、雷暴大风等预报,建立了逐小时的分类强对流天气预报。该方法的预测结果显示,多源观测数据与数值模式数据融合相比单纯使用多源观测数据或单独使用数值模式数据,有更好的预报效果,且融合预报时效越长,融合的优势越明显。而短期预报则主要建立在全球数值模式预报基础上,使用卷积神经网络基于超过100个对流指数和物理量进行训练,实现了未来3 d的分类强对流天气潜势预报,冰雹、雷暴大风和短时强降水预报在统计检验意义上超过了预报员的主观预报,已成为中央气象台强对流天气预报的重要业务指导产品(张小玲等,2018; Zhou et al.,2019; 周康辉等,2021)。
图52022年7—9月全国雷达回波30、60、90和120 min预报TS评分(橙色柱体为深度学习算法PredRNN++,蓝色和绿色为SWAN系统中的光流法等传统外推预报)
Fig.5TS for radar echo forecasts at lead times of 30, 60, 90, and 120 minutes from July to September 2022. The orange bars correspond to forecasts produced by the deep learning algorithm PredRNN++, while the blue and green bars represent traditional extrapolation methods such as the optical flow technique used in SWAN
2.1.2 台风监测预报
在众多人工智能应用研究成果的鼓舞和启发下,中央气象台尝试选择了一些深度学习模型在台风监测和预报业务中开展运用,包括基于深度图像目标检测的台风涡旋识别、定位定强、路径预报、强度预报等(吕心艳等,2022; 周冠博等,2022a,2022b)。2019年中央气象台联合北京邮电大学,提出了一种端到端的可视化智能台风定强模型,以ResNet模型为基础,在预训练后应用迁移学习技术,以西北太平洋和南海台风的卫星云图为样本,设计了一种自动且客观的台风强度估测技术,其精度明显优于传统方法,并于2019年投入中央气象台全球热带气旋监测预报业务中(钱奇峰等,2021)。近年来,中央气象台也在不断尝试传统的路径预报方法与人工智能新技术相结合,优化台风路径集合预报订正(typhoon track ensemble correction,TYTEC)方法,通过人工智能算法自动调整各集合预报模式的参数及权重系数,从而取得最佳台风路径预报效果; 以基于时空关联深度学习模型为基础,通过标注、学习、预测已有数据中的关键信息来解决台风强度快速增强趋势预测和判别问题。
然而人工智能技术在台风监测和预报的应用中还存在许多困难和挑战,未来将需要强化海量的气象卫星图像资料应用,通过人工智能技术对卫星图像特征信息进行深度学习和挖掘,结合数值模式对台风强度进行预报,更加精准地识别出全球范围内同时存在的多个热带气旋,并且自动进行定位和定强、台风路径预报优化以及台风强度突变预报。
2.1.3 定量降水及衍生气象灾害风险预报
提高降水临近预报的准确度和时空分辨率一直是气象预报领域的重要研究方向(金荣花等,2019)。快速滚动更新的临近预报使用金字塔架构的LK光流技术,通过解决无回波区域的最优平流风场问题,将U-Net模型引入分钟级临近降水预报;相较光流法和业务中尺度模式CMA-MESO,10 mm/h以上的强降水预报效果有明显提升(曹勇等,2016,2021)。此外,利用雷达、卫星、地面观测等多源观测和全球、区域模式预报数据,通过研制频率匹配与机器学习等模式后处理新技术,使临近、短时、短中期无缝隙定量降水精细化网格预报技术得以逐步构建。
暴雨等引发的山洪及其产生或诱发的灾害,具有突发性强、危害性大、预见期短等特点,在全世界范围内都造成了巨大的灾难。近年来,中央气象台也开始尝试基于无缝隙的定量降水预报,发展山洪等气象灾害风险预报,如包红军等(2018)将BP神经网络多断面水位预报实时校正模型与水动力学模型结合,进行河道洪水实时预报; 通过分布式水文模型与动态雨量阈值技术的融合,发展了分钟级的山洪短临预报技术。
2.1.4 其他应用
数值模式的快速发展,提供了从全球到对流尺度、集合到确定、短时到中长期的多尺度、多种类气象要素的网格化预报场,但基于大气动力学的数值模式仍然无法清晰描述所有物理关系,其预报也无法解决近地面的天气细节问题,因此,在实际天气预报业务中,仍然需要在模式预报基础上利用实况信息进行解释应用,以提高预报技巧。自2014年起,中央气象台着力构建无缝隙智能网格预报产品体系。在该体系的建设进程中,诸多气象要素借助人工智能技术,实现了预报技巧的显著提升(赵声蓉等,2012; 金荣花等,2019; 杨绚等,2022a)。
在使用人工智能技术显著提升气象要素预报精度方面,最为典型的范例当属为保障2022年北京冬奥会成功举办而研发的STNF技术。该技术聚焦复杂地形下北京冬奥赛场高时空分辨率的多场景气象保障服务需求,依据各时效风和气温等要素可预报性特征,分别采用复杂地形模式多维插值、多机器学习优选、全阈Kalman滤波、多模式MOS优选、EMOS概率预报订正、BP神经网络订正等人工智能和统计方法,结合物理过程诊断客观固化预报员预报制作思维过程,提供涵盖风、气温、湿度等气象要素的15 d内无缝隙客观预报。在冬奥示范计划中,与来自国内外的预报技术同台竞技,STNF的阵风等气象要素的预报始终名列第一(https ://www .cma .gov .cn/2011xwzx/2011xqxxw/2011xqxyw/202310/t20231023_5841239.html; Xiong,2023)。STNF技术随后被拓展到全国2 000余个站点业务预报和面向风能、太阳能的新能源预报服务中。
此外,在雾的监测与预报和能见度预报中,使用神经网络方法构建监测预报模型也取得了很好的效果(马学款等,2007; 胡海川等,2018)。在气象灾害风险评估中,刘扬和王维国(2020)利用随机森林算法构建了暴雨灾害人口损失预估模型;Liu et al.(2023)使用机器学习方法评估了台风灾害损失。在县域台风灾害经济损失风险评估中,杨绚等(2022b)通过随机森林、支持向量机等5种经典的机器学习算法发现,气象灾害风险评估需要结合我国无缝隙精细化智能网格预报技术,将孕灾环境和致灾因子匹配至智能网格预报的网格分辨率上,同时需要结合全国千米尺度网格化天气预报产品,这样才能提高气象灾害风险评估的精度。
如何提升气象服务产品制作效能,也是预报业务必须面对的挑战。2018年,中央气象台基于人工智能方法,研发出文字产品自动生成方法,初步实现了涵盖定量降水和强对流天气、大雾、沙尘、高温等灾害性天气在内的天气公报、预警等图文产品的自动生成,不仅大幅度节约了预报员手工操作的时间,而且显著降低了图文产品的出错率(https :// www .cma .gov .cn/2011xwzx/2011xgzdt/201810/t20181010_479569. html)。近几年,通过不断改进算法,基于人工智能算法的文字产品自动生成系统已经涵盖中央气象台的全部预报服务业务,制作天气公报等产品的时间由预报员纯手工操作的30 min缩短到几分钟。
2.2 人工智能气象预报大模型及应用
2022年以来,人工智能气象预报大模型已成为气象预报竞争的新赛道,大模型在全球中短期大气环流中的预报与数值模式预报相当,且在计算效率和迭代更新方面更是表现出远超传统数值预报的优势。2023年,中央气象台确定了人工智能气象预报大模型体系的战略发展路线:通过与人工智能领域的优势高校和科研单位合作,发展自主可控的人工智能气象预报基础大模型和适配不同预报业务领域的专业适配模型; 开展人工智能气象预报大模型示范比对计划,加速先进的大模型业务转化应用。2024年6月,人工智能气象短临预报大模型“风雷”、全球中短期预报大模型“风清”公开发布,逐步成为数值预报的重要补充,在强对流天气临近预报、台风路径预报以及高温等灾害性天气预报中都有出色表现。
2.2.1 人工智能气象短临预报大模型“风雷”
“风雷”是中央气象台与清华大学合作、在NowcastNet(Zhang et al.,2020)的基础上改造而成。NowcastNet创新融入守恒定律的神经演变算子,使用雷达数据实现0~3 h雷达回波和降水预报,效果显著优于传统外推预报光流法,也是国际上首个具有物理约束的短临预报大模型。该模型采用端到端的方式,将降水物理过程的神经演变算子与深度学习技术相结合,实现了深度学习与物理规律的无缝融合。2023年底,中央气象台与清华大学携手组建的联合研究团队开始对NowcastNet模型进行适应业务改造。考虑到我国复杂地形对强对流天气的局地生消和发展有重要影响,“风雷”在NowcastNet骨干模型中增加了海拔高度和海陆掩码等地形信息的输入; 为了应对全国业务化实时运行带来的数据规模显著提升挑战,在训练数据集的构建中,将中国区域的雷达拼图进行了全图序列裁剪空间扩充以及垂直和水平方向偏移,并使用了分层抽样技术; 为了降低国产雷达数据中噪音对模型的影响,提升模型的鲁棒性,采取百分位编码-解码器和时间平滑的方案来对数据进行去噪,将NowcastNet中的二阶段生成式模型中的编码-解码结构替换为变分自编码器。团队最终利用2016—2022年近40万次上亿条序列的全国雷达回波组合反射率训练数据,并利用2023年数据对大模型预报效果进行了验证。2024年5月,中国气象局在人工智能智算平台部署了“风雷”大模型,从而实现了数据、算法和平台的全链条自主可控。“风雷”大模型提供全国范围1 km水平分辨率、逐6 min滚动更新的0~3 h雷达回波组合反射率预报产品。预报产品被集成于短临预报业务系统SWAN中,提供给全国各级气象预报台站使用。
2023年的雷达组合反射率回报评估显示,与SWAN中原有业务产品相比,“风雷”大模型预报时效延长至3 h,且在2 h内各个预报时效的TS评分均明显高于原业务产品; 在强回波预报方面,“风雷”大模型TS评分显著优于原业务算法; 回波面积预报误差在3 h内均很稳定,在1 h之后显著小于原业务产品,体现出“风雷”模型无论在预测稳定性还是强对流天气的预报上,都明显好于短临预报系统SWAN中的原有算法(图6)。“风雷”大模型在强对流天气临近预测中的优势在北京一次雷暴下山组织化发展过程预报中表现突出,获得预报员的广泛认可。2024年5月30日中午,河北西北部和内蒙古交界的高海拔山区对流发生后以70 km/h的速度快速东南移动,并且下山后发展为有组织的飑线系统,在北京城区造成破坏性的极端大风天气(图7)。雷暴下山是否发展一直是困扰强对流天气预报的难题。而此次过程,北京地区对流发生的大气热力和水汽条件非常弱,更是增加了预报员及时发布强对流天气预警的难度。“风雷”大模型多个时次稳定预报对流下山增强为飑线并横扫全市,为及时发布强对流预警提供了有力支持。
2.2.2 人工智能全球中短期预报大模型“风清”
2023年,中央气象台组建人工智能气象预报大模型敏捷攻关团队,联合清华大学和国家气象信息中心等科研业务机构,着力构建自主可控的全球中短期天气预报人工智能大模型。团队选择了物理启发的模型结构研制路线:以变换器网络结构Transformer为基础,充分考虑了已公开发布大模型以计算机视觉模型将天气过程建模为空间信息交互导致的物理可解释性等问题,原创神经状态转移模型Transitor,将气象资料投影为隐空间的物理状态,实现将天气过程中复杂的时空变化、物理反应转换为隐空间中的状态转移,使得深度模型可以挖掘天气过程背后的机理,提高模型的物理可解释性; 在模型的训练策略中,仍采用物理启发的路线,引入哈密顿神经网络,将能量损失函数集成入损失函数; “风清”大模型还通过设计多尺度建模框架,确保模型能高效学习不同尺度下的天气过程(https ://www .cma .gov .cn/2011xwzx/2011xqxxw/2011xqxyw/202407/t20240701_6388093.html)。“风清”大模型最终实现了采用中国气象局自主研发的1979—2022年CMA-CRA40逐6 h再分析数据作为训练集,以中国气象局数值模式CMA-GFS零场作为初始场,部署运行在中国气象局智算平台上,实现从数据、模型算法和平台的全链条自主可控。
目前,“风清”大模型为全国各级预报台站实时提供全球水平分辨率为25 km、时间分辨率为6 h的未来15 d的13个等压面的高空和地面气象要素预报。2022—2023年“风清”大模型的回算预报(图略)显示,500 hPa高度场距平相关系数与国内的“风乌”和“伏羲”大模型相当,优于ECMWF的确定性预报。2024年5月以来影响我国的12个台风路径预报显示,“风清”大模型的台风路径预报误差在72 h内与ECMWF的路径预报误差相当; 在24 h内略低于中央气象台和美国飓风中心发布的主观预报,优于日本气象厅发布的主观预报。在2024年对登陆我国的最强台风“摩羯”的路径预报中,“风清”大模型在120 h内的预报结果均优于ECMWF和中国、日本、美国的主观预报(图8)。但与传统数值模式相比,“风清”大模型在台风强度预报、暴雨等灾害性天气预报上还有较大的差距。
图62023年4—9月雷达回波回报评估:(a)强回波TS评分;(b)回波面积预报偏差BIAS
Fig.6Evaluation of radar echo re-forecasts from April to September 2023: (a) TS for strong radar echoes; (b) Bias in echo area forecasts
图72024年5月30日13:15(北京时,下同)(a)、14:15(b)和15:30(c)风云4B卫星图像,以及“风雷”大模型13:48预报的14:18(d)、14:48(e)和15:36(f)的雷达回波图(单位:dBZ)
Fig.7FY-4B satellite imagery and radar echo forecasts on May 30, 2024. (a) , (b) , and (c) show satellite images at 13:15 BST, 14:15 BST, and 15:30 BST, respectively. (d) , (e) , and (f) show radar echo forecasts at 14:18 BST, 14:48 BST, and 15:36 BST from the Fenglei large model initialized at 13:48 BST, respectively (units:dBZ)
3 总结和讨论
本文以中央气象台的业务实践为例,分析了天气预报业务向智能化转型进程中所面临的挑战,回顾了近10年人工智能技术在强对流天气、台风等灾害性天气的监测预报中的应用,在定量降水及其衍生山洪等气象风险预报中的应用,在智能网格预报的各类气象要素预报中的应用,以及在气象灾害风险评估和自动化的图文产品制作等的应用,并重点介绍了2024年发布的人工智能气象短临预报大模型“风雷”和全球中短期预报大模型“风清”。
人工智能技术已在中央气象台的各业务环节得到应用,在一定程度上加速了天气预报业务向数字化、智能化升级转型发展,特别是人工智能气象预报大模型“风雷”和“风清”的发布以及投入业务实际应用,使得中央气象台及时跻身气象预报前沿发展的新赛道,具有积极的示范意义。
人工智能与传统气象技术的整合,提高了台风、暴雨、强对流等天气的监测预报准确性,而气象大模型则展示了人工智能在应对无缝隙预报的临近预测和中长期两端困境的潜力,综合其在预报时效性和计算速度等方面的优势,将有可能给气象预报业务带来极大的变革。但是,“风雷”和“风清”大模型和其他大模型一样,未来发展面临众所周知的可解释性、数据的不确定性、模型可迁移性、预报过度平滑导致极端天气难以预测等一系列科学和技术问题(马雷鸣,2020; 孙健等,2021; 李双林等,2022; 黄建平和陈斌,2024; 黄小猛等,2024)。众多学者认为,数值模式与人工智能融合发展,不失为一条推动气象领域进步的有效路径。从业务应用的角度,本文想更加强调如下4个方面。
1)数据质量问题。“风雷”和“风清”大模型的预报均显示出,在当前人工智能气象应用的新赛道,中央气象台的技术和业务示范均处于国际第一梯队,但也暴露出数据在未来持续发展中的短板。“风雷”和“风清”大模型均开展了使用国外先进机构发布数据和中国气象局自研数据作为训练集的比较。“风雷”大模型的原型NowcastNet使用美国雷达回波拼图数据进行训练,在美国对16 mm/h的降水2 h预报的中位临界成功指数可高达0.3(Das et al.,2024)。使用中国雷达回波数据训练的“风雷”大模型,其预报性能则有所降低。“风清”大模型同样也暴露出使用国产数据性能下降的特点。2023年的回报试验显示,“风清”大模型使用ERA5数据进行训练,全球500 hPa位势高度场有效预报超过10 d,而使用国产数据CMA-CRA40训练的模型有效预报时间则为9.25 d。因此,发挥中国气象局的气象观测和气象数据采集优势,构建长序列高质量的气象数据集,迫在眉睫。
图8气象大模型与数值模式、气象业务机构官方发布的台风路径预报误差对比(BABJ代表中央气象台主观预报,JMA代表日本主观预报,JTWC代表美国飓风中心主观预报,EC代表ECMWF的IFS模式预报,其余均为各公开发布大模型预报,其中Fengqing表示“风清”大模型预报):(a)2024年5—10月影响中国的台风;(b)2024年台风摩羯
Fig.8Comparison of typhoon track forecast errors among large meteorological models, numerical models, and official forecasts by operational meteorological agencies. “BABJ” refers to the subjective forecast from the National Meteorological Center; “JMA” and “JTWC” denote the subjective forecasts from the Japan Meteorological Agency and the Joint Typhoon Warning Center (U.S.) , respectively; “EC” represents the IFS forecast from ECMWF. The remaining forecasts are from publicly available large-scale models. “Fengqing” represents forecast from the Fengqing large model. (a) Typhoons affecting China from May to October 2024; (b) Typhoon Yagi in 2024
2)“黑匣子”问题。人工智能气象预报大模型虽然能提供有用的预测,但预测结果不是基于清晰的方程组和参数推理而得,其存在不可解释性,可能会产生违背常识的预测结果,因此引起广泛的担忧。当前各类气象预报大模型主要使用隐含大气物理约束的再分析数据训练,还尚未出现违背常识的预报。但未来会引入更多的雷达、卫星等遥感探测数据以及地面站点观测数据,来发展端到端的气象预报大模型,这是否会出现预报“幻觉”就非常值得关注。目前,人工智能方法的准确性和可解释性之间存在着一种负相关关系:解释性越大,准确性越低。鉴于人工智能能够在人类难以理解但至关重要的高维空间中进行操作,其依赖的“黑箱”模型在通过增加数据量提升准确性的同时,亦需发展有效的统计学工具,以对“黑箱”模型的预测结果进行合理的解释,如对一些假设的量化测试验证、相关性分析、信度区间和概率分布分析等(马雷鸣,2020)。
3)极端天气预报问题。数值模式和人工智能等气象应用技术已经能较为准确地预测常规天气。实际业务更加关注极端天气,如风雹类强对流天气、路径和强度快速变化的台风和极端暴雨等灾害性天气。这些极端天气目前主要还是依赖预报员的主观分析判断。对于小概率极端灾害性天气,虽然人工智能气象预报大模型可以通过使用重加权算法等对不平衡的类别给予不同的惩罚,使得模型优化偏向于少数类,但样本不平衡的问题仍属于一大挑战。而有经验的预报员通常通过对某个令人困惑的数据点的直觉来放大异常从而实现对极端天气的分析研判。如何将预报员对极端天气分析判断的直觉经验融入人工智能气象预报大模型,从而发展灾害性天气适配模型,值得深入研究。
4)人工智能技术业务集成应用问题。过去的业务发展已经验证,信息技术可极大提升天气预报业务质量(Rappaport et al.,2012)。中央气象台通过将先进信息技术与现代天气预报技术紧密结合,发展了全国气象预报业务系统MICAPS(Meteorological Information Comprehensive Analysis and Processing System),实现了预报业务流程从纸质到电子数字化的革命性变革(高嵩等,2017)。据估计,到2030年业务中心每天产生的分析和预报数据的量级将达到PB级。预报员从这些海量的分析预报产品中如何快速提取更加有效的信息,在面向越来越高、越来越广泛的服务需求时,如何更加高效制作针对性的预报服务产品,就急需引入更加智能的预报服务辅助工具。2024年,中央气象台提出建设以智脑为核心、场景应用为载体的天气业务一体化平台,将通过集成气象预报大模型、智能网格预报以及生成式大模型等众多算法,构建气象人工智能体,打造数智天气预报员助手,支撑预报业务向智能化转型发展。
气象预报的发展历史已经验证,气象与信息科学的融合创造了以数值天气预报为基础、主客观融合的现代天气预报业务。未来,气象部门与高校、企业以及相关行业联合,一定能走出跨部门联合、多学科融合的“人工智能+气象”的高质量发展道路。

