摘要
土壤冻结深度与路基变形密切相关,准确预测土壤冻结层深度对川藏铁路安全运行极为重要。在综合前期气象风险普查结果的基础上,本文利用机器学习和多因子融合分析方法,并结合数值模式预报气象条件,构建了川藏铁路沿线冻结深度预报系统。该系统采用了随机森林机器学习模型,其输入特征涵盖了多年平均积温、气温、湿度、高程、土壤成分等11个对冻土预测具有显著影响的因子。实际预报业务中,只需将当前冻结深度和未来7 d的气象条件输入到模型中,系统就能输出未来7 d的5 km分辨率的网格化冻结深度预报产品。检验结果显示,预报产品与实测数据显示出高度的一致性,土壤冻结的准确率为96%,TS评分为0.96。相关结果达到实用标准,可为川藏铁路冻土路段的灾害防治提供参考。
Abstract
Accurate prediction of soil freezing depth is critical for ensuring the operational safety of the Sichuan-Tibet Railway (STR),as frozen soil dynamics play a significant role in subgrade deformation.This study developed a high-resolution freezing depth forecasting system for the STR,leveraging a random forest machine learning model combined with multi-factor fusion analysis and integrated numerical meteorological predictions.The system utilizes 11 key predictive variables—including multi-year accumulated temperature,air temperature,humidity,elevation,soil composition,and real-time freezing depth—to generate 5 km-resolution gridded forecasts of freezing depth up to 7 days in advance.Based on an extensive analysis of meteorological risk factors and 40 years (1980—2021) of climate data from the Xizang region,three key findings emerged:1) The spatial distribution of frozen soil in the Tibet section of the STR is strongly corelated with altitude.Seasonally frozen soil—characterized by winter freezing and summer thawing—is primarily distributed above 4000 m in regions such as Bangda Grassland,Guoging (Baxoi County),and Lajiu (Lhorong County).These areas exhibit annual mean ground temperatures below -5.0 ℃,with seasonal freezing depths ranging from 2.0 to 3.5 m,significantly impacting embankment sections,particularly in the Bangda Grassland.2) Over the past four decades,the region has experienced a warming and wetting climate trend,accompanied by declining wind speeds.The maximum annual freezing depth has decreased at a rate of 0.37—11.55 cm per decade,with the greatest reduction at Qamdo Station and the smallest at Nyingchi Station.3) The random forest-based freezing depth prediction model demonstrated high accuracy and reliability.Validation using field measurements yielded a prediction accuracy of 96%,a TS score of 0.96,a 3% missed detection rate,and zero false alarms.The model achieved a R2 value of 0.74 and a RMSE (root mean squared error) of 66.34 cm,indicating strong consistency between predicted and observed values.
在我国,多年冻土达2.15×106 km2,青藏高原是我国最大的一片冻土区,冻土对温度极为敏感,对铁路的修建有非常大的影响(章金钊等,2002; 彭维庆等,2003)。川藏铁路是西藏及沿线地区的重要东出通道,经四川成都铁路枢纽接入全国铁路网,全长1 850 km,跨越四川盆地、云贵高原和青藏高原3个台阶,累计爬升高度超过14 000 m。铁路沿线地形地质和气候条件复杂、生态环境脆弱,虽然西藏境内铁路大部是隧道、高架桥,但地表层冬季冻结、夏季融化的季节性冻土区,遍及邦达草原等广大区域。该区域天气多变、灾害频发,温差大,在季节性冻融循环影响下,工程力学性质会发生很大的变化,容易产生冻胀、寒冻裂缝、边坡垮塌等病害(艾秋池,2020)。
研究表明,铁路路基冻胀导致的病害严重影响铁路交通安全(杨增丽,2019; 于东彬等,2021; 王福久和陈亚男,2022),国内外学者针对铁路路基冻胀问题采用不同方法建立了相关预测模型。Asaoka(1978)根据收集到的路基变形实测数据,利用垂直单向固结理论,对工后沉降进行了预测。Takashi et al.(1978)提出的Takashi冻胀估算模型在日本被广泛采用。Lu et al.(2024)基于Takashi的经验模型和实测数据,建立了一个改进的土体冻胀率预测模型。吴湘华等(2017)采用机器视觉及光学成像的非接触式测量方法,针对严寒地区路基冻胀的定量预测,提出一种优化灰色与神经网络组合模型。祁长青等(2007)采用惯性校正法,引入动态学习因子与惯性因子,建立对青藏铁路冻土路基变形预测模型。刘海鹏等(2021)对路基变形规律与影响因素进行分析并构建了预测模型。也有针对路基温度对路基变形影响应用BP神经网络方法进行建模(苗姜龙等,2018)。这些方法,主要抓住其中一个或几个冻胀深度的影响因子进行分析,缺少较为全面的影响因子综合分析,主要着眼于粗粒度的变换判断,缺少精细、定量的冻胀深度预报方法。
然而,全国各区域的铁路冻害存在明显时空差异(代娟等,2016; 蒋元春等,2020; 邹宓君等,2020)。就西藏而言,由于各地区气候差异较大,影响交通事故发生的气象因子也不尽相同。通过调查分析发现,川藏沿线因强降水导致泥石流、崩塌、滑坡、冻土冻融,常常造成交通堵塞、事故、运输中断,严重影响了道路交通安全(格央等,2010; 德庆卓嘎等,2018)。近年来,机器学习方法在视频图像目标识别、机器翻译、趋势预测等诸多方面取得较好的效果。因此,本文利用机器学习方法具有数据驱动、多因子融合分析的优势做冻胀深度预报,并结合数值模式预报气象条件,预测逐日的冻土层深度。实验结果表明,机器学习方法具有实时性高、能灵活适应天然或人工干预下的冻结深度预报,具有智能化和鲁棒性高的特点。
1 资料和方法
1.1 研究区概况
川藏铁路位于我国四川省和西藏自治区境内,从东到西依次经过四川盆地、川西高山峡谷区、川西高山原区、藏东南横断山区、藏南谷底区等5个地貌单元(张锦等,2020),铁路沿线地势落差大,山川河谷众多。全路段最高海拔4 400 m,最低海拔121 m,海拔落差达3 000 m之多,东西横穿横断山脉至青藏高原拉萨平原,沿途翻越二郎山、折多山、高尔寺山、沙鲁里山、芒康山、他念他翁山、伯舒拉岭和色季拉山等众多大山; 沿线跨越大渡河、鲜水河、雅砻江、金沙江、澜沧江、怒江、帕隆藏布江、尼洋河等诸多河流。整条铁路横跨14条大江大河、21座海拔4 000 m以上雪山,十分依赖桥梁的架设,而这些关键位置更易受低温、降雪等不利气象条件的影响产生土壤冻胀,危害路基和桥梁的稳定性。
1.2 数据来源
1.2.1 气象数据
利用1981—2020年川藏铁路西藏段贡嘎、泽当、加查、林芝、波密和昌都6个气象站(图1)年平均气温、平均最高气温、平均最低气温、降水量、平均风速和最大冻结深度等数据,数据由西藏自治区气象信息网络中心提供。
图1川藏铁路西藏段气象冻土观测站及野外观测点分布
Fig.1Distribution of meteorological frozen soil observation stations and field observation points along the Xizang section of the Sichuan-Xizang Railway
1.2.2 再分析资料
本研究采用2008—2021年中国区域多源融合实况分析1 km再分析资料(ART_1 km,地面),包括1 km分辨率逐小时的降水量、2 m平均气温、10 m平均风速、2 m平均相对湿度和最大冻结深度。
1.2.3 野外观测数据
为了调查收集铁路沿线冻胀实地数据,2020—2021年利用手持自动气象站、铂电阻、TDR350土壤水分速测仪和土壤温度测量仪对川藏铁路西藏段的气象要素、土壤温湿度等进行实地观测,实地观测路线为江达县-八宿县邦达镇-八宿县城-波密县-巴宜区-米林市-桑日县-乃东县-贡嘎县-拉萨市区,行程超过3 000 km。
1.3 研究方法
1.3.1 智能网格预报
首先以专家评估、实地调查等方式开展了川藏铁路沿线西藏段气象要素特征、冻土、土壤湿度及综合气象风险普查工作,并确定冻胀灾害隐患路段,针对性地选点建设交通气象自动站; 其次综合利用气象站点、再分析资料、冻土站点观测、土壤类型等数据,基于机器学习构建了冻结深度预报模型。采用多因子融合反距离加权融合方法,计算出前1 d冻土层深度5 km分辨率的格网数据(陈元昭等,2019)。从智能网格预报中获取5 km分辨率未来7 d的预报数据,建立多个随机森林冻土预报机器学习模型,通过随机森林机器学习模型融合前1 d冻结深度和未来7 d的气象条件,实现对未来7 d冻结深度预报。冻结深度预报系统每天可以根据最近1 d的冻土站点观测数据,更新冻结深度预报,并通过模式产品的释用及订正,形成川藏铁路路基冻涨预报服务产品,冻结深度预报系统总体架构如图2所示。
GDFS(global data file system)智能网格预报是国家气象中心研发的中国大陆地区以及近海区域0~10 d、5 km×5 km、3 h分辨率的网格预报指导产品。预报要素包括降水及相态、气温、风、云量等(刘新伟等,2020)。
GRAPES(global regional assimilation and prediction system)模型预报是中国气象局数值模式中心自主研制的中国区域0~84 h、3 km×3 km、1 h分辨率的数值天气预报系统,包括2 m温度和2 m相对湿度等天气要素预报,并有高分辨率卫星地形资料进行地形订正。
1.3.2 线性倾向估计
线性倾向估计(魏凤英,2007)采用式(1)进行计算:
(1)
式中:Y为气象要素; t为时间(本研究为1981—2020年); a0为回归常数; a1为回归系数,把a1×10称为气象要素每10 a的变化趋势,其显著性可通过t与Y之间的相关系数进行检验(P<0.05、P<0.01和P<0.001)。
2 结果与分析
2.1 近40年川藏铁路西藏段气候变化特征
土壤温湿度变化可以印证土壤水热之间的相互关系,土壤湿度是气候系统的关键变量,也可以表明多年冻土区土壤水分的空间差异性(陈珊珊等,2020; 周钰瑶和施红霞,2021)。
根据本研究实地考察和观测资料分析发现,研究区土壤温度最高值(34.2℃)出现在芒康县附近,最低点(10.4℃)出现在林芝米林县机场附近,平均为24.0℃。土壤湿度最高值(60.0%)出现在山南桑日县拉隆隧道,其次为昌都邦达镇吉中乡(35.9%),最低值(15%)在林芝米林江中村、朗县令巴堤村和朗县隧道口。
统计分析了1981—2020年研究区6个站年平均气温、平均最高气温、平均最低气温、降水量、平均风速的气候变化趋势,结果见表1。从表中可知:1)近40年各站年平均气温均呈现为一致的升高趋势,升温率为0.18~0.36℃·(10 a)-1,以林芝升温率最显著(P<0.001),其次是波密(0.33℃·(10 a)-1,P<0.001),贡嘎最小。各站年平均最高都表现为显著的升高趋势,平均每10 a升高0.29~0.61℃(P<0.001),其中贡嘎升幅最大、波密最小。年最低气温除贡嘎站呈弱的降低趋势之外,其他5个站均呈升高趋势,升幅为0.29~0.47℃·(10 a)-1(P<0.01),其中波密最大、泽当最小。2)近40年,除波密站年降水量趋于减少(-22.53 mm·(10 a)-1)外,其余各站年降水量呈增加趋势,增幅为2.33~32.18 mm·(10 a)-1,以贡嘎站最大、林芝站最小。3)近40年除昌都站年平均风速呈增加趋势(0.09 m·s-1·(10 a)-1,P<0.05)外,其他各站表现为减小趋势,平均每10 a减小0.08~0.30 m·s-1(除林芝外,P<0.05),其中贡嘎减幅最大,加查和林芝减幅最小。总体来看,近40年川藏铁路西藏段气候趋于暖湿化,风速变小。
图2川藏铁路沿线冻结深度预报系统总体架构(IDW,inverse distance weight,反距离加权)
Fig.2Overall architecture of the freezing depth prediction system along the Sichuan-Xizang Railway (IDW,inverse distance weight)
表11981—2020年研究区气象站主要气象要素气候变化趋势
Table1Climate change trends of major meteorological elements at observation stations in the study area (1981—2020)
注:1)、2)、3)分别表示P<0.05、P<0.01、P<0.001.
2.2 近40年川藏铁路西藏段冻土气候特征
调查发现,沿线冻土区主要分布于海拔4 000 m以上的邦达草原、八宿的郭庆、洛隆腊久等区域,地表层冬季冻结、夏季融化的季节性冻土明显。冻土年平均地温在-5.0℃以上,尤其邦达草原,以季节性冻土为主,层厚2.0~3.5 m,会影响邦达草原铁路运营。此外,全线地势险峻,事故多发,普查的冻融灾害风险隐患点分布有明显的地域特点,总体呈东多西少、南多北少的特点。
表2给出了川藏铁路西藏段各站年最大冻结深度的气候特征值,近40年各站平均年最大冻结深度为8.7~45.6 cm,以昌都最大、波密最小。极端最高值为81 cm,出现在1983年的昌都站; 极端最低值为3 cm,出现在2020年的加查站和波密站。总体来看研究区极端最高最大冻结深度出现在20世纪80年代初,极端最低最大冻结深度出现在20世纪10年代后期。
表21981—2020年研究区气象站最大冻结深度气候特征值
Table2Climatic characteristics of maximum freezing depth at meteorological stations in the study area (1981—2020)
如图3所示,近40年川藏铁路西藏段各站年最大冻结深度均呈减小趋势,平均每10 a减小0.37~11.55 cm(除林芝外,P<0.05),以昌都减幅最大(P<0.001),其次是贡嘎(-3.11 cm·(10 a)-1,P<0.001),林芝站减幅最小。其中,林芝站前20 a(1981—2000年)年最大冻结深度呈显著增加趋势(3.87 cm·(10 a)-1,P<0.001),而近20年(2001—2020年)趋于显著减少(-2.94 cm·(10 a)-1,P<0.001)。
2.3 川藏铁路沿线高分辨率土壤冻结深度预报建模
首先在前期调查获得的川藏沿线冻融灾害隐患点信息数据和气象站点信息基础上,结合中国区域多源融合实况分析1 km分辨率产品(ART_1 km,地面)-HRCLDAS逐小时温湿风实时产品,利用多源数据融合分析技术,对地面观测数据、数值模式数据以及卫星遥感地形数据,进行融合,再利用高分辨率卫星资料进行地形订正,制作1 km×1 km分辨率2 m平均气温、10 m平均风速、2 m平均比湿和2 m平均相对湿度融合高分辨率数据产品。并从中国气象局天擎气象大数据平台收集2008—2021年研究区域的冻结深度数据,剔除其中的异常,获得冻土数据的年分布图。
其次冻土预报产品加工系统主要由多源数据读取通用数据模型(Unidata's Common Data Model,CDM)、随机森林机器学习模型两个部分组成,CDM通用数据模型用于数据的读取和写入,随机森林机器学习模型包括不平衡数据处理及随机森林建模。
1)通用数据模型CDM是美国大气科学联合会推出的科学数据集的抽象模型,采用三层架构形式,数据层用于数据的读取和写入,给包括netCDF,OPENDAP和HDF5在内的多种科学数据集提供API接口; 坐标层用于定义数组的各维度坐标,此处坐标是指科学数据集上的概念,和地理坐标有所区别; 科学特征层用于定义数据的特征,如格网数据(模式)、点数据(站点)等。
图31981—2020年研究区气象站最大冻结深度变化
Fig.3Changes in maximum freezing depth at meteorological stations in the study area from 1981 to 2020
2)IDW(inverse distance weight,反距离加权)插值方法,也称空间插值方法,是基于已知的地理特征点数据,推求同一区域内的未知点的数据。IDW插值全称为反距离加权插值,它以插值点与样本点之间的距离为权重进行加权平均,离插值点越近的样本点赋予的权重越大。
3)随机森林机器学习(Breiman,2001)建模,首先对原始数据进行预处理,包括滤波、异常值剔除等,通过随机森林机器学习方法来自动计算各因子对动土的贡献权重。随机森林机器学习每次拆分节点都会根据优化目标选择拆分因子,拆分因子在节点拆分过程中,拆分次数越多,其重要性越高。Sklearn机器学习库,基于历史样本学习随机森林模型,可以直接输出因子重要性权重。然后以2020年为训练数据和测试数据的时间划分节点,2008—2019年的10万7千条数据作为训练数据,2020—2021年的3 000条作为测试数据。使用的环境因子包括年积温、最大温度、最小温度、平均气温、平均相对湿度、经度、纬度、高程、土壤成分、土地利用代码和平均冻结深度11个特征。经过文献所述方法,训练得到随机森林机器学习模型,最后对测试数据进行测试,验证模型性能,并估计各特征重要性。各特征贡献度显示,平均冻结深度贡献显著(图4),说明冻结深度的变化具有较大惯性,但是其他因素长期积累下来,也会对冻土深度产生显著影响。
2.4 基于机器学习铁路路基冻胀预报产品
路基冻胀预报服务产品使用GRAPES模型预报和GDFS智能网格预报为背景场,其中前1 d冻结深度是由站点数据插值成5 km×5 km的格网,然后和GDFS配合逐点输入,建立随机森林机器学习冻土预报模型,融合前1 d冻土层深度和未来7 d的气象条件,获取5 km分辨率未来7 d格网冻结深度预报产品和桩点冻土产品。
图4环境因子对冻结深度的重要度排序
Fig.4Importance ranking of environmental factors influencing freezing depth
2.5 预报产品检验评估
检验站点使用范围为90°~105°E、33°~28°N,主要分布于西藏、四川的国家气象站; 来源包括国家基准气候站,国家基本气象站和国家一般气象站的24 h逐时观测。选取2020—2021年的3 422个样本作为测试数据进行检验。检验冻土预报的TS、准确率、漏报率、空报率和判定系数(R2)评分(潘留杰等,2023)。结果显示,冻土预报准确率为96%,TS评分为0.96,空报0,漏报3%,R2评分为0.74,RMSE(root mean squared error,均方根误差)为66.34 cm。以2021年为例,沿线各站的冻结深度预测和实际深度时序对比,数据指标非常好,能达到实用标准(图5)。
3 结论
本研究依托川藏铁路西藏段近40年的气象数据、再分析资料及实地观测数据,对川藏铁路路基冻胀的气象条件展开了深入的气候学剖析。该预报系统采用了随机森林机器学习模型,针对青藏高原冻土深度及多年平均积温、气温、湿度、高程、土壤成分等11个对冻土预测具有显著影响的因子,进行动土深度反演和未来7 d的冻土深度建模分析。综合各项分析,得到以下主要结论:
图52021年川藏铁路西藏段各站的冻结深度预测值与实际值对比
Fig.5Comparison between predicted and observed freezing depths at stations in the Xizang section of the Sichuan-Xizang Railway in 2021
1)2020—2021年川藏铁路沿线西藏境内气象要素特征、冻土、土壤湿度及综合气象风险普查结果表明:沿线冻土区主要分布于海拔4 000 m以上的邦达草原、八宿的郭庆、洛隆腊久等区域,地表层冬季冻结、夏季融化的季节性冻土明显。冻土年平均地温在-5.0℃以上,尤其邦达草原,以季节性冻土为主,层厚约2.0~3.5 m,其影响邦达草原明线段落。
2)近40年川藏铁路西藏段气候表现为暖湿化,平均风速减小。年最大冻结深度均表现为减小趋势,平均每10 a减小0.37~11.55 cm,减幅以昌都站最大、林芝站最小。
3)建立的随机森林机器学习冻土预报模型,融合了前1 d冻土层深度和未来7 d的气象条件,计算得到5 km分辨率未来7 d网格冻结深度预报产品和站点冻土产品。经检验,冻土产品预报准确率为96%,TS评分为0.96,空报0,漏报3%,R2评分为0.74,RMSE为66.34 cm。预测和实际较为吻合,达到实用标准。
综上所述,本研究不仅揭示了川藏铁路西藏段近40年的气候变化特征和冻土气候特征,还成功建立了铁路路基冻胀预报系统。这些研究成果对于保障川藏铁路的安全运营、提高防灾减灾能力具有重要意义。未来,将进一步优化预报模型,提高预报精度,为川藏铁路的长期安全运行提供更加可靠的技术支持。

