AI for Earth Science in 2025
作者:微信文章点击下面卡片,快速关注本公众号
过去一年,地球科学领域正在经历一场深刻的变革。
2025年,人工智能已经真正走进了气象台、海洋研究所、地震监测中心的日常工作中。从预测明天的天气,到追踪南极冰川的消融,再到监听地壳深处的震动——这些曾经需要超级计算机跑上几天几夜的任务,现在可能只需要一杯咖啡的时间。
本文将回顾这一年里,那些AI for Earth Science相关的技术突破。
一、地球系统基础模型
今年最引人注目的进展,莫过于几个"全能型"模型的出现。
微软的Aurora堪称其中的代表作。这个拥有13亿参数的模型,接受了超过一百万小时地球物理数据的"训练"。它能预测空气质量、海浪高度、飓风路径,还能做高分辨率天气预报——而且速度比传统方法快了5000倍。
NASA和IBM联手打造的Prithvi则走了开源路线。这个模型覆盖全球数据,可以填补卫星云图的空白、识别农作物种类、绘制洪水淹没范围。今年,开发团队还拿到了美国地球物理联盟的"开放科学奖"。
Google一口气发布了好几个重量级工具:11月的WeatherNext 2号称"最强天气预报",7月的AlphaEarth把地球制图精度提升到了新高度,3月的FireSat专门盯着森林火情。
NVIDIA更是放出了一个"大招"——cBottle,号称全球首个能以公里级精度模拟气候的生成式模型。要知道,以前的气候模型分辨率动辄几十甚至上百公里,很多极端天气的细节根本看不清。
二、天气预报:从"大概准"到"相当准"
气候预测一直是个老大难问题。传统方法是把大气层切成无数小格子,然后用物理方程一个个算过去,耗时耗力不说,精度还不一定高。
今年的一个重要发现是:最好的办法可能是"两条腿走路"。
MIT的研究团队做了一组有趣的对比实验。他们发现,对于区域温度预测,相对简单的物理模型反而比复杂的深度学习表现更好;但到了局部降雨预测,深度学习又扳回一城。
Google的NeuralGCM就是这种"混合思路"的产物——它保留了传统气候模型的物理框架,但用机器学习来处理那些难以精确描述的过程。结果是,2到15天的天气预报比现有的"金标准"还准,40年的气温记录重建也更贴近实际观测。
中国团队开发的风顺模型则在中长期预测上取得突破。它能提供60天的全球预报,涵盖大气、海洋、陆地、冰雪等29个关键指标,在降水预测上明显优于欧洲气象中心的业务模型。
值得一提的是,欧洲中期天气预报中心(ECMWF)——全球气象预报的"金标准"——也在今年迈出了关键一步。7月,他们的AIFS(人工智能预报系统)正式投入业务运行,这是一个51成员的集合预报系统。与传统的物理模型相比,AIFS的运算速度快了10倍以上,能耗却降低了约1000倍。在地表温度预测上,准确率提升了20%。更难得的是,ECMWF还在官网免费开放了多个AI模型的预报产品,包括GraphCast、盘古气象等,任何人都可以查看。
三、海洋:从"黑箱"到"透明海洋"
海洋是地球上最难预测的系统之一。洋流错综复杂,数据采集困难,传统模型算力需求惊人。但2025年,这个领域迎来了井喷式的突破。
速度革命首当其冲。纽约大学开发的Samudra海洋模拟器,运行速度比传统模型快了150倍,而且可以稳定运行十年以上。加州大学圣克鲁兹分校和富士通合作的墨西哥湾模型更夸张——快了10万倍。这意味着,以前需要超级计算机跑几天的任务,现在普通服务器几分钟就能搞定。
秘诀在于"物理约束"。纯数据驱动的模型容易产生违反物理规律的结果,比如能量凭空消失、温度出现负值。把物理定律"写"进神经网络,就能避免这类荒唐的输出。
崂山实验室牵头研发的问海模型首次实现了全球涡旋分辨率的海洋预报,可以提前1到10天预测海洋中尺度涡旋的演变。这对渔业、航运和海上作业都有重要价值。论文发表在《自然·通讯》上。
长期预测也有突破。ORCA-DL模型发表在《科学·进展》上,首次实现了季节到十年尺度的三维全球海洋预报。它在厄尔尼诺和海洋热浪预测上的表现,超过了目前最好的数值模式。
IBM则发布了首个海洋专用的基础模型——Granite-Geospatial-Ocean。这个5000万参数的模型在50万张Sentinel-3卫星图像上训练,可以监测浮游植物分布和海洋健康状况,而且完全开源。
欧洲也在加速布局。11月底,欧盟正式启动了"海洋数字孪生"第二阶段(EDITO2),投资1400万欧元,目标是建成覆盖全欧洲海域的实时监测和预测系统。这是联合国海洋大会上宣布的欧盟"海洋公约"核心支柱之一。
在珊瑚礁监测方面,澳大利亚海洋科学研究所的RapidBenthos系统可以自动分析水下照片,每次分析节省60小时的人工时间。NVIDIA的SeaSplat则能从普通水下视频重建三维场景,还能校正水对光线的扭曲。
风暴潮预报的效率也大幅提升。物理信息神经网络把预测时间从几小时压缩到几分钟,误差控制在0.3米以内。NOAA和Google DeepMind的合作项目,让飓风路径预报的准确性提高了约140公里。
四、地震预测
地震预测是地球科学界公认的"圣杯"——几十年来,无数人前赴后继,却始终没有实质性突破。
但2025年出现了一些值得关注的进展。
京都大学的研究团队在实验室里重现了地震发生的过程。他们发现,在主震之前,岩石会发出一些微弱的"预警信号"。通过训练深度学习模型识别这些信号,他们成功预测了实验室地震的发生时间。
这只是米级尺度的实验,离真正的地壳地震还有很远距离。但研究人员指出,米级实验比以前的厘米级实验更接近真实地壳环境,结果更有参考价值。
另一个叫SafeNet的模型则采用了不同思路。它综合历史地震数据、地质构造信息、地球物理观测,可以在几秒钟内生成某个区域未来一年的地震风险评估。用50年的中国地震数据做回溯测试,它的表现超过了13个同类模型。
当然,也有清醒的声音。一些研究者指出,目前的机器学习方法还没有真正超越传统的统计模型。地震预测这条路,仍然很长。
五、碳排放
应对气候变化,首先要搞清楚碳从哪里来。但全球碳排放的监测一直是笔"糊涂账"——很多数据靠估算,更新慢,精度低。
今年的技术进步正在改变这一局面。
一项研究显示,借助机器学习,温室气体监测的数据延迟从24小时缩短到1小时,空间分辨率从30米提升到10米,检测准确率从80%提高到95%。更重要的是,系统还发现了一些以前不知道的排放源。
Climate TRACE平台可能是这个领域最有影响力的项目。它整合了卫星遥感、传感器网络、机器学习等技术,提供全球排放的实时监测和溯源。现在,任何人都可以上网查看某个工厂、某条航线、某片油田的碳排放情况。
甲烷监测是另一个热点。甲烷的温室效应是二氧化碳的80多倍,但以前很难定位具体的泄漏点。现在,Kayrros、Carbon Mapper等公司的工具可以从卫星图像中自动识别甲烷泄漏,并追溯到具体的责任方。
六、冰川与极地:和时间赛跑
南极和格陵兰的冰盖正在以惊人的速度消融。但传统的冰川模型计算量巨大,很难做大规模的情景模拟。
今年,深度学习把冰川模拟的速度提升了1000倍。
这意味着什么?以前只能跑一两个情景,现在可以跑成百上千个,充分评估各种可能性。对于海平面上升的预测来说,这种"不确定性量化"至关重要。
另一个叫MELTNET的模型专门预测冰架的底部融化。冰架漂浮在海面上,底部被温暖的海水不断侵蚀。这个过程以前需要耦合冰盖模型和海洋模型,计算代价极高。MELTNET用深度学习"学会"了海洋对冰架的影响,把计算成本降到了可以忽略不计的程度。
不过,南极海冰的预测仍然是个难题。2014年以来,南极海冰经历了剧烈波动,现有模型——无论是物理模型还是机器学习模型——都很难准确把握。
七、生态监测:让数据自己说话
森林在消失,物种在灭绝,但我们对自然界的了解还远远不够。
一个尴尬的事实是:地球上大部分物种,我们连名字都叫不出来。热带雨林里有多少种昆虫?深海里有多少种微生物?没人知道。
机器学习正在帮助填补这些空白。
BioCLIP可以从照片中自动识别物种特征。野生动物相机拍到的画面,以前需要专家一张张看,现在算法可以自动分类、计数。
英国生态与水文中心正在全球部署自动化监测站,重点放在热带地区——那里物种最丰富,但数据最匮乏。
世界自然基金会的Forest Foresight项目则把目光投向了森林砍伐。它分析卫星图像,预测哪些地方可能发生非法砍伐,准确率达到80%。这样,保护力量就可以提前部署,而不是事后补救。
当然,技术不是万能的。有研究者提醒,目前的模型训练数据主要来自西方科学体系,可能忽视了原住民的传统生态知识。如何让技术发展更加包容,是需要认真思考的问题。
八、水资源:从"靠天吃饭"到"心中有数"
洪水和干旱,是最常见的自然灾害。但预报难度很大,尤其在观测数据稀少的发展中国家。
宾夕法尼亚州立大学的团队开发了一个全球水文模型,可以模拟低至36平方公里的区域,数据详尽的地方甚至能细化到6平方公里。这意味着,即使是偏远山区的小流域,也能获得可靠的洪水预警。
另一个研究热点是地下水。地下水是全球最大的淡水储库,但开采过度的问题日益严重。机器学习可以从有限的监测井数据中,推断整个含水层的动态变化。
不过,让决策者信任这些模型,还需要迈过"可解释性"这道坎。黑箱模型说"三天后会发洪水",凭什么相信?新兴的"可解释人工智能"方法正在尝试回答这个问题。
九、矿产勘探:老行业遇上新技术
找矿是个古老的行当。但传统方法效率不高,成功率低,成本高昂。
一项调查显示,到2025年,67%的头部矿业公司计划引入人工智能进行预测性地质分析。
模型可以综合地质图、地球物理数据、地球化学分析、遥感图像,预测哪里可能存在有价值的矿床。算法从历史发现和失败案例中学习,不断提高判断能力。
印度政府和地质调查局联合举办了一场"矿产靶区"黑客松,让参赛者用机器学习方法寻找新矿床。斯坦福大学的教授则在赞比亚开设了非洲首个"数据科学与矿产勘探"课程。
有意思的是,业内人士开始强调"知识耦合"——最好的模型不是纯粹的数据驱动,而是把地质学家的专业知识融入其中。毕竟,再聪明的算法也不能完全替代人类几百年积累的经验。
最 后
回顾2025年,几个趋势已经非常清晰:
"混合"成为主流。纯物理模型和纯数据驱动各有局限,把两者结合起来才是正道。
速度的飞跃。百倍、千倍、万倍的加速不再是新闻。这不仅意味着效率提升,更意味着以前不可能的研究变得可能——比如大规模的情景模拟和不确定性分析。
从实验室走向业务。越来越多的系统开始投入实际应用,服务于气象预报、灾害预警、环境监测、资源勘探。
开放与合作。主流模型纷纷开源,研究数据加速共享。这让资源有限的机构和国家也能站上技术前沿。
当然,挑战依然存在。模型的"黑箱"问题尚未彻底解决;训练数据的偏见可能导致结果的偏颇;大规模计算本身也在消耗能源、产生碳排放。
但总体而言,这是充满希望的一年。人工智能正在帮助我们更好地理解这颗蓝色星球——而理解,是保护的第一步。
页:
[1]