“伏羲”的升级之路仍在继续。下一步,团队将推进“端到端”气象大模型,构建基于气象大模型的同化系统,实现多种卫星资料同化(微波、红外等),摆脱对传统模式的依赖;开发地球系统大模型,实现大气、海洋、陆面、冰冻圈的预报,探索大气污染、气候风险预报;构建基于大模型的国产化再分析数据集,利用大模型构建完全独立自主的国产化再分析数据,摆脱模型训练对国外数据的依赖。
对新能源产业,“伏羲”2.0是全球首个针对新能源优化的气象大模型,带来更准确的风速、辐照和发电能力预测,能够优化风电和太阳能发电的效率、平衡电网负荷、减少弃风弃光等,相当于为风电场和太阳能电站装上智能导航系统。
“自诞生以来,‘伏羲’一直在成长。”上海科学智能研究院地球科学负责人、复旦大学研究员李昊介绍,相较于去年推出的1.0系列,“伏羲”2.0的中期天气预报大模型和次季节大模型,面向新能源、航空运输等行业取得进展。
台风、暴雨、干旱、洪涝……气候变化的加剧导致极端天气事件频发,威胁多个行业的稳定与发展。在海运过程中,洋流、风向、台风、航线选择等对航海安全、成本等影响巨大。通过高精度的全球天气预报,远洋气象导航对降低航行成本及规避恶劣天气具有重要意义,但长期以来,航海中的气象导航被日本、荷兰等国外厂商垄断。
a8体育真人仪式上,上海科学智能研究院(下文简称:上智院)与中远海运科技股份有限公司(下文简称:中远海科)、上海大数据股份有限公司(下文简称:上海大数据股份)、国网电力市场运营实验室等企业机构达成战略合作。
“在极端天气预报方面,伏羲通过采用扩散模型优化,有效缓解模型预报的平滑问题,提高对极端降水和大风等极端天气现象的预报精度,超越ECMWF的数值天气预报精度。” 中国气象局党组成员、副局长熊绍员指出,中国气象局高度重视气象与人工智能深度融合发展,联合相关高校、科研机构、企业共同推进气象大模型以及人工智能气象应用关键核心技术攻关。
“女娲”的产业化前景同样可观,团队将与企业合作研发RNA大模型,预测RNA的结构和功能,加速RNA疫苗研发,促进核酸药物设计;研发生物影像大模型,实现多模态时空理解与生成,赋能智能诊疗,例如与华山医院、全景医学合作优化神经退行性疾病的诊疗方法和设备。
翱翔天际,云层间穿梭,云量的优化对航空业的飞行安全至关重要。“伏羲”2.0率先研发低云量、总云量等多个航空关注的气象要素,有助于预测飞行中可能遇到的积冰、颠簸、光线明暗不均等各种天气现象,提升飞行体验、降低行业成本等。
“我们面向气象导航对伏羲大模型进行优化,提高时空分辨率,实现未来15天0.1度逐小时气象预测;构建海气耦合模型,纳入风浪、涌浪、海温等要素,提升全球风、浪、流、能见度等预测精度;进行极端天气优化,提升台风、极端降水等更多灾害性场景的预测精度。” 李昊介绍,多层次焕然升级的“伏羲”2.0,有望助力解决远洋气象导航长期依赖国外服务厂商问题,落实“国船国导”、实现“国产替代”。
女娲医药大模型包括DNA大模型和动态蛋白大模型。其中,DNA大模型,以全球最长序列、最细粒度的基因调控关系理解,促进生物机制的发现。它基于状态空间模型,捕捉长序列关联,构建2亿参数的DNA模型,相比DeepMind等团队发布的高精度基因表达预测模型Enformer,分辨率和调控距离提升4倍,将应用于药物靶点发现。
“伏羲”和“女娲”两大模型分别是上智院地球科学、生命科学领域的代表性成果。在物质科学领域,上智院则构建物质科学大模型,致力于数据、工具、机理融合,已构建第一性原理(QM)数据库,4000万分子构象数据库具备全球最大规模。团队开发出薛定谔方程AI求解模型,高精度近似求解薛定谔方程,拥有被称为小分子药物亲和力预测精度持平“世界最好的商用软件”薛定谔FEP+。另有AI驱动的多孔材料模型、计算物质科学通用模型。
而动态蛋白大模型,是全球首个基于氨基酸序列生成蛋白质全量3D结构(主链+侧链)的扩散模型,实现了5个时间点的蛋白质3D动态结构预测,正在突破长时间的动态预测(>100个时间点),将应用于口袋发现。
“伏羲”2.0采用人工智能大模型技术,相对数值模式计算速度有千倍以上的提升。落实到场景应用上,国网电力市场运营技术实验室主任冯树海表示:“伏羲中期天气预报大模型提供的精准风速和辐照预报,能够大幅提高新能源电力的调度和管理效率,期待‘伏羲’不断精进、合力降低中国电力行业运营成本。”
团队还开发出大规模并行化多尺度表型AI分析工具,分析规模、速度提升多个量级,发现人体表型网络随时间脆弱化的规律及衰老时间拐点,指出多个潜在衰老分子标志物,助力书写“科技抗衰”新篇章。
建设科学大模型的评测体系也已提上日程。相比通用大模型,科学大模型评测从专用领域的具体科学问题出发,更关注专业指标和科学机理的一致性。