新闻中心

News

公司动态 新冠相关 信息公示

米兰官网-孙凝晖:我对“AI赋能科学发现”的一些看法—新闻—科学网

2025-12-29 12:12:04 999+ 公司动态

     

近日,由中国计较机学会(CCF)主理的第21届天下高机能计较学术年夜会(CCF HPC China 2025)于内蒙古鄂尔多斯召开。年夜会上,中国工程院院士、中国计较机学会理事长孙凝晖第一个作特邀大旨陈诉。于题为“AI赋能科学发明”陈诉中,他分享了本身对于这一备受存眷话题的思索。

孙凝晖于CCF HPC China 2025年夜会上。组委会供图

“第五范式”登上汗青舞台

他起首谈到,“科学智能”(AI for Science,也即“AI赋能科学发明”)这一研究范式的涌现,始在AlphaFold于卵白质布局猜测上的冲破。2020年,AlphaFold于CASP14年夜赛中乐成猜测了2/3的方针卵白布局,开启了基在人工智能猜测卵白和核酸平分子布局的汗青进程。

“(借助高机能计较机)重新计较猜测卵白质布局的(传统)要领,颠末二三十年未能取患上显著进展;厥后,AlphaFold推进了一年夜步。”孙凝晖说,AlphaFold的呈现,标记着AI成为科学发明的基本手腕之一。

接着,2024年诺贝尔物理学奖及化学奖接连授予了人工智能基础理论及科学发明范畴的科学家,揭示了对于人工智能的“偏幸”。孙凝晖认为,这标记着国际学术界公认了人工智能技能已经进入科学范畴,“代表着科研范式的庞大转变”。

“交融年夜模子、年夜算力、年夜数据及年夜团队办事等特色的科学研究,(对于科学发明的作用)就像年夜科学装配同样,是一个新的范式。”孙凝晖说,新研究范式的形成,除了了“年夜模子、年夜算力、年夜数据”以外,还有离不开“包括物理、化学、生物、人工智能等各范畴科学家及工程师构成的团队持久的事情”以和企业资金的持久撑持,诸般要素齐聚“才让这件事发生”。

孙凝晖暗示,于“AI赋能科学发明”以前,现代科学勾当中存于四种范式,即基在试验不雅察的科学试验范式、依靠科学家的理论推演范式、借助计较装备的科学计较或者数值模仿范式、基在试验及理论数据计较的科学数据范式。如今,AI赋能科学发明当属“第五范式”,正于登上汗青舞台。

帮忙科学家从“增肌强体”到“付与年夜脑”

AI到底怎样赋能科学发明?

孙凝晖提出,从信息化视角来看,AI赋能科学发明的焦点于在将构建包括不雅测(Observe)、模仿(Orient)、料想(Hypothesis)与试验(Verify)四个环节,并将数据驱动及智能算法驱动引入到这四个环节中,形成一个“OOHV全环的AI赋能”。

“于这四个环节中,信息技能总能阐扬作用,它们让常识的获取、分享及检索、互换越发利便,让信息的抽取更简朴。”孙凝晖睁开谈到,推演模仿环节素质上是“高机能计较+AI”,而呆板进修、年夜模子能经由过程处置惩罚科学数据发明纪律、验证料想,不雅察及试验将来也可倚靠具身智能。

AI4S赋能模仿、不雅测、料想、试验4个环节的典型案例。 受访者供图,下同

?

他举出了一些详细的例子:“已经有的AI4S的结果,较多还有于(对于)料想及不雅测环节(赋能),是以基在常识年夜模子的结果较多,好比农业范畴的‘神农年夜模子’,中国科学院主动化研究所发布的‘ScienceOne科学基础年夜模子’等,它们可以对于不雅测数据用呆板进修的要领(来处置惩罚数据、发明新纪律);赋能模仿环节的事情还有比力少,除了AlphaFold以外,还有有份子动力学模子DeePMD以和‘盘古景象形象年夜模子’及‘LAM年夜原子模子’等,它们对于科学发明的帮忙潜力巨年夜;试验环节联合患上也不许多,较知名的有中国科学技能年夜学推出的‘呆板化学家’、中国科学院高能物理研究所上线的‘聪明光源年夜脑’等。”

从这些详细案例来看,孙凝晖认为,信息学科的重要使命是提供东西,包括提高出产率的科研信息化东西及运用开发中间件;而年夜模子、呆板进修算法等付与科学家的“相称在是手腕的进化”。

对于此,他有一个形象的比方:信息技能赋能科学的手腕犹如从“加强肌肉(算力)”到“提供养分”(数据),如今正朝着“付与年夜脑”(人工智能)的标的目的进化。

“AI4S更年夜的作用应该是冲破人类认知极限,这也是科学研究的最高寻求。”孙凝晖说,人类于科学计较范式(第三范式)及数据科学范式(第四范式)下都有三木SEO-很多冲破认知极限的事情,好比经由过程科学计较,咱们既能做千米级精度的中短时间气候预告,也能从全世界标准做天气变化的猜测;经由过程数据解析,人类患上以从基因组层面熟悉本身,经由过程天文千里镜摸到黑洞的“脉搏”。如今,于科学智能范式下,也有冲破人类认知极限的事情,好比AlphaFold及DeePMD,且两者的技能路径有所差别。

不外,他提示,AI东西其实不是全能的,科学发明依然离不开高机能计较这一基础手腕。同时,于解决现实科学问题时,怎样对于齐AI4S共性东西的科学语义,将成为要害问题。

AI4S的数据、模子、计较问题,以和将来瞻望

瞻望AI赋能科学发明的将来成长,孙凝晖深切剖析了AI4S面对的数据问题、模子问题与计较问题。

“科学数据年夜概来自4个方面,理论数据、不雅测数据、试验数据及常识数据,AI4S数据集预备不仅需要持久的堆集,还有需要存眷数据的AI-Ready化与成熟度。”孙凝晖暗示,科学数据除了了呆板进修范畴通用的特性化、标签化、流程化之外,还有需要运用范畴更存眷物理性子的铆定、各类标准的对于齐东西,这些东西需要以插件的情势作为通用东西里为科学办事。别的,还有要留意数据的偏差问题及对于齐问题——数据的体系性偏差会被AI模子进修到,进而影响模子的精度。

模子方面,孙凝晖提到,OpenAI将实现通用人工智能的路径分为5个阶段:对于话者(Chatbots)、推理者(Rensoners)、代办署理者(Agents)、立异者(Innovators)、构造者(Organizations),这5个阶段对于应的AI也依次插手了数据驱动、常识嵌入、物理约束、人机协同、群体智能的能力。今朝,AI4S的运用能级正处在“数据驱动+常识嵌入+物理约束”三轮驱动的阶段。

从模子的角度看AI4S的能级。

?

于孙凝晖展示的AI4S的能级图中,AI的进阶犹如从“单车”到“高铁”般地按部就班:仅靠数据驱动的AI恍如“单轮车”,跟着常识的嵌入,AI成为了“自行车”;插手了物理约束(物理性子的铆定、标准对于齐等)后,AI堪比“三轮摩托”。而跟着人机协同、群体智能等更多“轮子”的插手,AI有望酿成“跑车”“高铁”,将年夜年夜加快人类科学发明的进程。

于计较问题上,孙凝晖提到,权衡计较有两个要害维度:精度及架构。科学计较需要高精度,计较体系以异构架构为主;年夜模子练习也是异构架构,但不需要高精度算力;AI4S不仅需要高(全)精度计较,还有需要可以或许降低负载的交融架构。也就是说,支撑HPC+AI运用的智能超算体系需要8/16/32/64位宽的全精度计较,对于体系级互联收集机能的要求也更高,平凡的智算中央一般没法满意HPC+AI运用的需求。他暗示,将来的智算的交融架构是甚么样,这是计较机科学家们需要思索的问题。

孙凝晖瞻望道,跟着算力集群的重叠、数据来历的多样化、模子参数范围等的进一步晋升,将来算力将进化成为Z级(每一秒可举行1021次浮点运算)智能超算,数据方面将成长为由海量知识数据、高质量理论数据、试验数据和加强数据来解决更繁杂问题,模子大将呈现一个参数目跨越千亿、通用的科学智能年夜模子。

而从以往信息技能赋能科学发明催生了计较化学、生物信息学、地舆信息体系等学科分支来看,许多人体贴,AI4S会不会催生如“智能质料学”如许的新的学科分支?

孙凝晖认为,可以先不着急下结论。可以或许看到的是,跟着AI技能对于科学研究范式(如“AI-first”的试验设计)的重构,新的研究东西链(如主动化试验室、AI驱动的仿真体系)的涌现,加上《天然》等顶级期刊开设AI for Science专栏、全世界顶尖机组成立AI4S相干或者专门的研究单位,一个极新的AI4S要领论及AI4S学术生态正于形成。

版权声明:凡本网注明“来历:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请于正文上方注明来历及作者,且不患上对于内容作本色性改动;微信公家号、头条号等新媒体平台,转载请接洽授权。邮箱:shouquan@stimes.cn。-米兰官网