中國(guó)工程院院士、之江實(shí)驗(yàn)室主任王堅(jiān)

AI for Science(AI4S)再次迎來(lái)新突破。

最近,在杭州舉辦的021科學(xué)基礎(chǔ)模型創(chuàng)新合作大會(huì)上,浙江之江實(shí)驗(yàn)室首次全面展示021科學(xué)基礎(chǔ)模型及系列領(lǐng)域科學(xué)模型研發(fā)的進(jìn)展,包括全球首個(gè)百億級(jí)人類(lèi)基因組基礎(chǔ)模型Genos。

021模型構(gòu)筑形成跨學(xué)科知識(shí)、跨領(lǐng)域推理、跨語(yǔ)言理解(覆蓋204種語(yǔ)言)三大基石,具備出色的科學(xué)推理能力,能夠深入分析、推導(dǎo)、驗(yàn)證多類(lèi)科學(xué)問(wèn)題。

“021”就是“從0到1”,其中包含著之江實(shí)驗(yàn)室對(duì)科學(xué)基礎(chǔ)模型的理解和發(fā)展規(guī)劃。

在中國(guó)工程院院士、之江實(shí)驗(yàn)室主任王堅(jiān)看來(lái),“如果基礎(chǔ)模型是人工智能的皇冠,那么科學(xué)基礎(chǔ)模型就是人工智能皇冠上的明珠。”

之江實(shí)驗(yàn)室科學(xué)模型總體部技術(shù)總師薛貴榮認(rèn)為,科學(xué)數(shù)據(jù)涵蓋時(shí)間、空間、能量等多個(gè)維度,是對(duì)復(fù)雜物理系統(tǒng)演變規(guī)律的高維表征。為解決科學(xué)問(wèn)題,科學(xué)界需要突破語(yǔ)言空間的局限,研發(fā)科學(xué)基礎(chǔ)模型,構(gòu)建“科學(xué)空間+語(yǔ)言空間”于一體的更高維空間,建立跨學(xué)科數(shù)據(jù)之間的深層連接,變革科學(xué)研究范式。

為此,之江實(shí)驗(yàn)室研發(fā)團(tuán)隊(duì)探索將科學(xué)數(shù)據(jù)和文本語(yǔ)料編碼到統(tǒng)一的高維空間,讓模型能夠識(shí)別、處理科學(xué)數(shù)據(jù),認(rèn)識(shí)并解決復(fù)雜科學(xué)問(wèn)題。經(jīng)過(guò)近萬(wàn)次實(shí)驗(yàn),團(tuán)隊(duì)形成了模型訓(xùn)練框架,包括預(yù)訓(xùn)練、后訓(xùn)練、強(qiáng)化學(xué)習(xí)等,并完成了2360億參數(shù)規(guī)模的021科學(xué)基礎(chǔ)模型訓(xùn)練。

021,不僅是“zero to one”的簡(jiǎn)寫(xiě),也是AI正在從輔助科研轉(zhuǎn)向重構(gòu)科研的符號(hào)。

在AI4S的道路上,之江實(shí)驗(yàn)室通過(guò)與科學(xué)合作伙伴共同舉辦“種子班”來(lái)培養(yǎng)團(tuán)隊(duì),讓不同學(xué)科背景的人才聚集在一起,由專(zhuān)家級(jí)班主任帶領(lǐng),共同碰撞創(chuàng)新,在實(shí)戰(zhàn)中完善、升級(jí)。截至目前,之江實(shí)驗(yàn)室已累計(jì)舉辦22期種子班,培育了900余名緊缺型AI人才。

圖片來(lái)源:之江實(shí)驗(yàn)室

圖片來(lái)源:之江實(shí)驗(yàn)室

這并不是021模型第一次落地,在本月正式發(fā)布前,其在諸多科學(xué)領(lǐng)域已有成果展示。

其中引人關(guān)注的,是生命科學(xué)領(lǐng)域的全球首個(gè)百億級(jí)人類(lèi)基因組基礎(chǔ)模型Genos。

10月23日,之江實(shí)驗(yàn)室與華大生命科學(xué)研究院在第二十屆國(guó)際基因組學(xué)大會(huì)上聯(lián)合發(fā)布并開(kāi)源了這款大模型。該模型支持多達(dá)百萬(wàn)堿基對(duì)的超長(zhǎng)上下文分析,并實(shí)現(xiàn)單堿基分辨率的精準(zhǔn)識(shí)別。

Genos整合了人類(lèi)泛基因組參考聯(lián)盟(HPRC)和人類(lèi)基因組結(jié)構(gòu)變異圖譜計(jì)劃(HGSVC)等資源,基于636個(gè)“端粒到端粒”級(jí)別高質(zhì)量人類(lèi)基因組數(shù)據(jù)進(jìn)行訓(xùn)練,覆蓋全球不同人群。

Genos模型采用混合專(zhuān)家(MoE)架構(gòu),通過(guò)“按需激活”機(jī)制降低推理成本,在致病性突變解讀任務(wù)中準(zhǔn)確率達(dá)92%,結(jié)合科學(xué)基礎(chǔ)模型后提升至98.3%。它提供12億和100億參數(shù)兩個(gè)版本,已在GitHub、Hugging Face及魔搭等平臺(tái)開(kāi)源,并集成至DCS Cloud云平臺(tái)提供免費(fèi)推理服務(wù)。 

在地學(xué)領(lǐng)域,之江實(shí)驗(yàn)室向全球開(kāi)源了地球科學(xué)大模型GeoGPT。

該模型基于021科學(xué)基礎(chǔ)模型研發(fā),目前已進(jìn)行了數(shù)次迭代,支持圖像描述總結(jié)、圖像信息提取、地理空間推理、地學(xué)分析推理等典型任務(wù),通過(guò)融合深時(shí)地球數(shù)據(jù)與智能算法,提升地學(xué)研究效率。

同時(shí)受到矚目的,還有之江實(shí)驗(yàn)室聯(lián)合中國(guó)科學(xué)院國(guó)家天文臺(tái)研發(fā)的天文領(lǐng)域科學(xué)大模型OneAstronomy。

該模型同樣基于021基礎(chǔ)模型打造,能夠?qū)崿F(xiàn)跨模態(tài)融合推理,重構(gòu)數(shù)據(jù)處理范式,釋放望遠(yuǎn)鏡自主觀測(cè)潛力,推動(dòng)實(shí)現(xiàn)“觀測(cè)即發(fā)現(xiàn)”,今年9月被列為全球科技公共產(chǎn)品,服務(wù)于開(kāi)放科學(xué)行動(dòng)。

此外,在材料學(xué)領(lǐng)域,021打造出了多孔合金材料模型OnePorous,可根據(jù)材料性能需求,逆向生成新型多孔結(jié)構(gòu),目前已應(yīng)用于3D打印衛(wèi)星主體結(jié)構(gòu)制造。

事實(shí)上,自去年諾貝爾化學(xué)獎(jiǎng)和物理學(xué)獎(jiǎng),均授予了與AI密切相關(guān)的研究者后,AI4S就已被普遍認(rèn)為是AI大模型的又一進(jìn)階之路。

各大高校和科研院所對(duì)AI4S探索步伐加速的同時(shí),政策也在持續(xù)加碼。其中引人關(guān)注的是,今年11月,美國(guó)總統(tǒng)特朗普還曾簽署行政令啟動(dòng)AI“創(chuàng)世紀(jì)計(jì)劃”。該計(jì)劃試圖利用人工智能變革科學(xué)研究方式、加速科學(xué)發(fā)現(xiàn),生物技術(shù)、關(guān)鍵材料、先進(jìn)制造業(yè)等均是重點(diǎn)領(lǐng)域。

不止于學(xué)術(shù)界,包括谷歌、微軟、Meta等全球科技巨頭,也在這一領(lǐng)域進(jìn)行了重點(diǎn)布局。其中,谷歌DeepMind的Alpha系列大模型一直被視為領(lǐng)軍者,該模型近年來(lái)在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面的突出表現(xiàn),已成為了AI4S的典型案例。

不過(guò),目前大模型對(duì)科研領(lǐng)域的助力,覆蓋范圍還有所局限。在這一方向上,人才、科學(xué)數(shù)據(jù)的搜集整合、不同前沿學(xué)科的交融等問(wèn)題亟待解決,并且極度缺少既往成功經(jīng)驗(yàn)和案例可參考。某種程度上,這更凸顯了打造新的基礎(chǔ)科學(xué)大模型的重要性,這也正是021科學(xué)基礎(chǔ)模型被開(kāi)發(fā)及面世的意義。(作者|胡珈萌,編輯|李程程)

本文系作者 飛向TAI空 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

19:36

英特爾盤(pán)前跌幅擴(kuò)大至超4%

19:35

魯信創(chuàng)投:控股股東魯信集團(tuán)擬減持不超1%股份

19:35

中廣核兩臺(tái)“華龍一號(hào)”核電機(jī)組開(kāi)始裝料

19:34

深圳發(fā)布低空經(jīng)濟(jì)與生物醫(yī)藥商業(yè)秘密保護(hù)指引

19:25

橫店?yáng)|磁:控股股東擬減持不超1%股份

19:19

20CM漲停超捷股份:控股股東12月8日至12月24日期間減持97.44萬(wàn)股

19:18

英特爾美股盤(pán)前跌近2%

19:16

達(dá)利凱普:公司射頻微波MLCC產(chǎn)品在航空航天領(lǐng)域有所應(yīng)用

19:16

章源鎢業(yè):控股股東減持計(jì)劃實(shí)施完成

19:15

三一重能:2026年度擬使用不超過(guò)95億元自有資金進(jìn)行委托理財(cái)

19:15

天海防務(wù):中國(guó)長(zhǎng)城資產(chǎn)12月22日至12月23日減持302.78萬(wàn)股

19:14

金盾股份:股東高新投擬減持不超1%股份,方正證券擬減持不超3%股份

19:14

濱化股份:與專(zhuān)業(yè)投資機(jī)構(gòu)共同設(shè)立創(chuàng)業(yè)投資基金,主要聚焦于合成生物、新能源等領(lǐng)域

19:13

英偉達(dá)據(jù)稱(chēng)已中止英特爾18A制程工藝的測(cè)試

19:13

世嘉科技:增資光彩芯辰事宜已獲得標(biāo)的公司股東會(huì)2/3以上通過(guò)

19:08

央行:要繼續(xù)實(shí)施適度寬松的貨幣政策,加大逆周期和跨周期調(diào)節(jié)力度

19:07

央行:把做強(qiáng)國(guó)內(nèi)大循環(huán)擺到更加突出的位置,增強(qiáng)宏觀政策前瞻性針對(duì)性協(xié)同性

19:06

央行:加強(qiáng)對(duì)擴(kuò)大內(nèi)需、科技創(chuàng)新、中小微企業(yè)等重點(diǎn)領(lǐng)域的金融支持

19:05

央行:建議發(fā)揮增量政策和存量政策集成效應(yīng),把握好政策實(shí)施的力度、節(jié)奏和時(shí)機(jī)

19:03

歐盟強(qiáng)烈譴責(zé)美國(guó)對(duì)歐委會(huì)前委員實(shí)施簽證限制

掃描下載App