中國工程院院士、之江實驗室主任王堅

AI for Science(AI4S)再次迎來新突破。

最近,在杭州舉辦的021科學(xué)基礎(chǔ)模型創(chuàng)新合作大會上,浙江之江實驗室首次全面展示021科學(xué)基礎(chǔ)模型及系列領(lǐng)域科學(xué)模型研發(fā)的進展,包括全球首個百億級人類基因組基礎(chǔ)模型Genos

021模型構(gòu)筑形成跨學(xué)科知識、跨領(lǐng)域推理、跨語言理解(覆蓋204種語言)三大基石,具備出色的科學(xué)推理能力,能夠深入分析、推導(dǎo)、驗證多類科學(xué)問題。

“021”就是“從0到1”,其中包含著之江實驗室對科學(xué)基礎(chǔ)模型的理解和發(fā)展規(guī)劃。

在中國工程院院士、之江實驗室主任王堅看來,“如果基礎(chǔ)模型是人工智能的皇冠,那么科學(xué)基礎(chǔ)模型就是人工智能皇冠上的明珠。”

之江實驗室科學(xué)模型總體部技術(shù)總師薛貴榮認(rèn)為,科學(xué)數(shù)據(jù)涵蓋時間、空間、能量等多個維度,是對復(fù)雜物理系統(tǒng)演變規(guī)律的高維表征。為解決科學(xué)問題,科學(xué)界需要突破語言空間的局限,研發(fā)科學(xué)基礎(chǔ)模型,構(gòu)建“科學(xué)空間+語言空間”于一體的更高維空間,建立跨學(xué)科數(shù)據(jù)之間的深層連接,變革科學(xué)研究范式。

為此,之江實驗室研發(fā)團隊探索將科學(xué)數(shù)據(jù)和文本語料編碼到統(tǒng)一的高維空間,讓模型能夠識別、處理科學(xué)數(shù)據(jù),認(rèn)識并解決復(fù)雜科學(xué)問題。經(jīng)過近萬次實驗,團隊形成了模型訓(xùn)練框架,包括預(yù)訓(xùn)練、后訓(xùn)練、強化學(xué)習(xí)等,并完成了2360億參數(shù)規(guī)模的021科學(xué)基礎(chǔ)模型訓(xùn)練。

021,不僅是“zero to one”的簡寫,也是AI正在從輔助科研轉(zhuǎn)向重構(gòu)科研的符號。

在AI4S的道路上,之江實驗室通過與科學(xué)合作伙伴共同舉辦“種子班”來培養(yǎng)團隊,讓不同學(xué)科背景的人才聚集在一起,由專家級班主任帶領(lǐng),共同碰撞創(chuàng)新,在實戰(zhàn)中完善、升級。截至目前,之江實驗室已累計舉辦22期種子班,培育了900余名緊缺型AI人才。

圖片來源:之江實驗室

圖片來源:之江實驗室

這并不是021模型第一次落地,在本月正式發(fā)布前,其在諸多科學(xué)領(lǐng)域已有成果展示。

其中引人關(guān)注的,是生命科學(xué)領(lǐng)域的全球首個百億級人類基因組基礎(chǔ)模型Genos。

10月23日,之江實驗室與華大生命科學(xué)研究院在第二十屆國際基因組學(xué)大會上聯(lián)合發(fā)布并開源了這款大模型。該模型支持多達百萬堿基對的超長上下文分析,并實現(xiàn)單堿基分辨率的精準(zhǔn)識別。

Genos整合了人類泛基因組參考聯(lián)盟(HPRC)和人類基因組結(jié)構(gòu)變異圖譜計劃(HGSVC)等資源,基于636個“端粒到端粒”級別高質(zhì)量人類基因組數(shù)據(jù)進行訓(xùn)練,覆蓋全球不同人群。

Genos模型采用混合專家(MoE)架構(gòu),通過“按需激活”機制降低推理成本,在致病性突變解讀任務(wù)中準(zhǔn)確率達92%,結(jié)合科學(xué)基礎(chǔ)模型后提升至98.3%。它提供12億和100億參數(shù)兩個版本,已在GitHub、Hugging Face及魔搭等平臺開源,并集成至DCS Cloud云平臺提供免費推理服務(wù)。 

在地學(xué)領(lǐng)域,之江實驗室向全球開源了地球科學(xué)大模型GeoGPT。

該模型基于021科學(xué)基礎(chǔ)模型研發(fā),目前已進行了數(shù)次迭代,支持圖像描述總結(jié)、圖像信息提取、地理空間推理、地學(xué)分析推理等典型任務(wù),通過融合深時地球數(shù)據(jù)與智能算法,提升地學(xué)研究效率。

同時受到矚目的,還有之江實驗室聯(lián)合中國科學(xué)院國家天文臺研發(fā)的天文領(lǐng)域科學(xué)大模型OneAstronomy。

該模型同樣基于021基礎(chǔ)模型打造,能夠?qū)崿F(xiàn)跨模態(tài)融合推理,重構(gòu)數(shù)據(jù)處理范式,釋放望遠鏡自主觀測潛力,推動實現(xiàn)“觀測即發(fā)現(xiàn)”,今年9月被列為全球科技公共產(chǎn)品,服務(wù)于開放科學(xué)行動。

此外,在材料學(xué)領(lǐng)域,021打造出了多孔合金材料模型OnePorous,可根據(jù)材料性能需求,逆向生成新型多孔結(jié)構(gòu),目前已應(yīng)用于3D打印衛(wèi)星主體結(jié)構(gòu)制造。

事實上,自去年諾貝爾化學(xué)獎和物理學(xué)獎,均授予了與AI密切相關(guān)的研究者后,AI4S就已被普遍認(rèn)為是AI大模型的又一進階之路。

各大高校和科研院所對AI4S探索步伐加速的同時,政策也在持續(xù)加碼。其中引人關(guān)注的是,今年11月,美國總統(tǒng)特朗普還曾簽署行政令啟動AI“創(chuàng)世紀(jì)計劃”。該計劃試圖利用人工智能變革科學(xué)研究方式、加速科學(xué)發(fā)現(xiàn),生物技術(shù)、關(guān)鍵材料、先進制造業(yè)等均是重點領(lǐng)域。

不止于學(xué)術(shù)界,包括谷歌、微軟、Meta等全球科技巨頭,也在這一領(lǐng)域進行了重點布局。其中,谷歌DeepMind的Alpha系列大模型一直被視為領(lǐng)軍者,該模型近年來在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面的突出表現(xiàn),已成為了AI4S的典型案例。

不過,目前大模型對科研領(lǐng)域的助力,覆蓋范圍還有所局限。在這一方向上,人才、科學(xué)數(shù)據(jù)的搜集整合、不同前沿學(xué)科的交融等問題亟待解決,并且極度缺少既往成功經(jīng)驗和案例可參考。某種程度上,這更凸顯了打造新的基礎(chǔ)科學(xué)大模型的重要性,這也正是021科學(xué)基礎(chǔ)模型被開發(fā)及面世的意義。(作者|胡珈萌,編輯|李程程)

本文系作者 飛向TAI空 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容
  • 種子班讓緊缺 AI 人才快速成長,以后搞 AI4S 不怕沒人干活了

    回復(fù) 2025.12.25 · via pc
  • GeoGPT 幫地學(xué)研究者處理復(fù)雜數(shù)據(jù),以前要好久的活現(xiàn)在快多了

    回復(fù) 2025.12.25 · via iphone
  • Genos 一出來,基因分析不用再一點點摳數(shù)據(jù),科研人員能少熬不少夜

    回復(fù) 2025.12.25 · via android
  • 材料學(xué)的 OnePorous 能逆向造新型多孔結(jié)構(gòu),新材料研發(fā)有新工具了

    回復(fù) 2025.12.25 · via pc
  • 021 模型能懂 204 種語言,2360 億參數(shù)規(guī)模,這技術(shù)實力在 AI4S 領(lǐng)域絕了

    回復(fù) 2025.12.25 · via android
  • 從 0 到 1 的突破最難,021 模型做到了,以后 AI 重構(gòu)科研的路會越走越寬

    回復(fù) 2025.12.25 · via pc
  • 22 期 “種子班” 培養(yǎng) 900 多 AI 人才,不同學(xué)科一起創(chuàng)新,人才儲備夠足

    回復(fù) 2025.12.25 · via h5
  • 有了 021 模型和種子班人才,中國在 AI4S 領(lǐng)域說不定能領(lǐng)跑全球

    回復(fù) 2025.12.25 · via h5
  • 021 模型就是來解決這些問題的,給 AI4S 發(fā)展指了條明路,意義太大了

    回復(fù) 2025.12.25 · via iphone
  • AI4S 現(xiàn)在缺成功經(jīng)驗,021 模型的成果能給大家當(dāng)參考,少走彎路

    回復(fù) 2025.12.25 · via h5
更多評論

快報

更多

17:30

2026太空算力產(chǎn)業(yè)大會將在北京啟幕

17:29

樹立和踐行正確政績觀學(xué)習(xí)教育中央指導(dǎo)組派駐地方和單位名單公布

17:28

世貿(mào)組織第14屆部長級會議在雅溫得閉幕,成員同意盡快就未決議題進行磋商

17:26

2連板貴廣網(wǎng)絡(luò):公司不涉及算力相關(guān)業(yè)務(wù)

17:25

伊朗稱未與美國直接對話,僅通過第三方傳遞信息

17:24

上交所對*ST星農(nóng)及有關(guān)責(zé)任人予以公開譴責(zé)

17:21

基金年報被要求詳列年度“罰單”明細

17:21

易方達基金:恒生紅利低波ETF易方達4月3日起暫停申購

17:19

耐世特泰國制造工廠正式投產(chǎn)

17:19

九安醫(yī)療今日漲停,有2家機構(gòu)專用席位凈賣出1.17億元

17:18

伊朗沖突打亂沙特原油常規(guī)定價機制,緊張的買家尋求替代方式

17:17

華安基金:華安標(biāo)普全球石油指數(shù)(LOF)4月3日暫停贖回

17:16

歐元區(qū)3月經(jīng)濟景氣指數(shù)為96.6,低于預(yù)期

17:15

神劍股份今日漲停,3家機構(gòu)專用席位凈買入1.35億元

17:15

邁為股份今日跌15.78%,有3家機構(gòu)專用席位凈賣出1.98億元

17:15

廣聯(lián)航空今日20cm漲停,3家機構(gòu)專用席位凈買入1.28億元

17:14

華泰證券:2025年凈利潤163.83億元,同比增長6.72%

17:13

市場監(jiān)管總局與歐盟委員會競爭總司共同舉辦第28屆中歐競爭政策周

17:06

中國攻克液氫燃料航空渦輪動力關(guān)鍵技術(shù)

17:04

面對多線作戰(zhàn)局面,以色列通過創(chuàng)紀(jì)錄預(yù)算

30

掃描下載App