圖片來源:DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning

DeepSeek方面表示,盡管仍有許多工作要做,但這些結(jié)果表明,自驗(yàn)證數(shù)學(xué)推理是一個(gè)可行的研究方向,可能有助于開發(fā)更強(qiáng)大的數(shù)學(xué)AI系統(tǒng)。

這款突破性的開源數(shù)學(xué)模型發(fā)布后,再次在社交平臺、reddit、Hacker News等評論區(qū)、社區(qū)引發(fā)熱潮。

其在測試、競賽成績和自驗(yàn)證方面形成的數(shù)學(xué)定理證明能力突破,最令人關(guān)注。

“從‘結(jié)果導(dǎo)向’的驗(yàn)證轉(zhuǎn)向‘過程導(dǎo)向’的驗(yàn)證,這對于定理證明尤為重要,因?yàn)樵诙ɡ碜C明中,嚴(yán)格的逐步推導(dǎo)比數(shù)值答案更重要。”

“雖然還不清楚具體用途,但擁有一位全天候免費(fèi)提供的數(shù)學(xué)天才,其潛力巨大。”

“這款開源模型會大大有助于自動(dòng)化許多注重驗(yàn)證的編程語言中的繁瑣工作!”

由研究人員和工程師組成的跨學(xué)科團(tuán)隊(duì)Binary Verse AI發(fā)文稱,一個(gè)開源模型悄無聲息地發(fā)布,卻突破了本科數(shù)學(xué)的瓶頸。該文章作者阿茲馬特(Azmat)提到,Math-V2的有趣之處不僅在于競賽分?jǐn)?shù),更在于其方法。

Binary Verse AI平臺文章DeepSeek Math V2: Inside the Open Source Model That Beat Google at the Math Olympiad

圖片來源:DeepSeek Math V2: Inside the Open Source Model That Beat Google at the Math Olympiad,Binary Verse AI

“如果你曾經(jīng)批改過數(shù)學(xué)試卷,你就會明白猜對答案的學(xué)生和真正推導(dǎo)出答案的學(xué)生之間的區(qū)別。”阿茲馬特認(rèn)為,此前的大模型多屬于前者,只是概率性的猜測者,而Math-V2的出現(xiàn)改變了這一切。

文章總結(jié)稱,我們正從“聊天機(jī)器人”時(shí)代過渡到“推理者”時(shí)代。Math-V2證明了可自驗(yàn)證的數(shù)學(xué)推理是可以解決的?;蛟S,人類不需要通用人工智能(AGI)來獲得嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)運(yùn)算能力,只需要教會模型保持謙遜。

社交平臺上,不少AI領(lǐng)域的KOL和知名專家都在轉(zhuǎn)發(fā)消息并表示“DeepSeek強(qiáng)勢回歸”“這是你無法忽視的力量”。

圖片來自社交平臺X

圖片來自社交平臺X

雖然DeepSeek R2的“難產(chǎn)”已經(jīng)成為了AI領(lǐng)域玩梗級別的存在,但實(shí)際上,不管是10月發(fā)布、讓OpenAI聯(lián)合創(chuàng)始人大神安德烈·卡帕斯(Andrej Karpathy)盛贊的探索視覺-文本壓縮邊界的DeepSeek-OCR,還是剛剛發(fā)布的Math-V2,都提示著人們:別忘了,今年AI領(lǐng)域的驚喜,正是從DeepSeek開始的。(作者|胡珈萌,編輯|李程程)

本文系作者 飛向TAI空 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容
  • 從只看答案到重視推理過程,Math-V2 這思路轉(zhuǎn)變太關(guān)鍵了,以后定理證明有幫手了!

    回復(fù) 2025.11.29 · via android
  • 開源模型能做到這水平,以后中小團(tuán)隊(duì)也能玩數(shù)學(xué) AI,不用再被巨頭卡脖子了!

    回復(fù) 2025.11.29 · via android
  • 之前覺得 AI 數(shù)學(xué)頂破天就是做題,Math-V2 一出來,才知道還能當(dāng) “小數(shù)學(xué)家”!

    回復(fù) 2025.11.29 · via iphone
  • 驗(yàn)證器訓(xùn)生成器還能自糾錯(cuò),這邏輯閉環(huán)玩得溜,難怪推理能這么嚴(yán)謹(jǐn)!

    回復(fù) 2025.11.29 · via android
  • 之前 OpenAI、谷歌拿 IMO 金牌夠厲害,結(jié)果 DeepSeek 不光跟上,還搞出開源版本,太驚喜了!

    回復(fù) 2025.11.29 · via pc
  • 不管 R2 怎么樣,Math-V2 這波已經(jīng)讓 DeepSeek 在 AI 圈站穩(wěn)腳,以后肯定還有大動(dòng)作!

    回復(fù) 2025.11.29 · via android
  • 社交平臺上好多 KOL 轉(zhuǎn)發(fā),都說這是 “無法忽視的力量”,看來業(yè)內(nèi)認(rèn)可度超高!

    回復(fù) 2025.11.29 · via pc
  • 社交平臺都炸了,好多專家說這是 “推理者” 時(shí)代的開始,不是光聊天的 AI 了!

    回復(fù) 2025.11.29 · via h5
  • 自驗(yàn)證推理不光能做數(shù)學(xué),說不定以后還能用到物理、化學(xué)證明,潛力太大了!

    回復(fù) 2025.11.29 · via android
  • 以前 AI 數(shù)學(xué)只敢當(dāng) “做題家”,Math-V2 居然能嚴(yán)謹(jǐn)推理,連證明過程都能自驗(yàn)證,絕了!

    回復(fù) 2025.11.29 · via h5
更多評論

快報(bào)

更多

2026-03-26 23:08

國內(nèi)商品期貨夜盤收盤多數(shù)上漲,對二甲苯期貨主力合約漲1.95%

2026-03-26 23:07

部分船舶通過伊朗“管控系統(tǒng)”通行霍爾木茲海峽

2026-03-26 23:07

五一視界2025年?duì)I收增21%,發(fā)布全球首款“物理直覺”世界模型

2026-03-26 23:00

伊拉克南部油田產(chǎn)量暴跌8成

2026-03-26 22:59

華虹公司:2025年凈利潤3.77億元,同比下降1.04%

2026-03-26 22:49

日本本州東部遠(yuǎn)海發(fā)生6.3級地震,震源深度10千米

2026-03-26 22:37

華虹半導(dǎo)體擬更名為“華虹宏力”,統(tǒng)一滬港兩地證券簡稱

2026-03-26 22:28

具身智能領(lǐng)域首個(gè)行業(yè)標(biāo)準(zhǔn)正式發(fā)布

2026-03-26 22:27

美國解除對白俄羅斯十余家實(shí)體制裁

2026-03-26 22:25

中國國航:2025年凈虧損17.7億元,同比大幅擴(kuò)大

2026-03-26 22:12

興業(yè)銀行:2025年凈利潤774.69億元,同比增長0.34%

2026-03-26 22:08

國際奧委會明確:奧運(yùn)女子組賽事僅限生理女性參加

2026-03-26 22:08

96個(gè)中央部門集中向社會公開預(yù)算

2026-03-26 21:58

Meta股價(jià)觸及2025年5月以來最低水平,最新下跌2.6%

2026-03-26 21:51

美團(tuán)財(cái)報(bào)電話會:預(yù)計(jì)Q1餐飲外賣的單均虧損環(huán)比優(yōu)化幅度會好于Q4

2026-03-26 21:42

伊朗通過中間人回應(yīng)美15點(diǎn)?;鹛嶙h,提出明確前提條件

2026-03-26 21:41

國臺辦回應(yīng)臺灣民眾黨前主席柯文哲一審被判17年

2026-03-26 21:34

納斯達(dá)克中國金龍指數(shù)跌超2%

2026-03-26 21:31

美股開盤:三大指數(shù)集體低開,芯片存儲板塊普跌

2026-03-26 21:29

云南銅業(yè):2025年凈利潤同比下降7.31%,擬10派2.3元

39

掃描下載App