圖片來源:DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning
DeepSeek方面表示,盡管仍有許多工作要做,但這些結(jié)果表明,自驗(yàn)證數(shù)學(xué)推理是一個(gè)可行的研究方向,可能有助于開發(fā)更強(qiáng)大的數(shù)學(xué)AI系統(tǒng)。
這款突破性的開源數(shù)學(xué)模型發(fā)布后,再次在社交平臺、reddit、Hacker News等評論區(qū)、社區(qū)引發(fā)熱潮。
其在測試、競賽成績和自驗(yàn)證方面形成的數(shù)學(xué)定理證明能力突破,最令人關(guān)注。
“從‘結(jié)果導(dǎo)向’的驗(yàn)證轉(zhuǎn)向‘過程導(dǎo)向’的驗(yàn)證,這對于定理證明尤為重要,因?yàn)樵诙ɡ碜C明中,嚴(yán)格的逐步推導(dǎo)比數(shù)值答案更重要。”
“雖然還不清楚具體用途,但擁有一位全天候免費(fèi)提供的數(shù)學(xué)天才,其潛力巨大。”
“這款開源模型會大大有助于自動(dòng)化許多注重驗(yàn)證的編程語言中的繁瑣工作!”
由研究人員和工程師組成的跨學(xué)科團(tuán)隊(duì)Binary Verse AI發(fā)文稱,一個(gè)開源模型悄無聲息地發(fā)布,卻突破了本科數(shù)學(xué)的瓶頸。該文章作者阿茲馬特(Azmat)提到,Math-V2的有趣之處不僅在于競賽分?jǐn)?shù),更在于其方法。
![]()
圖片來源:DeepSeek Math V2: Inside the Open Source Model That Beat Google at the Math Olympiad,Binary Verse AI
“如果你曾經(jīng)批改過數(shù)學(xué)試卷,你就會明白猜對答案的學(xué)生和真正推導(dǎo)出答案的學(xué)生之間的區(qū)別。”阿茲馬特認(rèn)為,此前的大模型多屬于前者,只是概率性的猜測者,而Math-V2的出現(xiàn)改變了這一切。
文章總結(jié)稱,我們正從“聊天機(jī)器人”時(shí)代過渡到“推理者”時(shí)代。Math-V2證明了可自驗(yàn)證的數(shù)學(xué)推理是可以解決的?;蛟S,人類不需要通用人工智能(AGI)來獲得嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)運(yùn)算能力,只需要教會模型保持謙遜。
社交平臺上,不少AI領(lǐng)域的KOL和知名專家都在轉(zhuǎn)發(fā)消息并表示“DeepSeek強(qiáng)勢回歸”“這是你無法忽視的力量”。
![]()
圖片來自社交平臺X
雖然DeepSeek R2的“難產(chǎn)”已經(jīng)成為了AI領(lǐng)域玩梗級別的存在,但實(shí)際上,不管是10月發(fā)布、讓OpenAI聯(lián)合創(chuàng)始人大神安德烈·卡帕斯(Andrej Karpathy)盛贊的探索視覺-文本壓縮邊界的DeepSeek-OCR,還是剛剛發(fā)布的Math-V2,都提示著人們:別忘了,今年AI領(lǐng)域的驚喜,正是從DeepSeek開始的。(作者|胡珈萌,編輯|李程程)
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論
從只看答案到重視推理過程,Math-V2 這思路轉(zhuǎn)變太關(guān)鍵了,以后定理證明有幫手了!
開源模型能做到這水平,以后中小團(tuán)隊(duì)也能玩數(shù)學(xué) AI,不用再被巨頭卡脖子了!
之前覺得 AI 數(shù)學(xué)頂破天就是做題,Math-V2 一出來,才知道還能當(dāng) “小數(shù)學(xué)家”!
驗(yàn)證器訓(xùn)生成器還能自糾錯(cuò),這邏輯閉環(huán)玩得溜,難怪推理能這么嚴(yán)謹(jǐn)!
之前 OpenAI、谷歌拿 IMO 金牌夠厲害,結(jié)果 DeepSeek 不光跟上,還搞出開源版本,太驚喜了!
不管 R2 怎么樣,Math-V2 這波已經(jīng)讓 DeepSeek 在 AI 圈站穩(wěn)腳,以后肯定還有大動(dòng)作!
社交平臺上好多 KOL 轉(zhuǎn)發(fā),都說這是 “無法忽視的力量”,看來業(yè)內(nèi)認(rèn)可度超高!
社交平臺都炸了,好多專家說這是 “推理者” 時(shí)代的開始,不是光聊天的 AI 了!
自驗(yàn)證推理不光能做數(shù)學(xué),說不定以后還能用到物理、化學(xué)證明,潛力太大了!
以前 AI 數(shù)學(xué)只敢當(dāng) “做題家”,Math-V2 居然能嚴(yán)謹(jǐn)推理,連證明過程都能自驗(yàn)證,絕了!