DeepSeek發(fā)布可自驗(yàn)證數(shù)學(xué)模型DeepSeekMath-V2
鈦媒體App 11月27日消息,DeepSeek推出新型數(shù)學(xué)推理模型DeepSeekMath-V2,采用可自我驗(yàn)證的訓(xùn)練框架。該模型基于DeepSeek-V3.2-Exp-Base構(gòu)建,通過LLM驗(yàn)證器自動(dòng)審查生成的數(shù)學(xué)證明,并利用高難度樣本持續(xù)優(yōu)化性能。在IMO 2025和CMO 2024中均達(dá)到金牌水平,Putnam 2024獲118/120分。團(tuán)隊(duì)表示,該成果驗(yàn)證了自驗(yàn)證推理路徑的可行性,為構(gòu)建可靠數(shù)學(xué)智能系統(tǒng)提供新方向。模型代碼與權(quán)重已開源,發(fā)布于Hugging Face及GitHub平臺(tái)。(廣角觀察)
本文內(nèi)容僅供參考,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論