DeepSeek-R1與其他代表性模型比較,來源:DeepSeek

DeepSeek-R1高性價比的API定價,極具商業(yè)化落地潛力。其定價為每百萬輸入tokens 1元(緩存命中)/4 元(緩存未命中),每百萬輸出tokens 16元,遠低于可比大模型API服務(wù)。

且與專有模型不同,DeepSeek R1的代碼和訓(xùn)練方法在MIT許可下完全開源,這意味著任何人都可以獲取、使用和修改該模型而不受限制,也有助于開發(fā)者在使用后,加速模型的功能迭代,從而解決目前模型存在的不足。

近一個月來,DeepSeek在開源大模型領(lǐng)域的探索不可謂不吸睛。在2025年達沃斯論壇上,AI科技初創(chuàng)公司Scale AI創(chuàng)始人亞歷山大·王公開表示,過去十年來,美國可能一直在人工智能競賽中領(lǐng)先于中國,但DeepSeek的AI大模型發(fā)布可能會“改變一切”。

2024年12月26日,深度求索正式上線全新系列模型DeepSeek-V3首個版本并同步開源。經(jīng)測試,在英語、代碼、數(shù)學(xué)、漢語以及多語言任務(wù)上,該模型不僅超越阿里云Qwen2.5-72B、Meta的Llama-3.1-405B等開源模型,且在性能上逼近GPT-4o、Claude-3.5-Sonnet等世界頂尖閉源模型,大大縮小了開源和閉源AI之間的差距。

根據(jù)DeepSeek-V3技術(shù)報告,該模型整個訓(xùn)練使用了277.8萬個GPU小時(GPU為H800),訓(xùn)練成本為557.6萬美元。通常這種能力水平的模型需要接近16K GPU的集群,而目前一些正在部署的集群規(guī)模已接近10萬塊GPU。例如,Llama-3-405B耗費了3080萬GPU小時,對比之下,DeepSeek-V3的算力需求減少約11倍。

其API也大幅下降,每百萬輸入tokens 0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens 8元。DeepSeek為V3大模型提供了45天優(yōu)惠價格體驗期,在2025年2月8日之前,所有用戶使用該模型API的價格分別下降80%(輸入命中)、50%(輸入未命中)、75%(輸出)。技術(shù)報告顯示,DeepSeek-V3成為唯一進入“最佳性價比”三角區(qū)的模型。

DeepSeek-V3位于“最佳性價比”三角區(qū),來源:DeepSeek

DeepSeek-V3位于“最佳性價比”三角區(qū),來源:DeepSeek

長江證券認為,DeepSeek-V3說明在有限算力預(yù)算下進行模型預(yù)訓(xùn)練仍可以達到優(yōu)秀的性能,目前在數(shù)據(jù)和算法方面仍有大量優(yōu)化空間,低成本的訓(xùn)練和高效推理應(yīng)用或?qū)⑹窍乱浑A段大模型發(fā)展的方向之一。后續(xù)有望在有限的預(yù)算下開發(fā)強勁性能的大模型,從而降低大模型的準入門檻,推動AI應(yīng)用的落地進程。

2024年5月,DeepSeek率先發(fā)起國內(nèi)大模型價格戰(zhàn),將100萬token的價格降至1元人民幣,迅速引發(fā)市場震動。字節(jié)跳動豆包大模型緊隨其后,將價格進一步壓低至100萬token 0.8元人民幣。阿里云通義千問則全線降價,雖然輸出token降幅較小,但整體價格仍處市場低位。此外,百度、科大訊飛、騰訊等大廠也紛紛加入降價行列。

興業(yè)證券認為,從豆包最新發(fā)布的視覺理解模型到Deepseekv3的全球關(guān)注,國內(nèi)AI大模型能力被低估。伴隨字節(jié)在AI領(lǐng)域的投入決心、豆包用戶目標設(shè)定,2025年或為國內(nèi)大模型真正算力軍備競賽的第一年,大廠資本開支有望持續(xù)超預(yù)期。

風(fēng)險提示:產(chǎn)品升級不及預(yù)期;市場競爭加??;下游應(yīng)用需求不及預(yù)期;安全風(fēng)險。

科股寶VIP由鈦媒體App與北京商報聯(lián)合推出,相關(guān)數(shù)據(jù)及信息已獲得北京商報授權(quán)。 風(fēng)險提示:本產(chǎn)品內(nèi)容僅供參考,不構(gòu)成投資建議。投資有風(fēng)險,入市需謹慎。
科股一線拆解

快報

更多

17:20

民調(diào):超七成歐洲人擔(dān)憂戰(zhàn)爭,呼吁歐盟提升獨立性

17:19

美國最高法院或限制中期選舉郵寄投票

17:19

甘李藥業(yè):博凡格魯肽新增適應(yīng)癥獲臨床試驗批準

17:17

中國人民銀行行長潘功勝會見國際貨幣基金組織第一副總裁丹·卡茨

17:16

歐元區(qū)3月制造業(yè)PMI初值51.4,高于預(yù)期

17:15

高盛:料中東運輸中斷持續(xù)至4月中旬,上調(diào)亞洲區(qū)油價及CPI通脹預(yù)測

17:14

不服聯(lián)邦法官裁決,五角大樓關(guān)閉“記者通道”

17:13

錦浪科技:目前與特斯拉沒有合作

17:13

青禾晶元完成約5億元戰(zhàn)略融資,中微公司參與領(lǐng)投

17:12

道達爾能源公司:將美國兩個海上風(fēng)電項目租賃資金轉(zhuǎn)投油氣領(lǐng)域

17:11

中國電信:2025年凈利潤331.85億元,同比增長0.5%

17:08

禾賽:2025年凈收入30.28億元,同比增長45.8%

17:07

中國央行:3月25日將開展5000億元MLF操作

17:04

國開行今年前2個月發(fā)放國家水網(wǎng)重點領(lǐng)域貸款104億元

17:04

在岸人民幣兌美元收報6.8877,較上一交易日上漲185點

17:03

特朗普甩鍋美防長赫格塞思:你帶頭表態(tài)要打伊朗

17:02

三只松鼠:擬1億元-2億元回購公司股份

17:01

富祥藥業(yè)今日20cm漲停,開源證券西安太華路證券營業(yè)部凈買入1.06億元

17:01

津巴布韋鋰出口禁令放開預(yù)期落空,相關(guān)中資企業(yè)回應(yīng)

16:59

北京君正:車規(guī)及工業(yè)領(lǐng)域存儲供應(yīng)緊張,客戶需求旺盛

掃描下載App