文 | 智械島,作者 | 霍如筠
2 月 23 日,美國 AI 巨頭 Anthropic 在官網(wǎng)投下一枚重磅炸彈。
一份措辭嚴(yán)厲的調(diào)查報告,將矛頭直指中國三家頭部AI公司——深度求索( DeepSeek )、月之暗面( Moonshot )與稀宇科技( MiniMax ),指控其對旗艦?zāi)P?Claude 發(fā)動了“工業(yè)化規(guī)模”的模型蒸餾攻擊。
這并非中國 AI 企業(yè)首次因蒸餾陷入爭議。就在兩周前, OpenAI 剛剛向美國國會提交內(nèi)部備忘錄,指控 DeepSeek 繞過安全防護(hù)對 GPT 系列實施蒸餾。
而這一次, Anthropic 拋出了更詳盡的數(shù)據(jù):約 2.4 萬個虛假賬戶、超過 1600 萬次交互、一套名為“九頭蛇集群”的分布式架構(gòu),將惡意流量偽裝成正常請求,系統(tǒng)性地提取Claude的推理能力、工具調(diào)用與編程數(shù)據(jù)。
然而,這份指控并未收獲行業(yè)一致支持。 xAI 創(chuàng)始人埃隆·馬斯克第一時間在 X 平臺嘲諷:“他們怎么敢偷 Anthropic 從人類程序員那里偷來的東西?”
這一反擊精準(zhǔn)戳中了 Anthropic 軟肋。就在 2025 年 9 月,該公司剛剛以 15 億美元天價和解了一起盜版書籍訴訟,被發(fā)現(xiàn)從盜版網(wǎng)站下載了超過 700 萬本受版權(quán)保護(hù)的書籍用于訓(xùn)練 Claude 。
硅谷著名評論人格爾蓋伊·奧羅斯的質(zhì)問直擊要害:“ Anthropic 無權(quán)‘兩頭占便宜’, Claude 的成功本身就建立在未經(jīng)許可使用受版權(quán)保護(hù)內(nèi)容的基礎(chǔ)上,如今卻對同類技術(shù)的使用大加指責(zé),難以自圓其說。”
當(dāng)行業(yè)慣例遭遇政治敘事,一場關(guān)于“偷”與“被偷”的輿論開始了,最后誰會破防?
一、蒸餾指控事件
要理解這場爭議的本質(zhì),首先需要厘清“蒸餾”究竟是什么。
知識蒸餾( Knowledge Distillation )是機器學(xué)習(xí)領(lǐng)域一項成熟且普遍的技術(shù),核心思路是用一個強大的“教師模型”的輸出來訓(xùn)練一個較小的“學(xué)生模型”,使其在參數(shù)規(guī)模更小、運行成本更低的情況下復(fù)現(xiàn)教師模型的核心能力。
Anthropic 自己在博文中也承認(rèn):“前沿 AI 實驗室會定期蒸餾自己的模型,為客戶提供更小、更便宜的版本。”
問題的關(guān)鍵不在于技術(shù)本身,而在于“誰蒸餾誰”,以及“以何種方式蒸餾”。
Anthropic 的指控核心在于,三家公司通過“虛假賬戶+代理服務(wù)”繞過了地區(qū)訪問限制,以欺詐手段大規(guī)模提取 Claude 的輸出用于訓(xùn)練競品。
從商業(yè)合同的角度看,這確實違反了 Anthropic 的服務(wù)條款——幾乎所有 AI 公司的 ToS 中都明確禁止使用其服務(wù)來訓(xùn)練或開發(fā)“與它競爭”的 AI 模型。
但從法律層面看,事情遠(yuǎn)非“偷竊”二字可以概括。
美國版權(quán)局 2025 年 1 月已確認(rèn),版權(quán)保護(hù)要求人類作者身份,“僅提供提示詞不使輸出受版權(quán)保護(hù)”。
這意味著, AI 模型的輸出本身在美國法律框架下并不享有版權(quán)。即便蒸餾行為被坐實,它在法律性質(zhì)上更接近合同違約,而非知識產(chǎn)權(quán)盜竊。
行業(yè)內(nèi)部也存在認(rèn)知分裂。多位開發(fā)者指出,用競爭對手的 API 輸出來訓(xùn)練自己的模型,在行業(yè)內(nèi)接近于“公開的秘密”。這并非 Anthropic 獨有的遭遇,而是整個行業(yè)面臨的灰色地帶。
Anthropic 在博文中完成了一次精妙的敘事偷換:它將本質(zhì)上的合同違約行為,重新包裝成了“蒸餾攻擊”,并將一個中性的技術(shù)術(shù)語與“國家安全”“生物武器”“出口管制”等關(guān)鍵詞綁定。
有觀察者一針見血地指出:“ Anthropic 正在從真實的技術(shù)事件中,蒸餾出一套服務(wù)于自身政治生存的敘事。”
更值得玩味的是事件的時間背景。 Anthropic 發(fā)布指控時,正處于與五角大樓的合作談判僵局中,面臨失去 2 億美元國防合同的風(fēng)險,而競爭對手 xAI 剛與五角大樓簽署合作協(xié)議。將中國企業(yè)列為指控對象,實則是 Anthropic 向美國政府表忠的戰(zhàn)略表態(tài),通過渲染 "中國 AI 威脅論" 強化自身國家安全價值。
對于 DeepSeek 而言,這并非首次遭遇此類指控,此前 OpenAI 就曾向美國國會提交備忘錄,指責(zé)其通過混淆手段蒸餾 GPT 系列模型,但 DeepSeek 始終強調(diào)自身優(yōu)勢源于架構(gòu)創(chuàng)新而非模仿輸出。
截至目前,DeepSeek 等三家企業(yè)均未對指控作出官方回應(yīng),這場爭議已從技術(shù)合規(guī)問題,演變?yōu)槿?AI 行業(yè)話語權(quán)爭奪的縮影。
二、兩副面孔:被神話,被質(zhì)疑
在這場爭議中, DeepSeek 被 Anthropic 推至 C 位。
但細(xì)看數(shù)據(jù)會發(fā)現(xiàn)一個有趣的細(xì)節(jié):三家公司中, MiniMax 的交互次數(shù)超過 1300 萬,月之暗面超過 340 萬,而 DeepSeek 只有約 15 萬,占比不到 1% 。
Anthropic 之所以把 DeepSeek 放在標(biāo)題第一位,很大程度上是因為這個名字在華盛頓的“知名度”。自 2025 年初以來,它已成為美國 AI 政策辯論中最具標(biāo)志性的中國符號。
這種知名度,源于 DeepSeek 身上揮之不去的兩面性。
一面是“技術(shù)突圍”的敘事。
在高端芯片出口受限、算力資源緊張的背景下, DeepSeek 確實做出了一些讓人印象深刻的成果。
2025 年初發(fā)布的 R1 模型,訓(xùn)練成本據(jù)稱只有約 560 萬美元,卻在多項推理測試中比肩 OpenAI 的 o1 。這種“少花錢辦大事”的能力,讓它在全球開發(fā)者社區(qū)贏得了不少口碑。
一位國內(nèi)智能體開發(fā)者這樣評價:“ DeepSeek 對社區(qū)最大的貢獻(xiàn),就是把 Token 的成本打下來,讓更多開發(fā)者能接觸 AI 開發(fā)。如果都學(xué)海外巨頭燒算力,這種低成本時代將一去不復(fù)返。”
Hugging Face 在“ DeepSeek 時刻一周年”的文章中也承認(rèn), R1 降低了三重壁壘:技術(shù)壁壘(將高級推理能力轉(zhuǎn)化為可復(fù)用的工程資產(chǎn))、采用壁壘(開源許可讓部署變得簡單)、心理壁壘(證明中國團(tuán)隊也能定義技術(shù)范式)。
另一面是“路徑依賴”的質(zhì)疑。
圍繞 DeepSeek 的爭議從未停歇。就在本月初, OpenAI 剛向美國國會提交備忘錄,指控 DeepSeek 繞過安全防護(hù)對 GPT 系列實施蒸餾。
盡管 DeepSeek 方面反問“如果真是偷的,上哪兒偷去?”,并強調(diào)自身優(yōu)勢源于 GRPO 強化學(xué)習(xí)和 MoE 稀疏專家系統(tǒng)等架構(gòu)創(chuàng)新,但這種自辯在輿論場上的說服力有限。
原因很簡單: DeepSeek 沒有公開其訓(xùn)練數(shù)據(jù)集。
在開源社區(qū),它雖然開放了模型權(quán)重和各種工具庫,但最關(guān)鍵的數(shù)據(jù)來源始終處于黑箱狀態(tài)。 Artificial Analysis 的數(shù)據(jù)顯示,目前全球開放程度排名前三的模型分別來自英偉達(dá)、 Allen Institute 和阿聯(lián)酋的 MBZUAI , DeepSeek 并未上榜。
這種“半開放”狀態(tài),讓它始終無法擺脫外界的質(zhì)疑:如果真的是靠架構(gòu)創(chuàng)新做到的,為什么不公開數(shù)據(jù)自證清白?
微妙的一點還在于, DeepSeek 的“低成本神話”本身也在被重新審視。
雖然 R1 的訓(xùn)練成本號稱 560 萬美元,但這只是單次訓(xùn)練的費用。背后的研發(fā)投入、試錯成本、算力采購,都由其母公司幻方量化承擔(dān)——而幻方是國內(nèi)頂尖的量化基金, 2025 年以 53% 的回報率賺了超 7 億美元利潤。
換句話說, DeepSeek 的“低成本”,是建立在母公司“高投入”基礎(chǔ)上的。如果沒有這座“印鈔機”持續(xù)輸血,所謂的“性價比優(yōu)勢”還能維持多久?
三、效率革命與規(guī)模信仰的碰撞
如果將 DeepSeek 放在更廣闊的競爭格局中觀察,它的特殊性會變得更加清晰。
過去一年,中國 AI 頭部企業(yè)逐漸走出了差異化的路線。智譜選擇的是“智能體工程化”方向,更關(guān)注模型在實際任務(wù)中的可靠性和落地能力;月之暗面則走“ C 端投流”路線,用重金換用戶心智; MiniMax 押注“輕量級效率”,用小參數(shù)模型切入編程賽道。
這三家雖然策略各異,但方向都很明確:盡快找到商業(yè)化的切口,在應(yīng)用層建立壁壘。
相比之下, DeepSeek 的定位最為特殊。它既不做投流搶 C 端——創(chuàng)始人梁文鋒曾表示, C 端應(yīng)用更像是“技術(shù)展示廳”和“數(shù)據(jù)采集器”;也不做垂直場景深耕——團(tuán)隊始終將重心放在底層模型的迭代上。
DeepSeek 選擇把自己定位為“開源基建的提供者”。根據(jù) OpenRouter 統(tǒng)計, DeepSeek-V3 和 R1 的 Token 吞吐量一度占所有開源模型的一半以上。當(dāng)全球開發(fā)者在做蒸餾、微調(diào)、魔改時,都將 DeepSeek 作為第一梯隊選擇。
這種開發(fā)者心智的占領(lǐng),形成了隱性的技術(shù)定價權(quán)。
但這種“基建”定位,也意味著它離錢最遠(yuǎn)。當(dāng)同行們已經(jīng)開始通過 API 服務(wù)變現(xiàn)、探索付費訂閱時, DeepSeek 至今沒有清晰的商業(yè)模式。而在算力資源普遍緊張的行業(yè)背景下,這種狀態(tài)能持續(xù)多久,是一個需要回答的問題。
將視野拉至全球, DeepSeek 代表的路線與西方巨頭形成鮮明對照。
OpenAI 、 Google 、 Anthropic 信奉的是“規(guī)模信仰”: GPT-5.2 的訓(xùn)練成本約 5 億美元, OpenAI 未來數(shù)年的 AI 基礎(chǔ)設(shè)施支出預(yù)計超過 1.4 萬億美元。
它們相信,更大的模型、更多的數(shù)據(jù)、更長的訓(xùn)練時間,最終會帶來質(zhì)的飛躍。這是一種“力大磚飛”的邏輯,只要算力堆得足夠多,總能砸出突破。
DeepSeek 代表的則是“效率革命”:用算法創(chuàng)新對沖算力封鎖,用系統(tǒng)優(yōu)化替代硬件堆砌。
即將發(fā)布的V4據(jù)稱在編程能力上可以比肩 Claude ,而成本只有后者的幾十分之一。摩根士丹利的報告中有句話被反復(fù)引用:“ DeepSeek 正在證明, AI 能力的下一次飛躍可能不是來自更多的 GPU ,而是來自學(xué)會如何在約束條件下思考。”
這種路徑讓 DeepSeek 在全球開發(fā)者社區(qū)贏得了不少擁躉,英偉達(dá) CEO 黃仁勛也評價其為“讓整個世界驚訝的開源模型代表”。
顯而易見的是, DeepSeek 的“效率優(yōu)先”存在固有局限。
在多模態(tài)領(lǐng)域,它的布局明顯滯后——當(dāng)智譜、阿里、騰訊紛紛發(fā)力視覺語言聯(lián)合理解,當(dāng)視頻生成、語音合成賽道爭奪“下一個 DeepSeek 時刻”, DeepSeek 仍將重心聚焦在純文本和代碼能力上。
這種專注或許是資源有限的主動取舍,但也可能使其錯失下一波技術(shù)紅利。
更值得警惕的是, DeepSeek 的“無商業(yè)模式”本身就是一把雙刃劍。
一方面,它讓團(tuán)隊可以不被資本裹挾、專注于技術(shù)理想;另一方面,沒有自我造血能力意味著持續(xù)的研發(fā)投入必須依賴母公司幻方量化的輸血。
2025 年,幻方以 53% 的回報率賺了超過 7 億美元利潤,這為 DeepSeek 提供了充足的彈藥??梢坏┗梅綐I(yè)績波動,或外部環(huán)境變化,這種“自由人”狀態(tài)將面臨嚴(yán)峻考驗。
在 DeepSeek 走紅一周年之際,這些問題或許比“蒸餾是否算偷”更值得追問。
四、結(jié)語:蒸餾之外
回看 Anthropic 的蒸餾指控,一個悖論浮出水面: DeepSeek 被指控的“罪”,恰恰是西方巨頭最擅長的“術(shù)”。
當(dāng) Anthropic 一邊用盜版書籍蒸餾 Claude ,一邊指責(zé)他人蒸餾自己的輸出;當(dāng) OpenAI 一邊靠每月 20 美元訂閱費構(gòu)筑商業(yè)模式,一邊警惕開源模型侵蝕市場份額。
所謂的“偷”,更像是一場精心包裝的商業(yè)競爭敘事。
剝離輿論迷霧, DeepSeek 的真正啟示在于:在算力封鎖的硬約束下,中國 AI 走出了一條獨特的突圍路徑。
在這個由 DeepSeek 定義下限、由巨頭定義上限的折疊空間里,真正的戰(zhàn)爭才剛剛開始。
比蒸餾爭議更重要的,或許是找到一條既能在技術(shù)上“并跑”、又能在規(guī)則上“對話”的可持續(xù)發(fā)展之路。
DeepSeek 等中國企業(yè)值得被贊賞,也值得被審視;它們正在改寫規(guī)則,也必須面對規(guī)則的拷問。







快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論