免费看在线a黄视频|99爽99操日韩毛片儿|91停婷在线无码观看|日韩三级片小视频|一级黄片免费播放|欧美成人视频网站导航|亚洲日韩欧美七区|国产视频在线观看91|人成视频免费在线播放|国产精品成人在线免费观看

DeepSeek 的“罪與罰”

AGI
中國AI的突圍與困境。

文 | 智械島,作者 | 霍如筠

2 月 23 日,美國 AI 巨頭 Anthropic 在官網(wǎng)投下一枚重磅炸彈。

一份措辭嚴(yán)厲的調(diào)查報告,將矛頭直指中國三家頭部AI公司——深度求索( DeepSeek )、月之暗面( Moonshot )與稀宇科技( MiniMax ),指控其對旗艦?zāi)P?Claude 發(fā)動了“工業(yè)化規(guī)模”的模型蒸餾攻擊。

這并非中國 AI 企業(yè)首次因蒸餾陷入爭議。就在兩周前, OpenAI 剛剛向美國國會提交內(nèi)部備忘錄,指控 DeepSeek 繞過安全防護(hù)對 GPT 系列實施蒸餾。

而這一次, Anthropic 拋出了更詳盡的數(shù)據(jù):約 2.4 萬個虛假賬戶、超過 1600 萬次交互、一套名為“九頭蛇集群”的分布式架構(gòu),將惡意流量偽裝成正常請求,系統(tǒng)性地提取Claude的推理能力、工具調(diào)用與編程數(shù)據(jù)。

然而,這份指控并未收獲行業(yè)一致支持。 xAI 創(chuàng)始人埃隆·馬斯克第一時間在 X 平臺嘲諷:“他們怎么敢偷 Anthropic 從人類程序員那里偷來的東西?”

這一反擊精準(zhǔn)戳中了 Anthropic 軟肋。就在 2025 年 9 月,該公司剛剛以 15 億美元天價和解了一起盜版書籍訴訟,被發(fā)現(xiàn)從盜版網(wǎng)站下載了超過 700 萬本受版權(quán)保護(hù)的書籍用于訓(xùn)練 Claude 。

硅谷著名評論人格爾蓋伊·奧羅斯的質(zhì)問直擊要害:“ Anthropic 無權(quán)‘兩頭占便宜’, Claude 的成功本身就建立在未經(jīng)許可使用受版權(quán)保護(hù)內(nèi)容的基礎(chǔ)上,如今卻對同類技術(shù)的使用大加指責(zé),難以自圓其說。”

當(dāng)行業(yè)慣例遭遇政治敘事,一場關(guān)于“偷”與“被偷”的輿論開始了,最后誰會破防?

一、蒸餾指控事件

要理解這場爭議的本質(zhì),首先需要厘清“蒸餾”究竟是什么。

知識蒸餾( Knowledge Distillation )是機器學(xué)習(xí)領(lǐng)域一項成熟且普遍的技術(shù),核心思路是用一個強大的“教師模型”的輸出來訓(xùn)練一個較小的“學(xué)生模型”,使其在參數(shù)規(guī)模更小、運行成本更低的情況下復(fù)現(xiàn)教師模型的核心能力。

Anthropic 自己在博文中也承認(rèn):“前沿 AI 實驗室會定期蒸餾自己的模型,為客戶提供更小、更便宜的版本。”

問題的關(guān)鍵不在于技術(shù)本身,而在于“誰蒸餾誰”,以及“以何種方式蒸餾”。

Anthropic 的指控核心在于,三家公司通過“虛假賬戶+代理服務(wù)”繞過了地區(qū)訪問限制,以欺詐手段大規(guī)模提取 Claude 的輸出用于訓(xùn)練競品。

從商業(yè)合同的角度看,這確實違反了 Anthropic 的服務(wù)條款——幾乎所有 AI 公司的 ToS 中都明確禁止使用其服務(wù)來訓(xùn)練或開發(fā)“與它競爭”的 AI 模型。

但從法律層面看,事情遠(yuǎn)非“偷竊”二字可以概括。

美國版權(quán)局 2025 年 1 月已確認(rèn),版權(quán)保護(hù)要求人類作者身份,“僅提供提示詞不使輸出受版權(quán)保護(hù)”。

這意味著, AI 模型的輸出本身在美國法律框架下并不享有版權(quán)。即便蒸餾行為被坐實,它在法律性質(zhì)上更接近合同違約,而非知識產(chǎn)權(quán)盜竊。

行業(yè)內(nèi)部也存在認(rèn)知分裂。多位開發(fā)者指出,用競爭對手的 API 輸出來訓(xùn)練自己的模型,在行業(yè)內(nèi)接近于“公開的秘密”。這并非 Anthropic 獨有的遭遇,而是整個行業(yè)面臨的灰色地帶。

Anthropic 在博文中完成了一次精妙的敘事偷換:它將本質(zhì)上的合同違約行為,重新包裝成了“蒸餾攻擊”,并將一個中性的技術(shù)術(shù)語與“國家安全”“生物武器”“出口管制”等關(guān)鍵詞綁定。

有觀察者一針見血地指出:“ Anthropic 正在從真實的技術(shù)事件中,蒸餾出一套服務(wù)于自身政治生存的敘事。”

更值得玩味的是事件的時間背景。 Anthropic 發(fā)布指控時,正處于與五角大樓的合作談判僵局中,面臨失去 2 億美元國防合同的風(fēng)險,而競爭對手 xAI 剛與五角大樓簽署合作協(xié)議。將中國企業(yè)列為指控對象,實則是 Anthropic 向美國政府表忠的戰(zhàn)略表態(tài),通過渲染 "中國 AI 威脅論" 強化自身國家安全價值。

對于 DeepSeek 而言,這并非首次遭遇此類指控,此前 OpenAI 就曾向美國國會提交備忘錄,指責(zé)其通過混淆手段蒸餾 GPT 系列模型,但 DeepSeek 始終強調(diào)自身優(yōu)勢源于架構(gòu)創(chuàng)新而非模仿輸出。

截至目前,DeepSeek 等三家企業(yè)均未對指控作出官方回應(yīng),這場爭議已從技術(shù)合規(guī)問題,演變?yōu)槿?AI 行業(yè)話語權(quán)爭奪的縮影。

二、兩副面孔:被神話,被質(zhì)疑

在這場爭議中, DeepSeek 被 Anthropic 推至 C 位。

但細(xì)看數(shù)據(jù)會發(fā)現(xiàn)一個有趣的細(xì)節(jié):三家公司中, MiniMax 的交互次數(shù)超過 1300 萬,月之暗面超過 340 萬,而 DeepSeek 只有約 15 萬,占比不到 1% 。

Anthropic 之所以把 DeepSeek 放在標(biāo)題第一位,很大程度上是因為這個名字在華盛頓的“知名度”。自 2025 年初以來,它已成為美國 AI 政策辯論中最具標(biāo)志性的中國符號。

這種知名度,源于 DeepSeek 身上揮之不去的兩面性。

一面是“技術(shù)突圍”的敘事。

在高端芯片出口受限、算力資源緊張的背景下, DeepSeek 確實做出了一些讓人印象深刻的成果。

2025 年初發(fā)布的 R1 模型,訓(xùn)練成本據(jù)稱只有約 560 萬美元,卻在多項推理測試中比肩 OpenAI 的 o1 。這種“少花錢辦大事”的能力,讓它在全球開發(fā)者社區(qū)贏得了不少口碑。

一位國內(nèi)智能體開發(fā)者這樣評價:“ DeepSeek 對社區(qū)最大的貢獻(xiàn),就是把 Token 的成本打下來,讓更多開發(fā)者能接觸 AI 開發(fā)。如果都學(xué)海外巨頭燒算力,這種低成本時代將一去不復(fù)返。”

Hugging Face 在“ DeepSeek 時刻一周年”的文章中也承認(rèn), R1 降低了三重壁壘:技術(shù)壁壘(將高級推理能力轉(zhuǎn)化為可復(fù)用的工程資產(chǎn))、采用壁壘(開源許可讓部署變得簡單)、心理壁壘(證明中國團(tuán)隊也能定義技術(shù)范式)。

另一面是“路徑依賴”的質(zhì)疑。

圍繞 DeepSeek 的爭議從未停歇。就在本月初, OpenAI 剛向美國國會提交備忘錄,指控 DeepSeek 繞過安全防護(hù)對 GPT 系列實施蒸餾。

盡管 DeepSeek 方面反問“如果真是偷的,上哪兒偷去?”,并強調(diào)自身優(yōu)勢源于 GRPO 強化學(xué)習(xí)和 MoE 稀疏專家系統(tǒng)等架構(gòu)創(chuàng)新,但這種自辯在輿論場上的說服力有限。

原因很簡單: DeepSeek 沒有公開其訓(xùn)練數(shù)據(jù)集。

在開源社區(qū),它雖然開放了模型權(quán)重和各種工具庫,但最關(guān)鍵的數(shù)據(jù)來源始終處于黑箱狀態(tài)。 Artificial Analysis 的數(shù)據(jù)顯示,目前全球開放程度排名前三的模型分別來自英偉達(dá)、 Allen Institute 和阿聯(lián)酋的 MBZUAI , DeepSeek 并未上榜。

這種“半開放”狀態(tài),讓它始終無法擺脫外界的質(zhì)疑:如果真的是靠架構(gòu)創(chuàng)新做到的,為什么不公開數(shù)據(jù)自證清白?

微妙的一點還在于, DeepSeek 的“低成本神話”本身也在被重新審視。

雖然 R1 的訓(xùn)練成本號稱 560 萬美元,但這只是單次訓(xùn)練的費用。背后的研發(fā)投入、試錯成本、算力采購,都由其母公司幻方量化承擔(dān)——而幻方是國內(nèi)頂尖的量化基金, 2025 年以 53% 的回報率賺了超 7 億美元利潤。

換句話說, DeepSeek 的“低成本”,是建立在母公司“高投入”基礎(chǔ)上的。如果沒有這座“印鈔機”持續(xù)輸血,所謂的“性價比優(yōu)勢”還能維持多久?

三、效率革命與規(guī)模信仰的碰撞

如果將 DeepSeek 放在更廣闊的競爭格局中觀察,它的特殊性會變得更加清晰。

過去一年,中國 AI 頭部企業(yè)逐漸走出了差異化的路線。智譜選擇的是“智能體工程化”方向,更關(guān)注模型在實際任務(wù)中的可靠性和落地能力;月之暗面則走“ C 端投流”路線,用重金換用戶心智; MiniMax 押注“輕量級效率”,用小參數(shù)模型切入編程賽道。

這三家雖然策略各異,但方向都很明確:盡快找到商業(yè)化的切口,在應(yīng)用層建立壁壘。

相比之下, DeepSeek 的定位最為特殊。它既不做投流搶 C 端——創(chuàng)始人梁文鋒曾表示, C 端應(yīng)用更像是“技術(shù)展示廳”和“數(shù)據(jù)采集器”;也不做垂直場景深耕——團(tuán)隊始終將重心放在底層模型的迭代上。

DeepSeek 選擇把自己定位為“開源基建的提供者”。根據(jù) OpenRouter 統(tǒng)計, DeepSeek-V3 和 R1 的 Token 吞吐量一度占所有開源模型的一半以上。當(dāng)全球開發(fā)者在做蒸餾、微調(diào)、魔改時,都將 DeepSeek 作為第一梯隊選擇。

這種開發(fā)者心智的占領(lǐng),形成了隱性的技術(shù)定價權(quán)。

但這種“基建”定位,也意味著它離錢最遠(yuǎn)。當(dāng)同行們已經(jīng)開始通過 API 服務(wù)變現(xiàn)、探索付費訂閱時, DeepSeek 至今沒有清晰的商業(yè)模式。而在算力資源普遍緊張的行業(yè)背景下,這種狀態(tài)能持續(xù)多久,是一個需要回答的問題。

將視野拉至全球, DeepSeek 代表的路線與西方巨頭形成鮮明對照。

OpenAI 、 Google 、 Anthropic 信奉的是“規(guī)模信仰”: GPT-5.2 的訓(xùn)練成本約 5 億美元, OpenAI 未來數(shù)年的 AI 基礎(chǔ)設(shè)施支出預(yù)計超過 1.4 萬億美元。

它們相信,更大的模型、更多的數(shù)據(jù)、更長的訓(xùn)練時間,最終會帶來質(zhì)的飛躍。這是一種“力大磚飛”的邏輯,只要算力堆得足夠多,總能砸出突破。

DeepSeek 代表的則是“效率革命”:用算法創(chuàng)新對沖算力封鎖,用系統(tǒng)優(yōu)化替代硬件堆砌。

即將發(fā)布的V4據(jù)稱在編程能力上可以比肩 Claude ,而成本只有后者的幾十分之一。摩根士丹利的報告中有句話被反復(fù)引用:“ DeepSeek 正在證明, AI 能力的下一次飛躍可能不是來自更多的 GPU ,而是來自學(xué)會如何在約束條件下思考。”

這種路徑讓 DeepSeek 在全球開發(fā)者社區(qū)贏得了不少擁躉,英偉達(dá) CEO 黃仁勛也評價其為“讓整個世界驚訝的開源模型代表”。

顯而易見的是, DeepSeek 的“效率優(yōu)先”存在固有局限。

在多模態(tài)領(lǐng)域,它的布局明顯滯后——當(dāng)智譜、阿里、騰訊紛紛發(fā)力視覺語言聯(lián)合理解,當(dāng)視頻生成、語音合成賽道爭奪“下一個 DeepSeek 時刻”, DeepSeek 仍將重心聚焦在純文本和代碼能力上。

這種專注或許是資源有限的主動取舍,但也可能使其錯失下一波技術(shù)紅利。

更值得警惕的是, DeepSeek 的“無商業(yè)模式”本身就是一把雙刃劍。

一方面,它讓團(tuán)隊可以不被資本裹挾、專注于技術(shù)理想;另一方面,沒有自我造血能力意味著持續(xù)的研發(fā)投入必須依賴母公司幻方量化的輸血。

2025 年,幻方以 53% 的回報率賺了超過 7 億美元利潤,這為 DeepSeek 提供了充足的彈藥??梢坏┗梅綐I(yè)績波動,或外部環(huán)境變化,這種“自由人”狀態(tài)將面臨嚴(yán)峻考驗。

在 DeepSeek 走紅一周年之際,這些問題或許比“蒸餾是否算偷”更值得追問。

四、結(jié)語:蒸餾之外

回看 Anthropic 的蒸餾指控,一個悖論浮出水面: DeepSeek 被指控的“罪”,恰恰是西方巨頭最擅長的“術(shù)”。

當(dāng) Anthropic 一邊用盜版書籍蒸餾 Claude ,一邊指責(zé)他人蒸餾自己的輸出;當(dāng) OpenAI 一邊靠每月 20 美元訂閱費構(gòu)筑商業(yè)模式,一邊警惕開源模型侵蝕市場份額。

所謂的“偷”,更像是一場精心包裝的商業(yè)競爭敘事。

剝離輿論迷霧, DeepSeek 的真正啟示在于:在算力封鎖的硬約束下,中國 AI 走出了一條獨特的突圍路徑。

在這個由 DeepSeek 定義下限、由巨頭定義上限的折疊空間里,真正的戰(zhàn)爭才剛剛開始。

比蒸餾爭議更重要的,或許是找到一條既能在技術(shù)上“并跑”、又能在規(guī)則上“對話”的可持續(xù)發(fā)展之路。

DeepSeek 等中國企業(yè)值得被贊賞,也值得被審視;它們正在改寫規(guī)則,也必須面對規(guī)則的拷問。

本文系作者 智械島 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

09:08

券商調(diào)研名單出爐,風(fēng)電、光伏、存儲芯片熱度高

09:06

激光和納米結(jié)構(gòu)在室溫下“孕育”出超固體

09:04

富時中國A50指數(shù)期貨盤初漲0.15%

09:03

國內(nèi)商品期貨開盤多數(shù)下跌,瓶片跌超7%

09:02

3月LPR報價出爐:5年期和1年期利率均維持不變

09:01

美國白宮據(jù)報將在數(shù)日內(nèi)發(fā)布人工智能監(jiān)管框架

08:59

國民技術(shù):確定H股發(fā)行的最終價格為每股10.8港元,預(yù)計3月23日上市

08:52

第二艘國產(chǎn)大型郵輪“愛達(dá)·花城號”今日將出塢

08:50

編造傳播涉科大訊飛網(wǎng)絡(luò)謠言,沙某被行拘

08:49

深港通下的港股通標(biāo)的證券名單調(diào)整,調(diào)入廣合科技

08:48

兩市融資余額減少42.88億元

08:45

3月20日A股盤前要聞

08:33

美聯(lián)儲4月維持利率不變的概率為92.8%,加息概率為7.2%

08:32

豬價下跌+業(yè)績承壓,生豬養(yǎng)殖業(yè)寒意加深

08:31

OpenAI將發(fā)布“超級應(yīng)用”:整合ChatGPT等三大平臺、開發(fā)智能體

08:25

特朗普會晤高市早苗,要求日本就伊朗戰(zhàn)事出力

08:24

英偉達(dá)CEO黃仁勛呼吁科技業(yè)領(lǐng)袖避免散布AI恐慌情緒,稱到2030年Anthropic收入或超1萬億美元

08:22

聯(lián)合利華據(jù)悉正與美國調(diào)味料生產(chǎn)商味好美商談合并食品業(yè)務(wù)

08:20

中國首個“路空一體”國家級檢測基地正式投用

08:18

同仁堂醫(yī)養(yǎng)尋求在香港IPO中籌資至多8.977億港元

掃描下載App