然而就是這樣一個日本國民級的AI模型,不到12小時,爆出驚天大雷。

當天下午,有人打開了Rakuten AI 3.0在Hugging Face上的config.json。

第一行配置,architectures(架構)字段,赫然寫著一個在中國家喻戶曉的模型:DeepseekV3ForCausalLM.

而model_type字段為deepseek_v3。

也就是說,這個日本“國內(nèi)最大規(guī)模的高性能AI模型”,正是DeepSeek V3。

01

事情的發(fā)現(xiàn)過程沒有任何技術門檻。

Rakuten AI 3.0發(fā)布后,模型權重按慣例上傳到了Hugging Face的楽天官方倉庫。

任何人點進去,切到“Files and versions”標簽頁,打開config.json就能看到。

這個config.json是每個大模型都有的配置文件,記錄著模型的架構信息。

architectures字段寫的“DeepseekV3ForCausalLM”,意思是這個模型使用的是DeepSeek V3的因果語言模型架構。

不是“參考”,不是“借鑒”,是直接聲明了模型類別。

往下看,hidden_size是7168,intermediate_size是18432,num_hidden_layers是61,n_routed_experts是256,vocab_size是129280。

這些數(shù)字和DeepSeek V3的原版配置一模一樣。

說實話,真的是演都不演了。而且現(xiàn)在DeepSeek已經(jīng)更新到V3.2了,V3幻覺太高,其實不怎么好用的。

難怪楽天的Rakuten AI 3.0號稱“參數(shù)量約7000億”,因為DeepSeek V3的參數(shù)量就是6810億。

Hugging Face的模型頁面上,標簽欄里甚至直接掛著“deepseek_v3”的標簽。這不是網(wǎng)友后加的,是模型上傳時系統(tǒng)根據(jù)config自動生成的。

楽天自己的說法是基于開源社區(qū)最優(yōu)秀的模型開發(fā)。

這句話寫在官方新聞稿里,還寫在Hugging Face的模型卡片里,也寫在楽天集團的PR Times新聞通稿里。從技術角度講,這句話沒有說謊。

改了個名字確實也算是開發(fā)。

DeepSeek V3是開源模型,許可證也允許這么做。楽天在此基礎上用自己的日語雙語數(shù)據(jù)做了微調(diào)和優(yōu)化,這個流程在業(yè)界很常見。

但問題在于,楽天在所有對外宣傳中,從未提及“DeepSeek”這三個字。

新聞稿里沒有,模型卡片的描述里沒有,接受媒體采訪時也沒有。

所以當有人把config.json的截圖貼到 X(原Twitter)上時,評論區(qū)的反應可想而知。

02

最先傳播開來的是一張截圖:Hugging Face上Rakuten AI 3.0的config.json 頁面,architectures字段里的“DeepseekV3ForCausalLM”被藍框高亮圈出。

截圖下面,有人只寫了兩個詞加一個問號:“deepseek V3?”

這條帖子被迅速轉(zhuǎn)發(fā)到Impress Watch的報道推文下面。

Impress Watch是最早報道 Rakuten AI 3.0 的日本科技媒體之一,它的推文本來是一條普通的新聞轉(zhuǎn)發(fā),評論區(qū)卻變成了另一番景象。

一個叫Ryu的用戶寫道:“日本終于到了用中國AI冒充日本產(chǎn)AI的時代了嗎?”

底下的日語評論普遍都是罵街的,中文評論都是看樂子的,在這里我也就不放出來了,大家自行想象一下那個場景就好了。

誠然,嚴格來說,楽天沒有違反任何規(guī)則。DeepSeek V3的開源許可允許商業(yè)使用和二次開發(fā),在開源模型基礎上做微調(diào)也是行業(yè)通行做法。

可是這事并沒有那么體面。

2025年DeepSeek爆火的時候,日本媒體給它起了個名字,叫“AI界的黑船事件”。

黑船是 1853 年美國海軍準將佩里率艦隊強行叩開日本國門的歷史事件,在日語里專門用來形容外來力量對日本造成的巨大沖擊。

把一個中國的AI產(chǎn)品比作黑船,這個措辭本身就說明了很多。

日本政府的反應很快。2025年2月初,日本數(shù)字大臣平將明公開表態(tài),稱在安全疑慮消除之前,日本公務員應避免使用DeepSeek,或者在使用時格外謹慎。

他特別提到了個人信息保護的問題。隨后,日本政府向各省廳發(fā)出警告,要求不要在政府設備上使用DeepSeek。

企業(yè)層面的動作更直接。

豐田汽車明確禁止員工使用DeepSeek,官方理由是“出于信息安全的考慮”。三菱重工同樣實施禁令,即便員工提交內(nèi)部申請也不會被批準。

軟銀則限制了公司內(nèi)部對 DeepSeek 的訪問,并禁止員工在工作設備上下載和使用。

可是現(xiàn)在……你怎么讓我忍得住不笑?。?/p>

本文系作者 字母AI 授權鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學習,不構成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容
  • 作者水平很低

    回復 3月18日 · via harmony
  • 從黑船事件到換皮使用日本 AI 產(chǎn)業(yè)的尷尬全寫在這了

    回復 3月18日 · via pc
  • 模型標簽自動標了 deepseek_v3 樂天這波演都不演了

    回復 3月18日 · via iphone
  • 日本吹了半天的自研高性能 AI 原來只是中國模型的中文版

    回復 3月18日 · via pc
  • 所有關鍵參數(shù)和 DeepSeek V3 一模一樣樂天連改都懶得改了

    回復 3月18日 · via android
  • 開源許可允許二次開發(fā)但光明正大換皮屬實吃相太難看

    回復 3月18日 · via android
  • 豐田三菱軟銀全禁了 DeepSeek 樂天卻把它當自家王牌發(fā)布

    回復 3月18日 · via iphone
  • 更尬的是 DeepSeek 都更到 V3.2 了樂天還拿有幻覺的 V3 湊數(shù)

    回復 3月18日 · via android
  • 拿日本經(jīng)產(chǎn)省補助搞換皮 AI 樂天這波操作屬實有點難看

    回復 3月18日 · via h5
  • 樂天只說基于開源模型開發(fā)全程不提 DeepSeek 藏得夠深的

    回復 3月18日 · via iphone
更多評論

快報

更多

10:47

美登月版圖巨變,NASA擬讓SpaceX替代波音核心職能

10:44

體育概念震蕩拉升,共創(chuàng)草坪漲停

10:43

小米汽車:新一代SU7“準現(xiàn)車”鎖單后預計1—5周即可交付

10:42

壓力大會加重皮炎,中國科學家首次發(fā)現(xiàn)科學證據(jù)

10:41

高盛擬4月啟動績效裁員,規(guī)?;驗?%-3%

10:38

今日MMLC電池級碳酸鋰(早盤)價格較昨日上漲50元/噸

10:36

世貿(mào)組織:中東沖突或拖累全球貿(mào)易增長前景

10:35

消息稱英特爾本月底CPU漲價10%

10:34

籌資1000億美元,亞馬遜貝索斯擬設立基金收購制造企業(yè)并引入AI

10:29

工信部部長李樂成調(diào)研信息技術創(chuàng)新應用和未來產(chǎn)業(yè)發(fā)展研究工作

10:28

滬深兩市成交額突破1萬億,較上一日此時放量超400億

10:27

美國批準部分俄羅斯原油的交付與銷售

10:24

預測市場Kalshi完成新一輪超10億美元融資,估值達220億美元

10:22

德國汽車半導體公司Elmos考慮出售,市值23億歐元

10:22

章源鎢業(yè)上調(diào)3月下半月長單采購報價

10:21

太空光伏概念震蕩走強,拉普拉斯?jié)q近10%

10:20

聯(lián)邦快遞第三財季業(yè)績和展望均超預期,盤后股價大漲逾9%

10:16

市場監(jiān)管總局:進一步完善經(jīng)營者集中委托審查制度

10:15

奇瑞2026款捷途X70超越版、山海L7超越版上市

10:14

穩(wěn)健資產(chǎn)受關注,資金開始涌入價值型ETF

21

掃描下載App