GTC 2026 即將開幕,黃仁勛準備掏出的不再是單純刷新參數(shù)的怪獸級 GPU,而是一張價值 200 億美元的明牌——一款基于 SRAM(靜態(tài)隨機存取存儲器)的專用推理芯片。

這標志著英偉達歷史上最大規(guī)模收購案(吞并 Groq 核心資產(chǎn))的底層技術(shù)正式落地。但這絕不是一次常規(guī)的產(chǎn)品迭代,黃仁勛正在親手打破自己維持了多年的神話:“一顆通用 GPU 可以包打天下”。

在筆者看來,這輪架構(gòu)調(diào)整的表象是硬件路線的演進,底層卻是英偉達面對科技巨頭“諸侯割據(jù)”與監(jiān)管高壓時,極其老辣的防御性進攻。

物理定律寫死的“算力階級分化”

外界有一種極其粗暴的誤讀,認為英偉達轉(zhuǎn)向 SRAM 是為了“拋棄 HBM”。這在半導(dǎo)體的物理規(guī)律上根本站不住腳。

標準的 SRAM 單元需要 6 個晶體管(6T)來存儲 1 個比特,而 HBM 依賴的 DRAM 只需要 1 個晶體管加 1 個電容(1T1C)。這種先天的物理結(jié)構(gòu)差異,導(dǎo)致 SRAM 的硅片面積是 DRAM 的 5 到 10 倍。這意味著 SRAM 速度極快,但極其昂貴且根本做不出大容量,它裝不下動輒數(shù)千億參數(shù)的大模型。

英偉達真正的算盤,是搞“算力的階級分化”。

過去,無論是煉大模型還是日常的 AI 問答,大家都在搶極其昂貴且缺貨的 HBM 和 GPU。但現(xiàn)在,AI 的重心已經(jīng)徹底滑向了“推理(Inference)”。思科等機構(gòu)的最新預(yù)測顯示,到 2027 年,高達 75% 的 AI 工作負載將全面轉(zhuǎn)向?qū)崟r推理。

面對這種不可逆的趨勢,英偉達給出了路線圖切分:

一邊是即將登場的下一代 Vera Rubin 架構(gòu),繼續(xù)把 GPU 和 HBM 的堆料推向極致,死死鎖住云廠商的“大模型訓(xùn)練”底座;

另一邊,就是這次基于 Groq 技術(shù)推出的 LPU(語言處理單元)。它用片上 SRAM 替代片外存儲,徹底干掉數(shù)據(jù)搬運的延遲,專門用來收割那些對實時性要求極高、單次請求成本極敏感的場景。

規(guī)避審查的殘酷清場:200億美元的“竊殼”游戲

為什么一向推崇通用計算的英偉達,會突然調(diào)轉(zhuǎn)車頭搞起專用推理架構(gòu)?

答案是被逼出來的。

就在近期,業(yè)界傳出 Meta 計劃在 2027 年將部分推理工作負載切給谷歌 TPU。當(dāng)大模型逐漸走向同質(zhì)化,推理成本的極致壓縮就成了生死線。如果英偉達繼續(xù)強迫所有客戶用“殺雞用牛刀”的 GPU 去做低延遲推理,大客戶遲早會跑向谷歌、AMD,甚至是以 Groq 為代表的初創(chuàng)公司。

為了掐滅這個苗頭,黃仁勛在 2025 年底砸出了 200 億美元。但最絕的不是金額,而是操盤手法

如果英偉達直接全盤收購 Groq,這筆交易必定會被美國 FTC 和歐盟的反壟斷監(jiān)管機構(gòu)以“壟斷 AI 算力”為由直接斃掉。因此,英偉達采取了極其狡猾的“資產(chǎn)收購+技術(shù)授權(quán)+核心團隊挖角(Acquihire)”模式。

他們花 200 億美元買斷了 Groq 的核心專利使用權(quán),并把創(chuàng)始人 Jonathan Ross 連同兩百多名核心工程師直接“收編”進英偉達。而 Groq 這家公司的空殼,在名義上依然作為獨立實體存在。

這是一種合法但極其殘酷的“掏空”式并購。黃仁勛用 200 億美元的“過路費”,繞開了反壟斷的紅線,兵不血刃地干掉了最危險的推理端刺客,順手接收了 Groq 生態(tài)上超過 200 萬名開發(fā)者。

算力洗牌:裁判下場,沒有中間商賺差價

這套“GPU主內(nèi)(訓(xùn)練),SRAM主外(推理)”的組合拳一旦打出,整個算力產(chǎn)業(yè)鏈的利潤池將面臨殘酷的重新分配。

首先,HBM 的神話將被祛魅。它依然是訓(xùn)練端不可或缺的皇冠明珠,但那種“只要搞 AI 就必須買 HBM”的非理性繁榮將一去不復(fù)返。

其次,留給其他芯片創(chuàng)業(yè)公司的單點突破空間被焊死。過去幾年,無數(shù)初創(chuàng)公司拿著“比英偉達推理快 X 倍”的 PPT 找融資。如今,當(dāng)裁判員自己下場推出極致低延遲的專用芯片,并且將其無縫接入英偉達龐大的 CUDA 軟件生態(tài)棧時,單靠底層架構(gòu)創(chuàng)新就能撕開一道口子的時代,正式終結(jié)了。

當(dāng)所有人都以為 GTC 2026 將是一場關(guān)于“算力規(guī)模有多大”的肌肉秀時,黃仁勛其實不關(guān)心 SRAM 和 HBM 誰替代誰,他只關(guān)心如何用最密不透風(fēng)的產(chǎn)品矩陣,把每一分流向 AI 數(shù)據(jù)中心的錢都截留在自己的口袋里。

這早就不是一場比拼芯片跑分的極客游戲,而是商業(yè)帝國捍衛(wèi)戰(zhàn)。(本文首發(fā)鈦媒體App,作者|硅谷Technews,編輯|寶叔) 

作品聲明:內(nèi)容由AI生成
本文系作者 硅谷Tech news 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

07:31

內(nèi)塔尼亞胡:以方將“暫?!笨找u伊朗能源設(shè)施

07:29

伊朗發(fā)動“真實承諾-4”第65、66輪軍事行動,首次使用升級版“卡德爾”導(dǎo)彈

07:24

美軍或奪島以迫使伊朗開放霍爾木茲海峽

07:17

六國發(fā)表聯(lián)合聲明:準備采取措施保障霍爾木茲海峽安全

07:14

美股收評:三大指數(shù)齊跌,光通信概念逆市走強,閃迪續(xù)刷新高

2026-03-19 22:58

內(nèi)存漲價潮席卷全球,32G內(nèi)存條從800元暴漲到3800元

2026-03-19 22:57

團隊版 OpenClaw (Clawith)宣布開源

2026-03-19 22:54

多家航司國際航線燃油附加費上調(diào)

2026-03-19 22:22

美股光通信概念股強勢拉升,Applied Optoelectronics 漲超6%

2026-03-19 22:13

ST泉為:公司及實控人、董事長褚一凡因涉嫌信息披露違法違規(guī)被證監(jiān)會立案調(diào)查

2026-03-19 22:03

現(xiàn)貨黃金跌3.78%,報4636.60美元/盎司

2026-03-19 22:02

東方財富:發(fā)布2026-2028年股東分紅回報規(guī)劃

2026-03-19 21:55

美元指數(shù)日內(nèi)走低0.50%,最低報99.70

2026-03-19 21:51

首都在線:2025年虧損1.7億元

2026-03-19 21:35

中國聯(lián)通:2025年凈利潤同比增長1.1%,擬派發(fā)全年股利約51.12億元

2026-03-19 21:35

納斯達克中國金龍指數(shù)跌3.0%,報6804.11點

2026-03-19 21:34

美股開盤:三大指數(shù)集體低開,美光科技跌超8%

2026-03-19 21:18

3月19日美股盤前要聞

2026-03-19 21:16

歐洲央行:維持三大關(guān)鍵利率不變,符合市場預(yù)期

2026-03-19 21:08

NYMEX鉑金主力合約跌超9%,報1870.1美元/盎司

掃描下載App