GTC 2026 即將開幕,黃仁勛準備掏出的不再是單純刷新參數(shù)的怪獸級 GPU,而是一張價值 200 億美元的明牌——一款基于 SRAM(靜態(tài)隨機存取存儲器)的專用推理芯片。
這標志著英偉達歷史上最大規(guī)模收購案(吞并 Groq 核心資產(chǎn))的底層技術(shù)正式落地。但這絕不是一次常規(guī)的產(chǎn)品迭代,黃仁勛正在親手打破自己維持了多年的神話:“一顆通用 GPU 可以包打天下”。
在筆者看來,這輪架構(gòu)調(diào)整的表象是硬件路線的演進,底層卻是英偉達面對科技巨頭“諸侯割據(jù)”與監(jiān)管高壓時,極其老辣的防御性進攻。
外界有一種極其粗暴的誤讀,認為英偉達轉(zhuǎn)向 SRAM 是為了“拋棄 HBM”。這在半導(dǎo)體的物理規(guī)律上根本站不住腳。
標準的 SRAM 單元需要 6 個晶體管(6T)來存儲 1 個比特,而 HBM 依賴的 DRAM 只需要 1 個晶體管加 1 個電容(1T1C)。這種先天的物理結(jié)構(gòu)差異,導(dǎo)致 SRAM 的硅片面積是 DRAM 的 5 到 10 倍。這意味著 SRAM 速度極快,但極其昂貴且根本做不出大容量,它裝不下動輒數(shù)千億參數(shù)的大模型。
英偉達真正的算盤,是搞“算力的階級分化”。
過去,無論是煉大模型還是日常的 AI 問答,大家都在搶極其昂貴且缺貨的 HBM 和 GPU。但現(xiàn)在,AI 的重心已經(jīng)徹底滑向了“推理(Inference)”。思科等機構(gòu)的最新預(yù)測顯示,到 2027 年,高達 75% 的 AI 工作負載將全面轉(zhuǎn)向?qū)崟r推理。
面對這種不可逆的趨勢,英偉達給出了路線圖切分:
一邊是即將登場的下一代 Vera Rubin 架構(gòu),繼續(xù)把 GPU 和 HBM 的堆料推向極致,死死鎖住云廠商的“大模型訓(xùn)練”底座;
另一邊,就是這次基于 Groq 技術(shù)推出的 LPU(語言處理單元)。它用片上 SRAM 替代片外存儲,徹底干掉數(shù)據(jù)搬運的延遲,專門用來收割那些對實時性要求極高、單次請求成本極敏感的場景。
為什么一向推崇通用計算的英偉達,會突然調(diào)轉(zhuǎn)車頭搞起專用推理架構(gòu)?
答案是被逼出來的。
就在近期,業(yè)界傳出 Meta 計劃在 2027 年將部分推理工作負載切給谷歌 TPU。當(dāng)大模型逐漸走向同質(zhì)化,推理成本的極致壓縮就成了生死線。如果英偉達繼續(xù)強迫所有客戶用“殺雞用牛刀”的 GPU 去做低延遲推理,大客戶遲早會跑向谷歌、AMD,甚至是以 Groq 為代表的初創(chuàng)公司。
為了掐滅這個苗頭,黃仁勛在 2025 年底砸出了 200 億美元。但最絕的不是金額,而是操盤手法。
如果英偉達直接全盤收購 Groq,這筆交易必定會被美國 FTC 和歐盟的反壟斷監(jiān)管機構(gòu)以“壟斷 AI 算力”為由直接斃掉。因此,英偉達采取了極其狡猾的“資產(chǎn)收購+技術(shù)授權(quán)+核心團隊挖角(Acquihire)”模式。
他們花 200 億美元買斷了 Groq 的核心專利使用權(quán),并把創(chuàng)始人 Jonathan Ross 連同兩百多名核心工程師直接“收編”進英偉達。而 Groq 這家公司的空殼,在名義上依然作為獨立實體存在。
這是一種合法但極其殘酷的“掏空”式并購。黃仁勛用 200 億美元的“過路費”,繞開了反壟斷的紅線,兵不血刃地干掉了最危險的推理端刺客,順手接收了 Groq 生態(tài)上超過 200 萬名開發(fā)者。
這套“GPU主內(nèi)(訓(xùn)練),SRAM主外(推理)”的組合拳一旦打出,整個算力產(chǎn)業(yè)鏈的利潤池將面臨殘酷的重新分配。
首先,HBM 的神話將被祛魅。它依然是訓(xùn)練端不可或缺的皇冠明珠,但那種“只要搞 AI 就必須買 HBM”的非理性繁榮將一去不復(fù)返。
其次,留給其他芯片創(chuàng)業(yè)公司的單點突破空間被焊死。過去幾年,無數(shù)初創(chuàng)公司拿著“比英偉達推理快 X 倍”的 PPT 找融資。如今,當(dāng)裁判員自己下場推出極致低延遲的專用芯片,并且將其無縫接入英偉達龐大的 CUDA 軟件生態(tài)棧時,單靠底層架構(gòu)創(chuàng)新就能撕開一道口子的時代,正式終結(jié)了。
當(dāng)所有人都以為 GTC 2026 將是一場關(guān)于“算力規(guī)模有多大”的肌肉秀時,黃仁勛其實不關(guān)心 SRAM 和 HBM 誰替代誰,他只關(guān)心如何用最密不透風(fēng)的產(chǎn)品矩陣,把每一分流向 AI 數(shù)據(jù)中心的錢都截留在自己的口袋里。
這早就不是一場比拼芯片跑分的極客游戲,而是商業(yè)帝國捍衛(wèi)戰(zhàn)。(本文首發(fā)鈦媒體App,作者|硅谷Technews,編輯|寶叔)
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論