2)性能和成本:在tokens/watt(吞吐量)和token速度(智能度)兩個(gè)維度上,英偉達(dá)均為全球最高性能;英偉達(dá)的token成本全球最低。

3)數(shù)據(jù)中心成為"token工廠":每個(gè)工廠受限于功率(如1GW),需要管理token生產(chǎn)的吞吐量和速度。

token將像大宗商品一樣細(xì)分層級(jí):免費(fèi)層(高吞吐、低速度)->$3/百萬(wàn)token層->$6/百萬(wàn)token層->$45/百萬(wàn)token層->$150/百萬(wàn)token層(頂級(jí)低延遲、高帶寬算力)。

以1GW數(shù)據(jù)中心為例,每25%功率分配一個(gè)層級(jí):Grace Blackwell可比Hopper生成5倍收入,Vera Rubin可再提升5倍。

4)Vera Rubin:在此前6類芯片基礎(chǔ)上,新增了Groq 3 LPU。

①Vera Rubin:100%液冷(45°C熱水冷卻),所有線纜取消,安裝時(shí)間從兩天縮短至兩小時(shí);

②CPO(共封裝光學(xué))Spectrum-X交換機(jī):已全面量產(chǎn),與TSMC共同研發(fā);

③CPU:世界上唯一使用LPDDR5的數(shù)據(jù)中心CPU,獨(dú)立售賣,將成為數(shù)十億美元級(jí)業(yè)務(wù);

Vera CPU Tray用于Agentic workload, 單個(gè)Vera Compute Tray集成了8顆Vera處理器, 每個(gè)處理器88核, 同時(shí)支持8通道的LPDDR5x內(nèi)存, 單個(gè)socket支持1.2TB/s的內(nèi)存帶寬。CPU Tray上集成了2塊BF4-DPU。

④Vera Rubin:已在Microsoft Azure上線運(yùn)行(第一個(gè)rack)。英偉達(dá)供應(yīng)鏈已可每周生產(chǎn)數(shù)千套系統(tǒng),每月數(shù)GW級(jí)AI工廠產(chǎn)能

⑤Rubin Ultra:Rubin是橫向滑入機(jī)柜,Rubin Ultra要垂直放入新機(jī)架Kyber,其中144 GPU在一個(gè)NVLink域內(nèi),中板后方用NVLink交換機(jī)替代銅纜。

5)Groq 3 LPU(新增芯片):Groq和HBM并用,符合預(yù)期

技術(shù)來(lái)自于收購(gòu)的Groq團(tuán)隊(duì),Groq LP30由三星制造,預(yù)計(jì)三季度發(fā)貨。

單顆Groq芯片500MB SRAM vs 單顆Rubin芯片288GB,Groq單獨(dú)無(wú)法承載主流大模型的參數(shù)和KV Cache。

解決方案:推出了一個(gè)Dynamo軟件,把推理步驟分解出來(lái):

1. 預(yù)填充階段:也稱Prefill,也是模型批量處理用戶輸入的Prompt的階段,主要是以計(jì)算為主,因此在Vera Rubin上完成;

2. 解碼的注意力環(huán)節(jié):主要是計(jì)算當(dāng)前產(chǎn)生的token與歷史tokens(KV Cache,對(duì)話存儲(chǔ)的記憶)的關(guān)系,是計(jì)算和存儲(chǔ)并重的工作性質(zhì),也是在Vera Rubin上完成,頻繁讀取Rubin上的HBM內(nèi)存單元。

3. 解碼的前饋網(wǎng)絡(luò)(FNN):在Attention環(huán)節(jié)確定上下文關(guān)系后,前饋網(wǎng)絡(luò)負(fù)責(zé)基于前Token來(lái)輸出下一個(gè)Token的概率分布,并選出下一Token,即“吐字”。

這個(gè)環(huán)節(jié)的每一層都要讀取模型的權(quán)重參數(shù),讀一次只能處理一個(gè)Token,原本參數(shù)放在HBM中,計(jì)算單元一直在等著數(shù)據(jù)從HBM搬運(yùn)過(guò)來(lái),這也是“內(nèi)存墻”的真正堵點(diǎn)。

把解碼分成用軟件拆出兩個(gè)階段后,等于把模型在工作的“上下文記憶”仍然保留在HBM上,但把大部分模型參數(shù)轉(zhuǎn)移到了Groq的SRAM上,芯片上內(nèi)嵌的存儲(chǔ)層SRAM能夠以極低的延遲讀取這些權(quán)重參數(shù),從而解決推理吐字慢的問(wèn)題。

Rubin和Groq之間用以太網(wǎng)緊密耦合,RDMA特殊連接模式可以讓兩芯片之間的交互延遲降低約一半。

6)Feynman:全新GPU + LP40(LPU)+ Rosa CPU(以Rosalind命名)+ BlueField-5 + CX10。

Kyber銅纜scale-up + Kyber CPO scale-up(首次同時(shí)支持銅纜和CPO scale-up)。這意味即使在Feynman階段,也將同時(shí)支持銅和CPO的混合方式。

雖然英偉達(dá)長(zhǎng)期看好CPO方案,但客戶方面傾向于將銅纜方案用到極致后再切換CPO(部署/維護(hù)更簡(jiǎn)單)。

7)其他信息:

①太空數(shù)據(jù)中心:針對(duì)能源不足問(wèn)題,英偉達(dá)宣布Vera Rubin Space-1,計(jì)劃將數(shù)據(jù)中心部署到太空(需解決輻射散熱問(wèn)題,太空中無(wú)傳導(dǎo)和對(duì)流,僅有輻射);

②OpenClaw:每家SaaS公司將變成GaaS公司(Agent-as-a-Service)。

代理系統(tǒng)在企業(yè)網(wǎng)絡(luò)中可以訪問(wèn)敏感信息、執(zhí)行代碼、對(duì)外通信——這需要企業(yè)級(jí)安全。英偉達(dá)與OpenClaw創(chuàng)始人Peter Steinberger合作推出NemoClaw(OpenClaw的企業(yè)安全參考設(shè)計(jì)),集成OpenShell技術(shù),包含網(wǎng)絡(luò)護(hù)欄(network guardrail)和隱私路由器(privacy router),可連接各SaaS公司的策略引擎;

③物理AI與機(jī)器人:自動(dòng)駕駛方面, 比亞迪/吉利/現(xiàn)代/日產(chǎn)等廠家加入Robtaxi, 并與Uber合作。然后機(jī)器人方面KUKA/ABB等廠商, 還有很多機(jī)器人/無(wú)人機(jī)平臺(tái)等。

總體來(lái)說(shuō),這次發(fā)布會(huì),除了澄清了銅纜和CPO會(huì)并用,主要就是新加入了一個(gè)服務(wù)器中新加入了Groq的LPU選項(xiàng)。這個(gè)在Groq被買后,市場(chǎng)已有充分預(yù)期;甚至指引的三年一萬(wàn)億美金收入,市場(chǎng)實(shí)際其實(shí)也已經(jīng)超過(guò)這個(gè)數(shù)字了。

整體上從英偉達(dá)的產(chǎn)品迭代可以看到:最近幾年的迭代重心不再芯片微架構(gòu)的創(chuàng)新,從Hopper到Blackwell解決主要是組合和連接的問(wèn)題,英偉達(dá)主要是完成了賣芯片到賣系統(tǒng)和服務(wù)的切換。

而從Blackwell到Rubin,無(wú)論是新加入的DPU(NAND芯片),還是這次新買來(lái)后緊急放進(jìn)來(lái)的LPU(SRAM),主要完成的是AI進(jìn)入推理和Agent時(shí)代,內(nèi)存墻的問(wèn)題。 

二、英偉達(dá)的近況:大會(huì)指引平淡,需要“成長(zhǎng)性新故事”

英偉達(dá)的股價(jià)表現(xiàn),在近半年的時(shí)間內(nèi)基本上一直都在170-200美元的區(qū)間內(nèi)震蕩。即便下游大廠增加資本開(kāi)支、公司業(yè)績(jī)持續(xù)超預(yù)期,公司股價(jià)也沒(méi)能實(shí)現(xiàn)向上突破,主要是市場(chǎng)有以下幾方面擔(dān)心:

a)大廠資本開(kāi)支持續(xù)性:Meta、谷歌等廠商都明確增加了2026年的資本開(kāi)支,四大核心云廠商在2026年的資本開(kāi)支有望達(dá)到6600億美元以上,同比增長(zhǎng)60%。但值得注意的是,大廠資本開(kāi)支在收入中的占比處于達(dá)到了相對(duì)較高的位置。

以Mete為例,公司預(yù)期2026年資本開(kāi)支將達(dá)到1150-1350億美元,資本開(kāi)支/年度收入將達(dá)到50%以上,進(jìn)一步提升的空間相對(duì)有限。即使各家大廠增加了2026年的投入展望,但依然難以打消市場(chǎng)對(duì)后續(xù)資本開(kāi)支增長(zhǎng)持續(xù)性的擔(dān)心。

b)AI芯片市場(chǎng)份額:當(dāng)前英偉達(dá)在AI芯片市場(chǎng)的份額維持在75%以上,較高的價(jià)格和“近乎壟斷”的市場(chǎng)結(jié)構(gòu),促使下游云廠商尋求“替代方案”。

在谷歌之外,博通AVGO已經(jīng)明確收獲了Anthropic、Open AI等的大額訂單,多個(gè)客戶也都開(kāi)啟了自研方案。即便英偉達(dá)后續(xù)還有Rubin新品,但市場(chǎng)普遍預(yù)期公司在AI芯片市場(chǎng)的份額將逐步下滑。

3)產(chǎn)品競(jìng)爭(zhēng)力:當(dāng)前谷歌TPUv7在FP8等領(lǐng)域的表現(xiàn)大致已經(jīng)接近于英偉達(dá)的B200(2024年四季度量產(chǎn)),谷歌TPU大致落后于英偉達(dá)一年左右。

英偉達(dá)在Blackwell系列中引入了NVFP4 格式,能使推理性能在FP8的基礎(chǔ)上再翻一倍。但其實(shí)FP8滿足了當(dāng)前市場(chǎng)大部分的需求,TPUv7已經(jīng)是一個(gè)“替代選項(xiàng)”。          

為了對(duì)抗行業(yè)競(jìng)爭(zhēng),英偉達(dá)正在通過(guò)戰(zhàn)略投資和算力擴(kuò)容,來(lái)鎖死供應(yīng)鏈上下游,比如說(shuō),以芯片部署為前提的戰(zhàn)略投資Open AI(300億美元)和Anthropic(100億美元)、為Meta旗下全新 AI 實(shí)驗(yàn)室MSL提供數(shù)百萬(wàn)塊GPU的算力支持,其中部分協(xié)議有一定的降價(jià)鎖定客戶需求的意味。

結(jié)合上述的市場(chǎng)擔(dān)心,公司估值也處于相對(duì)較低的位置。海豚君按照截止25-27自然年數(shù)據(jù)中心收入1.15萬(wàn)億(高于公司目前指引的1萬(wàn)億),英偉達(dá)當(dāng)前市值(4.4萬(wàn)億美元),對(duì)應(yīng)2028財(cái)年(接近2027自然年)凈利潤(rùn)約為13倍PE左右(假定營(yíng)收兩年復(fù)合增速64%,毛利率72%,稅率18%)。

英偉達(dá)上季度交出了超預(yù)期的財(cái)報(bào),但公司股價(jià)并未迎來(lái)上漲。這主要是因?yàn)?027年收入預(yù)期已經(jīng)全部打進(jìn)去后,市場(chǎng)擔(dān)心下游云廠商在資本開(kāi)支強(qiáng)度拉到50%以上的之后,進(jìn)一步拉高資本開(kāi)支的空間非常有限。

理論上,處于云廠商二級(jí)導(dǎo)上的英偉達(dá),即使客戶資本開(kāi)支高位維持,英偉達(dá)來(lái)自云客戶的收入會(huì)就變成零增長(zhǎng),市場(chǎng)不敢給2027年之后的英偉達(dá)高估值,導(dǎo)致英偉達(dá)當(dāng)前只有27年利潤(rùn)13X的PE,建籌的興趣也不高。

結(jié)合本次GTC大會(huì)的內(nèi)容來(lái)看,老黃給出的“至2027年數(shù)據(jù)中心累計(jì)收入達(dá)到1萬(wàn)億美元以上”,其實(shí)市場(chǎng)預(yù)期早已拉到比這個(gè)數(shù)還更高一些。

會(huì)議中更多的時(shí)間,給到了英偉達(dá)的產(chǎn)品推銷和路線規(guī)劃,對(duì)產(chǎn)業(yè)鏈公司的影響更多(CPO和銅仍將混合使用、LPU與HBM分擔(dān)不同的工作),對(duì)公司自身的增量信息并不多。

未來(lái)英偉達(dá)公司的PE再次提升,海豚君認(rèn)為除了AI應(yīng)用上能夠更大規(guī)模、更快速度落地之后,還需要新的“成長(zhǎng)曲線”來(lái)拉動(dòng),比如“Physic AI”、“太空算力”等。

本文系作者 海豚研究 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

09:15

瓶片期貨主力合約日內(nèi)跌幅擴(kuò)大至10%

09:14

澤連斯基:烏克蘭和談應(yīng)恢復(fù),烏美21日先談

09:13

布倫特原油期貨日內(nèi)跌超2%

09:11

現(xiàn)貨白銀日內(nèi)漲幅擴(kuò)大至1%

09:10

北交所上市公司今日達(dá)到300家

09:09

華沿機(jī)器人尋求在香港IPO中籌資13.7億港元

09:08

券商調(diào)研名單出爐,風(fēng)電、光伏、存儲(chǔ)芯片熱度高

09:06

激光和納米結(jié)構(gòu)在室溫下“孕育”出超固體

09:04

富時(shí)中國(guó)A50指數(shù)期貨盤(pán)初漲0.15%

09:03

國(guó)內(nèi)商品期貨開(kāi)盤(pán)多數(shù)下跌,瓶片跌超7%

09:02

3月LPR報(bào)價(jià)出爐:5年期和1年期利率均維持不變

09:01

美國(guó)白宮據(jù)報(bào)將在數(shù)日內(nèi)發(fā)布人工智能監(jiān)管框架

08:59

國(guó)民技術(shù):確定H股發(fā)行的最終價(jià)格為每股10.8港元,預(yù)計(jì)3月23日上市

08:52

第二艘國(guó)產(chǎn)大型郵輪“愛(ài)達(dá)·花城號(hào)”今日將出塢

08:50

編造傳播涉科大訊飛網(wǎng)絡(luò)謠言,沙某被行拘

08:49

深港通下的港股通標(biāo)的證券名單調(diào)整,調(diào)入廣合科技

08:48

兩市融資余額減少42.88億元

08:45

3月20日A股盤(pán)前要聞

08:33

美聯(lián)儲(chǔ)4月維持利率不變的概率為92.8%,加息概率為7.2%

08:32

豬價(jià)下跌+業(yè)績(jī)承壓,生豬養(yǎng)殖業(yè)寒意加深

掃描下載App