2)性能和成本:在tokens/watt(吞吐量)和token速度(智能度)兩個(gè)維度上,英偉達(dá)均為全球最高性能;英偉達(dá)的token成本全球最低。
![]()
3)數(shù)據(jù)中心成為"token工廠":每個(gè)工廠受限于功率(如1GW),需要管理token生產(chǎn)的吞吐量和速度。
token將像大宗商品一樣細(xì)分層級(jí):免費(fèi)層(高吞吐、低速度)->$3/百萬(wàn)token層->$6/百萬(wàn)token層->$45/百萬(wàn)token層->$150/百萬(wàn)token層(頂級(jí)低延遲、高帶寬算力)。
以1GW數(shù)據(jù)中心為例,每25%功率分配一個(gè)層級(jí):Grace Blackwell可比Hopper生成5倍收入,Vera Rubin可再提升5倍。
![]()
4)Vera Rubin:在此前6類芯片基礎(chǔ)上,新增了Groq 3 LPU。
①Vera Rubin:100%液冷(45°C熱水冷卻),所有線纜取消,安裝時(shí)間從兩天縮短至兩小時(shí);
②CPO(共封裝光學(xué))Spectrum-X交換機(jī):已全面量產(chǎn),與TSMC共同研發(fā);
③CPU:世界上唯一使用LPDDR5的數(shù)據(jù)中心CPU,獨(dú)立售賣,將成為數(shù)十億美元級(jí)業(yè)務(wù);
Vera CPU Tray用于Agentic workload, 單個(gè)Vera Compute Tray集成了8顆Vera處理器, 每個(gè)處理器88核, 同時(shí)支持8通道的LPDDR5x內(nèi)存, 單個(gè)socket支持1.2TB/s的內(nèi)存帶寬。CPU Tray上集成了2塊BF4-DPU。
④Vera Rubin:已在Microsoft Azure上線運(yùn)行(第一個(gè)rack)。英偉達(dá)供應(yīng)鏈已可每周生產(chǎn)數(shù)千套系統(tǒng),每月數(shù)GW級(jí)AI工廠產(chǎn)能;
⑤Rubin Ultra:Rubin是橫向滑入機(jī)柜,Rubin Ultra要垂直放入新機(jī)架Kyber,其中144 GPU在一個(gè)NVLink域內(nèi),中板后方用NVLink交換機(jī)替代銅纜。
![]()
![]()
5)Groq 3 LPU(新增芯片):Groq和HBM并用,符合預(yù)期
技術(shù)來(lái)自于收購(gòu)的Groq團(tuán)隊(duì),Groq LP30由三星制造,預(yù)計(jì)三季度發(fā)貨。
單顆Groq芯片500MB SRAM vs 單顆Rubin芯片288GB,Groq單獨(dú)無(wú)法承載主流大模型的參數(shù)和KV Cache。
解決方案:推出了一個(gè)Dynamo軟件,把推理步驟分解出來(lái):
1. 預(yù)填充階段:也稱Prefill,也是模型批量處理用戶輸入的Prompt的階段,主要是以計(jì)算為主,因此在Vera Rubin上完成;
2. 解碼的注意力環(huán)節(jié):主要是計(jì)算當(dāng)前產(chǎn)生的token與歷史tokens(KV Cache,對(duì)話存儲(chǔ)的記憶)的關(guān)系,是計(jì)算和存儲(chǔ)并重的工作性質(zhì),也是在Vera Rubin上完成,頻繁讀取Rubin上的HBM內(nèi)存單元。
3. 解碼的前饋網(wǎng)絡(luò)(FNN):在Attention環(huán)節(jié)確定上下文關(guān)系后,前饋網(wǎng)絡(luò)負(fù)責(zé)基于前Token來(lái)輸出下一個(gè)Token的概率分布,并選出下一Token,即“吐字”。
這個(gè)環(huán)節(jié)的每一層都要讀取模型的權(quán)重參數(shù),讀一次只能處理一個(gè)Token,原本參數(shù)放在HBM中,計(jì)算單元一直在等著數(shù)據(jù)從HBM搬運(yùn)過(guò)來(lái),這也是“內(nèi)存墻”的真正堵點(diǎn)。
把解碼分成用軟件拆出兩個(gè)階段后,等于把模型在工作的“上下文記憶”仍然保留在HBM上,但把大部分模型參數(shù)轉(zhuǎn)移到了Groq的SRAM上,芯片上內(nèi)嵌的存儲(chǔ)層SRAM能夠以極低的延遲讀取這些權(quán)重參數(shù),從而解決推理吐字慢的問(wèn)題。
Rubin和Groq之間用以太網(wǎng)緊密耦合,RDMA特殊連接模式可以讓兩芯片之間的交互延遲降低約一半。
![]()
6)Feynman:全新GPU + LP40(LPU)+ Rosa CPU(以Rosalind命名)+ BlueField-5 + CX10。
Kyber銅纜scale-up + Kyber CPO scale-up(首次同時(shí)支持銅纜和CPO scale-up)。這意味即使在Feynman階段,也將同時(shí)支持銅和CPO的混合方式。
雖然英偉達(dá)長(zhǎng)期看好CPO方案,但客戶方面傾向于將銅纜方案用到極致后再切換CPO(部署/維護(hù)更簡(jiǎn)單)。
![]()
7)其他信息:
①太空數(shù)據(jù)中心:針對(duì)能源不足問(wèn)題,英偉達(dá)宣布Vera Rubin Space-1,計(jì)劃將數(shù)據(jù)中心部署到太空(需解決輻射散熱問(wèn)題,太空中無(wú)傳導(dǎo)和對(duì)流,僅有輻射);
②OpenClaw:每家SaaS公司將變成GaaS公司(Agent-as-a-Service)。
代理系統(tǒng)在企業(yè)網(wǎng)絡(luò)中可以訪問(wèn)敏感信息、執(zhí)行代碼、對(duì)外通信——這需要企業(yè)級(jí)安全。英偉達(dá)與OpenClaw創(chuàng)始人Peter Steinberger合作推出NemoClaw(OpenClaw的企業(yè)安全參考設(shè)計(jì)),集成OpenShell技術(shù),包含網(wǎng)絡(luò)護(hù)欄(network guardrail)和隱私路由器(privacy router),可連接各SaaS公司的策略引擎;
③物理AI與機(jī)器人:自動(dòng)駕駛方面, 比亞迪/吉利/現(xiàn)代/日產(chǎn)等廠家加入Robtaxi, 并與Uber合作。然后機(jī)器人方面KUKA/ABB等廠商, 還有很多機(jī)器人/無(wú)人機(jī)平臺(tái)等。
總體來(lái)說(shuō),這次發(fā)布會(huì),除了澄清了銅纜和CPO會(huì)并用,主要就是新加入了一個(gè)服務(wù)器中新加入了Groq的LPU選項(xiàng)。這個(gè)在Groq被買后,市場(chǎng)已有充分預(yù)期;甚至指引的三年一萬(wàn)億美金收入,市場(chǎng)實(shí)際其實(shí)也已經(jīng)超過(guò)這個(gè)數(shù)字了。
整體上從英偉達(dá)的產(chǎn)品迭代可以看到:最近幾年的迭代重心不再芯片微架構(gòu)的創(chuàng)新,從Hopper到Blackwell解決主要是組合和連接的問(wèn)題,英偉達(dá)主要是完成了賣芯片到賣系統(tǒng)和服務(wù)的切換。
而從Blackwell到Rubin,無(wú)論是新加入的DPU(NAND芯片),還是這次新買來(lái)后緊急放進(jìn)來(lái)的LPU(SRAM),主要完成的是AI進(jìn)入推理和Agent時(shí)代,內(nèi)存墻的問(wèn)題。
英偉達(dá)的股價(jià)表現(xiàn),在近半年的時(shí)間內(nèi)基本上一直都在170-200美元的區(qū)間內(nèi)震蕩。即便下游大廠增加資本開(kāi)支、公司業(yè)績(jī)持續(xù)超預(yù)期,公司股價(jià)也沒(méi)能實(shí)現(xiàn)向上突破,主要是市場(chǎng)有以下幾方面擔(dān)心:
a)大廠資本開(kāi)支持續(xù)性:Meta、谷歌等廠商都明確增加了2026年的資本開(kāi)支,四大核心云廠商在2026年的資本開(kāi)支有望達(dá)到6600億美元以上,同比增長(zhǎng)60%。但值得注意的是,大廠資本開(kāi)支在收入中的占比處于達(dá)到了相對(duì)較高的位置。
以Mete為例,公司預(yù)期2026年資本開(kāi)支將達(dá)到1150-1350億美元,資本開(kāi)支/年度收入將達(dá)到50%以上,進(jìn)一步提升的空間相對(duì)有限。即使各家大廠增加了2026年的投入展望,但依然難以打消市場(chǎng)對(duì)后續(xù)資本開(kāi)支增長(zhǎng)持續(xù)性的擔(dān)心。
b)AI芯片市場(chǎng)份額:當(dāng)前英偉達(dá)在AI芯片市場(chǎng)的份額維持在75%以上,較高的價(jià)格和“近乎壟斷”的市場(chǎng)結(jié)構(gòu),促使下游云廠商尋求“替代方案”。
在谷歌之外,博通AVGO已經(jīng)明確收獲了Anthropic、Open AI等的大額訂單,多個(gè)客戶也都開(kāi)啟了自研方案。即便英偉達(dá)后續(xù)還有Rubin新品,但市場(chǎng)普遍預(yù)期公司在AI芯片市場(chǎng)的份額將逐步下滑。
![]()
3)產(chǎn)品競(jìng)爭(zhēng)力:當(dāng)前谷歌TPUv7在FP8等領(lǐng)域的表現(xiàn)大致已經(jīng)接近于英偉達(dá)的B200(2024年四季度量產(chǎn)),谷歌TPU大致落后于英偉達(dá)一年左右。
英偉達(dá)在Blackwell系列中引入了NVFP4 格式,能使推理性能在FP8的基礎(chǔ)上再翻一倍。但其實(shí)FP8滿足了當(dāng)前市場(chǎng)大部分的需求,TPUv7已經(jīng)是一個(gè)“替代選項(xiàng)”。
為了對(duì)抗行業(yè)競(jìng)爭(zhēng),英偉達(dá)正在通過(guò)戰(zhàn)略投資和算力擴(kuò)容,來(lái)鎖死供應(yīng)鏈上下游,比如說(shuō),以芯片部署為前提的戰(zhàn)略投資Open AI(300億美元)和Anthropic(100億美元)、為Meta旗下全新 AI 實(shí)驗(yàn)室MSL提供數(shù)百萬(wàn)塊GPU的算力支持,其中部分協(xié)議有一定的降價(jià)鎖定客戶需求的意味。
![]()
結(jié)合上述的市場(chǎng)擔(dān)心,公司估值也處于相對(duì)較低的位置。海豚君按照截止25-27自然年數(shù)據(jù)中心收入1.15萬(wàn)億(高于公司目前指引的1萬(wàn)億),英偉達(dá)當(dāng)前市值(4.4萬(wàn)億美元),對(duì)應(yīng)2028財(cái)年(接近2027自然年)凈利潤(rùn)約為13倍PE左右(假定營(yíng)收兩年復(fù)合增速64%,毛利率72%,稅率18%)。
英偉達(dá)上季度交出了超預(yù)期的財(cái)報(bào),但公司股價(jià)并未迎來(lái)上漲。這主要是因?yàn)?027年收入預(yù)期已經(jīng)全部打進(jìn)去后,市場(chǎng)擔(dān)心下游云廠商在資本開(kāi)支強(qiáng)度拉到50%以上的之后,進(jìn)一步拉高資本開(kāi)支的空間非常有限。
理論上,處于云廠商二級(jí)導(dǎo)上的英偉達(dá),即使客戶資本開(kāi)支高位維持,英偉達(dá)來(lái)自云客戶的收入會(huì)就變成零增長(zhǎng),市場(chǎng)不敢給2027年之后的英偉達(dá)高估值,導(dǎo)致英偉達(dá)當(dāng)前只有27年利潤(rùn)13X的PE,建籌的興趣也不高。
結(jié)合本次GTC大會(huì)的內(nèi)容來(lái)看,老黃給出的“至2027年數(shù)據(jù)中心累計(jì)收入達(dá)到1萬(wàn)億美元以上”,其實(shí)市場(chǎng)預(yù)期早已拉到比這個(gè)數(shù)還更高一些。
會(huì)議中更多的時(shí)間,給到了英偉達(dá)的產(chǎn)品推銷和路線規(guī)劃,對(duì)產(chǎn)業(yè)鏈公司的影響更多(CPO和銅仍將混合使用、LPU與HBM分擔(dān)不同的工作),對(duì)公司自身的增量信息并不多。
未來(lái)英偉達(dá)公司的PE再次提升,海豚君認(rèn)為除了AI應(yīng)用上能夠更大規(guī)模、更快速度落地之后,還需要新的“成長(zhǎng)曲線”來(lái)拉動(dòng),比如“Physic AI”、“太空算力”等。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論