免费看在线a黄视频|99爽99操日韩毛片儿|91停婷在线无码观看|日韩三级片小视频|一级黄片免费播放|欧美成人视频网站导航|亚洲日韩欧美七区|国产视频在线观看91|人成视频免费在线播放|国产精品成人在线免费观看

關(guān)于Rubin,我們列了六個關(guān)鍵問題

鈦度號
英偉達開始有了類似蘋果的想象力。

文 | 新眸,作者 | 李小東

英偉達沒有在CES 2026上發(fā)布任何新的顯卡。

取而代之的,黃仁勛用近兩個小時,詳細闡述了一個名為Vera Rubin的全新AI超算架構(gòu),以及一組足以改寫行業(yè)規(guī)則的數(shù)字:

在Rubin上運行AI推理,吞吐量提升十倍,訓(xùn)練萬億參數(shù)模型所需的GPU數(shù)量,可以減少到上一代Blackwell的四分之一,而每個token的成本降至十分之一。

這件事可能埋了個信號。

它或許預(yù)示,在傳統(tǒng)消費級GPU這條線上,通過制程和架構(gòu)微迭代帶來的性能提升,其邊際效應(yīng)正在減弱,或者說,已不足以支撐一個激動人心的發(fā)布會。

以下是我們就此事的一些思考。

關(guān)于沒有新顯卡與Rubin的商業(yè)模式

理解Rubin,關(guān)鍵在于轉(zhuǎn)變視角。

它不是一個更快的GPU,你可以把它視為一套極度垂直整合的AI計算系統(tǒng)。英偉達設(shè)計了六顆功能各異、但深度耦合的專用芯片去進行打包:

Vera CPU(負責(zé)AI數(shù)據(jù)流調(diào)度)、Rubin GPU(核心算力單元)、NVLink 6(超高帶寬內(nèi)部互聯(lián))、ConnectX-9 SuperNIC(AI專用網(wǎng)絡(luò))、BlueField-4 DPU(卸載存儲與安全任務(wù))、Spectrum-6以太網(wǎng)交換芯片。

六塊芯片協(xié)同工作,目標(biāo)是將整個數(shù)據(jù)中心機柜整合為一臺無縫的“巨型AI計算機”。 

Rubin解決的,是系統(tǒng)規(guī)模化的難題,不是單顆芯片的性能極限。讓算力的堆疊,從“手工組裝賽車引擎”變?yōu)?ldquo;標(biāo)準(zhǔn)化汽車工廠流水線”,至于帶來的效率提升和成本下降,是系統(tǒng)級優(yōu)化的必然結(jié)果。

這種模式,確實與谷歌通過TPU及其互聯(lián)技術(shù)打造自家AI基礎(chǔ)設(shè)施的思路異曲同工。英偉達的Rubin,正是面向那些與谷歌有相似需求的客戶——即需要處理海量Token、訓(xùn)練和運行萬億參數(shù)模型的超大規(guī)模AI廠商或云服務(wù)商。

對比英偉達在這之前的商業(yè)模式,有一些從“賣鏟子”到“賣生產(chǎn)力車間” 的商業(yè)模式的轉(zhuǎn)向。它帶來的性能提升(如10倍推理吞吐)和成本下降(1/10的Token成本),是這種專用化、系統(tǒng)級優(yōu)化所能釋放的潛力。

但它的限制也在于此。

Rubin的威力只有在處理其預(yù)設(shè)的、高度并行化的AI計算負載時才能完全釋放。對于圖形渲染、通用科學(xué)計算或小規(guī)模模型推理等場景,其復(fù)雜性和成本可能并不劃算。它瞄準(zhǔn)的是一個龐大但特定的“主航道”市場。

關(guān)于對現(xiàn)有AI硬件生態(tài)的沖擊

Rubin的出現(xiàn),會不會讓“囤積高端GPU”作為核心競爭力的時代,開始進入倒計時?

如果說,Rubin真的能夠達到市場普及,隨之而來就要面對一些尷尬情況:

對于第一波靠買賣或租賃算力(如H100集群)的廠商,他們的商業(yè)模式將承受巨大壓力。當(dāng)新一代系統(tǒng)能以低得多的單位成本提供推理服務(wù)時,舊有集群的性價比優(yōu)勢會迅速喪失,除非他們能快速升級到新架構(gòu)。

而對于那些早期投入巨資自建GPU集群的AI公司,他們的處境更為微妙。這些硬件資產(chǎn)短期內(nèi)不會報廢,依然能用于研發(fā)和現(xiàn)有服務(wù)。

但問題在于未來的競爭維度。

當(dāng)新入場的玩家可以憑借Rubin級別的廉價算力,輕松獲得與你相當(dāng)?shù)耐评砟芰r,你之前用巨額資本構(gòu)筑的算力壁壘,戰(zhàn)略價值就會急劇縮水。競爭將更快地、更徹底地轉(zhuǎn)向模型算法本身的優(yōu)越性、數(shù)據(jù)的獨特性和閉環(huán),以及產(chǎn)品與市場的契合度。

英偉達自身的角色,也會因此在演變。它確實在向“AI時代的高通”靠攏,即提供核心的、標(biāo)準(zhǔn)化的計算模塊。但Rubin所展現(xiàn)的集成度,又比手機SoC復(fù)雜得多,更接近于提供一整套參考設(shè)計和系統(tǒng)解決方案。

未來,如果其超算架構(gòu)(如DGX SuperPOD)以云服務(wù)形式被大規(guī)模交付,那么它還將附加一層“運營商”的屬性,直接向終端用戶輸出AI算力服務(wù)。

關(guān)于Token平價時代的窗口期問題

Rubin所承諾的“平價推理時代”,其窗口期的長短,取決于兩個關(guān)鍵變量:Rubin的銷量爬坡速度,以及現(xiàn)有巨頭模型能力的迭代速度。

如果Rubin能在2026年下半年如期規(guī)模上市,并快速被主要云廠商(如AWS、Azure、GCP)部署,那么這個“平價算力”的接入點就會迅速普及。

窗口期可能并不長。在這段時間里,存量公司必須完成從“依賴硬件規(guī)模”到“依賴軟件和生態(tài)優(yōu)勢”的關(guān)鍵轉(zhuǎn)型。

具體來說,他們可能需要:利用現(xiàn)有算力優(yōu)勢,加速訓(xùn)練出具有代際差異的模型,建立足夠高的算法壁壘;將業(yè)務(wù)迅速與具體商業(yè)場景深度綁定,形成數(shù)據(jù)閉環(huán)和客戶粘性,讓算力成本不再是決定性因素;積極探索基于現(xiàn)有模型的創(chuàng)新應(yīng)用和生態(tài),在平價算力浪潮到來前,占據(jù)用戶心智和市場份額。

當(dāng)大家獲取先進算力的成本拉平時,那些僅靠算力堆砌而無獨特技術(shù)或產(chǎn)品護城河的公司,優(yōu)勢可能很快蒸發(fā)。

關(guān)于AI泡沫與下一代種子選手

需要注意的是,Rubin的大規(guī)模投入,是為AI商業(yè)價值的全面實現(xiàn),拆除了最大的成本和規(guī)模障礙,但它本身并不能自動創(chuàng)造價值。

簡單來說,解決的是“成本可不可行”問題,而不是“需求存不存在”問題。

AI泡沫論常質(zhì)疑的是:天價訓(xùn)練成本能否產(chǎn)生與之匹配的商業(yè)價值?Rubin將成本打下來,實際上是大幅降低了驗證商業(yè)價值的門檻。

更多的創(chuàng)業(yè)團隊可以用可承受的成本,去測試更激進、更復(fù)雜的AI想法。因此,接下來的邏輯不是泡沫破裂,行業(yè)可能正從依靠資本堆砌的蠻力階段,進入一個更健康、更依賴創(chuàng)新而非資本的篩選階段。

最先能有效利用Rubin級別算力的創(chuàng)業(yè)者,未必是現(xiàn)在資金最雄厚的,但一定是對AI原生應(yīng)用有最深洞察、最能發(fā)揮廉價推理潛力的團隊。他們可能是下一代“殺手級應(yīng)用”的種子選手。

從這個角度來看,長遠一些,以往算力的天價成本導(dǎo)致只有少數(shù)玩家能入場,他們的故事建立在“我有稀缺算力”的基礎(chǔ)上,商業(yè)價值驗證被推遲。

Rubin之后的新邏輯是,算力門檻驟降,入場玩家會激增。當(dāng)然,這可能會導(dǎo)致大量同質(zhì)化應(yīng)用涌現(xiàn),市場競爭會瞬間變得極為殘酷。因為許多僅僅依靠“我有AI功能”的應(yīng)用將迅速失去價值,因為它們無法在成本相近的情況下提供獨特優(yōu)勢。

真正的價值創(chuàng)造者(擁有獨特數(shù)據(jù)、精妙算法、深刻行業(yè)洞察的團隊)會脫穎而出,而裸泳者會更快暴露。所以,Rubin的到來可能并不意味著泡沫結(jié)束,恰恰是一輪更劇烈的淘汰賽開始。

關(guān)于不推新顯卡的深層原因

作為天才銷售大師的黃仁勛,在這次CES全球大會上沒有推銷顯卡,這件事本身是很值得討論的,我們甚至可以合理猜測,在半導(dǎo)體物理邊界下,已經(jīng)逼近創(chuàng)新極限?

在傳統(tǒng)GPU的晶體管微縮競賽中,持續(xù)實現(xiàn)代際性能飛躍的難度確實在增加。與此同時,AI數(shù)據(jù)中心市場的增長曲線和利潤空間,已經(jīng)形成了絕對的戰(zhàn)略引力。

在先進封裝、HBM內(nèi)存等產(chǎn)能可能依然全局緊張的背景下,英偉達選擇將資源(研發(fā)、產(chǎn)能、市場聲量)絕對優(yōu)先地投入到?jīng)Q定其未來的AI基礎(chǔ)設(shè)施戰(zhàn)場,有一定的必然性。

另一方面,在過去一年里,英偉達的行業(yè)統(tǒng)治地位或多活動受到不少挑戰(zhàn),尤其是來源于谷歌這類科技公司的一些顛覆。

在缺乏制程紅利或架構(gòu)顛覆性突破的情況下,匆忙推出小幅升級的產(chǎn)品,反而可能打亂市場節(jié)奏、影響現(xiàn)有產(chǎn)品線(如RTX 40系)的銷售。英偉達有資本選擇等待一個更合適的發(fā)布時機。

更實際的問題

拋開以上,還有兩個非常實際的問題:一是從現(xiàn)有架構(gòu)遷移到Rubin的更新成本與收益是否匹配;二是新架構(gòu)下硬件必然會存在的穩(wěn)定性與魯棒性風(fēng)險。

對于從業(yè)者來說,從Blackwell或更早架構(gòu)遷移到Rubin,遠不止一次簡單的硬件采購。

最典型的例子,集成六種尖端芯片、采用全液冷設(shè)計的Rubin系統(tǒng),其單機柜或單托盤的價格必然極其昂貴,會顯著高于當(dāng)前一代系統(tǒng)。

還有他們的計算邏輯,客戶不會單純?yōu)榱水?dāng)前的算力付費,他們要購買一張通往下一代AI成本結(jié)構(gòu)的門票。核心比較指標(biāo)非“總擁有成本(TCO)”,而是 “單位智能成本(Cost Per Intelligence)”——即處理每萬億token、訓(xùn)練每個萬億參數(shù)模型的綜合開銷。

那劃不劃得來呢?對于極度稀缺、高速迭代的前沿模型研發(fā)(如追求AGI的實驗室)和超大規(guī)模AI云服務(wù)商來說,答案很可能是肯定的。

即便硬件單價高,但若能將其服務(wù)的天量Token推理成本降低一個數(shù)量級,或在競品之前以數(shù)月時間優(yōu)勢推出更強大的模型,這筆投資就能在極短時間內(nèi)通過市場領(lǐng)先地位和更低的運營成本收回。這是為生存和領(lǐng)先而戰(zhàn)。

除了這些,還有遷移與適配的隱性成本。比如,Rubin的NVFP4張量核心、新的內(nèi)存層次(如由BlueField-4驅(qū)動的上下文存儲平臺)以及CPU-GPU協(xié)同模式,都需要對現(xiàn)有的深度學(xué)習(xí)框架、模型架構(gòu)和調(diào)度軟件進行深度優(yōu)化,甚至重寫部分代碼。這需要投入大量工程師時間和驗證成本。

決策者還要考慮什么時候回本,比如:

基于Rubin更低廉的Token成本,自己的業(yè)務(wù)量(推理請求、模型訓(xùn)練任務(wù))將增長多少?新架構(gòu)帶來的能效提升,能節(jié)省多少電力成本?與“維持舊系統(tǒng),但承擔(dān)更高邊際成本和逐漸喪失競爭力”的路徑相比,提前投資Rubin的凈現(xiàn)值(NPV)是否為正?

對于大多數(shù)企業(yè),這個平衡點可能不會立即到來。

另一方面,關(guān)于穩(wěn)定性與魯棒性,是這種系統(tǒng)級極致創(chuàng)新的天然反面。

對于任一硬件工藝,復(fù)雜度激增必然帶來故障點的擴散。傳統(tǒng)的GPU集群有一兩個出現(xiàn)問題,任務(wù)可遷移解決。但Rubin是一個超級有機體,內(nèi)部(Vera CPU、Rubin GPU、NVLink 6、DPU、超級網(wǎng)卡)精密耦合,任何一個關(guān)鍵部件的異常,都可能影響整個系統(tǒng)的協(xié)同效率。

對于工程師來說,故障診斷難度大概率也會上升。當(dāng)性能問題或錯誤出現(xiàn)時,排查的根源可能是硬件(六種芯片中的任何一種)、固件、驅(qū)動、互聯(lián)協(xié)議或系統(tǒng)軟件中的任何一環(huán)。這種深度集成使得傳統(tǒng)“分而治之”的調(diào)試方法變得異常困難。

我們也注意到,針對這幾個風(fēng)險,老黃在演講中回應(yīng)了幾項特性,如全鏈路機密計算與加密、徹底重新設(shè)計的供電與冷卻、通過DPU實現(xiàn)“卸載”與“隔離”。

只不過,無論設(shè)計多么精妙,一套如此復(fù)雜的新系統(tǒng),也必須經(jīng)過大規(guī)模、長時間、多樣化實際工作負載的淬火才能得到驗證。

按照以往的經(jīng)驗,早期采用者將不可避免地承擔(dān)“共同測試者”的角色,與英偉達一同發(fā)現(xiàn)并解決那些在實驗室中無法預(yù)見的問題。

這個過程可能需要更長時間。

本文系作者 新眸 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

掃描下載App