文 / 節(jié)點(diǎn)AI觀 ,作者 | 道哥
美國當(dāng)?shù)貢r間1月5日,英偉達(dá)CEO黃仁勛率在拉斯維加斯楓丹白露酒店的劇場中心舉行新年的第一場演講。依然是那身熟悉的皮衣。
通常情況下,英偉達(dá)會在春季于硅谷舉行的開發(fā)者大會上詳細(xì)介紹其最新芯片的規(guī)格和性能。但黃仁勛表示,由于人工智能所需的計算復(fù)雜度不斷提高,以及市場對先進(jìn)處理器用于訓(xùn)練和運(yùn)行AI模型的巨大需求,整個半導(dǎo)體行業(yè)不得不加快步伐。
在總結(jié)2025年這一年變化時,黃仁勛特意提到了DeepSeek R1的出現(xiàn)意外起到的催化劑作用,另外,在他身后的PPT上,還展示了中國開源模型Kimi K2和Qwen。
整個演講持續(xù)一個半小時,仔細(xì)看來,這場大會信息密度極高。節(jié)點(diǎn)AI總結(jié)了下分別是Agentic AI、物理AI、新芯片三大關(guān)鍵詞。
01 芯片新架構(gòu)Vera Rubin全面投產(chǎn)
雖然芯片新架構(gòu)出現(xiàn)在演講后半程,但算力作為AI的心臟,小編認(rèn)為還是有必要提前點(diǎn)出:
這次大會上,英偉達(dá)發(fā)布了一套由六個部分組成的Rubin平臺——包括Rubin和Rubin Ultra兩種規(guī)格的GPU與CPU,以及NVLink 6交換芯片和ConnectX-9 SuperNIC。
這款新服務(wù)器專為處理創(chuàng)建此類模擬而設(shè)計,能將其用于模型訓(xùn)練所需的海量計算負(fù)載。命名由來是,20世紀(jì)中期美國天文學(xué)家Vera Rubin,她曾通過對天體運(yùn)動的開創(chuàng)性觀測取得重大科學(xué)突破。
黃仁勛評價,每一顆芯片都是革命性的,都值得單獨(dú)開一場發(fā)布會。
從公開數(shù)據(jù)來看性能驚人:
其中,Rubin GPU的NVFP4(4位浮點(diǎn)數(shù)格式)推理算力為50PFLOPS,是Blackwell的5倍;NVFP4訓(xùn)練算力是35PFLOPS,是Blackwell的3.5倍;HBM4內(nèi)存帶寬22TB/s,是Blackwell的2.8倍,晶體管數(shù)量3360億個,是Blackwell的1.6倍。與Blackwell平臺相比,Rubin平臺通過軟硬件協(xié)同設(shè)計,將推理token成本降低10倍,將訓(xùn)練MoE模型(專家模型)所需的GPU數(shù)量減少4倍。
“如果我們不做協(xié)同設(shè)計,即便在每年提升1.6倍晶體管數(shù)量的最好情況下,以及在每個晶體管性能提升一些,例如提升25%的情況下,也難以獲得巨大的性能提升。”黃仁勛表示,這就是為什么要做另外一些事情,例如推出NVFP4,以便在可以損失精度的地方實(shí)現(xiàn)更高的吞吐量。這種協(xié)同設(shè)計,使新的芯片平臺可以有比較大的性能提升。
從商業(yè)化步伐來看,英偉達(dá)下一代AI超級芯片平臺Vera Rubin已進(jìn)入全面量產(chǎn),2026年下半年開始向合作伙伴交付,AWS、Google Cloud、Microsoft、Oracle等主要云服務(wù)商已確認(rèn)部署。
02 劍指Agentic AI
有了充足的燃料——算力,軟件層才有想象空間。
如果說近年來AI領(lǐng)域最熱門的概念有哪些,Agentic AI絕對位列其中。
現(xiàn)在英偉達(dá)在試圖為企業(yè)們降低Agent的開發(fā)成本。
英偉達(dá)稱,其發(fā)布的Nemotron-CC,是一個多語言預(yù)訓(xùn)練語料庫,覆蓋140多種語言,總規(guī)模達(dá)1.4萬億token,被定位為構(gòu)建和微調(diào)模型的“開放”基礎(chǔ)層。
公司同時強(qiáng)調(diào)了一套名為“Granary”的指令數(shù)據(jù)集,目標(biāo)是讓模型在企業(yè)級任務(wù)上“開箱即用”
從現(xiàn)場展示來看,利用英偉達(dá)的硬件和框架,開發(fā)者在幾分鐘內(nèi)就能構(gòu)建出一個功能完整的個人助理。這在幾年前是不可想象的,而現(xiàn)在,它變得易如反掌。
英偉達(dá)加入開源運(yùn)動的原因不難理解,是希望用“免費(fèi)樣品”把開發(fā)者吸引進(jìn)自家生態(tài),這樣反而能鞏固硬件的優(yōu)勢。
事實(shí)上,近年來英偉達(dá)一直致力于豐富開源生態(tài)。用英偉達(dá)生成式AI與軟件副總裁Kari Briski的話所說,此次大會的發(fā)布是一次“擴(kuò)展”。
“在2025年,英偉達(dá)是Hugging Face上最大的貢獻(xiàn)者之一——發(fā)布了650個開放模型和250個開放數(shù)據(jù)集。”Briski表示。
對企業(yè)而言,Agent門檻的降低對未來的影響十分深遠(yuǎn)。未來的IT部門,或許會將人類員工從繁瑣的流程中解放出來。工作內(nèi)容將變成“招募、管理和優(yōu)化”各種AI數(shù)字代理。
這正是AI Agent的終極魅力,從被動的數(shù)據(jù)喂養(yǎng),變成了一個能夠主動解決問題的數(shù)字員工,為企業(yè)創(chuàng)造極高的效率和價值。
03 接棒LLM,物理AI是下個主角
如果Agent是軟件層面的智能面,那么物理AI——這次演講的重頭戲,就是聯(lián)動現(xiàn)實(shí)世界與物理世界的全新應(yīng)用場景。從黃仁勛的規(guī)劃來看,自動駕駛、機(jī)器人、工業(yè)制造將是首推的三大場景。
黃仁勛強(qiáng)調(diào)表示,英偉達(dá)已為物理AI工作了8年。他認(rèn)為,物理AI的ChatGPT時刻即將到來。
而仿真是英偉達(dá)幾乎所有物理AI工作的核心——英偉達(dá)通過其Omniverse平臺,構(gòu)建了一個與現(xiàn)實(shí)世界幾乎一模一樣的“數(shù)字孿生”環(huán)境。在這個虛擬世界里,AI可以安全、高效地進(jìn)行訓(xùn)練。
黃仁勛強(qiáng)調(diào),這一多層次的技術(shù)棧,正推動AI從屏幕內(nèi)的對話者,轉(zhuǎn)變?yōu)槟軌蛟诂F(xiàn)實(shí)世界中執(zhí)行任務(wù)的行動者。
最先試驗(yàn)的落地場景就是對安全系數(shù)要求極高的自動駕駛。
此次英偉達(dá)推出開源推理VLA模型Alpamayo,該模型系列包含開源AI模型、仿真工具和數(shù)據(jù)集,可加速基于推理的、安全的自動駕駛車輛開發(fā),這是英偉達(dá)AV團(tuán)隊數(shù)千人的工作成果。
“我想我們都同意,從非自動駕駛汽車到自動駕駛汽車的轉(zhuǎn)折點(diǎn),可能就發(fā)生在這個時候。”黃仁勛表示,未來十年里,可以相當(dāng)肯定,世界上很大一部分汽車將是自動駕駛或高度自動駕駛的。
從落地效果來看,英偉達(dá)DRIVE AV軟件將在梅賽德斯奔馳車輛上使用,相關(guān)的AV自動駕駛汽車剛投入生產(chǎn)。第一輛AV自動駕駛汽車將在今年第一季度在美國上路,第二季度進(jìn)入歐洲,第三或第四季度進(jìn)入亞洲。英偉達(dá)還將繼續(xù)更新版本,合作建造L4 Robotaxi的生態(tài)系統(tǒng)還在擴(kuò)大。
機(jī)器人方面,面向智能機(jī)器人的推理視覺語言模型(VLM)Isaac GR00T N1.6等,還有多個用于機(jī)器人開發(fā)的新開源框架。
除了專門的硬件設(shè)備,黃仁勛還將目光投向了工業(yè)級場景。
黃仁勛宣布了與西門子深化合作,將英偉達(dá)的物理AI模型、Omniverse仿真平臺集成至西門子的工業(yè)軟件組合,覆蓋從芯片設(shè)計、工廠模擬到生產(chǎn)運(yùn)營的全生命周期。
“我們正站在一場新工業(yè)革命的開端,”他表示。物理AI將賦能芯片設(shè)計、生產(chǎn)線自動化乃至整個數(shù)字孿生系統(tǒng),實(shí)現(xiàn)“在計算機(jī)中設(shè)計、在計算機(jī)中制造”。
與其說是產(chǎn)品發(fā)布會,倒不如說是,黃仁勛本人對AI及計算產(chǎn)業(yè)未來十年的預(yù)判與宣言。通過開源關(guān)鍵模型、發(fā)布顛覆性硬件,英偉達(dá)試圖強(qiáng)勢定義,下個AI時代的技術(shù)標(biāo)準(zhǔn)與基礎(chǔ)設(shè)施。
其戰(zhàn)略核心也延續(xù)以往英偉達(dá)的開源+軟硬一體的作風(fēng),以全棧式的開放生態(tài),牢牢占據(jù)從數(shù)據(jù)中心到智能終端的每一個計算節(jié)點(diǎn),不放過任何一個有可能鞏固護(hù)城河的機(jī)會。







快報
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論