人工智能的熱度越來越高,以至于“AI春晚”一年要辦兩場。
美東時間10月27日至29日,人工智能盛會英偉達(dá)GTC大會首次在華盛頓特區(qū)舉辦“加場”。有別于更聚焦技術(shù)、產(chǎn)品的3月圣何塞春季旗艦大會,10月的華盛頓大會更像是“政策專場”,不少討論都聚焦于AI領(lǐng)域的產(chǎn)業(yè)政策、政府角色等。
此前英偉達(dá)官方也曾預(yù)告,大會重頭戲——公司CEO黃仁勛的主題演講除了會公布產(chǎn)品相關(guān)信息外,還將為觀眾厘清AI如何重塑行業(yè)、基礎(chǔ)設(shè)施及公共部門的路線圖。Wccftech的會前報道也曾指出,考慮地緣問題對英偉達(dá)變得愈發(fā)重要,在華盛頓舉辦的大會或?qū)⒏雨P(guān)注“如何確保美國在人工智能競賽中保持領(lǐng)先地位”。更引人矚目的是,美國總統(tǒng)特朗普在大會召開之際稱“希望向黃仁勛表示祝賀”,還表示二人隨后就將會面。
美東時間10月28日中午12時許,黃仁勛如期登臺發(fā)表演講。再次回顧公司發(fā)展歷程后,他集中介紹了公司在6G、量子計算、AI基礎(chǔ)設(shè)施建設(shè)等領(lǐng)域的最新進(jìn)展和雄心。而在這背后,有關(guān)如何保持美國在AI領(lǐng)域的競爭優(yōu)勢的考慮無處不在。
在6G領(lǐng)域,黃仁勛詳細(xì)解釋了公司剛剛宣布的向諾基亞投資10億美元的計劃。表示雙方將合作開發(fā)6G人工智能平臺,諾基亞未來的基站將全面采用主題演講中發(fā)布的全新產(chǎn)品線NVIDIA Arc架構(gòu)。“這將推動美國重返電信領(lǐng)導(dǎo)地位”,英偉達(dá)在與黃仁勛主題演講同步發(fā)出的新聞稿中寫道。
黃仁勛還在演講中推出了NVQLink,這是一種旨在將量子處理器與GPU計算系統(tǒng)連接起來的系統(tǒng)架構(gòu)。他表示,未來每臺使用英偉達(dá)GPU的超級計算機(jī)都將是混合的,與量子處理器緊密耦合,以擴(kuò)展計算的可能性。“這是計算的未來”,雖然沒有公布具體技術(shù)進(jìn)展,但黃仁勛稱已有17家量子計算公司承諾支持NVQLink。另外,主題演講中也明確提到,NVQLink允許量子處理器與美國九個國家實驗室的超級計算系統(tǒng)連接,保持美國在高性能計算領(lǐng)域的領(lǐng)先地位。與此同時,黃仁勛還宣布英偉達(dá)將與美國能源部合作建造7臺新的AI超級計算機(jī)以推動美國科學(xué)發(fā)展,這也將成為美國能源部最大的AI超級計算機(jī)。
在近2個小時的演講中,黃仁勛還談到了機(jī)器人、物理AI、美國的制造業(yè)回流等眾多熱點問題,并展示了下一代Vera Rubin超級芯片,還發(fā)布了英偉達(dá)數(shù)據(jù)中心/AI GPU路線圖。值得一提的是,就像呼應(yīng)后者在遠(yuǎn)方的祝賀一樣,黃仁勛還感謝了特朗普,主要是因為他在推動為數(shù)據(jù)中心加強(qiáng)能源供給方面的舉措。
延續(xù)著此前說法,黃仁勛認(rèn)為人類正處于人工智能工業(yè)革命的黎明,而這項技術(shù)將定義每個行業(yè)和國家的未來。“美國必須引領(lǐng)這場邁向未來的競賽,這是我們這一代人的阿波羅時刻。下一輪的發(fā)明、發(fā)現(xiàn)和進(jìn)步將取決于國家擴(kuò)展人工智能基礎(chǔ)設(shè)施的能力。我們正在與我們的合作伙伴一起建設(shè)有史以來最先進(jìn)的人工智能基礎(chǔ)設(shè)施,確保美國擁有繁榮未來的基礎(chǔ),并確保世界人工智能以美國的創(chuàng)新、開放和協(xié)作為基礎(chǔ)造福所有人。”他表示。
在中美AI競賽趨于白熱化,兩國貿(mào)易關(guān)系持續(xù)波動的時刻,黃仁勛和他的英偉達(dá)也承受著來自雙方的壓力。此前特朗普政府曾禁止英偉達(dá)向中國出口高端芯片。但禁令解除后,英偉達(dá)又在中國接連遭遇反壟斷調(diào)查、安全后門等問題。根據(jù)公司季度財報和黃仁勛的“親口承認(rèn)”,英偉達(dá)在中國的市占率已從95%直接歸零,從今年二季度開始就無法向中國市場正常銷售芯片。而中國則在加速AI制造國產(chǎn)化替代進(jìn)程,以寒武紀(jì)為代表的國產(chǎn)芯片公司備受矚目,被寄予“產(chǎn)生像DeepSeek一樣的沖擊波”的期待。截至10月28日,寒武紀(jì)股價已再次超越貴州茅臺,成為A股第一高價股。
不過,英偉達(dá)是全球市值最高的公司。值得一提的是,在黃仁勛發(fā)表主題演講的同時,英偉達(dá)股價繼續(xù)走高,盤中突破203美元,總市值逼近5萬億美元,再次創(chuàng)下歷史新高。
以下為黃仁勛主題演講的中文翻譯版,經(jīng)AI輔助和人工編輯:
歡迎來到GTC。
今天我們有太多內(nèi)容要和大家分享。GTC是我們探討工業(yè)、科學(xué)、計算、現(xiàn)在與未來的地方。所以今天我要涵蓋的內(nèi)容非常多。
但在我開始之前,我想感謝我們所有的合作伙伴。他們幫助贊助了這次活動。你們會在展會周圍看到他們。他們來這里與大家會面,這真的很棒。沒有我們整個生態(tài)系統(tǒng)的合作伙伴,
我們無法完成我們所做的一切。
大家都說,這是AI領(lǐng)域的“超級碗”。那么,每一屆“超級碗”都應(yīng)該有一個精彩的開場秀。你們覺得剛才的開場秀(指開場播放的回顧美國及全球科技產(chǎn)業(yè)發(fā)展的短片)和我們的“全大寫全明星”陣容(指大屏幕上展示的贊助商名單)怎么樣?全是全明星運(yùn)動員和全明星陣容??纯催@些家伙。
在接下來的三個半小時里,AI生態(tài)系統(tǒng)的各個行業(yè)將齊聚一堂,共同探討一些事情。
那么,我們開始吧。
如大家在視頻中所見,英偉達(dá)在60年來首次發(fā)明了一種新的計算模型。一種新的計算模型很少出現(xiàn)。這需要大量的時間和一系列我們觀察到的條件。我們發(fā)明這種計算模型,是因為我們想解決通用計算機(jī)、普通計算機(jī)無法解決的問題。我們還觀察到,總有一天,晶體管會繼續(xù)增加,但晶體管的性能和功耗提升將會放緩。這就意味著,摩爾定律將無法持續(xù),它會受到物理定律的限制。那個時刻現(xiàn)在已經(jīng)到來,我們的縮放已經(jīng)停止了。這被稱為“德納德縮放”。德納德縮放大約在十年前就幾乎停止了。事實上,晶體管性能及其功耗的提升已經(jīng)大幅放緩。
然而,晶體管數(shù)量仍在繼續(xù)增長。我們在很久以前就注意到了這一點,并且在過去的30年里,我們一直在推進(jìn)這種我們稱之為“加速計算”的計算形式。我們發(fā)明了GPU。我們發(fā)明了名為CUDA的編程模型。我們觀察到,如果我們能增加一個處理器,利用越來越多的晶體管,應(yīng)用并行計算,將其與順序處理的CPU相結(jié)合,我們就能將計算能力擴(kuò)展到遠(yuǎn)超以往的程度。而這個時刻確實已經(jīng)到來了。
我們已經(jīng)看到了這個拐點:加速計算,它的時代現(xiàn)在已經(jīng)來臨。
然而,加速計算是一種本質(zhì)上就不同的編程模型。你不能只是把手工編寫的、順序執(zhí)行的CPU軟件放到GPU上,并指望它能正常運(yùn)行。事實上,如果你只是那樣做,它實際上會運(yùn)行得更慢。所以你必須重新發(fā)明新算法,你必須創(chuàng)建新的庫,事實上,你必須重寫應(yīng)用程序,這就是為什么它花了這么長時間。我們花了將近30年才走到這里,但我們是一步一個腳印走來的。這也是我們公司的瑰寶。
大多數(shù)人談?wù)揋PU的重要性,但如果沒有一個構(gòu)建在其之上的編程模型,并且沒有對這個編程模型進(jìn)行代際兼容的dedication(我們現(xiàn)在是CUDA 13,即將推出14),如果沒有數(shù)百萬個GPU在每臺計算機(jī)上完美兼容地運(yùn)行。那么開發(fā)者就不會以這個計算平臺為目標(biāo)。如果我們沒有創(chuàng)建這些庫,那么開發(fā)者就不知道如何使用算法,并充分發(fā)揮架構(gòu)的潛力。我的意思是,這真的是我們公司的瑰寶。
(對應(yīng)現(xiàn)場屏幕的展示依次解釋)我們花了將近七年的時間才讓cuLitho達(dá)到現(xiàn)在的水平?,F(xiàn)在臺積電在使用它,三星在使用它,ASML也在使用它。這是一個用于計算光刻的不可思議的庫,這是制造芯片的第一步。
cuOpt,在數(shù)值優(yōu)化方面打破了幾乎每一項紀(jì)錄……
cuDF,一個數(shù)據(jù)幀方法,基本上是加速SQL、數(shù)據(jù)幀、專業(yè)數(shù)據(jù)幀數(shù)據(jù)庫。
這個庫是共同啟動AI的庫,cuDNN,以及構(gòu)建在它之上的名為Megatron Core的庫,使我們能夠模擬和訓(xùn)練極其龐大的語言模型。這樣的例子還有很多。MONAI,非常重要,世界排名第一的醫(yī)學(xué)影像AI框架。順便說一下,我們今天不會過多討論醫(yī)療保健,但請務(wù)必觀看Kimberly的主題演講。她會詳細(xì)討論我們在醫(yī)療保健領(lǐng)域的工作。這樣的例子還有很多,基因組學(xué)處理、航空影像… 請大家注意,今天我們在這里要做一些非常重要的事情。那就是cuQuantum,量子計算。
屏幕展示的這只是我們公司350個不同庫的代表。這里的每一個庫都重新設(shè)計了加速計算所需的算法。每一個庫都使得我們所有的生態(tài)系統(tǒng)合作伙伴能夠利用加速計算,并且每一個庫都為我們開辟了新的市場。讓我們看看CUDA-X能做什么。
準(zhǔn)備好了嗎?開始。
(現(xiàn)場展示了數(shù)段游戲、動畫CG片段)
是不是很神奇?你們看到的一切都是模擬。沒有藝術(shù),沒有動畫。這就是數(shù)學(xué)之美。這是深度的計算機(jī)科學(xué),深度的數(shù)學(xué),它的美令人難以置信。涵蓋了每一個行業(yè),從醫(yī)療保健和生命科學(xué),到制造業(yè)、機(jī)器人技術(shù)、自動駕駛汽車、計算機(jī)圖形學(xué)…甚至電子游戲。你們看到的第一個鏡頭是英偉達(dá)運(yùn)行過的第一個應(yīng)用程序。那是我們1993年開始的地方。我們一直堅信我們正在努力做的事情。很難想象,你能看到那個最初的虛擬戰(zhàn)斗機(jī)場景活生生地呈現(xiàn)出來。而同一家公司相信我們今天會站在這里。這真是一段不可思議的旅程。我想感謝所有英偉達(dá)員工,請大家為他們鼓掌,感謝你們所做的一切。這真的太不可思議了。
今天,我們涵蓋了很多行業(yè)。我的演講也將涵蓋AI、6G、量子模型、企業(yè)計算、機(jī)器人和工廠。
讓我們開始吧。我們要涵蓋很多內(nèi)容,有很多重大發(fā)布,有很多新合作伙伴,這些可能會讓你們非常驚訝。
電信是我們經(jīng)濟(jì)、我們工業(yè)、我們國家安全的支柱和生命線。自從無線技術(shù)誕生以來,我們定義技術(shù),我們定義全球標(biāo)準(zhǔn),我們將美國技術(shù)出口到世界各地,以便世界可以基于美國的技術(shù)和標(biāo)準(zhǔn)進(jìn)行建設(shè)。然而,距離那時已經(jīng)過去很久了。
當(dāng)今世界部署的無線技術(shù)很大程度上都基于外國技術(shù)。我們基本的通信架構(gòu)建立在外國技術(shù)之上。這種情況必須停止。
而我們有機(jī)會做到這一點,尤其是在這個根本性的平臺轉(zhuǎn)型期。
如你們所知,計算機(jī)技術(shù)實際上是每個行業(yè)的基礎(chǔ)。它是科學(xué)最重要的工具。它是工業(yè)最重要的工具。我剛剛說過我們正在經(jīng)歷一個平臺轉(zhuǎn)型。這個平臺轉(zhuǎn)型應(yīng)該是我們千載難逢的機(jī)會,讓我們重新回到游戲中,開始基于美國技術(shù)進(jìn)行創(chuàng)新。今天,我們宣布我們將這樣做。我們與諾基亞建立了重大合作伙伴關(guān)系。
諾基亞是世界第二大電信設(shè)備制造商。這是一個3萬億美元的產(chǎn)業(yè)。包含數(shù)千億美元的基礎(chǔ)設(shè)施,全球有數(shù)百萬個基站。如果雙反進(jìn)行合作,我們可以基于這個令人難以置信的、根本上基于加速計算和AI的新技術(shù)進(jìn)行建設(shè)。并且讓美國成為6G下一次革命的中心。所以今天,我們宣布英偉達(dá)有一個新的產(chǎn)品線。它叫做英偉達(dá)Aerial RAN Computer Arc。Arc由三項基本新技術(shù)構(gòu)建而成:出色的CPU——Blackwell GPU,以及我們用于此應(yīng)用的ConnectX網(wǎng)絡(luò)。
所有這些使我們能夠運(yùn)行這個庫。我前面提到的這個CUDA-X庫叫做Aerial,本質(zhì)上是一個運(yùn)行在CUDA之上的無線通信系統(tǒng)。
我們將首次創(chuàng)建一個軟件定義的、可編程的計算機(jī),它能夠無線通信,同時進(jìn)行AI處理。
這完全是革命性的。我們稱之為英偉達(dá)Arc。
而諾基亞將與我們合作,集成我們的技術(shù),重寫他們的軟件棧。這是一家擁有7000項5G基本專利的公司。
很難想象,還有比這更偉大的電信領(lǐng)導(dǎo)者了。所以我們將與諾基亞合作。他們未來的基站將全面采用英偉達(dá)Arc。而英偉達(dá)Arc也與諾基亞當(dāng)前的AirScale基站兼容。
這意味著,我們將采用這項新技術(shù),并能夠用6G和AI升級全球數(shù)百萬個基站?,F(xiàn)在,6G和AI確實很重要,我們也將首次能夠使用AI技術(shù)——“AI for ran”——通過使用人工智能、強(qiáng)化學(xué)習(xí),根據(jù)環(huán)境、流量、移動性、天氣等實時調(diào)整波束成形,來提高無線通信的頻譜效率。
所有這些都可以被考慮進(jìn)去,這樣我們就能提高頻譜效率。基站消耗了全球約1.5%到2%的電力。所以提高頻譜效率意味著我們可以在不增加必要能源的情況下,通過無線網(wǎng)絡(luò)傳輸更多數(shù)據(jù)。
我們能做的另一件事是“AI on ran”。這是一個全新的機(jī)會。請記住,互聯(lián)網(wǎng)實現(xiàn)了通信,但令人驚奇的是,像AWS這樣的聰明公司在互聯(lián)網(wǎng)之上構(gòu)建了云計算系統(tǒng)。我們現(xiàn)在將在無線電信網(wǎng)絡(luò)之上做同樣的事情。這個新的云將是一個邊緣工業(yè)機(jī)器人云。
這就是說,“AI for ran”來提高無線電頻譜效率。“AI on ran”本質(zhì)上則是無線電信的云計算。云計算將能夠直接延伸到邊緣,那里沒有數(shù)據(jù)中心,因為我們在世界各地都有基站。這個發(fā)布非常令人興奮。Justin Hodar,諾基亞他們的CEO,我想他就在會場某處,感謝您與我們合作,感謝您幫助將電信技術(shù)帶回美國。這真是一次了不起的合作。非常感謝。
(現(xiàn)場響起諾基亞經(jīng)典鈴聲)這是慶祝諾基亞的最佳方式。
接下來,讓我們談?wù)劻孔佑嬎?/strong>。1981年,粒子物理學(xué)家、量子物理學(xué)家理查德·費(fèi)曼設(shè)想了一種新型計算機(jī),可以直接模擬自然。他稱之為量子計算機(jī)。
四十年后,這個行業(yè)取得了根本性的突破。
就在去年,實現(xiàn)了一個根本性的突破?,F(xiàn)在可以制造出一個邏輯量子比特。一個相干的、穩(wěn)定的、并且經(jīng)過糾錯的邏輯量子比特。這一個邏輯量子比特由有時是幾十個,有時是幾百個物理量子比特共同工作組成。如您所知,量子比特這些粒子極其脆弱。它們可能非常不穩(wěn)定。
任何觀察、任何采樣、任何環(huán)境條件都可能導(dǎo)致它退相干。
因此,它需要極其受控的環(huán)境,現(xiàn)在還需要許多不同的物理量子比特讓它們協(xié)同工作,讓我們能夠?qū)λ鼈冞M(jìn)行糾錯,這些被稱為輔助量子比特或綜合征量子比特。讓我們能夠糾正錯誤,并推斷出那個邏輯量子比特的狀態(tài)。有各種不同類型的量子計算機(jī),超導(dǎo)、光子、囚禁離子、穩(wěn)定原子,各種不同的制造量子計算機(jī)的方法。
我們現(xiàn)在意識到,將量子計算機(jī)直接連接到GPU超級計算機(jī)是至關(guān)重要的,這樣我們才能進(jìn)行糾錯,才能進(jìn)行量子計算機(jī)的人工智能校準(zhǔn)和控制,才能進(jìn)行協(xié)同模擬,共同工作,讓正確的算法運(yùn)行在GPU上,正確的算法運(yùn)行在QPU(量子處理單元)上,并讓這兩個處理器、兩臺計算機(jī)并肩工作。
這是量子計算的未來。讓我們看看。
(現(xiàn)場播放了一段量子計算相關(guān)的視頻,其中稱量子糾錯是答案,NVQ Link則是一種新的互連架構(gòu),直接將量子處理器與英偉達(dá)GPU連接起來,他們還將能夠協(xié)調(diào)量子設(shè)備和AI超級計算機(jī)來運(yùn)行量子GPU應(yīng)用程序。)
所以今天,我們正式發(fā)布NVQ、NVQ Link。這得益于兩件事,當(dāng)然,這個互連實現(xiàn)了量子計算機(jī)控制和校準(zhǔn)、量子糾錯,以及連接兩臺計算機(jī)(QPU和我們的GPU超級計算機(jī))的混合模擬。它也是完全可擴(kuò)展的。它不僅僅針對今天少量量子比特進(jìn)行糾錯。它也為未來進(jìn)行糾錯,屆時我們將把這些量子計算機(jī)從今天的幾百個量子比特擴(kuò)展到數(shù)萬個量子比特,未來甚至到數(shù)十萬個量子比特。
所以我們現(xiàn)在有一個架構(gòu),可以進(jìn)行控制、協(xié)同模擬、量子糾錯,并面向未來進(jìn)行擴(kuò)展。行業(yè)的支持一直令人難以置信。
在CUDA-Q的發(fā)明期間,記住,CUDA是為GPU-CPU加速計算設(shè)計的,基本上是用合適的工具做合適的工作?,F(xiàn)在CUDA-Q已經(jīng)擴(kuò)展到CUDA之外,這樣我們就可以支持QPU,并讓兩個處理器(QPU和GPU)協(xié)同工作,計算在幾微秒內(nèi)來回移動,這是與量子計算機(jī)協(xié)作所需的關(guān)鍵延遲。所以現(xiàn)在CUDA-Q是一個如此不可思議的突破,被眾多不同的開發(fā)者采納。今天我們宣布有17家不同的量子計算機(jī)行業(yè)公司支持NVQ Link架構(gòu)。我對此感到非常興奮。還有8個不同的美國能源部下屬實驗室:伯克利、布魯克海文、費(fèi)米實驗室、林肯實驗室、洛斯阿拉莫斯、橡樹嶺… 幾乎每個美國能源部實驗室都與我們合作,與我們的量子計算機(jī)公司和這些量子控制器生態(tài)系統(tǒng)合作,以便我們將量子計算集成到未來的科學(xué)中。
我們還有一個額外的重要發(fā)布。
今天,我們宣布美國能源部正與英偉達(dá)合作,建造7臺新的AI超級計算機(jī),以推動我們國家的科學(xué)發(fā)展。
我必須向克里斯·賴特部長(美國能源部部長)部長致敬。他給能源部帶來了如此多的活力,能量的激增、激情的激增,以確保美國再次引領(lǐng)科學(xué)。
正如我提到的,計算是科學(xué)的基本工具,我們正在經(jīng)歷幾個大的平臺轉(zhuǎn)型期。一方面,我們轉(zhuǎn)向加速計算。這就是為什么未來的每臺超級計算機(jī)都將是基于GPU的超級計算機(jī)。而且,我們轉(zhuǎn)向AI,這樣AI和基于原理的求解器、基于物理的模擬都不會消失,但它可以得到增強(qiáng),從而通過使用代理模型、AI模型協(xié)同工作來擴(kuò)展規(guī)模。
我們也知道,基于原理的求解器、經(jīng)典計算可以通過使用量子計算來增強(qiáng),以理解自然狀態(tài)。我們也知道,未來,我們有如此多的信號,如此多的數(shù)據(jù)需要從世界中采樣。遙感比以往任何時候都更重要。而這些實驗室,除非它們是機(jī)器人工廠、機(jī)器人實驗室,否則我們無法以我們需要的規(guī)模和速度進(jìn)行實驗。所以所有這些不同的技術(shù)正在同時進(jìn)入科學(xué)領(lǐng)域。
賴特部長理解我們,他希望美國能源部抓住這個機(jī)會,為自己注入超強(qiáng)動力,并確保美國保持在科學(xué)的前沿。
我想為此感謝你們所有人。謝謝。
接下來,讓我們談?wù)凙I。
什么是AI?大多數(shù)人會說AI是一個聊天機(jī)器人,這確實是正確的。毫無疑問,ChatGPT是人們認(rèn)為的AI前沿。然而,正如你現(xiàn)在看到的,這些科學(xué)超級計算機(jī)不是用來運(yùn)行聊天機(jī)器人的。它們將進(jìn)行基礎(chǔ)科學(xué)AI。
AI的世界遠(yuǎn)不止聊天機(jī)器人,當(dāng)然。聊天機(jī)器人極其重要,而AGI從根本上來說至關(guān)重要。深度計算機(jī)科學(xué)、不可思議的計算能力、偉大的突破對于AGI仍然至關(guān)重要。但除此之外,AI還有更多內(nèi)涵。
事實上,我將用幾種不同的方式來描述AI。
第一種方式,你首先會想到的是,AI已經(jīng)完全重塑了計算棧。
我們過去編寫軟件的方式是手工編碼的軟件運(yùn)行在CPU上。今天AI是機(jī)器學(xué)習(xí)、訓(xùn)練、數(shù)據(jù)密集型編程,如果你愿意這么說的話,通過AI進(jìn)行訓(xùn)練和學(xué)習(xí),而AI運(yùn)行在GPU上。為了實現(xiàn)這一點,整個計算棧已經(jīng)改變。注意,你在這里看不到Windows。你看不到CPU。
你看到的是一個完全不同的、根本不同的棧。
我們還可以從對能源的需求開始說起,這是另一個領(lǐng)域,我們的政府、特朗普總統(tǒng)值得巨大贊譽(yù),他支持能源發(fā)展的倡議,他認(rèn)識到這個行業(yè)需要能源來增長,需要能源來進(jìn)步,我們需要能源來獲勝。他認(rèn)識到這一點,并將國家的力量置于支持能源增長之后,完全改變了游戲規(guī)則。如果沒有發(fā)生這種情況,我們可能會陷入糟糕的境地。我為此感謝特朗普總統(tǒng)。
在能源之上是這些GPU。這些GPU被連接起來,構(gòu)建成我稍后會展示的基礎(chǔ)設(shè)施。在這個基礎(chǔ)設(shè)施之上,包括巨型數(shù)據(jù)中心,輕松有這個房間大小的好多倍,消耗巨大的能量,然后通過這些稱為GPU超級計算機(jī)的新機(jī)器轉(zhuǎn)化能量,以生成數(shù)字。這些數(shù)字被稱為Token,可以說是人工智能的語言、計算單元、詞匯表。你幾乎可以將任何東西標(biāo)記化。你當(dāng)然可以將英文單詞標(biāo)記化。這就是為什么你能夠識別圖像或生成圖像。將視頻標(biāo)記化,將3D結(jié)構(gòu)標(biāo)記化,你可以標(biāo)記化學(xué)物質(zhì)、蛋白質(zhì)和基因,你可以標(biāo)記我們自己,或者幾乎任何有結(jié)構(gòu)的東西,任何有信息內(nèi)容的東西。
一旦你能將其標(biāo)記化,AI就能學(xué)習(xí)那種語言及其含義。一旦它理解了那種語言的含義,它就能翻譯、能響應(yīng),就像你與ChatGPT互動一樣。它也能生成,就像ChatGPT能生成一樣。所以,你看到ChatGPT做的所有基本事情,你只需要想象,如果它是蛋白質(zhì)會怎樣?
如果它是化學(xué)物質(zhì)呢?如果它是一個像工廠一樣的3D結(jié)構(gòu)呢?如果它是一個機(jī)器人,而標(biāo)記是理解行為,并將動作和運(yùn)動標(biāo)記化呢?所有這些概念基本上都是一樣的,這就是為什么AI正在取得如此非凡的進(jìn)展。
在這些模型之上是應(yīng)用程序。Transformer不是一個通用模型。它是一個非常有效的模型,但不存在一個通用的模型。只是AI具有普遍的影響力而已。我們有太多不同類型的模型了。在過去的幾年里,我們享受了多模態(tài)的發(fā)明并經(jīng)歷了創(chuàng)新突破。有太多不同類型的模型。有CNN模型,有狀態(tài)空間模型,有圖神經(jīng)網(wǎng)絡(luò)模型。
在這些模型架構(gòu)之上是應(yīng)用程序,即過去的軟件。這是對人工智能的一個深刻理解,一個深刻的觀察。
過去的軟件行業(yè)是關(guān)于創(chuàng)建工具的。Excel是一個工具,Word是一個工具,網(wǎng)頁瀏覽器也是一個工具。我們之所以知道這些是工具,是因為大家在使用它們。
工具,就像螺絲刀和錘子一樣,行業(yè)只有這么大,這些IT工具大約價值1萬億美元左右。
但AI不是一個工具,AI是工作者,這就是深刻的區(qū)別。AI實際上是能夠使用工具的工人。
我真正感到興奮的事情之一是由Irvin在Perplexity所做的工作,他們使用網(wǎng)頁瀏覽器來預(yù)訂假期或購物。
基本上是一個使用工具的AI。Cursor是一個AI和代理式AI系統(tǒng),我們在英偉達(dá)使用它。英偉達(dá)的每一位軟件工程師都在使用Cursor。這極大地提高了我們的生產(chǎn)力。它基本上是我們每一位軟件工程師生成代碼的合作伙伴。它也使用名叫VS Code的工具。所以Cursor是一個AI,一個代理式AI系統(tǒng),而VS Code是它使用的工具。
所有這些不同的行業(yè),無論是聊天機(jī)器人,還是數(shù)字生物學(xué)(在那里我們有AI助理研究員),或者機(jī)器人出租車。說到這,在機(jī)器人出租車內(nèi)部,雖然看不見的,但顯然有一個AI司機(jī)。那個司機(jī)在工作,而它用來工作的工具就是汽車。
所以,我們至今創(chuàng)造的一切,整個世界,我們至今創(chuàng)造的一切都是供我們使用的工具。有史以來第一次,技術(shù)現(xiàn)在能夠自己工作并幫助我們提高生產(chǎn)力。
這樣的機(jī)會列表還在繼續(xù),這就是為什么AI所涉及的經(jīng)濟(jì)領(lǐng)域是它從未觸及過的。
它是在工具之下的幾萬億美元、甚至百萬億美元全球經(jīng)濟(jì)。現(xiàn)在,AI將首次涉足這百萬億美元的經(jīng)濟(jì),使其更具生產(chǎn)力,增長更快,規(guī)模更大。我們面臨嚴(yán)重的勞動力短缺,擁有增強(qiáng)勞動力的AI將幫助我們增長。
從技術(shù)產(chǎn)業(yè)的角度來看,有趣的是,在AI是開創(chuàng)經(jīng)濟(jì)新領(lǐng)域的新技術(shù)這一事實之外,AI本身也是一個新產(chǎn)業(yè)。
正如我早先解釋的,這些Token,這些數(shù)字,在你將所有不同的模態(tài)和信息標(biāo)記化之后,需要一個工廠來生產(chǎn)這些數(shù)字,這與過去不同。過去的計算機(jī)行業(yè)和芯片行業(yè),請注意,如果你看過去的芯片行業(yè)的話,過去的芯片行業(yè)約占IT行業(yè)的5%到10%,也許更少。
原因是,使用Excel不需要那么多計算,使用瀏覽器不需要那么多計算,使用Word不需要那么多計算。
但是在這個新世界里,需要有一臺計算機(jī)始終理解上下文。它無法預(yù)先計算,因為每次你使用AI計算機(jī),每次你要求AI做某事時,上下文都是不同的。所以它必須處理所有這些信息環(huán)境。例如,在自動駕駛汽車的情況下,它必須處理汽車的上下文。你提出的指令是什么?要求AI去做?然后它必須逐步分解問題,進(jìn)行推理,制定計劃并執(zhí)行。每一步都需要生成大量的Token,這就是為什么我們需要一種新型系統(tǒng),我稱之為AI工廠。
它當(dāng)然是一個AI工廠。它不同于過去的數(shù)據(jù)中心,它是一個AI工廠。
因為,這個工廠只生產(chǎn)一樣?xùn)|西,不像過去的數(shù)據(jù)中心什么都做,為我們所有人存儲文件,運(yùn)行各種不同的應(yīng)用程序。你可以像使用計算機(jī)一樣使用那個數(shù)據(jù)中心來處理所有應(yīng)用程序。你可以一天用它來玩游戲,你可以用它來瀏覽網(wǎng)頁,你也可以用它來做會計。
所以那是過去的計算機(jī),一個通用的、多用途的計算機(jī)。
我在這里談?wù)摰挠嬎銠C(jī)是一個工廠。它基本上只運(yùn)行一樣?xùn)|西:它運(yùn)行AI。其目的是設(shè)計用來生產(chǎn)盡可能有價值的Token,意思是它們必須聰明,并且你希望以驚人的速度生產(chǎn)這些Token。因為當(dāng)你向AI提問時,你希望它快速響應(yīng)。并且注意到在高峰時段,這些AI的響應(yīng)越來越慢,因為它要為很多人做很多工作。
所以你希望以驚人的速度生產(chǎn)有價值的Token,并且你希望以高效的方式生產(chǎn)它。我使用的每一個詞都與AI工廠、汽車工廠或任何工廠的概念一致。
它絕對是一個工廠。而這些工廠以前從未存在過。在這些工廠內(nèi)部是堆積如山的芯片,這引出了今天的話題。
過去幾年發(fā)生了什么。事實上,去年發(fā)生了一些相當(dāng)深刻的事情。
實際上,如果你看今年年初,每個人對AI都有某種態(tài)度。這種態(tài)度通常是:這將會很大,這將是未來。幾個月前,它進(jìn)入了渦輪增壓模式。原因有幾個。首先,在過去的幾年里,我們已經(jīng)找到了如何讓AI更聰明的方法。這不僅僅是預(yù)訓(xùn)練。預(yù)訓(xùn)練基本上是說,讓我們把人類創(chuàng)造的所有信息都給AI學(xué)習(xí)。這本質(zhì)上是記憶和泛化。這不像我們小時候上學(xué)。學(xué)習(xí)的第一階段,預(yù)訓(xùn)練從來不是,就像學(xué)前班從來不是教育的終點一樣。預(yù)訓(xùn)練僅僅是教你智能的基本技能,以便你能夠理解如何學(xué)習(xí)其他一切。
接下來是后訓(xùn)練。預(yù)訓(xùn)練之后是教你解決問題的技能,分解問題,進(jìn)行推理。
關(guān)于如何解決數(shù)學(xué)問題,如何編碼,如何逐步思考這些問題,使用第一性原理推理。然后在那之后,才是計算真正開始發(fā)揮作用的時候。如你們所知,我們上了學(xué),那對我來說是幾十年前的事了。但自那以后,我學(xué)到了更多,思考了更多。原因是我們在不斷地用新知識夯實自己。我們不斷地進(jìn)行研究,我們不斷地思考,這確實是智能的全部意義所在。
所以現(xiàn)在我們擁有三個基本的技術(shù)技能。我們有這三個技術(shù):預(yù)訓(xùn)練,這仍然需要巨大的計算量。我們現(xiàn)在有后訓(xùn)練,它使用甚至更多的計算。而現(xiàn)在,“思考”給基礎(chǔ)設(shè)施帶來了難以置信的計算負(fù)荷,因為它是在為我們每一個人思考。
所以AI進(jìn)行推理、“思考”所需的計算量確實非常巨大。我以前聽人說推理很容易,英偉達(dá)應(yīng)該做訓(xùn)練,英偉達(dá)需要做。
但是,思考怎么可能容易?
思考是困難的,這就是為什么這三個擴(kuò)展法則給計算量帶來了如此大的壓力?,F(xiàn)在另一件事發(fā)生了,從這三個擴(kuò)展法則中,我們得到了更聰明的模型,這些更聰明的模型需要更多的計算。而模型越聰明,就有越多的人使用它,這就需要越多的計算。而且,現(xiàn)在它們值得付費(fèi)了。英偉達(dá)為每一份Cursor許可證付費(fèi),我們很樂意這樣做,因為Cursor正在幫助價值數(shù)十萬美元的員工——軟件工程師或AI研究員——提高數(shù)倍的生產(chǎn)力。所以,我們當(dāng)然非常樂意這樣做。
這些AI模型已經(jīng)好到值得付費(fèi)了。Cursor、11 Labs、Cynthia、Abridge、OpenEvidence,這樣的例子還有很多。當(dāng)然還有OpenAI、Claude。這些模型現(xiàn)在如此之好,以至于人們愿意為之付費(fèi)。因為人們付費(fèi)并更多地使用它,而每次他們更多地使用它,你就需要更多的計算。我們現(xiàn)在有兩個指數(shù)級增長。這兩個指數(shù),一個是三個擴(kuò)展法則帶來的指數(shù)級計算需求。
第二個指數(shù)是,模型越智能,就有越多的人使用它,用戶增長和模型能力提升相互促進(jìn),都導(dǎo)致計算需求指數(shù)級增長。
兩個指數(shù)現(xiàn)在同時對世界的計算資源施加壓力,正好在我剛才告訴你摩爾定律已基本結(jié)束的時候。
所以問題是,我們該怎么做?
如果我們有這兩個指數(shù)級增長的需求,而我們找不到方法來驅(qū)動成本下降,那么這個正反饋系統(tǒng)就會崩潰。良性循環(huán)對幾乎任何行業(yè)都至關(guān)重要,對任何平臺行業(yè)都至關(guān)重要。它對英偉達(dá)也至關(guān)重要。
我們現(xiàn)在已經(jīng)達(dá)到了CUDA的良性循環(huán)。
創(chuàng)建的應(yīng)用越多,人們創(chuàng)造的應(yīng)用越多,CUDA就越有價值,CUDA就越有價值。購買的CUDA計算機(jī)越多,購買的計算機(jī)越多,開發(fā)者就越想為該平臺創(chuàng)建應(yīng)用。英偉達(dá)的這個良性循環(huán)在經(jīng)過30年后現(xiàn)在已經(jīng)實現(xiàn)了。15年后,我們也將為AI實現(xiàn)了這個良性循環(huán)。
AI現(xiàn)在已經(jīng)達(dá)到了一個良性循環(huán)。所以,你越多地使用它,因為AI很智能并且我們愿意付費(fèi),就能產(chǎn)生越多的利潤。產(chǎn)生的利潤越多,投入到電網(wǎng)中的計算資源就越多,投入到AI工廠中的計算就越多,AI就能變得越智能,越多的人使用它,越多的應(yīng)用使用它,我們能解決的問題就越多。這個良性循環(huán)現(xiàn)在開始運(yùn)轉(zhuǎn)了。
我們需要做的是大幅降低成本,以便第一讓用戶體驗更好,當(dāng)你提示AI時,它響應(yīng)你的速度要快得多;第二,這樣我們就能通過驅(qū)動成本下降來保持這個良性循環(huán)繼續(xù),這樣它就能變得更聰明,這樣就有更多人使用它,如此循環(huán)下去,這個良性循環(huán)現(xiàn)在正在加速。
但是當(dāng)摩爾定律真的達(dá)到極限時,我們該怎么做呢?答案叫做協(xié)同設(shè)計。你不能只設(shè)計芯片,然后指望運(yùn)行在上面的東西會更快。在設(shè)計芯片方面,你能做的最好就是每隔幾年增加可能50%的晶體管。如果你增加了更多晶體管,或者只是不斷增加更多晶體管,但那都是百分比增長,不是指數(shù)增長。我們需要復(fù)合指數(shù)增長來保持這個良性循環(huán)繼續(xù),我們稱之為極端協(xié)同設(shè)計。英偉達(dá)是當(dāng)今世界上唯一一家真正從一張白紙開始,能夠同時思考新的基礎(chǔ)架構(gòu)、計算機(jī)架構(gòu)、新芯片、新系統(tǒng)、新軟件、新模型架構(gòu)和新應(yīng)用的公司。在座的許多人之所以在這里,是因為你們是這個堆棧不同層面的一部分。通過與英偉達(dá)合作,我們從根本上重新設(shè)計了從底層到頂層的一切。
然后,因為AI是一個如此龐大的問題,我們將其規(guī)?;?。我們首次創(chuàng)建了一臺計算機(jī),這臺計算機(jī)已經(jīng)擴(kuò)展成整個機(jī)架。那是一臺計算機(jī),一個GPU,然后我們通過發(fā)明一種新的AI以太網(wǎng)技術(shù)(我們稱之為Spectrum-X Ethernet)將其橫向擴(kuò)展。
每個人都會說以太網(wǎng)就是以太網(wǎng)。而Spectrum-X以太網(wǎng)是為AI性能而設(shè)計的,這就是它如此成功的原因。即使那樣也還不夠大。我們會用AI超級計算機(jī)和GPU填滿整個房間。那仍然不夠大,因為AI的應(yīng)用數(shù)量和用戶數(shù)量持續(xù)呈指數(shù)級增長,我們將多個這樣的數(shù)據(jù)中心連接在一起,我們稱之為跨規(guī)模擴(kuò)展,使用Spectrum-X GS,千兆規(guī)模X,Spectrum-X Gigascale XGS。
通過這樣做,我們在如此巨大的層面上進(jìn)行協(xié)同設(shè)計,如此極端的層面,以至于性能提升是驚人的。不是每一代提升50%,不是每一代提升25%,而是多得多。
這是我們制造過的最極端的協(xié)同設(shè)計計算機(jī),坦白說,自IBM System 360以來,在現(xiàn)代時期,我認(rèn)為從未有過像這樣從頭開始、徹底重新發(fā)明的計算機(jī)。創(chuàng)建這個系統(tǒng)極其困難。我稍后會向你們展示其好處。但本質(zhì)上我們所做的,我們創(chuàng)造了NVLink 72,如果我們要創(chuàng)建一個巨大的芯片,一個巨大的GPU,它看起來會是這樣。這是我們必須要做的晶圓級處理的水平,是不可思議的。所有這些,所有這些芯片現(xiàn)在都被放入一個巨大的機(jī)架,這個巨大的機(jī)架使所有這些芯片作為一個整體協(xié)同工作。這看上去完全不可思議。
(現(xiàn)場演示環(huán)節(jié))
不管怎樣,我們基本上,過去我們創(chuàng)造的是這個。這是NVLinks,NVLink 8?,F(xiàn)在這些模型如此巨大,我們解決的方法是把這個模型,這個巨大的模型,變成一大堆專家,有點像團(tuán)隊。所以這些專家擅長某些類型的問題,我們把一大堆專家聚集在一起。所以這個巨大的數(shù)萬億美元AI模型有所有這些不同的專家,我們把所有這些不同的專家放在GPU上?,F(xiàn)在是NVLink 72。我們可以把所有的芯片放入一個巨大的交換網(wǎng)絡(luò)中,每個專家都可以相互交談。所以主專家、主要專家可以與所有下屬專家交談,以及所有必要的上下文、提示和我們必須發(fā)送給所有專家的大量數(shù)據(jù)。專家們,無論哪個專家被選中來解答問題,我們會更多地嘗試響應(yīng),然后它會一層接一層地去做,有時八層,有時十六層。有時這些專家,有時六十四個,有時兩百五十六個。但關(guān)鍵是專家越來越多。
那么,這里,NVLink 72,我們有72個GPU。正因為如此,我們可以在一個GPU里放四個專家。你需要為每個GPU做的最重要的事情是生成Token,這取決于你的HBM內(nèi)存的帶寬量。
我們有一個H100 GPU為四個專家生成“思考”。而在這里,因為每臺計算機(jī)只能放八個GPU,我們必須把三十二個專家放進(jìn)一個GPU。所以這個GPU要為一個專家進(jìn)行三十二次“思考”。
對比這個系統(tǒng),每個GPU只為一個專家進(jìn)行四次“思考”。正因為如此,速度差異是驚人的。這個剛剛出來,是由SemiAnalysis進(jìn)行的基準(zhǔn)測試。他們做了非常徹底的工作,他們對所有可進(jìn)行基準(zhǔn)測試的GPU進(jìn)行了基準(zhǔn)測試。結(jié)果發(fā)現(xiàn)并沒有那么多。如果你看看GPU列表,實際上可以基準(zhǔn)測試的GPU大概90%是英偉達(dá)。
好吧。但是,所以我們是在和自己比較,但世界上第二好的GPU是H200,運(yùn)行所有工作負(fù)載。
Grace Blackwell每個GPU的性能是H200的10倍。當(dāng)你只增加了兩倍的晶體管時,如何獲得10倍的性能?答案是極端協(xié)同設(shè)計。通過理解未來AI模型的性質(zhì),并且我們在整個堆棧上進(jìn)行思考,我們可以為未來創(chuàng)建架構(gòu)。這是件大事。這意味著我們現(xiàn)在可以更快地響應(yīng)。但接下來是更大的事。
這張圖片顯示世界上成本最低的Token是由Grace Blackwell NVLink 72生成的,這是最昂貴的計算機(jī)。一方面,GB200是最昂貴的計算機(jī)。另一方面,它的Token生成能力如此強(qiáng)大,以至于它以最低的成本生產(chǎn)Token。
因為每秒Token數(shù)除以Grace Blackwell的總擁有成本是如此之好,以至于它是生成Token成本最低的方式。通過這樣做,提供驚人的性能,10倍的性能提升,并提供10倍的低成本,以此讓良性循環(huán)可以繼續(xù)。
不管怎樣,有兩個平臺轉(zhuǎn)型正在同時發(fā)生。一個平臺轉(zhuǎn)型是從通用計算轉(zhuǎn)向加速計算。
記住,加速計算,正如我之前向你們提到的,它進(jìn)行數(shù)據(jù)處理、圖像處理、計算機(jī)圖形學(xué),它進(jìn)行各種計算。它運(yùn)行SQL,運(yùn)行Spark,不管你需要什么,我相當(dāng)確定我們有一個很棒的庫能夠給你。你可能是一個試圖制造掩模版來生產(chǎn)半導(dǎo)體的數(shù)據(jù)中心。我們有一個很棒的庫給你。所以,在底層, irrespective of AI,世界正在從通用計算轉(zhuǎn)向加速計算,這與AI無關(guān)。事實上,許多CSP在AI出現(xiàn)之前早就有了服務(wù)。記住,它們誕生于機(jī)器學(xué)習(xí)時代,經(jīng)典的機(jī)器學(xué)習(xí)算法,如XGBoost,用于推薦系統(tǒng)、協(xié)同過濾、內(nèi)容過濾的算法,像數(shù)據(jù)幀這樣的算法,所有這些技術(shù)都是在通用計算的時代創(chuàng)建的。
即使是那些算法,即使是那些架構(gòu),現(xiàn)在通過加速計算也變得更好。所以,即使沒有AI,世界的CSP也將投資于加速。而我們的GPU是唯一能完成所有這些事情的GPU。
而ASIC可能能做AI,但它不能做任何其他事情。
英偉達(dá)能完成所有那些。
這就解釋了為什么僅僅依賴英偉達(dá)的架構(gòu)是如此安全。我們現(xiàn)在已經(jīng)達(dá)到了我們的良性循環(huán),達(dá)到了我們的拐點。這相當(dāng)不尋常。
我有很多合作伙伴在座,你們所有人都是我們供應(yīng)鏈的一部分,我知道你們工作得多么努力。
我想感謝你們所有人,感謝你們?nèi)绱伺Φ毓ぷ?。非常感謝。
現(xiàn)在我要向你們展示原因。這是我們公司業(yè)務(wù)正在發(fā)生的情況。我們看到Grace Blackwell的增長非常驚人,原因正如我剛才提到的。它是由兩個指數(shù)驅(qū)動的。我們現(xiàn)在能見度很高,我想我們可能是歷史上第一家能看到截至2026年累計5000億美元Blackwell訂單和早期Ruben(下一代平臺)訂單的技術(shù)公司。如您所知,2025年還沒結(jié)束,2026年還沒開始。這是已經(jīng)預(yù)訂的業(yè)務(wù)量,價值5000億美元。
到目前為止,我們已經(jīng)出貨了600萬個Blackwell GPU…
在最初幾個季度,我想,是頭四個生產(chǎn)季度或三個半生產(chǎn)季度。2025年我們還有一個季度要完成。然后我們還有四個季度。所以接下來五個季度,要完成5000億美元,那是五倍的增長速度。
這某種程度上告訴了你一些事情。這是上一代的Hopper的整個生命周期的數(shù)額。還不包括中國和亞洲市場。
所以Hopper在其整個生命周期中是400萬個GPU。每個Blackwell模塊里面有2個GPU,是一個大封裝。Blackwell在早期階段就有2000萬個GPU,增長非常驚人。
所以我想感謝我們所有的供應(yīng)鏈合作伙伴,各位。我知道你們工作得多么努力。我制作了一個視頻來慶祝你們的工作。讓我們播放它。
(播放一段關(guān)于美國制造業(yè)的視頻)
我們再次在美國進(jìn)行制造,這太不可思議了。
特朗普總統(tǒng)之前講的第一件事就是讓制造業(yè)回歸,因為這對國家安全是必要的。讓制造業(yè)回歸,因為我們想要那些工作崗位。我們想要那部分經(jīng)濟(jì)。
九個月后,我們現(xiàn)在在亞利桑那州全面生產(chǎn)Blackwell。Extreme Blackwell,GB200 NV Grace,Blackwell NVLink 72。極端協(xié)同設(shè)計給我們帶來了10倍的代際提升。這完全不可思議。現(xiàn)在,真正不可思議的部分是,這是我們制造的第一臺AI超級計算機(jī)。
這是在2016年,我把它交付給舊金山的一家初創(chuàng)公司,這家公司后來被證明是OpenAI。這就是那臺計算機(jī)。
而為了制造那臺計算機(jī),我們設(shè)計了一款新芯片以便我們進(jìn)行協(xié)同設(shè)計。
現(xiàn)在我們必須設(shè)計的所有芯片。這就是目前所需要的。你不可能拿一個芯片就讓計算機(jī)快10倍。那不會發(fā)生。讓計算機(jī)快10倍的方法,讓我們能夠持續(xù)指數(shù)級提升性能、持續(xù)指數(shù)級驅(qū)動成本下降的方法,就是極端協(xié)同設(shè)計,同時研發(fā)所有這些不同的芯片。我們現(xiàn)在已經(jīng)有了下一代的Ruben芯片。
這是我們的第三代NVLink 72機(jī)架規(guī)模計算機(jī)。GB200是第一代。我們在世界各地的所有合作伙伴,我知道我聽說你們工作有多努力。第一代做得非常艱難,第二代順暢多了。而這一代,看這個(現(xiàn)場展示),對我們來說真的不算什么了。這些現(xiàn)在都在實驗室里了。這是下一代Ruby。在我們發(fā)貨的同時,我們正在準(zhǔn)備投入生產(chǎn),你知道,大概明年這個時候,甚至可能稍早一點。所以每一年,我們都會推出最極端的協(xié)同設(shè)計系統(tǒng),這樣我們就能持續(xù)提升性能,持續(xù)降低Token生成成本??纯催@個,這非常漂亮。所以這太神奇了。
(接下來是現(xiàn)場展示和介紹,包括Vera Rubic計算托盤、BlueField、NVLink交換機(jī)等)
現(xiàn)在,如你所注意到的,英偉達(dá)最初從設(shè)計芯片開始,然后我們開始設(shè)計系統(tǒng),我們設(shè)計AI超級計算機(jī)。現(xiàn)在我們正在設(shè)計整個AI工廠。
每次我們向外擴(kuò)展并集成更多需要解決的問題,我們就能提出更好的解決方案。我們現(xiàn)在建造整個AI工廠。這個AI工廠是我們?yōu)閂era Ruben建造的,我們創(chuàng)建了一種技術(shù),使我們所有的合作伙伴能夠數(shù)字化地集成到這個工廠中。讓我展示給你們看。
(現(xiàn)場播放 一段相關(guān)視頻)
完全數(shù)字化。遠(yuǎn)在Vera Ruben作為實體存在之前,遠(yuǎn)在這些AI工廠存在之前。我們就優(yōu)化它,并將它作為數(shù)字孿生來運(yùn)營。所以所有與我們合作的合作伙伴,很高興你們所有人都支持我們。我們一起建造AI工廠。
再來,讓我們談?wù)勀P停_源模型。
在過去的幾年里,發(fā)生了幾件事。一個是開源模型,由于推理能力相當(dāng)強(qiáng)大,例如Stability AI,這些不同的能力使得開源模型首次對開發(fā)者來說非常有用,它們現(xiàn)在是初創(chuàng)公司的命脈。
每個行業(yè)都有其自己的用例,不同行業(yè)的初創(chuàng)公司需要讓那個領(lǐng)域?qū)I(yè)知識能夠嵌入到一個模型中。開源使之成為可能。研究人員需要開源,開發(fā)者需要開源。世界各地的公司,我們需要開源模型,這非常重要。
美國也必須在開源方面領(lǐng)先。我們有驚人的專有模型,但我們還需要驚人的開源模型。
我們的國家依賴于此,我們的初創(chuàng)公司依賴于此,所以英偉達(dá)正致力于去做這件事。
我們現(xiàn)在是開源貢獻(xiàn)的最大領(lǐng)導(dǎo)者。我們有23個模型在排行榜上。我們有所有這些不同的領(lǐng)域,從語言模型到物理AI模型再到生物學(xué)模型。每個模型都有龐大的團(tuán)隊。這就是我們?yōu)樽约簶?gòu)建超級計算機(jī)的原因之一,以促成所有這些模型的創(chuàng)建。我們有排名第一的語音模型,排名第一的推理模型,排名第一的物理AI模型。下載量非??捎^。我們致力于此。原因是科學(xué)需要它,研究人員需要它,初創(chuàng)公司需要它。
我很高興AI初創(chuàng)公司基于英偉達(dá)構(gòu)建。他們這樣做有幾個原因。當(dāng)然,我們的系統(tǒng)豐富。我們的工具運(yùn)行良好。我們所有的工具都在我們所有的GPU上運(yùn)行。我們的GPU無處不在, 在每一個云上都可用,你可以下載我們的軟件棧,然后它就能工作。我們擁有豐富的開發(fā)者生態(tài)系統(tǒng)的優(yōu)勢,他們正在使這個生態(tài)系統(tǒng)更加豐富。
所以我真的很高興與所有我們合作的初創(chuàng)公司建立關(guān)系。謝謝你們。同樣的情況是,許多這些初創(chuàng)公司現(xiàn)在開始創(chuàng)造更多的方式來利用我們的GPU,雇傭人員并擴(kuò)展規(guī)模。
Nibias、Lama、love、Lambda, 所有這些公司都很棒。
所有我談到的CUDA-X庫。我告訴過你們關(guān)于如何開源AI,將我談到的所有模型貨幣化,我們集成到AWS中,我們集成到Google Cloud中……我們還將真實的庫集成到世界SaaS中,這樣每一個SaaS最終都將成為一個代理式SaaS。
總有一天,我很想雇傭一個AI代理基本設(shè)計師,與我們的ACS合作,本質(zhì)上是Synopsys的Cursor,如果你愿意這么說的話。我們與Anirudh Devgan、Cadence合作。
今天早些時候,他是開場秀的一部分,Cadence在做不可思議的工作,加速他們的堆棧以創(chuàng)建AI代理,這樣我們就能擁有Cadence AI、AC設(shè)計師和系統(tǒng)設(shè)計師工作。今天,我們宣布一個新的合作。AI將極大提高生產(chǎn)力。AI將改變幾乎每一個行業(yè)。
但AI也將極大地加劇大型網(wǎng)絡(luò)安全挑戰(zhàn),那些壞AI。所以,我們需要一個不可思議的防御者。我無法想象有比CrowdStrike更好的防御者了。
George Voltage在這里。他剛才在這里。是的,我早些時候看到他了。我們正在與CrowdStrike合作,使網(wǎng)絡(luò)安全達(dá)到光速。創(chuàng)建一個在云中擁有網(wǎng)絡(luò)安全AI代理的系統(tǒng),同時也在本地或邊緣擁有真正優(yōu)秀的AI代理。這樣,無論何時出現(xiàn)威脅,你都能在瞬間檢測到它。我們需要速度,我們需要快速的代理式AI,超級智能的代理。
然后,還有一個發(fā)布要宣布。
這是世界上增長速度最快、最有價值的企業(yè),可能是當(dāng)今世界上最重要的企業(yè)堆棧——Palantir。他們獲取信息,獲取數(shù)據(jù),獲取人類判斷,并將其轉(zhuǎn)化為商業(yè)洞察。我們與Palantir合作,加速Palantir所做的一切,這樣我們就能以更大的規(guī)模和更快的速度進(jìn)行數(shù)據(jù)處理。
無論是過去的結(jié)構(gòu)化數(shù)據(jù),還是非結(jié)構(gòu)化數(shù)據(jù)。然后,我們會為我們的政府處理這些數(shù)據(jù),為了國家安全,也為世界各地的企業(yè)。以光速處理這些數(shù)據(jù),并從中發(fā)現(xiàn)洞察。這就是未來的樣子。Palantir將集成英偉達(dá)技術(shù),以便我們能夠以光速處理數(shù)據(jù)。
接下來,讓我們談?wù)?strong>物理AI吧。
物理AI需要三臺計算機(jī),就像訓(xùn)練一個語言模型需要兩臺計算機(jī)一樣:一臺訓(xùn)練它,一臺評估和推理。好吧,所以那就是你看到的大型GB200。為了給物理AI做這件事,你需要三臺計算機(jī)。你需要計算機(jī)來訓(xùn)練它。這是GB,Grace Blackwell NVLink 72,是進(jìn)行所有我早先向你們展示的模擬的計算機(jī),使用Omniverse DSX。那基本上是一個大窗口,讓機(jī)器人學(xué)習(xí)如何成為一個好機(jī)器人,讓工廠本質(zhì)上成為一個數(shù)字工具。
(現(xiàn)場展示)這臺計算機(jī)必須非常擅長生成式AI,并且必須擅長計算機(jī)圖形學(xué)、傳感器模擬、光線追蹤、信號處理。
這臺計算機(jī),它叫做Omniverse計算機(jī)。一旦我們訓(xùn)練了模型,在數(shù)字孿生中模擬那個AI,那個數(shù)字孿生可以是一個工廠的數(shù)字孿生,也可以是一大堆機(jī)器人的數(shù)字孿生,然后你需要操作那個機(jī)器人。而這是機(jī)器人計算機(jī)。這個進(jìn)入自動駕駛汽車。它的一半可以進(jìn)入一個機(jī)器人。好吧?或者你實際上可以有,你知道,相當(dāng)敏捷和快速操作的機(jī)器人。它可能需要兩個這樣的計算機(jī)。這三臺計算機(jī)都運(yùn)行CUDA。
這使得我們能夠推進(jìn)物理AI,讓AI理解物理世界,理解物理定律、因果關(guān)系、持久性。我們有令人難以置信的合作伙伴與我們一起創(chuàng)建工廠的物理AI。我們自己也在使用它在德克薩斯州創(chuàng)建我們的工廠?,F(xiàn)在一旦我們創(chuàng)建了機(jī)器人工廠,里面有一堆機(jī)器人,而這些機(jī)器人也需要物理AI,應(yīng)用物理AI并在可視化孿生中工作。
讓我們看看美國的再工業(yè)化。在德克薩斯州的休斯頓,富士康正在建設(shè)一個最先進(jìn)的機(jī)器人設(shè)施,用于制造英偉達(dá)AI基礎(chǔ)設(shè)施系統(tǒng)。面對勞動力短缺和技能差距,數(shù)字化、機(jī)器人技術(shù)和物理AI比以往任何時候都更加重要。工廠在Omniverse中以數(shù)字方式誕生。富士康工程師在基于Omniverse技術(shù)的西門子數(shù)字孿生解決方案中組裝他們的虛擬工廠。每個系統(tǒng),機(jī)械、電氣、管道,都在施工前經(jīng)過驗證。
西門子Plant Simulation運(yùn)行設(shè)計空間探索優(yōu)化,以確定理想的布局。當(dāng)出現(xiàn)瓶頸時,工程師使用由西門子TeamCenter管理的更改來更新布局。
在Isaac Sim中,相同的數(shù)字孿生用于訓(xùn)練和模擬機(jī)器人AI。在裝配區(qū),發(fā)那科機(jī)械手構(gòu)建GB300托盤模塊。由FII的靈巧機(jī)械手和熟練的AI將母線排安裝到托盤中。AMR(自主移動機(jī)器人)將托盤運(yùn)送到測試艙。富士康使用Omniverse進(jìn)行大規(guī)模傳感器模擬,機(jī)器人AI在其中學(xué)習(xí)作為車隊協(xié)同工作。在Omniverse中,基于英偉達(dá)Metropolis和Cosmos構(gòu)建的視覺AI智能體從上方監(jiān)視機(jī)器人車隊和工人以監(jiān)控操作,并在出現(xiàn)異常、安全違規(guī)甚至質(zhì)
人與機(jī)器人協(xié)同工作。這就是制造業(yè)的未來,工廠的未來。我想感謝我們的合作伙伴富士康,他們的CEO就在這里。
所有這些生態(tài)系統(tǒng)合作伙伴使得我們創(chuàng)建機(jī)器人工廠成為可能。你知道,完成這項工作所需的軟件量如此巨大,除非你能在數(shù)字孿生中完成,在這個星球上設(shè)計它,在數(shù)字孿生中操作它,否則讓這個正常工作的希望很渺茫。我也非常高興地看到,Caterpillar,我的朋友Joe Creed和他有百年歷史的公司也正在將數(shù)字孿生融入他們制造這些工廠的方式中。
我們將擁有未來的機(jī)器人系統(tǒng)。而最先進(jìn)的系統(tǒng)之一是Figure。Brett Abcock今天在這里,他剛在三年前創(chuàng)立了一家公司。他們今天價值近400億美元。我們正在一起合作訓(xùn)練AI,、訓(xùn)練機(jī)器人、模擬機(jī)器人,當(dāng)然,還有進(jìn)入Figure的機(jī)器人計算機(jī)。真的很驚人。我有幸看到了它。它真的非常了不起。
還有我的朋友馬斯克也在研究人形機(jī)器人,這很可能將成為最大的新型消費(fèi)電子市場之一,并且肯定也是最大的工業(yè)設(shè)備市場之一。Peggy Johnson,Agility的同事們正在與我們合作,是關(guān)于倉庫自動化機(jī)器人的。Johnson & Johnson的同事們再次與我們合作,訓(xùn)練機(jī)器人,在數(shù)字孿生中模擬以及操作機(jī)器人。這些Johnson & Johnson的手術(shù)機(jī)器人甚至將執(zhí)行完全現(xiàn)代的非侵入性手術(shù),其精度將是世界前所未見的。當(dāng)然,還有最可愛的機(jī)器人,迪士尼機(jī)器人。這個真的非常貼近我們的心。我們正與迪士尼研究部門合作,基于一項革命性的技術(shù),開發(fā)一個全新的框架和模擬平臺,使得機(jī)器人能夠在一個物理上準(zhǔn)確、基于物理的環(huán)境里學(xué)習(xí)如何成為一個好機(jī)器人。讓我們看看它。
(現(xiàn)場播放了一段機(jī)器人相關(guān)視頻)
現(xiàn)在,記住,你剛剛看到的一切… 那不是動畫,不是電影,是模擬。那個模擬是在Omniverse中實現(xiàn)的,是數(shù)字孿生。所以這些工廠的數(shù)字孿生、倉庫的數(shù)字孿生、手術(shù)室的數(shù)字孿生,他們學(xué)習(xí)如何操作和導(dǎo)航、與世界互動的數(shù)字孿生,而且全部都是實時完成的。這將成為世界上最大的消費(fèi)電子產(chǎn)品線,這是人形機(jī)器人的未來,
當(dāng)然,現(xiàn)在人形機(jī)器人仍在開發(fā)中。但與此同時,有一種機(jī)器人顯然正處于拐點,并且基本上已經(jīng)到來,那就是輪式機(jī)器人。機(jī)器人出租車本質(zhì)上是一個AI司機(jī)。
現(xiàn)在我們今天要做的一件事是,發(fā)布英偉達(dá)Drive Hyperion。
這是件大事!我們創(chuàng)建了這個架構(gòu),以便世界上每家汽車公司都能制造汽車。車輛可以是商用的,可以是乘用的,可以專用于機(jī)器人出租車。制造作為機(jī)器人出租車的車輛。
本質(zhì)上,3個環(huán)繞攝像頭和雷達(dá)、激光雷達(dá)使我們能夠?qū)崿F(xiàn)最高水平的環(huán)繞繭式傳感器感知和冗余,這是最高安全級別所必需的。Drive Hyperion現(xiàn)在已被梅賽德斯-奔馳等采用了,未來還有許多其他汽車企業(yè)會采用。
(現(xiàn)場播放了一段機(jī)器人自動駕駛相關(guān)視頻)
好吧,所以這就是我們今天討論的內(nèi)容。我們討論了大量的事情,核心是兩個平臺轉(zhuǎn)型,從通用計算轉(zhuǎn)向加速計算,以及英偉達(dá)CUDA。而那套名為CUDA-X的庫使我們能夠涉足幾乎每個行業(yè),并且我們正處在拐點上。它現(xiàn)在正在增長,正如良性循環(huán)所預(yù)示的那樣,第二個拐點現(xiàn)在正降臨到我們身上。
第二個平臺轉(zhuǎn)型,AI,從經(jīng)典的手寫軟件轉(zhuǎn)向人工智能。兩個平臺轉(zhuǎn)型同時發(fā)生,這就是為什么我們感受到了如此驚人的增長。
我們談到了量子計算、開源模型。在企業(yè)方面,我們與CrowdStrike和Palantir合作,加速他們的平臺。我們談到了機(jī)器人技術(shù),它即將成為最大的消費(fèi)電子和工業(yè)制造領(lǐng)域之一。當(dāng)然,我們還談到了6G,英偉達(dá)為6G提供了新平臺。我們稱之為Arc。我們?yōu)闄C(jī)器人汽車提供了新平臺,我們稱之為Hyperion。
我們甚至為工廠提供了新平臺,兩種類型的工廠:AI工廠,我們稱之為DSX。然后是應(yīng)用AI的工廠,我們稱之為Mega。所以現(xiàn)在我們也在美國進(jìn)行制造。
女士們先生們,感謝你們今天蒞臨,感謝你們允許我將GTC帶到華盛頓特區(qū)。我們希望每年都能在這里舉辦。感謝你們所有人,讓美國再次偉大。謝謝!
(主題演講在觀眾的掌聲和機(jī)器人舞蹈的視頻影像中結(jié)束。)
(本文首發(fā)于巴倫中文網(wǎng),作者|胡珈萌,編輯|蔡鵬程)







快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機(jī)號后發(fā)表評論