圖片系AI 生成

英偉達GTC大會再次把“物理AI”推到了臺前。

3月17日,英偉達GTC 2026在美國舉行,和往年相比,這屆GTC對外釋放的信號更直接:英偉達已經(jīng)不滿足于把AI停留在數(shù)字世界,而是把“Physical AI”推到了舞臺中央。

官方議程把 physical AI 與 agentic AI、AI factories 并列為大會主線;黃仁勛在相關發(fā)布中也把重點放在機器人、仿真、世界模型和開放數(shù)據(jù)工廠上,試圖把“會算”的AI,進一步推進到“會感知、會判斷、會行動”的AI。

在這個背景下,元戎啟行CTO曹通易在GTC上介紹了Foundation Model(基座模型)為核心重構(gòu)的輔助駕駛技術體系。 這家公司試圖把輔助駕駛從一個單點產(chǎn)品,重新定義為物理世界AI的一種落地形態(tài)。換句話說,車不再只是終點,而是起點。

1、汽車只是物理AI的一部分

英偉達這次發(fā)布的新內(nèi)容里,既有面向機器人和工業(yè)場景的 Isaac 仿真框架、GR00T 模型,也有面向 physical AI 訓練的數(shù)據(jù)工廠藍圖;官方甚至明確提到,這套體系將用于機器人、視覺AI代理和自動駕駛開發(fā)。

這背后其實是一個比較明顯的產(chǎn)業(yè)判斷:過去幾年,AI主要解決的是“理解文本、生成內(nèi)容、輔助決策”的問題;接下來要解決的,是如何讓系統(tǒng)進入現(xiàn)實空間,在復雜環(huán)境里感知、推理、行動,并且承擔結(jié)果。

對汽車行業(yè)來說,這件事并不抽象。輔助駕駛本質(zhì)上就是最早、最成熟、也是最嚴苛的 physical AI 試驗場之一。因為車每天都在真實道路中運行,場景開放、變量密集、容錯極低,遠比很多封閉環(huán)境里的機器人更難。

所以,元戎啟行選擇在GTC這個時間點,把自己的技術體系和“物理世界AI基座”綁定,并不是在追熱點,而是在順著英偉達定義的新敘事往前走。問題不在于它會不會講故事,而在于這個故事有沒有產(chǎn)業(yè)基礎。

2、不是輔助駕駛功能,而是“統(tǒng)一大腦”

按照曹通易在GTC上的表述,元戎啟行正在用 Foundation Model 重構(gòu)下一代輔助駕駛技術體系,并將其定義為面向物理世界的AI基座模型。公開信息顯示,這套系統(tǒng)以 400 億參數(shù)規(guī)模的 VLA(視覺—語言—動作)基座模型為核心,試圖把場景理解、駕駛決策和安全評估統(tǒng)一到同一套模型架構(gòu)里,而不是像過去那樣,把感知、規(guī)劃、控制拆成多個相互耦合但并不真正統(tǒng)一的模塊。

這件事為什么重要?因為過去一代輔助駕駛系統(tǒng)最大的問題,不是功能做不出來,而是系統(tǒng)天然是“拼接式”的??匆娛且粋€模塊,理解是一個模塊,決策又是一個模塊,最后靠規(guī)則、工程經(jīng)驗和大量人工調(diào)參,把它們盡量焊在一起。

這種架構(gòu)在高速和標準化道路上還能工作,一旦進入城市、施工、混行、博弈密集的復雜場景,就容易出現(xiàn)兩個老問題:第一,系統(tǒng)知道“看到了什么”,但不一定真正理解發(fā)生了什么;第二,系統(tǒng)能完成動作,但不一定讓用戶敢持續(xù)使用。

元戎啟行現(xiàn)在想做的,是把“駕駛員”、“分析師”、“裁判員”三種能力塞進同一個基礎模型里。說白了,就是讓系統(tǒng)不只是執(zhí)行,而是先形成對物理場景的統(tǒng)一理解,再輸出動作。這種路徑和行業(yè)過去的“規(guī)則+模塊堆疊”相比,核心變化不在架構(gòu)邏輯:它希望系統(tǒng)先長出一個統(tǒng)一認知,再去調(diào)用不同能力,而不是讓不同能力各干各的。

這也是為什么曹通易會把輔助駕駛稱為基座模型的第一個“身體”。這句話聽上去很像技術圈常見的大詞,但放到產(chǎn)業(yè)邏輯里并不難理解:今天先讓模型在車上學會感知道路、處理風險、完成動作,明天同樣的認知底座,就有可能遷移到 Robotaxi,甚至更廣義的具身智能系統(tǒng)。

3、為什么是汽車先跑出來?

如果只把這套邏輯當成概念包裝,其實會低估它。元戎啟行這次最現(xiàn)實的一點,是它給終局找到了一條當前可走的路徑:先從量產(chǎn)車開始,把真實世界的數(shù)據(jù)、反饋和訓練閉環(huán)做出來。

公開報道顯示,搭載元戎啟行方案的量產(chǎn)車累計交付已超過25萬輛;公司方面同時強調(diào),這些車輛在復雜道路中的場景理解能力,可以遷移到 Robotaxi 研發(fā)中。其面向量產(chǎn)輔助駕駛的數(shù)據(jù)閉環(huán)周期已壓縮到12小時。無論這些數(shù)字最終效果如何,至少說明一件事:它不是先去做人形機器人,再倒推通用模型,而是先在車這個高頻、高風險、高反饋密度的場景里,把模型打磨出來。

這條路徑的現(xiàn)實性,恰恰在于汽車行業(yè)的特殊性。車是少數(shù)已經(jīng)具備規(guī)?;布d體、持續(xù)在線運行環(huán)境、海量真實場景數(shù)據(jù),以及明確安全邊界要求的行業(yè)。

換句話說,汽車很可能是離物理AI最近的訓練場。英偉達對 physical AI 的最新布局里,也一再把自動駕駛和機器人并列:從 Cosmos 世界模型,到開放數(shù)據(jù)工廠藍圖,再到面向自動駕駛長尾場景的開放模型家族,底層思路都指向同一個方向——用更統(tǒng)一的世界建模和仿真能力,處理真實世界里最昂貴的長尾問題。

所以,汽車行業(yè)積累的數(shù)據(jù)、算力和工程體系,不只能服務于賣車,也可能反過來成為物理AI時代最先成型的一塊底座,因為車是最貴也最有效的數(shù)據(jù)源。

4、是中國智駕公司開始搶解釋權(quán)

當然,這條路線還遠沒到可以下結(jié)論的時候。Foundation Model 能不能真正解決輔助駕駛里的安全一致性、責任邊界和長尾穩(wěn)定性,最終還要看量產(chǎn)表現(xiàn),而不是技術演講。尤其在智能駕駛領域,所有宏大敘事最后都要落到一個最樸素的問題上:用戶敢不敢開,車企敢不敢上,監(jiān)管敢不敢放。

但從行業(yè)競爭的角度看,元戎啟行在GTC釋放這個信號,仍然值得重視。因為過去兩年,汽車AI的主導敘事,基本掌握在特斯拉、英偉達這樣的平臺型巨頭手里。中國智駕公司更多是在做應用落地、性能追趕和成本優(yōu)化,很少有人試圖從“底層范式”層面重新定義自己。

元戎啟行這次的動作,本質(zhì)上是在爭奪一個新的解釋權(quán):它不滿足于被理解成一家輔助駕駛供應商,而是試圖把自己放進物理AI的更大坐標系里。

這件事能不能成功,現(xiàn)在還言之過早。但有一點已經(jīng)越來越清楚:輔助駕駛行業(yè)正在進入一個新階段。過去比的是有沒有功能、有沒有地圖、能不能開;接下來比的,是誰能先做出一個足夠統(tǒng)一、足夠可遷移、足夠能在真實世界里持續(xù)學習的“大腦”,只有這個才能拉開差距。(作者|李玉鵬,編輯|李程程)

轉(zhuǎn)載請注明出處、作者和本文鏈接
聲明:文章內(nèi)容僅供參考、交流、學習、不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

掃描下載App