Momenta CEO 曹旭東
很長一段時間里,自動駕駛行業(yè)喜歡討論路線之爭。
端到端、世界模型、VLA、大模型、強化學(xué)習(xí)、無圖、輕圖……每隔一段時間,行業(yè)都會出現(xiàn)一個新的關(guān)鍵詞。車企發(fā)布會上的技術(shù)名詞越來越密集,供應(yīng)商之間的表達也越來越接近。乍一看,大家都在往同一個方向走。
但 Momenta CEO 曹旭東認為,真正的差距并不在這些單點技術(shù)名詞上。
在北京車展期間的交流中,他多次提到一個判斷:自動駕駛行業(yè)真正的壁壘,已經(jīng)不再是某個單點算法,而是架構(gòu)、體系和組織能力。算法可以被學(xué)習(xí),人才會流動,技術(shù)概念也會快速擴散,但一家企業(yè)能不能把數(shù)據(jù)變成能力,把能力變成產(chǎn)品,把產(chǎn)品變成商業(yè)閉環(huán),才是決定行業(yè)格局的核心。
他用了一個很形象的比喻:數(shù)據(jù)不是金礦,而是“含礦量很低的鐵礦石”。擁有海量原始數(shù)據(jù),只是價值源頭的10%,剩下90%的價值,來自如何把貧礦變成富礦,再把富礦變成鋼鐵、發(fā)動機,最終裝到車上。
這也是 Momenta 在這輪自動駕駛競爭中想強調(diào)的東西:自動駕駛的下半場,不是堆數(shù)據(jù)和喊模型,而是體系戰(zhàn)爭。
過去兩年,中國智能駕駛供應(yīng)商開始密集進入國際車企體系。Momenta 已經(jīng)與奔馳、大眾、豐田、本田、日產(chǎn)、通用、福特等全球主流品牌建立量產(chǎn)合作關(guān)系。曹旭東說,和國際 OEM 合作,最常見的挑戰(zhàn)是“中國速度”和“國際標(biāo)準(zhǔn)”的沖突,但只要圍繞用戶價值共創(chuàng),很多矛盾可以找到創(chuàng)新性的解法。
與此同時,自動駕駛也被他放進了一個更大的坐標(biāo)里:物理 AI。
在曹旭東看來,自動駕駛很可能是物理 AI 最先跑通規(guī)模化閉環(huán)的領(lǐng)域。因為它已經(jīng)率先實現(xiàn)了數(shù)據(jù)閉環(huán)和商業(yè)閉環(huán),而這兩者一旦互相正反饋,就可能推動能力快速跨越人類水平。機器人也會走向類似方向,但距離規(guī)?;]環(huán)還需要更長時間。
“物理 AI 是需要門票的。”曹旭東說,這張門票不是一個漂亮的技術(shù)概念,而是能支撐長期研發(fā)的現(xiàn)金流業(yè)務(wù)。
“原始數(shù)據(jù)只是價值源頭的10%,剩下90%來自體系”
問:Momenta一直強調(diào)數(shù)據(jù)驅(qū)動?,F(xiàn)在行業(yè)里也有一種說法,數(shù)據(jù)本身并不難,難的是用好數(shù)據(jù)。你怎么看?
曹旭東:數(shù)據(jù)這件事情,不是單單的數(shù)據(jù)本身。你可以認為數(shù)據(jù)是礦石,而且是含礦量很低的鐵礦石。你要真正把數(shù)據(jù)用起來,首先要把貧礦變成富礦。
比如我剛才分享的,高速上三只小狗排隊橫穿高速,這樣的場景真的是萬中無一。你怎么把這個數(shù)據(jù)挑出來?這本身就是大海撈針級別的難度。
但這只是第一步。你要把貧礦變成富礦,再從富礦變成鋼鐵,鋼鐵又變成發(fā)動機,發(fā)動機最終裝到車上,這才是最終價值。
所以,整個數(shù)據(jù)飛輪是一個體系能力。擁有原始數(shù)據(jù),哪怕?lián)碛泻A吭紨?shù)據(jù),也只是價值源頭的10%,剩下90%來自體系。
問:那 Momenta 是怎么把數(shù)據(jù)真正用起來的?
曹旭東:我們的大模型細節(jié)不能說太多,但可以分享一個大致過程。它分為預(yù)訓(xùn)練和 Post-Training 兩個階段。
預(yù)訓(xùn)練階段,數(shù)據(jù)來自我們量產(chǎn)車的大規(guī)模數(shù)據(jù)?,F(xiàn)在我們已經(jīng)有80萬臺量產(chǎn)車,這些量產(chǎn)數(shù)據(jù)里包括大量長尾場景。我們會通過 World Model Pre-Training 預(yù)訓(xùn)練模型。
預(yù)訓(xùn)練讓模型具備物理常識,但有物理常識不代表它是一個好司機。大量數(shù)據(jù)里面有好的駕駛行為,也有很多不好的駕駛行為。這一點和數(shù)字 AI 里的大模型訓(xùn)練類似,海量數(shù)據(jù)可以讓模型具備世界常識,但不意味著它有好的行為。
所以還需要 Post-Training,把模型的行為激發(fā)出來,或者說對齊到人類好的駕駛行為上去。
“單點算法沒有長期壁壘,真正的差距在體系和組織”
問:今年車展上,很多車企都在強調(diào)輔助駕駛技術(shù)路線,比如小鵬的 VLA、華為乾崑 ADS。Momenta 世界模型最大的特點是什么?
曹旭東:我覺得更重要的不是單點算法,而是架構(gòu)能力。
架構(gòu)能力比單點算法能力更強。因為一旦涉及架構(gòu),就一定涉及取舍。不是所有創(chuàng)新都能放到同一個架構(gòu)里面。好的架構(gòu)能實現(xiàn)更好的積累和合力。
架構(gòu)之上還有體系。這個體系包括數(shù)據(jù)迭代體系、訓(xùn)練體系、驗證體系,也包括整個迭代體系。體系之上,則是組織和文化。
根本上,企業(yè)之間的差距來自組織、文化和體系建設(shè)。單點算法當(dāng)然很重要,每一代算法架構(gòu)創(chuàng)新都會帶來大的進步。但坦率來說,在中國環(huán)境下,知識流動和人才流動都很快,僅僅靠單點算法,并不存在特別大的長期壁壘。
有壁壘的是體系和組織能力。
所以你會發(fā)現(xiàn),大家說的可能是同樣的單點算法方向,但最終做出來的效果可能差一代甚至兩代。背后不是單點算法的差距,而是體系和組織的差距。
“中國技術(shù)出海,反向合資會是一個共贏模式”
問:現(xiàn)在全球汽車產(chǎn)業(yè)出現(xiàn)一種新的趨勢,越來越多海外車企看重中國科技公司,甚至出現(xiàn)所謂‘反向合資’。你怎么看?
曹旭東:中國技術(shù)正在從中國走向世界,速度非???。進入歐洲等海外市場時,中國技術(shù)可以給當(dāng)?shù)赜脩魩砀I(lǐng)先的產(chǎn)品價值,但另一方面,也會對當(dāng)?shù)毓?、就業(yè)和稅收產(chǎn)生沖擊。
比較好的解決方案,就是借鑒中國之前的發(fā)展模式,做反向合資。
反向合資之后,一方面讓當(dāng)?shù)赜脩粝硎艿街袊呖萍紟淼暮卯a(chǎn)品和好體驗;另一方面,中國技術(shù)也能賦能當(dāng)?shù)仄髽I(yè),給當(dāng)?shù)貛砀喟l(fā)展機會、就業(yè)機會和稅收。這是一個共贏模式。
問:Momenta 與外資車企合作時,最大的挑戰(zhàn)是什么?
曹旭東:我們現(xiàn)在已經(jīng)是全球品牌的共同選擇。全球頂尖品牌里,德系的 BBA、大眾,日系的豐田、本田、日產(chǎn),美系的通用、福特,都已經(jīng)是我們的量產(chǎn)合作客戶。
挑戰(zhàn)最常見的是,中國速度和國際 OEM 標(biāo)準(zhǔn)之間有時會矛盾和沖突。但這個矛盾和沖突,只要圍繞客戶和用戶價值去共創(chuàng),很多時候都能找到更好的創(chuàng)新方法,帶來更好的結(jié)果。
“自動駕駛是物理 AI 的序章”
問:物理 AI 最近非常熱。你覺得 Momenta 在物理 AI 里處于什么位置?
曹旭東:物理 AI 是大勢所趨。
數(shù)字 AI 有很大優(yōu)勢。第一個優(yōu)勢是數(shù)據(jù)能夠快速、大規(guī)模獲得。比如 GPT 所需要的是互聯(lián)網(wǎng)數(shù)據(jù),互聯(lián)網(wǎng)數(shù)據(jù)天然就是大規(guī)模的。第二個優(yōu)勢是數(shù)字 AI 的驗證成本更低、周期更短。Agent 調(diào)用一個工具,可能只需要一個接口。
但機器人要調(diào)用一個工具,就要先把機械手造出來,再抓取工具、使用工具,難度和復(fù)雜度都大很多。
我們所處的世界既有數(shù)字部分,也有物理部分,而且物理部分可能更大。所以當(dāng)數(shù)字世界取得巨大進展后,很多成功經(jīng)驗和方法自然會進入物理世界。
現(xiàn)在只是物理 AI 的序章剛開始。
講到物理 AI,最核心的是兩個閉環(huán):數(shù)據(jù)閉環(huán)和商業(yè)閉環(huán)。這兩者是互動的。
我有一個觀察:任何一個人工智能應(yīng)用,一旦接近人類水平,就會在很短時間內(nèi)大幅超過人類水平。AlphaGo如此,人臉識別也是如此。前面接近人類可能花了十年、二十年,但超過人類,可能只需要一兩年、兩三年。
背后的邏輯,就是數(shù)據(jù)閉環(huán)和商業(yè)閉環(huán)的正反饋。先有數(shù)據(jù)閉環(huán),才有足夠好的體驗;體驗一旦接近甚至超過人類水平,就能實現(xiàn)爆發(fā)式商業(yè)化;商業(yè)化又帶來數(shù)據(jù)爆發(fā)式增長;數(shù)據(jù)增長再推動模型能力繼續(xù)增長。
自動駕駛正在進入這個階段。機器人還需要一段時間。自動駕駛是物理 AI 的序章,因為它最先實現(xiàn)了規(guī)?;臄?shù)據(jù)閉環(huán)和商業(yè)閉環(huán)。
“物理 AI 是需要門票的,門票就是現(xiàn)金流業(yè)務(wù)”
問:為什么你認為自動駕駛會比機器人更早進入物理 AI 的規(guī)?;A段?
曹旭東:自動駕駛要實現(xiàn)規(guī)?;?L4,我判斷累計投入至少是百億美金級別,而且這可能還是創(chuàng)業(yè)公司的研發(fā)效率。如果是大公司,可能不只是百億美金,而是幾百億美金。
通用機器人需要多少錢?我的判斷可能是幾百億美金到千億美金級別,而且這也可能還是創(chuàng)業(yè)公司的研發(fā)效率。
所以,物理 AI 是需要門票的。這個門票就是你需要有現(xiàn)金流業(yè)務(wù)。
雖然現(xiàn)在中國具身智能資本市場非?;钴S,但長期來看,靠投資、靠融資去追蹤做成通用物理 AI,或者物理世界 AGI,是不現(xiàn)實的。一定要有現(xiàn)金流業(yè)務(wù)支撐物理 AI 研發(fā)。
這個現(xiàn)金流業(yè)務(wù)可以是自動駕駛,也可以是物理 AI 的某個方向,或者來自數(shù)字 AI 的現(xiàn)金流業(yè)務(wù)。無論如何,一定要有現(xiàn)金流業(yè)務(wù)支撐長期研發(fā)。
“一個自動駕駛大模型,可以覆蓋所有垂直場景”
問:今年 Momenta 的 L4 業(yè)務(wù)有什么進展?Robotaxi 賽道玩家越來越多,Momenta 的優(yōu)勢是什么?
曹旭東:Momenta 的 L4 不只做 Robotaxi,也會做 Robovan,也就是物流。我們十年前的愿景里,就有物流和出行效率翻倍。實際上物流放在更前面,出行放在后面。明年我們還會做 Robotruck,今年不會做,但明年會做。
背后的底層邏輯,是我們相信一個自動駕駛大模型能夠?qū)崿F(xiàn)所有自動駕駛垂直應(yīng)用,并且做得更好。
這件事我們已經(jīng)在 Robotaxi、Robovan 和乘用車上驗證過,并取得了很好的效果。
它帶來的價值是,每一個 vertical 的研發(fā)成本會大幅降低。每個應(yīng)用場景、每個垂直領(lǐng)域的經(jīng)驗和數(shù)據(jù),又可以匯總、吸收到同一個大模型里,讓每個垂直領(lǐng)域做得更好。
這就是平臺優(yōu)勢。
有點像十年前互聯(lián)網(wǎng)行業(yè)有垂直電商,也有平臺電商。最后勝出的往往是平臺電商,重要原因就是平臺效應(yīng)。
我們的判斷是,自動駕駛大模型領(lǐng)域也存在很強的平臺效應(yīng)。一個大模型能夠覆蓋所有垂直領(lǐng)域,每個領(lǐng)域成本更低,效果也會更好。
“自動駕駛會比芯片行業(yè)更快收斂”
問:你怎么看智駕供應(yīng)商格局?未來會一直是華為、Momenta 和少數(shù)玩家,還是會有更多供應(yīng)商趕上來?2030年會不會迎來終局?
曹旭東:自動駕駛有非常強的規(guī)模效應(yīng)和先發(fā)優(yōu)勢,而且這個效應(yīng)會比芯片行業(yè)更強。
回顧歷史,PC 芯片時代全球主要就兩家,手機芯片時代全球也就兩家,高通和 MTK。自動駕駛因為是軟件,邊際成本是零,所以規(guī)模效應(yīng)更強。
它的規(guī)模效應(yīng)不只是成本上的規(guī)模效應(yīng),還有體驗提升上的規(guī)模效應(yīng)。
另一方面,面向主機廠也有很強的先發(fā)優(yōu)勢。汽車行業(yè)很多業(yè)務(wù)都是敲門敲三年。從見到客戶到拿下合同,國內(nèi) OEM 可能需要三年,國際 OEM 可能需要五到七年。
比如奔馳。2017年奔馳投資了我們,當(dāng)時 Ola Källenius,也就是現(xiàn)在奔馳董事長,覺得 Momenta 很有活力,選擇投資我們。但我們和奔馳的第一個量產(chǎn)項目真正上市,是2025年后半年,整整經(jīng)歷了八年時間,而且這已經(jīng)算加速了。
2017年到2020年是 POC,2020年到2022年是 Pre-SOP,2022年到2024年是小批量量產(chǎn)開發(fā),到了2024年才拿到奔馳所有電車和油車業(yè)務(wù),2025年底才真正量產(chǎn)。
所以這個行業(yè)有非常強的規(guī)模效應(yīng)和先發(fā)優(yōu)勢。我還是維持原來的判斷:中國最終可能只有2到3家,全球可能只有3到4家,會非常快速地收斂。
“創(chuàng)業(yè)十年,最重要的是和志同道合的人做真正喜歡的事”
問:今年是 Momenta 成立十周年。從創(chuàng)業(yè)到現(xiàn)在,你最大的感受是什么?
曹旭東:我覺得自己蠻幸運。
一路走來,最重要的還是跟志同道合的人,去干真正喜歡的事情。這會讓你的人生生機勃勃。
創(chuàng)業(yè)過程中有很多困難和挑戰(zhàn)。每一年你都會覺得,今年可能是最難的一年,過了今年明年會更好。但實際上不是。
所以,如果你不享受發(fā)現(xiàn)問題、解決問題的過程,不享受和身邊志同道合的人一起探索、面對困難、解決困難,創(chuàng)業(yè)中的這些困難很難堅持下去。
咬著牙堅持一年、兩年、三年可能可以,但很難堅持十年。
你一定要找到志同道合的人,去干喜歡的事情,讓自己的人生生機勃勃。
(作者|李玉鵬,編輯|楊林)
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論