以下為李飛飛訪談實(shí)錄:

1、空間智能是AI的下一個(gè)前沿領(lǐng)域

主持人:很高興能親眼見(jiàn)證World Labs在過(guò)去一年中所取得的進(jìn)展。讓我們先來(lái)聊聊你們正在做的事情,以及它為何如此重要。

李飛飛:現(xiàn)在我每天醒來(lái)腦子里只思考一件事,那就是空間智能(spatial intelligence)。大約兩年前,我與一群年輕的技術(shù)專家共同創(chuàng)立了World Labs。為什么空間智能如此重要?我認(rèn)為它是AI的下一個(gè)前沿領(lǐng)域。如果從進(jìn)化的角度看待智能發(fā)展,這段歷史可以追溯到5億多年前。最先開(kāi)啟神經(jīng)系統(tǒng)演化競(jìng)賽的是感知而非語(yǔ)言。相比之下,語(yǔ)言是一種非常新穎的智能形式,歷史大概只有50萬(wàn)年。但在15億年前,動(dòng)物就開(kāi)始感知光線并觸摸環(huán)境,從而產(chǎn)生了觸覺(jué)、視覺(jué)、本能和知覺(jué)。

“本能”這個(gè)詞雖然有些模糊,但不可否認(rèn)的是,正是通過(guò)觸覺(jué)和視覺(jué)與物理世界進(jìn)行身體接觸,才開(kāi)啟了神經(jīng)系統(tǒng)的發(fā)育,引發(fā)了動(dòng)物進(jìn)化的軍備競(jìng)賽。這使得生物在與環(huán)境交互中變得越來(lái)越活躍,也越來(lái)越智能。我想表達(dá)的是,在真實(shí)的3D、4D物理世界中進(jìn)行理解、推理、交互和導(dǎo)航的能力是基礎(chǔ)性的,與語(yǔ)言智能同樣重要。這一核心關(guān)鍵技術(shù)就是空間智能。這就是為什么我認(rèn)為它是AI的下一代前沿領(lǐng)域,也是World Labs一直致力于構(gòu)建的目標(biāo)。

主持人:請(qǐng)跟我們聊聊Marble,這是你們最近剛剛發(fā)布的產(chǎn)品。究竟什么是Marble?

李飛飛:Marble是我們第一代空間智能模型。雖然我們常隨口稱其為世界模型(world model),但鑒于目前關(guān)于世界模型的定義繁多,稱謂其實(shí)并不重要。本質(zhì)上,這是一個(gè)前沿的空間智能模型。Marble能接收多模態(tài)輸入,無(wú)論是句子、圖片、視頻還是簡(jiǎn)單的3D輸入,并將這些提示詞轉(zhuǎn)化為一個(gè)完全可導(dǎo)航、可交互且具有永久一致性的3D世界。這與大家現(xiàn)在看到的視頻模型截然不同,Marble生成的環(huán)境擁有幾何結(jié)構(gòu),支持模擬機(jī)器人動(dòng)作或編寫游戲代碼等操作。

李飛飛:我們大約兩個(gè)月前發(fā)布了Marble。雖然它仍處于起步階段,是第一代產(chǎn)品,但作為最先進(jìn)的3D生成式世界模型,我們對(duì)開(kāi)啟這段旅程感到非常激動(dòng)。

主持人:有一種觀點(diǎn)認(rèn)為,如果僅僅依賴語(yǔ)言模型,我們將無(wú)法實(shí)現(xiàn)AGI,必須對(duì)自身的物理性進(jìn)行某種增強(qiáng)。您顯然深信這一點(diǎn)。那么請(qǐng)談?wù)勥@個(gè)維度,隨著時(shí)間推移,未來(lái)五年最重要的突破點(diǎn)會(huì)是什么?除了機(jī)器人技術(shù)這個(gè)顯而易見(jiàn)的用例,還有哪些我們今天無(wú)法想象的應(yīng)用?

李飛飛:其實(shí)不需要等五年,我們的用戶和客戶已經(jīng)開(kāi)始嘗試早期版本的模型了。我們看到用戶利用它開(kāi)發(fā)游戲;視覺(jué)特效(VFX)客戶將其用于商業(yè)化的虛擬制作場(chǎng)景;包括Nvidia在內(nèi)的大公司、初創(chuàng)企業(yè)及學(xué)術(shù)實(shí)驗(yàn)室等合作伙伴,正在利用Marble作為訓(xùn)練環(huán)境來(lái)訓(xùn)練機(jī)器人;建筑師和設(shè)計(jì)師則用它進(jìn)行室內(nèi)設(shè)計(jì)

我們還發(fā)現(xiàn)了一些意想不到的用例。例如,臨床研究人員對(duì)Marble表現(xiàn)出了極大的熱情。大量的精神病學(xué)和心理健康研究及干預(yù)手段都需要沉浸式環(huán)境,且需針對(duì)特定情況進(jìn)行個(gè)性化定制。以強(qiáng)迫癥(OCD)為例,患者會(huì)被非常具體的場(chǎng)景觸發(fā),比如我個(gè)人會(huì)被堆積的臟衣服困擾,但每個(gè)人的觸發(fā)點(diǎn)各不相同。研究人員發(fā)現(xiàn)搭建實(shí)體環(huán)境非常困難,而Marble只需輸入提示詞,幾分鐘內(nèi)就能生成各種不同類型的環(huán)境。

此外,還有人將其用于健身訓(xùn)練,比如個(gè)性化的瑜伽環(huán)境。隨著Marble不斷完善,畢竟我們現(xiàn)在還處于早期階段,我相信未來(lái)會(huì)看到越來(lái)越多橫向的應(yīng)用場(chǎng)景。

2、AI的社會(huì)價(jià)值

主持人:你進(jìn)入AI行業(yè)已經(jīng)很長(zhǎng)時(shí)間了。

李飛飛:這是在委婉地討論我的年齡。

主持人:不,我的意思是,你不僅僅是那種跟風(fēng)研究了三年的人,而是將畢生精力都奉獻(xiàn)給了AI。當(dāng)你創(chuàng)立這家公司并著手構(gòu)建空間智能時(shí),最讓你感到驚訝的是什么?

李飛飛:這個(gè)問(wèn)題問(wèn)得很好。正如我們討論過(guò)的,即便到了我們這個(gè)年紀(jì),保持求知欲和學(xué)習(xí)能力依然是最重要的事情。我投身AI領(lǐng)域已經(jīng)很多年了,最初是因?yàn)閺?qiáng)烈的好奇心,我想探索什么是智能以及如何讓機(jī)器變得智能。當(dāng)時(shí)AI還是一個(gè)無(wú)人問(wèn)津的冷門領(lǐng)域,大家甚至不知道怎么拼寫AI,那段時(shí)光非常有趣。但過(guò)去十年發(fā)生了翻天覆地的變化,AI對(duì)我而言不再僅僅是個(gè)人層面的追求,它已經(jīng)上升到了文明層面。這讓我作為教育者和企業(yè)家多了一層責(zé)任感,不僅要在技術(shù)上做出貢獻(xiàn),還要推動(dòng)其健康發(fā)展。

作為企業(yè)家,最讓我驚訝的有幾點(diǎn)。首先是過(guò)去幾年AI的發(fā)展速度令人屏息。無(wú)論我們外表如何淡定,內(nèi)心深處都難免焦慮,因?yàn)橛刑嗟恼撐囊x、太多的博客、新聞和模型發(fā)布。這種焦慮感正是我們這個(gè)時(shí)代的寫照,技術(shù)正以驚人的速度推動(dòng)我們前進(jìn)。這讓我既興奮又清醒,正如蘇格拉底所言“我一無(wú)所知”,我希望大家不要放棄學(xué)習(xí),保持好奇心。

另一點(diǎn)讓我驚訝甚至擔(dān)憂的是關(guān)于AI的極化言論。網(wǎng)絡(luò)上的討論往往是非黑即白的:要么是完全的技術(shù)烏托邦主義,忽略了技術(shù)是一把雙刃劍;要么就是末日論調(diào),仿佛人類時(shí)刻面臨生存危機(jī)。對(duì)于一項(xiàng)對(duì)人類文明如此深遠(yuǎn)的技術(shù),這種討論方式是不負(fù)責(zé)任的。主動(dòng)權(quán)掌握在每一位企業(yè)家、產(chǎn)品經(jīng)理、工程師和公民手中,我們需要具備能動(dòng)性來(lái)引導(dǎo)技術(shù)的發(fā)展。我真心希望在邁向2026年及未來(lái)的過(guò)程中,我們能更客觀、細(xì)膩且心懷仁慈地看待AI,既保持樂(lè)觀,又肩負(fù)起責(zé)任,而不是為了博取眼球去發(fā)表極端言論。

主持人:在你心中,未來(lái)幾年AI取得什么樣的成果才算成功?我很喜歡你提到的這種兩極分化的觀點(diǎn),要么工作全部消失盯著大海發(fā)呆,要么技術(shù)完全沒(méi)用。

李飛飛:如果我們把時(shí)間回?fù)芤话俣嗄辏胂笠幌庐?dāng)時(shí)的人們?nèi)绾味x電力的成功。很難想象那個(gè)版本的我們能預(yù)見(jiàn)到今天的景象,但我希望那時(shí)的愿景是:學(xué)校燈火通明,家園溫暖如春,機(jī)器被賦予力量實(shí)現(xiàn)工業(yè)化,進(jìn)而延長(zhǎng)人類壽命,讓更多孩子接受教育。這就是技術(shù)和AI的意義,是一種永恒的價(jià)值。成功的定義應(yīng)該是文明變得更加美好,而文明是由每一個(gè)追求幸福、繁榮且擁有尊嚴(yán)的個(gè)體組成的。這就是AI以及每一項(xiàng)技術(shù)成功的定義。

3、世界模型與具身智能的技術(shù)難點(diǎn)

主持人:接下來(lái)我們談?wù)剳?zhàn)術(shù)層面。Large World Models(大型世界模型)的計(jì)算密集度是否與Language Models(語(yǔ)言模型)相當(dāng)?

李飛飛:首先,存在不同種類的大型世界模型。我們致力于創(chuàng)建具有顯式3D表示的世界模型,以賦能機(jī)器人、游戲、娛樂(lè)和設(shè)計(jì)等領(lǐng)域。還有一類通常被稱為世界模型的其實(shí)是視頻生成模型。目前我們的模型規(guī)模并沒(méi)有那么大。從宏觀視角來(lái)看,GPT-5的訓(xùn)練量大約在10的26次方flops(每秒浮點(diǎn)計(jì)算)左右,而我們的Marble模型在規(guī)模上仍要小幾個(gè)數(shù)量級(jí)。

主持人:這僅僅是因?yàn)闆](méi)有足夠的數(shù)據(jù)來(lái)喂給這些模型嗎?

李飛飛:我認(rèn)為兩者兼而有之。規(guī)模化確實(shí)始于數(shù)據(jù)和模型參數(shù),數(shù)據(jù)起到了重要作用。但另一方面,這個(gè)領(lǐng)域還處于早期階段。Transformer論文發(fā)表于2016年左右,語(yǔ)言模型的發(fā)展已經(jīng)快十年了,而世界模型是一個(gè)新得多的領(lǐng)域。雖然過(guò)去兩年我們降低了一些科學(xué)風(fēng)險(xiǎn),但仍處于探索模型架構(gòu)的相對(duì)早期階段,所以規(guī)模較小。不過(guò)考慮到我們實(shí)驗(yàn)室以及整個(gè)領(lǐng)域的進(jìn)展,接下來(lái)的幾年將會(huì)非常令人興奮,我們將見(jiàn)證大型世界模型在Scaling Law(規(guī)模定律)曲線上的飛躍。

主持人:這讓我很著迷。語(yǔ)言模型是在互聯(lián)網(wǎng)上免費(fèi)、公開(kāi)的數(shù)據(jù)上訓(xùn)練的,獲取海量數(shù)據(jù)相對(duì)容易。但物理數(shù)據(jù)很難獲取,因此合成數(shù)據(jù)(Synthetic Data)變得至關(guān)重要,同時(shí)你也需要以更慢的速度去收集真實(shí)數(shù)據(jù)。這帶來(lái)了哪些限制?世界模型的進(jìn)步速度會(huì)因此變慢嗎?我們會(huì)擁有通用機(jī)器人,還是因?yàn)閿?shù)據(jù)限制只能擁有專用機(jī)器人?

李飛飛:這是一個(gè)信息量很大的問(wèn)題。在World Labs,我們采取混合數(shù)據(jù)策略。我非常羨慕研究語(yǔ)言的朋友,因?yàn)檎Z(yǔ)言數(shù)據(jù)的輸入是完全可觀測(cè)的、單一模態(tài)的,且含義清晰。而像素或體素構(gòu)成的3D世界則要混亂得多。為了突破技術(shù)極限創(chuàng)造3D、4D世界,我們必須意識(shí)到我們并沒(méi)有海量的3D數(shù)據(jù)。因此我們采取分層混合方法:利用互聯(lián)網(wǎng)規(guī)模的文本、圖像和視頻,結(jié)合模擬數(shù)據(jù),再加上真實(shí)世界采集的數(shù)據(jù)。這就像自動(dòng)駕駛公司花費(fèi)數(shù)十年收集真實(shí)和模擬數(shù)據(jù)一樣。

至于速度,雖然數(shù)據(jù)獲取難,但算力在增強(qiáng),芯片在進(jìn)步,整個(gè)生態(tài)系統(tǒng)也在成熟。我們現(xiàn)在合作的數(shù)據(jù)供應(yīng)商在三年前甚至不存在。合成數(shù)據(jù)確實(shí)發(fā)揮了很好的作用,而且我們正在制作的模型也將反過(guò)來(lái)為模擬世界貢獻(xiàn)數(shù)據(jù),形成飛輪效應(yīng)。

關(guān)于通用機(jī)器人,這幾句話就能概括,但做起來(lái)很難。我在斯坦福運(yùn)營(yíng)機(jī)器人實(shí)驗(yàn)室十多年,作為科學(xué)家,我必須承認(rèn)這是一個(gè)極具挑戰(zhàn)的問(wèn)題??辞灞睒O星并不意味著旅程會(huì)很短。回想2006年,我和同事帶領(lǐng)團(tuán)隊(duì)創(chuàng)造了第一輛在沙漠行駛138英里的自動(dòng)駕駛汽車,當(dāng)時(shí)我們預(yù)言20年后會(huì)有自動(dòng)駕駛汽車。直到去年,Waymo才開(kāi)始在城市街道大規(guī)模運(yùn)行,這確實(shí)是一段漫長(zhǎng)的旅程。

汽車與機(jī)器人的區(qū)別在于,汽車可以被視作一個(gè)在二維平面上移動(dòng)的方塊機(jī)器人,它的目標(biāo)是不要碰到任何東西。而機(jī)器人是一個(gè)三維實(shí)體,在三維世界中運(yùn)行,通用機(jī)器人的目標(biāo)是必須接觸物體而不破壞它們。這是一個(gè)更高維度的問(wèn)題,加上手部模擬的極高難度、視覺(jué)的精準(zhǔn)度以及空間理解的需求,挑戰(zhàn)巨大。這就是我創(chuàng)立World Labs的原因。我不喜歡過(guò)度承諾,但這確實(shí)是我們致力于解決的重要問(wèn)題。

主持人:最后,對(duì)于企業(yè)界人士,他們應(yīng)該如何看待世界模型、物理AI以及你正在思考的整個(gè)領(lǐng)域?

李飛飛:雖然我的思維方式有時(shí)候還像個(gè)研究生,總想著要有免費(fèi)食物才行,但對(duì)于企業(yè)而言,World Labs非常樂(lè)意與合作伙伴交流。世界模型和空間智能是一項(xiàng)橫向技術(shù)。我們談?wù)摍C(jī)器人、模擬和沉浸式交互娛樂(lè),但這不僅僅局限于此。我們還沒(méi)有深入探討醫(yī)療保健、教育產(chǎn)品、現(xiàn)場(chǎng)服務(wù)、金融服務(wù)、農(nóng)業(yè)制造、倉(cāng)儲(chǔ)檢測(cè)以及城市規(guī)劃等領(lǐng)域。利用空間智能我們可以做的事情還有很多,這確實(shí)是下一個(gè)前沿領(lǐng)域,我邀請(qǐng)大家無(wú)論是與我們合作還是獨(dú)立開(kāi)展研究,都加入到這個(gè)進(jìn)程中來(lái)。

本文系作者 劃重點(diǎn)KeyPoints 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

2026-02-07 22:49

國(guó)家電網(wǎng):春節(jié)假期新能源汽車充電量預(yù)計(jì)將創(chuàng)歷史新高

2026-02-07 22:30

海外并購(gòu)資產(chǎn)遭遇強(qiáng)制出售,“FTDI案”進(jìn)入關(guān)鍵節(jié)點(diǎn)

2026-02-07 22:20

元寶新春紅包新增支持分享至“派群聊”

2026-02-07 21:56

兩部門印發(fā)意見(jiàn),健全重大水利工程建設(shè)運(yùn)行管理機(jī)制

2026-02-07 21:55

中國(guó)團(tuán)隊(duì)研制出不確定度指標(biāo)最高光鐘,連續(xù)計(jì)時(shí)約720億年誤差不超過(guò)1秒

2026-02-07 21:54

中國(guó)首次實(shí)現(xiàn)5000米級(jí)高海拔超高壓等電位帶電作業(yè)

2026-02-07 21:20

寧夏:累計(jì)外送電量突破9000億千瓦時(shí),新能源占比近三成

2026-02-07 20:39

四川省最大天然氣發(fā)電基地全面建成投產(chǎn)

2026-02-07 20:38

2月7日新聞聯(lián)播速覽23條

2026-02-07 20:35

擬取得東方金信13.12%股權(quán),日辰股份收上交所監(jiān)管工作函

2026-02-07 20:34

巴塞羅那足球俱樂(lè)部宣布正式退出歐洲超級(jí)聯(lián)賽

2026-02-07 20:32

北京市醫(yī)保局組織召開(kāi)精神疾病類醫(yī)保定點(diǎn)醫(yī)療機(jī)構(gòu)集體約談工作會(huì)

2026-02-07 20:31

韓國(guó)非洲豬瘟疫情蔓延,近期豬肉價(jià)格有所上漲

2026-02-07 20:29

中國(guó)農(nóng)業(yè)發(fā)展銀行黨委委員、副行長(zhǎng)徐一丁被查

2026-02-07 20:29

2026年米蘭-科爾蒂納冬奧會(huì)首金產(chǎn)生

2026-02-07 19:25

特朗普在經(jīng)濟(jì)演講中宣稱通脹勝利近20次,盡管物價(jià)高企

2026-02-07 19:23

蔡司大中華區(qū)總部綜合園區(qū)在上海浦東啟動(dòng)建設(shè)

2026-02-07 19:23

小米推出觸覺(jué)驅(qū)動(dòng)的機(jī)器人精細(xì)抓取微調(diào)模型TacRefineNet

2026-02-07 19:21

金銀價(jià)飆升,米蘭冬奧金牌史上最貴

2026-02-07 19:18

中國(guó)發(fā)現(xiàn)植物新物種“銅壁關(guān)醉魂藤”

掃描下載App