中國(guó)、硅谷、模型、具身、AI硬件和AI Agent,這些標(biāo)簽共同組成了今年創(chuàng)投圈最熾熱的氛圍,而這些看似獨(dú)立的標(biāo)簽之間更有著關(guān)系整個(gè)AI創(chuàng)業(yè)生態(tài)的聯(lián)動(dòng)密碼。當(dāng)身上貼有這些標(biāo)簽的頭部創(chuàng)業(yè)者們匯聚一堂,在阿爾法公社創(chuàng)始合伙人許四清的引導(dǎo)主持下各抒己見(jiàn),我們得以透視2025全球的華人AI創(chuàng)投圈到底發(fā)生了哪些令人興奮的變化。
諾亦騰機(jī)器人創(chuàng)始人兼CEO 戴若犁
戴若犁是諾亦騰機(jī)器人創(chuàng)始人/首席執(zhí)行官,畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué)(9705)與香港中文大學(xué),獲機(jī)械與自動(dòng)化工程博士學(xué)位。戴博士在動(dòng)作捕捉、人機(jī)交互以及機(jī)器人遙操作、具身智能數(shù)據(jù)平臺(tái)構(gòu)建等領(lǐng)域擁有超過(guò)15年的前沿創(chuàng)新經(jīng)驗(yàn)。在創(chuàng)立諾亦騰機(jī)器人之前,他聯(lián)合創(chuàng)辦了諾亦騰科技(Noitom Ltd.),作為公司技術(shù)與產(chǎn)品的第一負(fù)責(zé)人,成功交付數(shù)萬(wàn)套動(dòng)作捕捉系統(tǒng),服務(wù)全球50多個(gè)國(guó)家用戶,幫助公司取得約70%的全球?qū)I(yè)動(dòng)作捕捉市場(chǎng)份額,確立行業(yè)領(lǐng)導(dǎo)地位。截至發(fā)稿諾亦騰機(jī)器人官宣完成數(shù)億元人民幣的Pre-A+輪融資,本輪融資由啟明創(chuàng)投領(lǐng)投,五源資本、君聯(lián)資本等機(jī)構(gòu)參與投資。
無(wú)界動(dòng)力創(chuàng)始人兼CEO 張玉峰
張玉峰是無(wú)界動(dòng)力的創(chuàng)始人兼CEO,曾任地平線副總裁、智能汽車事業(yè)部總裁、公司董事及經(jīng)營(yíng)管理委員會(huì)成員,于2025年創(chuàng)立無(wú)界動(dòng)力,該公司專注于構(gòu)建機(jī)器人“通用大腦”與“操作智能”,突破“手、眼、腦”協(xié)同的關(guān)鍵瓶頸,讓具身智能成為可廣泛部署、持續(xù)進(jìn)化的基礎(chǔ)設(shè)施。公司首代機(jī)器人平臺(tái)已在工業(yè)制造與商業(yè)服務(wù)兩大方向取得實(shí)質(zhì)性突破。無(wú)界動(dòng)力首輪3億元天使融資,由紅杉中國(guó)、線性資本領(lǐng)投,高瓴創(chuàng)投、地平線、華業(yè)天成、鐘鼎資本、BV百度風(fēng)投、同歌創(chuàng)投等跟投。據(jù)悉,天使+輪融資已接近完成,累計(jì)融資額超5億元。
Looki創(chuàng)始人兼CEO 孫洋
孫洋是Looki的創(chuàng)始人兼CEO,畢業(yè)于卡耐基梅隆大學(xué)計(jì)算機(jī)專業(yè),曾任職于Google,Amazon,Momenta和美團(tuán)。Looki創(chuàng)立于2024年,旨在通過(guò)打造AI的“眼睛”與“耳朵”,將AI無(wú)窮潛力融入并賦能于每個(gè)人的日常生活。Looki首款產(chǎn)品L1自今年8月在海外上市以來(lái),已取得了卓越的銷售業(yè)績(jī)與用戶口碑;Looki L1已于12月16日正式登陸國(guó)內(nèi)市場(chǎng)。目前,公司已完成天使、天使+和Pre-A三輪共計(jì)超千萬(wàn)美元的融資。投資機(jī)構(gòu)包括BAI資本、鐘鼎資本、阿爾法公社和同歌創(chuàng)投。
元理智能創(chuàng)始人兼CEO 張帆
張帆是元理智能的創(chuàng)始人兼CEO,畢業(yè)于法國(guó)巴黎十一大,主修人工智能。2022年創(chuàng)立元因智能,被智譜AI并購(gòu),2023年加入智譜AI擔(dān)任COO,2025年6月離職智譜AI,創(chuàng)立元理智能,聚焦商業(yè)強(qiáng)化學(xué)習(xí),致力于將模型能力轉(zhuǎn)化為數(shù)字化勞動(dòng)力,為企業(yè)提供可量化的生產(chǎn)力解決方案。元理智能已于近日完成近千萬(wàn)美元種子輪融資,由藍(lán)馳創(chuàng)投領(lǐng)投,光源創(chuàng)業(yè)者基金跟投。
Aha創(chuàng)始人兼CEO Kay Feng
Kay Feng是Aha的創(chuàng)始人兼CEO,深耕達(dá)人營(yíng)銷與AI和SaaS行業(yè)7年,以對(duì)行業(yè)結(jié)構(gòu)的深刻理解,打造出全球首個(gè)“AI員工式”達(dá)人營(yíng)銷平臺(tái)Aha。目前已服務(wù)300多家客戶,覆蓋AI領(lǐng)域的全球領(lǐng)先企業(yè)與高速成長(zhǎng)的創(chuàng)業(yè)公司。18歲時(shí),Kay輟學(xué)加入Dora AI創(chuàng)始團(tuán)隊(duì),作為市場(chǎng)負(fù)責(zé)人,推動(dòng)產(chǎn)品從0成長(zhǎng)至50萬(wàn)用戶,成為23年增長(zhǎng)最快的AI產(chǎn)品之一。Aha已獲得錦秋基金、金沙江創(chuàng)投的投資、聯(lián)想創(chuàng)投和初心資本等多家知名機(jī)構(gòu)的總計(jì)千萬(wàn)美金級(jí)別投資。
阿爾法公社創(chuàng)始合伙人、CEO 許四清
許四清,阿爾法公社創(chuàng)始合伙人、CEO,畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué)和中國(guó)科學(xué)院,分別獲得學(xué)士和碩士學(xué)位。他曾三次創(chuàng)業(yè),2010年作為COO成功帶領(lǐng)創(chuàng)業(yè)公司在美國(guó)納斯達(dá)克上市。許四清曾擔(dān)任創(chuàng)新工場(chǎng)投資合伙人、奇虎360首席營(yíng)銷官,后加入中經(jīng)合任董事總經(jīng)理負(fù)責(zé)中國(guó)的投資和管理工作,2015年創(chuàng)立天使投資機(jī)構(gòu)阿爾法公社。許四清擁有20年以上IT、互聯(lián)網(wǎng)及通訊行業(yè)的工作經(jīng)驗(yàn), 曾開(kāi)創(chuàng)微軟公司華南區(qū)業(yè)務(wù)并就任第一任總經(jīng)理,擔(dān)任中國(guó)網(wǎng)絡(luò)通信有限公司數(shù)據(jù)業(yè)務(wù)總經(jīng)理、藝龍旅行網(wǎng)首席市場(chǎng)營(yíng)銷官等職務(wù)。許四清共5次獲得“福布斯中國(guó)最佳創(chuàng)投人top100”稱號(hào)。
戴若犁:過(guò)去我們服務(wù)的更多是影視和體育行業(yè)的時(shí)候,還是會(huì)發(fā)現(xiàn)在理念的先進(jìn)性,或者是說(shuō)客戶的發(fā)展階段方面,美國(guó)的領(lǐng)先性還挺明確的,而且基本上都是海外的業(yè)務(wù)要大于國(guó)內(nèi)的業(yè)務(wù)。而我們目前的感受和以前完全不一樣,至少在機(jī)器人這行業(yè)里,中美是沒(méi)有代差。
雖然大背景是沒(méi)有代差,但實(shí)際這個(gè)生意做起來(lái)還是有挺大區(qū)別的。我們做的業(yè)務(wù)是典型的TO B的業(yè)務(wù),TO B業(yè)務(wù)的本質(zhì)其實(shí)是甲乙雙方的勞動(dòng)力成本置換,或者說(shuō)是能力的置換。在不同市場(chǎng)環(huán)境下,TO B業(yè)務(wù)的推進(jìn)邏輯會(huì)有明顯差異,這與當(dāng)?shù)氐膭趧?dòng)力成本結(jié)構(gòu)、客戶組織方式以及技術(shù)分工習(xí)慣都有關(guān)系。相對(duì)來(lái)說(shuō),美國(guó)的業(yè)務(wù)會(huì)更好做一些。
在中國(guó)市場(chǎng),企業(yè)全棧/全鏈路自研是一種思維定勢(shì),更希望TO B合作企業(yè)提供概念驗(yàn)證。但美國(guó)的客戶或者說(shuō)全球其他勞動(dòng)力成本相對(duì)較高地區(qū)的客戶,他們對(duì)于垂直整合這件事情的追求就沒(méi)有這么強(qiáng)勢(shì),或者沒(méi)有那么執(zhí)著,客戶更傾向于基于清晰分工和長(zhǎng)期合作關(guān)系來(lái)推進(jìn)項(xiàng)目。
所以對(duì)我們來(lái)說(shuō),中國(guó)的生意體量大,中國(guó)的客戶離我們更近,但是海外的客戶可能毛利更高,也更容易沉淀長(zhǎng)期合作項(xiàng)目,所以市場(chǎng)體感上還是有挺大的區(qū)別的。
純粹說(shuō)機(jī)器人行業(yè),中國(guó)市場(chǎng)參與的主體的更多,投資階段分布更廣,覆蓋了更多相當(dāng)早期的企業(yè)。而美國(guó)市場(chǎng)的資本集中度相對(duì)更高,馬太效應(yīng)更強(qiáng)。
張玉峰:第一點(diǎn),我覺(jué)得首先從團(tuán)隊(duì)來(lái)講,中國(guó)的團(tuán)隊(duì)是更兼?zhèn)渎斆骱颓趭^的。我舉一個(gè)我最熟悉的新能源汽車和自動(dòng)駕駛行業(yè)的例子,三年疫情期間,海外的很多企業(yè)團(tuán)隊(duì)都處于停擺狀態(tài),甚至直到今天,歐洲的一些團(tuán)隊(duì)還在居家辦公。但這三年期間,最起碼在我所熟悉的新能源汽車和智能駕駛行業(yè),實(shí)現(xiàn)了非??焖俚淖汾s和超越。比如我們用八個(gè)月時(shí)間,幫助一家新勢(shì)力車企把ADAS自研從立項(xiàng)到量產(chǎn)上車,到頭一年就達(dá)到十萬(wàn)量級(jí)這樣一個(gè)速度,是非常能說(shuō)明問(wèn)題的。
然后第二點(diǎn),我覺(jué)得國(guó)內(nèi)目前的市場(chǎng)和行業(yè)的格局,對(duì)于打磨產(chǎn)品是一個(gè)非常好的機(jī)會(huì)。國(guó)內(nèi)的B端客戶和消費(fèi)者對(duì)于新產(chǎn)品新技術(shù)的容忍度和接納程度都非常好,同時(shí)B端客戶對(duì)于一個(gè)新產(chǎn)品導(dǎo)入的要求和期待又非常高。他們可以給資源,給支持,同時(shí)也給很大的壓力。這種卷法帶來(lái)的結(jié)果,就是我們可以通過(guò)與B端客戶深入的聯(lián)合共創(chuàng),來(lái)快速產(chǎn)出有競(jìng)爭(zhēng)力的產(chǎn)品,再去批量化地復(fù)制,包括走向海外。
孫洋:在AI硬件賽道,中國(guó)在硬件的產(chǎn)業(yè)鏈上肯定是有優(yōu)勢(shì)的。其實(shí)大家更多的探索是AI硬件會(huì)以一個(gè)什么樣的方式去切入大家的日常生活,給用戶帶來(lái)更大價(jià)值。這是一個(gè)相對(duì)早期,相對(duì)模糊的方向,對(duì)于創(chuàng)業(yè)團(tuán)隊(duì)來(lái)說(shuō)更需要保持的敏捷,是頭腦敏捷和實(shí)驗(yàn)的敏捷,更多在于想象力和taste方面的探索。
說(shuō)回中國(guó)團(tuán)隊(duì)的優(yōu)勢(shì),我覺(jué)得軟硬之間的結(jié)合這件事情,是中國(guó)團(tuán)隊(duì)毫無(wú)疑問(wèn)的得天獨(dú)厚優(yōu)勢(shì)。美國(guó)的軟件非常強(qiáng),AI非常強(qiáng),但硬件上明顯的一個(gè)短板。我們也看到很多美國(guó)的同行做的AI硬件產(chǎn)品,最后并沒(méi)有收到市場(chǎng)的正反饋。他們大多數(shù)只是兜售了一個(gè)比較強(qiáng)的AI概念,但交貨有可能一年了也無(wú)法交貨。
Kay Feng:我們自己本身服務(wù)了很多中國(guó)科技公司的出海,以及很多歐美本土市場(chǎng)的科技公司。這兩類創(chuàng)業(yè)公司的市場(chǎng)邏輯有一些明顯的不同。歐美的客戶在軟件領(lǐng)域,或者說(shuō)TO B領(lǐng)域的垂直專業(yè)性和服務(wù)深度非常高,公司數(shù)量多,資本關(guān)注度也高。在每一個(gè)細(xì)分場(chǎng)景其實(shí)都有做的很深的公司,他們的切入口都非常小,但深度做的很深,市場(chǎng)的策略也很垂直。另一方面我們能看到中國(guó)出海的創(chuàng)業(yè)者們,大部分還是偏向TO C,他們更希望以一個(gè)整體的角度去做增長(zhǎng)。當(dāng)然,這得益于中國(guó)過(guò)去互聯(lián)網(wǎng)時(shí)代積累下了一批流量玩法和增長(zhǎng)人才,他更習(xí)慣和擅長(zhǎng)從這個(gè)角度去考慮公司的市場(chǎng)。而歐美TO B公司的增長(zhǎng)邏輯和方法論,也同樣得益于上一代SaaS類產(chǎn)品的經(jīng)驗(yàn)和基礎(chǔ)。
而最新的變化是,今天新的這一波中國(guó)出??萍脊荆麄兊臎Q策行為已經(jīng)越來(lái)越接近于歐美本土的客戶了。
張帆:很多投資人問(wèn)我的第一個(gè)問(wèn)題都是中國(guó)TO B到底能不能干?我覺(jué)得,不是中國(guó)的TO B不好干,是中國(guó)的軟件不好干。咱們看那些國(guó)內(nèi)互聯(lián)網(wǎng)廣告平臺(tái),大家都在心甘情愿的在付費(fèi)嘛。我覺(jué)得中國(guó)軟件企業(yè)不好干,是由于中國(guó)的企業(yè)的數(shù)字化還沒(méi)有那么成熟,以至于他無(wú)法判斷一個(gè)單點(diǎn)在整個(gè)鏈路里的貢獻(xiàn),所以只能是通過(guò)整個(gè)鏈條的結(jié)果來(lái)判斷價(jià)值。而AI是一個(gè)非常好的切入點(diǎn)。在AI出現(xiàn)以前,我們賣軟件其實(shí)都是一個(gè)不顯性的價(jià)值呈現(xiàn)。但今天AI讓我們有機(jī)會(huì)把軟件的顯性價(jià)值做出來(lái)。比如我們今天真的能將AI轉(zhuǎn)化為一個(gè)數(shù)字員工,那它到底能給企業(yè)帶來(lái)多少價(jià)值,是完全顯性的。這也是為什么我們一直認(rèn)為AI在TOB上并不是對(duì)標(biāo)軟件市場(chǎng),而是對(duì)標(biāo)勞動(dòng)力市場(chǎng)。
第二個(gè)點(diǎn)來(lái)講,我覺(jué)得中國(guó)的優(yōu)勢(shì)在于大家對(duì)于新技術(shù)的擁抱,比絕大多數(shù)海外國(guó)家要更快的。像歐洲很多人還在還用諾基亞的功能機(jī)。過(guò)去我們服務(wù)過(guò)很多全球性企業(yè),我們會(huì)發(fā)現(xiàn)即使我們的基座模型并沒(méi)有美國(guó)那么好,但是我們?cè)谶@些跨國(guó)項(xiàng)目上所產(chǎn)生的結(jié)果,都會(huì)作為客戶全球合作的標(biāo)桿。中國(guó)對(duì)于新技術(shù)的擁抱和開(kāi)放,是在刻骨子里的。
在大模型的方向上,中美其實(shí)還是蠻一致的。在國(guó)內(nèi),無(wú)論是智譜,字節(jié),阿里、kimi等等,基礎(chǔ)模型都做的很好,可能只用了海外模型的十分之一甚至更少的算力,就得到了今天這樣的結(jié)果,普及率也非常高。可能唯一的區(qū)別在于,今天中國(guó)企業(yè)對(duì)于模型應(yīng)用的轉(zhuǎn)化率是比海外團(tuán)隊(duì)快得多的,所以我們從應(yīng)用反饋回來(lái)的認(rèn)知也會(huì)更多。
張帆:讓我最興奮的事,其實(shí)是強(qiáng)化學(xué)習(xí)的跑通。其實(shí)強(qiáng)化學(xué)習(xí)本身并不是個(gè)新技術(shù),但是在去年Q4,幾乎所有的人都在討論一個(gè)話題,就是人類數(shù)據(jù)不夠用了。甚至連illiya也在公開(kāi)發(fā)言說(shuō)人類的語(yǔ)料是化石燃料,用完就沒(méi)了。但你會(huì)發(fā)現(xiàn),今年已經(jīng)沒(méi)人聊這個(gè)話題了,根本的原因其實(shí)是在于強(qiáng)化學(xué)習(xí)的跑通。特別是應(yīng)用在今天大量的數(shù)學(xué),大量的coding,GUI已經(jīng)得到了非常強(qiáng)的驗(yàn)證。
之前的情況是,人標(biāo)的東西你才可以學(xué),如果人標(biāo)不了,你就學(xué)不了。所以嚴(yán)格意義上,機(jī)器永遠(yuǎn)超不過(guò)人。但是強(qiáng)化學(xué)習(xí)的出現(xiàn),讓我們開(kāi)始從alphago走向alphago zero,讓我們突破了人類的認(rèn)知邊界。這件事兒帶來(lái)了一個(gè)極大的變量,我認(rèn)為也由此開(kāi)啟了AI的下半場(chǎng)。
Kay Feng:2025 年行業(yè)中讓我最興奮的一件事是:Agentic AI第一次在真實(shí)業(yè)務(wù)里跑通了。之所以說(shuō)這是今年,不是因?yàn)閍gent這個(gè)概念新,而是因?yàn)橹嗡茉谡鎸?shí)業(yè)務(wù)里的關(guān)鍵技術(shù)條件,直到 2025 年才同時(shí)具備。第一是長(zhǎng)期任務(wù)和上下文記憶真正跑通了;第二是工具調(diào)用和執(zhí)行穩(wěn)定性發(fā)生了質(zhì)變;第三是從人類示范,轉(zhuǎn)向結(jié)果驅(qū)動(dòng)的自我優(yōu)化。 回到公司來(lái)看,作為 Agentic 的TO B產(chǎn)品,今年我們從業(yè)務(wù)數(shù)據(jù)上真的能看到Aha作為一個(gè)平臺(tái)的飛輪效應(yīng)被點(diǎn)燃,我們達(dá)人側(cè)的入駐速度,呈現(xiàn)了一個(gè)指數(shù)級(jí)的增長(zhǎng),半年內(nèi)就從0上漲到5萬(wàn)。然后另一方面,就是全球那些最頂尖的AI客戶和頭部大廠都能選擇我們這樣一家成立才半年的公司。
孫洋:我覺(jué)得最興奮的兩個(gè)點(diǎn)就是Google的回歸和Gemini 3的出現(xiàn),其實(shí)這兩個(gè)也是一回事啊。我覺(jué)得Google的回歸是讓整個(gè)25年的模型賽道撥亂反正。大家之前會(huì)看到Open AI已經(jīng)開(kāi)始做一些硬件,但其實(shí)我覺(jué)得模型還遠(yuǎn)遠(yuǎn)沒(méi)到天花板,Google的回歸也讓大家重新聚焦回模型能力的進(jìn)一步提升。而Gemini 3的出現(xiàn)也符合我們的預(yù)期,在多模態(tài)能力又前進(jìn)了一大步。去年大家所看到是,都是假的多模態(tài),今年Gemini 2開(kāi)始大家又在做圖片幀的動(dòng)態(tài),然后直到Gemini 3的出現(xiàn),視頻的能力又進(jìn)一步增強(qiáng),這是符合我們對(duì)模型發(fā)展趨勢(shì)的預(yù)判的。
張玉峰:技術(shù)的發(fā)展層面上,其實(shí)讓我最興奮的今年能看到視頻生成大模型,真的能將越來(lái)越多的物理規(guī)律展現(xiàn),內(nèi)嵌到其生成的視頻中了。這不僅是對(duì)Scaling Law的進(jìn)一步佐證,同時(shí)也對(duì)未來(lái)具身行業(yè)的數(shù)據(jù)補(bǔ)充,給予了我們很大的信心。
從我們無(wú)界動(dòng)力來(lái)說(shuō),最令我興奮的,還是成立不到半年時(shí)間,我們就成功的讓一群背景各異的超級(jí)個(gè)體們快速融合成了一支執(zhí)行效率極高的團(tuán)隊(duì),也基本上完成了每個(gè)環(huán)節(jié)的從零到一。
戴若犁:2025年,我女兒考上了一個(gè)她特別喜歡的學(xué)校,這個(gè)肯定是第一啊。然后我們講回科技圈。過(guò)去來(lái)跟我們聊數(shù)據(jù)業(yè)務(wù)的業(yè)內(nèi)同仁一般都在聊幾千小時(shí),頂多上萬(wàn)小時(shí)的數(shù)據(jù)。但是就最近美國(guó)有一家公司叫Generalist,這家公司大力出奇跡,自己獨(dú)立驗(yàn)證了一把Scaling Law,他們用了27萬(wàn)小時(shí)的數(shù)據(jù)做了訓(xùn)練,并且在這27萬(wàn)小時(shí)之內(nèi)沒(méi)有看到任何訓(xùn)練收益的放緩。這件事情之后,來(lái)找我們聊的業(yè)內(nèi)同仁們的數(shù)據(jù)單位也都變成了以十萬(wàn)小時(shí)為單位。這也讓具身這個(gè)行業(yè)整體認(rèn)識(shí)到Scaling Law的邊界其實(shí)還很遠(yuǎn)很遠(yuǎn),這件事還是挺讓人興奮的。
戴若犁:美國(guó)的早期階段融資中,如果是用SAFE(Simple agreement for equity)這樣的方式融錢(qián),機(jī)制相當(dāng)簡(jiǎn)化,這是很偉大的。他們也更愿意在小圈子里邊閉環(huán),整個(gè)融資的事情就在一個(gè)微信群或者group里就能完成,更強(qiáng)調(diào)對(duì)創(chuàng)新和試錯(cuò)的支持,對(duì)于創(chuàng)始人的壓力相對(duì)比較小。
張玉峰:我感覺(jué)關(guān)于堅(jiān)信一個(gè)技術(shù)或堅(jiān)信一個(gè)方向長(zhǎng)期投入,也就是資本的耐心方面,美國(guó)整體上還是一個(gè)更加包容的狀態(tài),這一點(diǎn)確實(shí)值得我們繼續(xù)學(xué)習(xí),但也并不是一個(gè)特別大的問(wèn)題。
孫洋:我覺(jué)得其實(shí)在硅谷,在美國(guó)的VC圈,投資一些高風(fēng)險(xiǎn)的項(xiàng)目來(lái)獲得高回報(bào)這件事上,大家收到過(guò)很多的正反饋。而在國(guó)內(nèi),大家可能更愿意投一些共識(shí)類的項(xiàng)目。但我覺(jué)得在今天中美在AI這個(gè)賽道上,基本上一個(gè)同樣的起跑線。希望中國(guó)的VC能夠更大膽地去支持創(chuàng)業(yè)者去做一些非共識(shí)的事情啊,和冒風(fēng)險(xiǎn)的事情。
張帆:今天國(guó)內(nèi)的資本市場(chǎng)過(guò)度相信共識(shí),我覺(jué)得無(wú)論是創(chuàng)業(yè)還是技術(shù),其實(shí)只有反共識(shí)才能帶來(lái)競(jìng)爭(zhēng)力。我們都在追求做更大的芯片,更大的集群,更多的token,token的單價(jià)更低,然后我們要做C端,我們要1~2人的公司,快速能拿個(gè)100萬(wàn)美金的ARR坦率講,我覺(jué)得這些其實(shí)都是偏向于線性思維。
許四清:中國(guó)在早期投資領(lǐng)域還有很多值得向硅谷學(xué)習(xí)和借鑒,從投資行為來(lái)看,硅谷的風(fēng)險(xiǎn)投資中,有接近一半集中在早期投資;中國(guó)的這個(gè)比例是他們的1/5-1/7,從這個(gè)角度看,我們還需要加強(qiáng)。
許四清:諾亦騰本來(lái)占了動(dòng)捕差不多全球七成的市場(chǎng)份額,你為什么把這個(gè)諾亦騰機(jī)器人拆出來(lái)單獨(dú)做呢?這個(gè)想法的出發(fā)點(diǎn)是什么?
戴若犁:傳統(tǒng)的動(dòng)作捕捉技術(shù)服務(wù)的都是一些小而美的行業(yè),像影視特效,人機(jī)交互,重度科研,體育運(yùn)動(dòng),醫(yī)療健康,它的天花板并沒(méi)有那么高,但是很剛需,整個(gè)行業(yè)的迭代也不會(huì)太快。而機(jī)器人這個(gè)行業(yè)的進(jìn)步是非??斓?,這個(gè)行業(yè)的成長(zhǎng)速度,已經(jīng)是指數(shù)級(jí)的速度。
所以我們會(huì)需要用不同的團(tuán)隊(duì),不同的思路,不同的企業(yè)的經(jīng)營(yíng)方式,也需要用不同的估值和募資的體量去支持這件足夠大的事情。當(dāng)這件事足夠大的時(shí)候,其實(shí)是特別值得最好的團(tuán)隊(duì)一起進(jìn)來(lái)的,所以就決定成立一家新公司。
許四清:大量的機(jī)器人公司在自己做動(dòng)作捕捉,為什么需要你?
戴若犁:核心其實(shí)還是專業(yè)化分工和成本問(wèn)題。就像臺(tái)積電和富士康存在的核心的原因其實(shí)是有大量的成本攤銷。對(duì)于絕大部分的機(jī)器人公司來(lái)說(shuō),數(shù)據(jù)的Infra的團(tuán)隊(duì)本身不是核心,但卻是一個(gè)長(zhǎng)期、高投入、高經(jīng)驗(yàn)要求的團(tuán)隊(duì),因此規(guī)模體量可能也較小,往往很難在資源、規(guī)模和經(jīng)驗(yàn)積累方面形成效率優(yōu)勢(shì)。
而我們可以在多個(gè)客戶和項(xiàng)目之間去攤銷長(zhǎng)期的研發(fā)成本,我們專精這件事情的同事持續(xù)積累在數(shù)據(jù)采集、處理與交付上的經(jīng)驗(yàn)。所以從各個(gè)層面上面來(lái)說(shuō),諾亦騰機(jī)器人(Noitom Robotics)作為一個(gè)三方的數(shù)據(jù)服務(wù)商,還是有穩(wěn)定的市場(chǎng)空間的。我們的核心的理念是:做核心用戶的非核心任務(wù)的核心供應(yīng)商,這可以說(shuō)是我們做TO B的精髓。
許四清:展望機(jī)器人行業(yè)未來(lái)十年,你最期待出現(xiàn)怎樣的顛覆性的進(jìn)步和變革?
戴若犁:我現(xiàn)在最希望看到的,就是人形機(jī)器人的通用性能夠在商業(yè)領(lǐng)域被驗(yàn)證。
目前其實(shí)不管是英偉達(dá)還是特斯拉,他們對(duì)于人形機(jī)器人的執(zhí)著其實(shí)是都是建立在底層假設(shè)第一性的基礎(chǔ)上。但事實(shí)上,迄今為止商業(yè)領(lǐng)域中不同場(chǎng)景的經(jīng)濟(jì)性和適用性仍在探索階段。一邊是專機(jī),也就是專門(mén)設(shè)計(jì)的特型機(jī)器人,另一邊是真人,這個(gè)中間的夾縫,是否真的可以通過(guò)人形機(jī)器人找到穩(wěn)定可持續(xù)的應(yīng)用空間,我認(rèn)為仍然需要時(shí)間來(lái)檢驗(yàn)。
如果在未來(lái)五到十年內(nèi),能夠看到人形機(jī)器人在部分商業(yè)場(chǎng)景中形成清晰的價(jià)值閉環(huán),我會(huì)認(rèn)為這是對(duì)整個(gè)行業(yè)非常重要的一步。
許四清:再繼續(xù)追問(wèn)一下,您認(rèn)為機(jī)器人的商業(yè)化驗(yàn)證最有可能先發(fā)生在商業(yè)領(lǐng)域還是工業(yè)領(lǐng)域?
戴若犁:我認(rèn)為應(yīng)該是在家庭領(lǐng)域。我個(gè)人一直不認(rèn)為工業(yè)生產(chǎn)制造當(dāng)中的那個(gè)夾縫足夠?qū)?,能夠讓人形機(jī)器人找到落地的價(jià)值。因?yàn)樵诠I(yè)領(lǐng)域里,特別確定性的任務(wù)就會(huì)走向?qū)C(jī),而特別泛化而困難的柔性的任務(wù)就會(huì)走向人類,所以中間的夾縫會(huì)非常的小。反而是在家庭場(chǎng)景里,雖然實(shí)現(xiàn)困難,但是還是會(huì)有很多機(jī)會(huì)。特別是一些在家庭里所謂時(shí)空分離的機(jī)會(huì),比如掃地機(jī)器人這種場(chǎng)景。時(shí)空分離下對(duì)于容錯(cuò)性,安全性,隱私性等各方面的容忍程度都會(huì)高一些,又不像在工業(yè)領(lǐng)域里非常容易被自動(dòng)化流水線專機(jī)和便宜的人類勞動(dòng)力去替代,所以這個(gè)夾縫會(huì)稍微寬一點(diǎn)點(diǎn)。
許四清:最后一個(gè)問(wèn)題,針對(duì)剛才提到的27萬(wàn)小時(shí)的訓(xùn)練數(shù)據(jù),在你看來(lái)真實(shí)數(shù)據(jù)和仿真數(shù)據(jù)之間是一種什么關(guān)系呢?
戴若犁:來(lái)自于真實(shí)世界的真實(shí)數(shù)據(jù)和合成仿真數(shù)據(jù),這兩條路徑肯定是一個(gè)協(xié)作狀態(tài)。
我們從最底層來(lái)說(shuō),機(jī)器人需要從數(shù)據(jù)中學(xué)習(xí)的東西可以粗暴地分為兩類,一類叫做規(guī)則rules,另外一類叫做先驗(yàn)叫prior。這兩類東西里,規(guī)則是可以枚舉和合成的,但人類先驗(yàn)是無(wú)法枚舉和合成的。從這個(gè)底層邏輯來(lái)說(shuō),很難說(shuō)真實(shí)數(shù)據(jù)或者仿真數(shù)據(jù)單一能解決所有問(wèn)題,大概率這兩者其實(shí)是需要合作的。
許四清:無(wú)界動(dòng)力提出的通用基礎(chǔ)模型和通用專家模型雙線驅(qū)動(dòng),那你們是如何構(gòu)筑你們?cè)谶@兩個(gè)場(chǎng)景里的核心競(jìng)爭(zhēng)力呢?
張玉峰:先回應(yīng)一下剛才戴總和許總聊的這個(gè)話題。我覺(jué)得首先,面向具身的基礎(chǔ)模型或者基座模型,最終還是要在真實(shí)場(chǎng)景中去得到鍛煉迭代。只在仿真或者在實(shí)驗(yàn)室去做,永遠(yuǎn)難以接近真實(shí)場(chǎng)景所需的泛化能力和精準(zhǔn)度,也很難普及開(kāi)來(lái)。我們必須要通過(guò)實(shí)際的部署來(lái)實(shí)現(xiàn)規(guī)模化,其實(shí)無(wú)論是對(duì)于大語(yǔ)言模型還是具身來(lái)講,規(guī)?;€是一個(gè)非常重要的話題。
其次,從路徑上來(lái)看,其實(shí)我們可以快速回顧一下智能駕駛。過(guò)去十年的時(shí)間里,有像Waymo這樣的企業(yè),希望一下就能把復(fù)雜的事情做到無(wú)人化;也有像Tesla這樣的企業(yè),走漸進(jìn)式路線,從一開(kāi)始僅能做到車道線保持,然后學(xué)會(huì)了變道、并線、上下匝道再到城區(qū)駕駛,整個(gè)過(guò)程中都在不斷地采集數(shù)據(jù)。我們會(huì)認(rèn)為,漸進(jìn)式的路線其實(shí)是我們具身智能公司能夠去形成突破并構(gòu)建護(hù)城河非常關(guān)鍵性的選擇。其實(shí)人工采集的訓(xùn)練數(shù)據(jù)量即使達(dá)到27萬(wàn)小時(shí),相比我們整個(gè)人類的語(yǔ)料數(shù)據(jù)量還是差很多。將來(lái)為了更大數(shù)量級(jí)的數(shù)據(jù)采集,要付出的代價(jià)會(huì)越來(lái)越高。它的成本性、可持續(xù)性到底如何,我還是抱有一個(gè)問(wèn)號(hào)。
不同于大語(yǔ)言模型或者自然語(yǔ)言處理那個(gè)時(shí)期,存在著很多既有的專家模型。大模型的出現(xiàn),就基本上把專家模型全都并掉了,實(shí)現(xiàn)了快速的“由專到通”。但這件事的前提是有可獲取的、海量的數(shù)據(jù),所以比較容易通過(guò)新的算法范式去訓(xùn)練大模型兼并掉各種專用小模型。但是具身智能現(xiàn)在面臨的挑戰(zhàn)是優(yōu)質(zhì)的、尤其是真實(shí)場(chǎng)景的真機(jī)數(shù)據(jù)非常稀缺,所以很難一蹴而就,我們還是要堅(jiān)定地走漸進(jìn)式的發(fā)展路線。
再說(shuō)到場(chǎng)景選擇,其實(shí)從場(chǎng)景到任務(wù),本身有兩個(gè)維度,一個(gè)是場(chǎng)景的復(fù)雜度和多樣性,一個(gè)是任務(wù)和包括被操作物體的復(fù)雜度和多樣性。家庭場(chǎng)景屬于四象限里最靠這個(gè)右上角選擇,也就是場(chǎng)景本身和任務(wù)對(duì)象都更復(fù)雜的區(qū)域。確實(shí)有很多企業(yè)在深耕這個(gè)場(chǎng)景,但更多的企業(yè),包括Tesla、Figure等,雖然嘴上講著要進(jìn)家庭場(chǎng)景,但身體還是很老實(shí)地?fù)湓诹薆端場(chǎng)景,包括工業(yè),商業(yè)服務(wù)等。這些場(chǎng)景都能夠讓我們?cè)谀壳凹夹g(shù)不成熟、數(shù)據(jù)量缺少的情況下,通過(guò)做一定的減法,就能夠較快的實(shí)現(xiàn)落地閉環(huán)的。
說(shuō)到我們自己為什么有雙線驅(qū)動(dòng)策略,其實(shí)是要用好這個(gè)通用基座模型的通識(shí)能力來(lái)支持我們的垂類專家模型,使得其能夠在半結(jié)構(gòu)化的工業(yè)制造或者商業(yè)服務(wù)場(chǎng)景去產(chǎn)生價(jià)值,再進(jìn)一步去激活整個(gè)數(shù)據(jù)閉環(huán),實(shí)現(xiàn)商業(yè)支撐,在這個(gè)長(zhǎng)坡厚雪的賽道上打一場(chǎng)更持久的仗。
我們的信心來(lái)自于我們?cè)谶^(guò)往自動(dòng)駕駛行業(yè)中,研發(fā)交付超1000萬(wàn)套的智能駕駛軟硬件產(chǎn)品。然后我們希望通過(guò)這種持續(xù)的漸進(jìn)式的路徑,結(jié)合技術(shù)場(chǎng)景,利用好生態(tài),把我們具身智能的護(hù)城河持續(xù)的拓寬。
許四清:你認(rèn)為具身智能的突破是否就依賴世界模型的突破?還是有什么其他路徑?
張玉峰:世界模型這兩年確實(shí)非?;?,然后也衍生出很多不同的子概念,也容易讓人混淆。大的類別上肯定有顯式的仿真模擬真實(shí)世界的生成式世界模型,比如李飛飛老師正在做的事情或者可交互的視頻生成類大模型,同時(shí)也有內(nèi)嵌在模型算法里隱性的,為決策提供物理規(guī)律先驗(yàn)的隱式世界模型。
先說(shuō)結(jié)論,我認(rèn)為世界模型是具身智能走向通用的一個(gè)非常強(qiáng)大的必要條件。從生物的智能進(jìn)化路徑上看,自從哺乳動(dòng)物進(jìn)化出新皮質(zhì),就擁有了對(duì)自身運(yùn)動(dòng)和內(nèi)部狀態(tài),以及對(duì)外部世界的預(yù)測(cè)想象能力,這實(shí)際上就是世界模型。這個(gè)世界模型和像Sora這樣像素級(jí)別構(gòu)建虛擬空間的顯式世界模型不太一樣,它不需要耗費(fèi)那么大的資源來(lái)做像素級(jí)還原,但是卻能基于對(duì)物理規(guī)律的認(rèn)知,讓包括我們?cè)趦?nèi)的哺乳動(dòng)物擁有預(yù)測(cè)、想象、揣測(cè)、模擬這個(gè)世界可能的變化并更好地在現(xiàn)實(shí)世界完成動(dòng)作的能力。
所以具身智能如果要走向更像人一樣去思考,去模擬,去預(yù)測(cè)。從終局來(lái)講,其實(shí)需要一個(gè)類似于人和高等動(dòng)物一樣內(nèi)置的隱式世界模型。不僅讓機(jī)器人知道要做什么動(dòng)作,還要理解為什么做這個(gè)動(dòng)作,而且能夠去模擬想象做這個(gè)動(dòng)作之后會(huì)發(fā)生什么事情。
我們無(wú)界動(dòng)力當(dāng)前更多的是在隱式世界模型方向上做研發(fā),把它內(nèi)嵌在負(fù)責(zé)動(dòng)作執(zhí)行的VLA模型里。同時(shí)顯式世界模型也是有意義的,對(duì)于目前數(shù)據(jù)短缺情況下(基于真實(shí)數(shù)據(jù)增廣)提供高質(zhì)量的數(shù)據(jù)補(bǔ)充也非常有幫助。現(xiàn)在自動(dòng)駕駛行業(yè)也用這種世界模型來(lái)做一些corner case 數(shù)據(jù)的增廣和生成,sim2real gap相比以前小了非常多。在隱式和顯式當(dāng)中,我們更側(cè)重于投入在隱式的世界模型上,同時(shí)在顯式的世界模型上也會(huì)有相應(yīng)的一定量的投入。
許四清:Looki的第一代產(chǎn)品是以記錄生活作為切入點(diǎn)的,現(xiàn)在產(chǎn)品也非常受歡迎,那這一代產(chǎn)品對(duì)Looki而言,是探索人機(jī)交互的一個(gè)起點(diǎn)呢?還是會(huì)繼續(xù)把單一產(chǎn)品做到極致?
孫洋:應(yīng)該說(shuō)是一個(gè)起點(diǎn)吧。我們的核心就是在給AI做眼睛和耳朵,然后讓AI在物理世界里生活。大家可以把具身理解為,它有像人一樣的大腦,然后再加上四肢,能做一些事情。其實(shí)Looki在做的事情,就是先把四肢去掉,看能不能先把第二大腦的功能實(shí)現(xiàn)
對(duì)于第二大腦而言,Looki只是一種形態(tài),未來(lái)也可能還會(huì)有其他的形態(tài)。這其實(shí)是隨著整個(gè)硬件供應(yīng)鏈和產(chǎn)業(yè)鏈的發(fā)展而改變的,怎么做到低功耗,怎么能做到無(wú)感化,怎么能融入大家的穿搭里去,形態(tài)上未來(lái)一定還會(huì)有各種各樣的這種延展。
從功能上來(lái)講,其實(shí)也會(huì)隨著模型能力的增強(qiáng),包括我們自己搭的記憶infra系統(tǒng)的升級(jí),不斷地生長(zhǎng)共進(jìn)。我們最終還是希望搭建一個(gè)叫human-centered AI,也就是以人為中心的AI。這件事情的價(jià)值在于,今天人類所有和AI的交互還是要鎖在對(duì)話框里邊,對(duì)于普通用戶來(lái)說(shuō),每天生活里面發(fā)生的所有事情,我都要轉(zhuǎn)換成語(yǔ)言,轉(zhuǎn)換成prompt,然后才能給到AI的對(duì)話框。那我們換一個(gè)思路,為什么不能把AI從對(duì)話框里拿出來(lái),讓AI自主能看到和聽(tīng)到物理世界里發(fā)生的事情,這個(gè)過(guò)程將不再需要用戶再去做一個(gè)prompt轉(zhuǎn)換。
我們有一個(gè)口號(hào)叫做:這個(gè)世界就是AI的prompt。這是我們的核心理念,這是一步一步去延展的。我們先把大腦做好,可能最后再把四肢做好,未必說(shuō)Looki在五年十年后不去做這件事情。通過(guò)一個(gè)消費(fèi)電子產(chǎn)品讓大家先用起來(lái),數(shù)據(jù)飛輪能夠轉(zhuǎn)起來(lái),我覺(jué)得把啟動(dòng)器找到這件事兒是最重要的。
下一代產(chǎn)品我們會(huì)做proactive AI或者叫real time proactive AI:更適時(shí)的主動(dòng)式的AI。今天我們L 1的產(chǎn)品是需要三段式的,先記錄,然后上傳AI分析,最后給你反饋記憶。到第二代產(chǎn)品L2的時(shí)候,適時(shí)發(fā)生的所有事情AI都能夠快速給予反饋。L3會(huì)是更遠(yuǎn)期的設(shè)想,我們覺(jué)得五年之后,模型的能力會(huì)讓今天所有的互聯(lián)網(wǎng)服務(wù)都變成Agent,但整個(gè)的Agent網(wǎng)絡(luò)里面會(huì)出現(xiàn)一個(gè)新的角色,這個(gè)新的角色就是一個(gè)中心的General Agent。這個(gè)agent它本身不能實(shí)現(xiàn)任何的服務(wù),但是它是非常懂用戶。當(dāng)用戶給他下達(dá)一個(gè)簡(jiǎn)單的指令,General Agent會(huì)把這條指令延展成非常豐富的context,然后去對(duì)接其他服務(wù)型Agent。
許四清:你認(rèn)為中國(guó)的硬件產(chǎn)品在走向全球化的時(shí)候,最大的挑戰(zhàn)是什么?
孫洋:我覺(jué)得對(duì)于AI硬件來(lái)說(shuō),今天最大的挑戰(zhàn)還是在于data compliance數(shù)據(jù)合規(guī)。因?yàn)榻裉斓腁I硬件更多都是一個(gè)數(shù)據(jù)的入口,這件事情讓數(shù)據(jù)的合規(guī)性變得非常重要。比如說(shuō)最基本的,你要把數(shù)據(jù)留在當(dāng)?shù)兀坏诙?,你要做該做的?shù)據(jù)審計(jì);然后第三,基于不同的國(guó)家,還要對(duì)數(shù)據(jù)所有權(quán)有一些規(guī)定。而這些對(duì)于之前的消費(fèi)類硬件來(lái)說(shuō),并沒(méi)有相關(guān)的積累。
許四清:Aha快速地構(gòu)筑了非常好的AI科技達(dá)人的網(wǎng)絡(luò),你們是如何實(shí)現(xiàn)這個(gè)快速增長(zhǎng)的?
Kay Feng:其實(shí)第一個(gè)點(diǎn)是這個(gè)市場(chǎng)本身的需求就非常強(qiáng)烈。我們服務(wù)客戶的時(shí)候,本質(zhì)上客戶花的是他的營(yíng)銷預(yù)算,我們看到營(yíng)銷預(yù)算里的一個(gè)最大的變化是過(guò)去大家可能把錢(qián)更多地花在廣告上,但現(xiàn)在其實(shí)更多的預(yù)算在往達(dá)人營(yíng)銷遷移。新一代的很多科技產(chǎn)品、AI產(chǎn)品,其實(shí)一半以上的預(yù)算都投放在了達(dá)人營(yíng)銷上,而不是傳統(tǒng)的投流廣告上。所以這里面就產(chǎn)生了每年上百萬(wàn)美金的達(dá)人投放預(yù)算,但是這個(gè)投放過(guò)程在過(guò)去是非常低效的,這也成為客戶本身一個(gè)非常亟待解決的問(wèn)題。所以你只要能做到一個(gè)比過(guò)去的agency更高效,規(guī)模更大,然后體驗(yàn)更好的產(chǎn)品,那客戶就一定會(huì)來(lái)嘗試。
另一個(gè)角度上,在平臺(tái)開(kāi)始有客戶之后,就會(huì)開(kāi)始有新的達(dá)人上來(lái)接單,而它是一個(gè)自動(dòng)化的流程。所以那就意味著其實(shí)客戶越多,達(dá)人就會(huì)越多,達(dá)人接過(guò)一單之后,對(duì)平臺(tái)有信任,那客戶那一側(cè)的體驗(yàn)顯然就會(huì)更好,那就會(huì)有更多客戶進(jìn)來(lái)。這其實(shí)就構(gòu)建起來(lái)了一個(gè)飛輪,他們相互之間不斷地撬動(dòng),所以這也是一個(gè)雙邊網(wǎng)絡(luò)的獨(dú)有優(yōu)勢(shì)。
許四清:你們?cè)诿绹?guó)遇到類似的競(jìng)品多嗎?
Kay Feng:其實(shí)從我們目前的情況來(lái)看,真正意義上的競(jìng)爭(zhēng)對(duì)手更多還是傳統(tǒng)的人工模式競(jìng)爭(zhēng)。這是因?yàn)槲覀儸F(xiàn)在主要服務(wù)的是中型及以上規(guī)模的客戶,在過(guò)去,這類客戶在達(dá)人營(yíng)銷上的主流解決方案,基本只有兩種:
一種是外包給 agency,另一種是少數(shù)公司選擇自己搭建一個(gè)比較大的內(nèi)部團(tuán)隊(duì)。
從行業(yè)背景來(lái)看,達(dá)人營(yíng)銷本身和傳統(tǒng)廣告有比較大的差異。
很多 agency 的核心能力,其實(shí)來(lái)自創(chuàng)意廣告,或者是上一代以Google、Facebook投流為核心的代理體系,它們?cè)谕斗藕蛣?chuàng)意上都非常成熟,但并不完全是為達(dá)人營(yíng)銷這種高協(xié)作、高執(zhí)行密度的工作形態(tài)而設(shè)計(jì)的。
而達(dá)人營(yíng)銷這個(gè)領(lǐng)域,長(zhǎng)期以來(lái)并沒(méi)有形成特別強(qiáng)勢(shì)、規(guī)?;腁gency形態(tài),一個(gè)很現(xiàn)實(shí)的原因是:它本身就是一件高度依賴人力執(zhí)行的事情。
在創(chuàng)意廣告里,一個(gè)成熟的人可以管理非常大的預(yù)算體量,一個(gè)人就可以承接100萬(wàn)美金的預(yù)算;但在達(dá)人營(yíng)銷里,預(yù)算規(guī)模一旦上來(lái),對(duì)應(yīng)的執(zhí)行人力幾乎是線性增長(zhǎng)的,要做100萬(wàn)美金的達(dá)人營(yíng)銷,可能就需要100個(gè)人來(lái)做。
所以其實(shí)今天在歐美,客戶反而會(huì)更迫切地尋找能降低對(duì)人工規(guī)模依賴的解決方案,因?yàn)槿绻胍?guī)模化,他的人力成本是真實(shí)存在的。
許四清:你原來(lái)做通用大模型,現(xiàn)在你要做商業(yè)的強(qiáng)化學(xué)習(xí),是否可以與大家分享一下你對(duì)模型的看法和心得嗎?
張帆:首先我覺(jué)得一個(gè)有意思的點(diǎn)就是在于,我覺(jué)得商業(yè)強(qiáng)化學(xué)習(xí)跟基座模型,它不是一個(gè)賽道,它是一個(gè)延展關(guān)系。市場(chǎng)上一直有一個(gè)兩種邏輯的爭(zhēng)論,一種邏輯說(shuō)將來(lái)會(huì)有一個(gè)超級(jí)大一統(tǒng)的模型解決everything;另外一種邏輯說(shuō)將來(lái)市場(chǎng)上會(huì)出現(xiàn)無(wú)數(shù)的垂類模型,來(lái)解決不同的事情。這兩種到底哪種會(huì)是未來(lái)。
我們先看看人類是怎么做的,我們會(huì)發(fā)現(xiàn)人類從5000年前到今天,其實(shí)人的腦容量沒(méi)有明顯的變化,但是今天的人類比5000年前的人單人的生產(chǎn)力大了1000倍。你可以發(fā)現(xiàn),進(jìn)化論并沒(méi)有把我們每個(gè)人進(jìn)化成一個(gè)200斤的腦袋,而是讓我們維持原有的腦袋的size,但是我們解決問(wèn)題的能力依然可以遠(yuǎn)超原古時(shí)代的人類。這個(gè)核心的原因和變化就叫做分工,分工之后就是協(xié)作。
分工的邏輯是在于讓每個(gè)模型獨(dú)立訓(xùn)練,協(xié)作的邏輯是在于讓所有獨(dú)立訓(xùn)練的模型解決統(tǒng)一的目標(biāo),從個(gè)體智能轉(zhuǎn)化為群體智能。所以你會(huì)發(fā)現(xiàn)整個(gè)社會(huì)的本質(zhì)上是一個(gè)超級(jí)MOE,這也是我們的底層邏輯。
我覺(jué)得在這個(gè)階段,你讓大腦的智商再繼續(xù)上升,其實(shí)邊際效果已經(jīng)下降了,不經(jīng)濟(jì)了。同理,今天的模型已經(jīng)足夠強(qiáng)了,我們?nèi)绾卧诮裉旖o模型構(gòu)建一個(gè)大學(xué),讓他從一個(gè)標(biāo)準(zhǔn)的智商轉(zhuǎn)變?yōu)闊o(wú)數(shù)跟業(yè)務(wù)耦合的最優(yōu)解,從而實(shí)現(xiàn)從個(gè)體智能到群體智能的飛躍。這也完美符合了OpenAI的AGI的五條路的level 4和level 5。所以我們做這件事的原因其實(shí)是基礎(chǔ)模型的延展。
許四清:那你覺(jué)得商業(yè)強(qiáng)化學(xué)習(xí),最先在哪些場(chǎng)景上可以實(shí)現(xiàn)突破呢?
張帆:我覺(jué)得首先取決于我們?cè)趺炊x這件事。我們今天把它定義為是一個(gè)勞動(dòng)力市場(chǎng)的事,而不是一個(gè)軟件市場(chǎng)。勞動(dòng)力市場(chǎng)大概是一個(gè)50萬(wàn)億美金的市場(chǎng),比軟件市場(chǎng)大50倍。在這個(gè)市場(chǎng)中,我們的切入有兩個(gè)選擇標(biāo)準(zhǔn),一個(gè)是今天的市場(chǎng)規(guī)模,今天有哪些工種所占的市場(chǎng)份額是最高的,肯定是我們優(yōu)先選擇的。第二個(gè)就是哪些工種,今天是可以完全在數(shù)字空間里解決的,也會(huì)是我們優(yōu)先選擇的對(duì)象。
許四清:你曾經(jīng)提出整個(gè)AI行業(yè)存在供給熱需求冷的狀況,企業(yè)也會(huì)被這種狀況帶入這個(gè)焦慮驅(qū)動(dòng)的采購(gòu)陷阱,你覺(jué)得你能改變這個(gè)采購(gòu)陷阱嗎?
張帆:這件事兒是一個(gè)很明確的觀察,我們發(fā)現(xiàn)今天其實(shí)是一個(gè)供給跟需求極度錯(cuò)配的市場(chǎng)。具體來(lái)說(shuō),今天所有的人,包括一級(jí)二級(jí)市場(chǎng),針對(duì)于供給側(cè)幾乎是無(wú)條件投入。大家會(huì)要更強(qiáng)的芯片,更大的集群和更強(qiáng)的基模,capex也從24年的2000億美金提升到了25年的4000億美金,明年可能就萬(wàn)億以上。另一方面,模型的成本逐步下降,芯片的性能逐步提升,未來(lái)三年我們可能會(huì)比現(xiàn)在多1000倍的token的產(chǎn)量,但大家從來(lái)沒(méi)有懷疑過(guò)它能不能被消耗掉。大家都認(rèn)為,只要算力足夠便宜就一定能被消耗掉,我覺(jué)得這個(gè)其實(shí)是不一定。
那么我們?cè)倏葱枨髠?cè),MIT之前有一個(gè)分享講到今天大概只有5%的PUC是真實(shí)落地并且?guī)?lái)了數(shù)百萬(wàn)美金的收益。這個(gè)跟我們過(guò)去兩年在整個(gè)市場(chǎng)上看到的情況是高度近似的,今天大模型落地是極其單調(diào)和重復(fù)的,無(wú)非就是chatbot、知識(shí)庫(kù)、合同審核,打標(biāo)簽等,其實(shí)根本就沒(méi)有切入到核心業(yè)務(wù),有點(diǎn)像具身領(lǐng)域大家都在翻跟頭,但是沒(méi)有真正進(jìn)流水線的邏輯。
許四清:這個(gè)非常有意思。所以你看到了大家在大煉鋼鐵一般煉模型和芯片,但你沒(méi)有看到大家在需求側(cè)把這些練好的模型和芯片用到極致,你就是想解決這個(gè)問(wèn)題是吧?
張帆:對(duì),我想解決這個(gè)問(wèn)題。我覺(jué)得AI其實(shí)更多對(duì)標(biāo)的是電力,你會(huì)發(fā)現(xiàn)電力是通過(guò)影響物理世界的方式在影響人類的生產(chǎn)生活,比如說(shuō)是電梯讓整個(gè)城市從平面變成了立體,改變了我們所有人的居住方式,房地產(chǎn)業(yè),城鎮(zhèn)化,地鐵交通一切問(wèn)題,而不是電力本身。所以今天AI也需要嵌入物理世界,這就是為什么我們覺(jué)得TOB很重要。
但是如果要嵌到物理世界,最大的問(wèn)題就是在于:一個(gè)是效果如何直觀觀測(cè),一個(gè)是成本如何下降。原來(lái)我們所有AI界的人,大家都在做一件事,叫做為知識(shí)建模。無(wú)論是垂類還是通用,我們都是把人類世界所有知識(shí)壓縮到一起放進(jìn)去,然后壓縮成一個(gè)模型。這種方式確實(shí)有一定的通用性,但是我們?nèi)稳徽J(rèn)為將來(lái)會(huì)出現(xiàn)無(wú)數(shù)個(gè)專業(yè)模型,這就意味著我們不能再靠人標(biāo)了。今天對(duì)于模型的調(diào)優(yōu)策略是極度局限的,就是做SFT、prompt優(yōu)化、workflow,我不認(rèn)為這能走到一個(gè)真正的終局。所以我們覺(jué)得必須要找到一個(gè)大一統(tǒng)的方式,用一個(gè)標(biāo)準(zhǔn)的手段解決一切垂類環(huán)境跟模型的最優(yōu)匹配。
孫洋:2026年,我覺(jué)得會(huì)是非常爭(zhēng)議的一年。這個(gè)爭(zhēng)議點(diǎn)在于AI產(chǎn)品上可能會(huì)出現(xiàn)的百花齊放,以及大家認(rèn)為26年可能會(huì)有很大的bubble。
張玉峰:希望兩邊的學(xué)術(shù)、技術(shù)、產(chǎn)業(yè)都能夠快速發(fā)展,尤其是這個(gè)兩地之間的交流、合作、協(xié)同能夠越來(lái)越順。
張帆:我覺(jué)得26年會(huì)是一個(gè)AI真正進(jìn)入物理世界的元年,也是一個(gè)商業(yè)強(qiáng)化學(xué)習(xí)落地的元年。25年更多的價(jià)值體現(xiàn)在了供給側(cè)的財(cái)報(bào),比如英偉達(dá),但我期望26年,我們能看到AI可以給二級(jí)市場(chǎng)AI帶來(lái)了明顯的業(yè)務(wù)價(jià)值的提升。
戴若犁:我們是服務(wù)具身智能這個(gè)行業(yè)的,所以我個(gè)人的期待其實(shí)很樸素:一方面希望馬斯克身體健康,繼續(xù)把人形機(jī)器人這條路線往前推;另一方面希望這一波具身智能創(chuàng)業(yè)公司都能走得穩(wěn)、走得遠(yuǎn),希望我的客戶們都越來(lái)越好。
Kay Feng:首先26年還是希望AI行業(yè)更好,更多的客戶的產(chǎn)品走過(guò)PMF的階段,到達(dá)go to market的階段,希望大家的產(chǎn)品能夠在全球更多地區(qū)扎根。
許四清:我對(duì)2026年的期望是,具身智能的落地前景能從此變得更加光明。目前具身智能面對(duì)的探索環(huán)境與大語(yǔ)言模型截然不同,受限于數(shù)據(jù)匱乏,行業(yè)只能在“小腦”層面進(jìn)行探索。我希望2026年大家能將探索重心轉(zhuǎn)向“大腦”層面,為具身智能的突破奠定基礎(chǔ)。(本文首發(fā)于鈦媒體APP,由鈦媒體編輯陶天宇整理)
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論