中國、硅谷、模型、具身、AI硬件和AI Agent,這些標(biāo)簽共同組成了今年創(chuàng)投圈最熾熱的氛圍,而這些看似獨立的標(biāo)簽之間更有著關(guān)系整個AI創(chuàng)業(yè)生態(tài)的聯(lián)動密碼。當(dāng)身上貼有這些標(biāo)簽的頭部創(chuàng)業(yè)者們匯聚一堂,在阿爾法公社創(chuàng)始合伙人許四清的引導(dǎo)主持下各抒己見,我們得以透視2025全球的華人AI創(chuàng)投圈到底發(fā)生了哪些令人興奮的變化。

嘉賓簡介

諾亦騰機器人創(chuàng)始人兼CEO 戴若犁

戴若犁是諾亦騰機器人創(chuàng)始人/首席執(zhí)行官,畢業(yè)于中國科學(xué)技術(shù)大學(xué)(9705)與香港中文大學(xué),獲機械與自動化工程博士學(xué)位。戴博士在動作捕捉、人機交互以及機器人遙操作、具身智能數(shù)據(jù)平臺構(gòu)建等領(lǐng)域擁有超過15年的前沿創(chuàng)新經(jīng)驗。在創(chuàng)立諾亦騰機器人之前,他聯(lián)合創(chuàng)辦了諾亦騰科技(Noitom Ltd.),作為公司技術(shù)與產(chǎn)品的第一負(fù)責(zé)人,成功交付數(shù)萬套動作捕捉系統(tǒng),服務(wù)全球50多個國家用戶,幫助公司取得約70%的全球?qū)I(yè)動作捕捉市場份額,確立行業(yè)領(lǐng)導(dǎo)地位。截至發(fā)稿諾亦騰機器人官宣完成數(shù)億元人民幣的Pre-A+輪融資,本輪融資由啟明創(chuàng)投領(lǐng)投,五源資本、君聯(lián)資本等機構(gòu)參與投資。

無界動力創(chuàng)始人兼CEO 張玉峰

張玉峰是無界動力的創(chuàng)始人兼CEO,曾任地平線副總裁、智能汽車事業(yè)部總裁、公司董事及經(jīng)營管理委員會成員,于2025年創(chuàng)立無界動力,該公司專注于構(gòu)建機器人“通用大腦”與“操作智能”,突破“手、眼、腦”協(xié)同的關(guān)鍵瓶頸,讓具身智能成為可廣泛部署、持續(xù)進化的基礎(chǔ)設(shè)施。公司首代機器人平臺已在工業(yè)制造與商業(yè)服務(wù)兩大方向取得實質(zhì)性突破。無界動力首輪3億元天使融資,由紅杉中國、線性資本領(lǐng)投,高瓴創(chuàng)投、地平線、華業(yè)天成、鐘鼎資本、BV百度風(fēng)投、同歌創(chuàng)投等跟投。據(jù)悉,天使+輪融資已接近完成,累計融資額超5億元。

Looki創(chuàng)始人兼CEO 孫洋

孫洋是Looki的創(chuàng)始人兼CEO,畢業(yè)于卡耐基梅隆大學(xué)計算機專業(yè),曾任職于Google,Amazon,Momenta和美團。Looki創(chuàng)立于2024年,旨在通過打造AI的“眼睛”與“耳朵”,將AI無窮潛力融入并賦能于每個人的日常生活。Looki首款產(chǎn)品L1自今年8月在海外上市以來,已取得了卓越的銷售業(yè)績與用戶口碑;Looki L1已于12月16日正式登陸國內(nèi)市場。目前,公司已完成天使、天使+和Pre-A三輪共計超千萬美元的融資。投資機構(gòu)包括BAI資本、鐘鼎資本、阿爾法公社和同歌創(chuàng)投。

元理智能創(chuàng)始人兼CEO 張帆

張帆是元理智能的創(chuàng)始人兼CEO,畢業(yè)于法國巴黎十一大,主修人工智能。2022年創(chuàng)立元因智能,被智譜AI并購,2023年加入智譜AI擔(dān)任COO,2025年6月離職智譜AI,創(chuàng)立元理智能,聚焦商業(yè)強化學(xué)習(xí),致力于將模型能力轉(zhuǎn)化為數(shù)字化勞動力,為企業(yè)提供可量化的生產(chǎn)力解決方案。元理智能已于近日完成近千萬美元種子輪融資,由藍馳創(chuàng)投領(lǐng)投,光源創(chuàng)業(yè)者基金跟投。

Aha創(chuàng)始人兼CEO Kay Feng

Kay Feng是Aha的創(chuàng)始人兼CEO,深耕達人營銷與AI和SaaS行業(yè)7年,以對行業(yè)結(jié)構(gòu)的深刻理解,打造出全球首個“AI員工式”達人營銷平臺Aha。目前已服務(wù)300多家客戶,覆蓋AI領(lǐng)域的全球領(lǐng)先企業(yè)與高速成長的創(chuàng)業(yè)公司。18歲時,Kay輟學(xué)加入Dora AI創(chuàng)始團隊,作為市場負(fù)責(zé)人,推動產(chǎn)品從0成長至50萬用戶,成為23年增長最快的AI產(chǎn)品之一。Aha已獲得錦秋基金、金沙江創(chuàng)投的投資、聯(lián)想創(chuàng)投和初心資本等多家知名機構(gòu)的總計千萬美金級別投資。

阿爾法公社創(chuàng)始合伙人、CEO 許四清

許四清,阿爾法公社創(chuàng)始合伙人、CEO,畢業(yè)于中國科學(xué)技術(shù)大學(xué)和中國科學(xué)院,分別獲得學(xué)士和碩士學(xué)位。他曾三次創(chuàng)業(yè),2010年作為COO成功帶領(lǐng)創(chuàng)業(yè)公司在美國納斯達克上市。許四清曾擔(dān)任創(chuàng)新工場投資合伙人、奇虎360首席營銷官,后加入中經(jīng)合任董事總經(jīng)理負(fù)責(zé)中國的投資和管理工作,2015年創(chuàng)立天使投資機構(gòu)阿爾法公社。許四清擁有20年以上IT、互聯(lián)網(wǎng)及通訊行業(yè)的工作經(jīng)驗, 曾開創(chuàng)微軟公司華南區(qū)業(yè)務(wù)并就任第一任總經(jīng)理,擔(dān)任中國網(wǎng)絡(luò)通信有限公司數(shù)據(jù)業(yè)務(wù)總經(jīng)理、藝龍旅行網(wǎng)首席市場營銷官等職務(wù)。許四清共5次獲得“福布斯中國最佳創(chuàng)投人top100”稱號。

中美創(chuàng)業(yè)與資本環(huán)境的體感

問題一:2025年您所在的賽道,中美創(chuàng)業(yè)環(huán)境有什么不一樣?華人團隊有什么獨特的優(yōu)勢?

戴若犁:過去我們服務(wù)的更多是影視和體育行業(yè)的時候,還是會發(fā)現(xiàn)在理念的先進性,或者是說客戶的發(fā)展階段方面,美國的領(lǐng)先性還挺明確的,而且基本上都是海外的業(yè)務(wù)要大于國內(nèi)的業(yè)務(wù)。而我們目前的感受和以前完全不一樣,至少在機器人這行業(yè)里,中美是沒有代差。

雖然大背景是沒有代差,但實際這個生意做起來還是有挺大區(qū)別的。我們做的業(yè)務(wù)是典型的TO B的業(yè)務(wù),TO B業(yè)務(wù)的本質(zhì)其實是甲乙雙方的勞動力成本置換,或者說是能力的置換。在不同市場環(huán)境下,TO B業(yè)務(wù)的推進邏輯會有明顯差異,這與當(dāng)?shù)氐膭趧恿Τ杀窘Y(jié)構(gòu)、客戶組織方式以及技術(shù)分工習(xí)慣都有關(guān)系。相對來說,美國的業(yè)務(wù)會更好做一些。

在中國市場,企業(yè)全棧/全鏈路自研是一種思維定勢,更希望TO B合作企業(yè)提供概念驗證。但美國的客戶或者說全球其他勞動力成本相對較高地區(qū)的客戶,他們對于垂直整合這件事情的追求就沒有這么強勢,或者沒有那么執(zhí)著,客戶更傾向于基于清晰分工和長期合作關(guān)系來推進項目。

所以對我們來說,中國的生意體量大,中國的客戶離我們更近,但是海外的客戶可能毛利更高,也更容易沉淀長期合作項目,所以市場體感上還是有挺大的區(qū)別的。

純粹說機器人行業(yè),中國市場參與的主體的更多,投資階段分布更廣,覆蓋了更多相當(dāng)早期的企業(yè)。而美國市場的資本集中度相對更高,馬太效應(yīng)更強。

張玉峰:第一點,我覺得首先從團隊來講,中國的團隊是更兼?zhèn)渎斆骱颓趭^的。我舉一個我最熟悉的新能源汽車和自動駕駛行業(yè)的例子,三年疫情期間,海外的很多企業(yè)團隊都處于停擺狀態(tài),甚至直到今天,歐洲的一些團隊還在居家辦公。但這三年期間,最起碼在我所熟悉的新能源汽車和智能駕駛行業(yè),實現(xiàn)了非常快速的追趕和超越。比如我們用八個月時間,幫助一家新勢力車企把ADAS自研從立項到量產(chǎn)上車,到頭一年就達到十萬量級這樣一個速度,是非常能說明問題的。

然后第二點,我覺得國內(nèi)目前的市場和行業(yè)的格局,對于打磨產(chǎn)品是一個非常好的機會。國內(nèi)的B端客戶和消費者對于新產(chǎn)品新技術(shù)的容忍度和接納程度都非常好,同時B端客戶對于一個新產(chǎn)品導(dǎo)入的要求和期待又非常高。他們可以給資源,給支持,同時也給很大的壓力。這種卷法帶來的結(jié)果,就是我們可以通過與B端客戶深入的聯(lián)合共創(chuàng),來快速產(chǎn)出有競爭力的產(chǎn)品,再去批量化地復(fù)制,包括走向海外。

孫洋:在AI硬件賽道,中國在硬件的產(chǎn)業(yè)鏈上肯定是有優(yōu)勢的。其實大家更多的探索是AI硬件會以一個什么樣的方式去切入大家的日常生活,給用戶帶來更大價值。這是一個相對早期,相對模糊的方向,對于創(chuàng)業(yè)團隊來說更需要保持的敏捷,是頭腦敏捷和實驗的敏捷,更多在于想象力和taste方面的探索。

說回中國團隊的優(yōu)勢,我覺得軟硬之間的結(jié)合這件事情,是中國團隊毫無疑問的得天獨厚優(yōu)勢。美國的軟件非常強,AI非常強,但硬件上明顯的一個短板。我們也看到很多美國的同行做的AI硬件產(chǎn)品,最后并沒有收到市場的正反饋。他們大多數(shù)只是兜售了一個比較強的AI概念,但交貨有可能一年了也無法交貨。

Kay Feng:我們自己本身服務(wù)了很多中國科技公司的出海,以及很多歐美本土市場的科技公司。這兩類創(chuàng)業(yè)公司的市場邏輯有一些明顯的不同。歐美的客戶在軟件領(lǐng)域,或者說TO B領(lǐng)域的垂直專業(yè)性和服務(wù)深度非常高,公司數(shù)量多,資本關(guān)注度也高。在每一個細(xì)分場景其實都有做的很深的公司,他們的切入口都非常小,但深度做的很深,市場的策略也很垂直。另一方面我們能看到中國出海的創(chuàng)業(yè)者們,大部分還是偏向TO C,他們更希望以一個整體的角度去做增長。當(dāng)然,這得益于中國過去互聯(lián)網(wǎng)時代積累下了一批流量玩法和增長人才,他更習(xí)慣和擅長從這個角度去考慮公司的市場。而歐美TO B公司的增長邏輯和方法論,也同樣得益于上一代SaaS類產(chǎn)品的經(jīng)驗和基礎(chǔ)。

而最新的變化是,今天新的這一波中國出??萍脊荆麄兊臎Q策行為已經(jīng)越來越接近于歐美本土的客戶了。

張帆:很多投資人問我的第一個問題都是中國TO B到底能不能干?我覺得,不是中國的TO B不好干,是中國的軟件不好干。咱們看那些國內(nèi)互聯(lián)網(wǎng)廣告平臺,大家都在心甘情愿的在付費嘛。我覺得中國軟件企業(yè)不好干,是由于中國的企業(yè)的數(shù)字化還沒有那么成熟,以至于他無法判斷一個單點在整個鏈路里的貢獻,所以只能是通過整個鏈條的結(jié)果來判斷價值。而AI是一個非常好的切入點。在AI出現(xiàn)以前,我們賣軟件其實都是一個不顯性的價值呈現(xiàn)。但今天AI讓我們有機會把軟件的顯性價值做出來。比如我們今天真的能將AI轉(zhuǎn)化為一個數(shù)字員工,那它到底能給企業(yè)帶來多少價值,是完全顯性的。這也是為什么我們一直認(rèn)為AI在TOB上并不是對標(biāo)軟件市場,而是對標(biāo)勞動力市場。

第二個點來講,我覺得中國的優(yōu)勢在于大家對于新技術(shù)的擁抱,比絕大多數(shù)海外國家要更快的。像歐洲很多人還在還用諾基亞的功能機。過去我們服務(wù)過很多全球性企業(yè),我們會發(fā)現(xiàn)即使我們的基座模型并沒有美國那么好,但是我們在這些跨國項目上所產(chǎn)生的結(jié)果,都會作為客戶全球合作的標(biāo)桿。中國對于新技術(shù)的擁抱和開放,是在刻骨子里的。

在大模型的方向上,中美其實還是蠻一致的。在國內(nèi),無論是智譜,字節(jié),阿里、kimi等等,基礎(chǔ)模型都做的很好,可能只用了海外模型的十分之一甚至更少的算力,就得到了今天這樣的結(jié)果,普及率也非常高。可能唯一的區(qū)別在于,今天中國企業(yè)對于模型應(yīng)用的轉(zhuǎn)化率是比海外團隊快得多的,所以我們從應(yīng)用反饋回來的認(rèn)知也會更多。

問題二:2025年公司或者AI圈最讓您興奮的事情是什么?

張帆:讓我最興奮的事,其實是強化學(xué)習(xí)的跑通。其實強化學(xué)習(xí)本身并不是個新技術(shù),但是在去年Q4,幾乎所有的人都在討論一個話題,就是人類數(shù)據(jù)不夠用了。甚至連illiya也在公開發(fā)言說人類的語料是化石燃料,用完就沒了。但你會發(fā)現(xiàn),今年已經(jīng)沒人聊這個話題了,根本的原因其實是在于強化學(xué)習(xí)的跑通。特別是應(yīng)用在今天大量的數(shù)學(xué),大量的coding,GUI已經(jīng)得到了非常強的驗證。

之前的情況是,人標(biāo)的東西你才可以學(xué),如果人標(biāo)不了,你就學(xué)不了。所以嚴(yán)格意義上,機器永遠(yuǎn)超不過人。但是強化學(xué)習(xí)的出現(xiàn),讓我們開始從alphago走向alphago zero,讓我們突破了人類的認(rèn)知邊界。這件事兒帶來了一個極大的變量,我認(rèn)為也由此開啟了AI的下半場。

Kay Feng:2025 年行業(yè)中讓我最興奮的一件事是:Agentic AI第一次在真實業(yè)務(wù)里跑通了。之所以說這是今年,不是因為agent這個概念新,而是因為支撐它跑在真實業(yè)務(wù)里的關(guān)鍵技術(shù)條件,直到 2025 年才同時具備。第一是長期任務(wù)和上下文記憶真正跑通了;第二是工具調(diào)用和執(zhí)行穩(wěn)定性發(fā)生了質(zhì)變;第三是從人類示范,轉(zhuǎn)向結(jié)果驅(qū)動的自我優(yōu)化。 回到公司來看,作為 Agentic 的TO B產(chǎn)品,今年我們從業(yè)務(wù)數(shù)據(jù)上真的能看到Aha作為一個平臺的飛輪效應(yīng)被點燃,我們達人側(cè)的入駐速度,呈現(xiàn)了一個指數(shù)級的增長,半年內(nèi)就從0上漲到5萬。然后另一方面,就是全球那些最頂尖的AI客戶和頭部大廠都能選擇我們這樣一家成立才半年的公司。

孫洋:我覺得最興奮的兩個點就是Google的回歸和Gemini 3的出現(xiàn),其實這兩個也是一回事啊。我覺得Google的回歸是讓整個25年的模型賽道撥亂反正。大家之前會看到Open AI已經(jīng)開始做一些硬件,但其實我覺得模型還遠(yuǎn)遠(yuǎn)沒到天花板,Google的回歸也讓大家重新聚焦回模型能力的進一步提升。而Gemini 3的出現(xiàn)也符合我們的預(yù)期,在多模態(tài)能力又前進了一大步。去年大家所看到是,都是假的多模態(tài),今年Gemini 2開始大家又在做圖片幀的動態(tài),然后直到Gemini 3的出現(xiàn),視頻的能力又進一步增強,這是符合我們對模型發(fā)展趨勢的預(yù)判的。

張玉峰:技術(shù)的發(fā)展層面上,其實讓我最興奮的今年能看到視頻生成大模型,真的能將越來越多的物理規(guī)律展現(xiàn),內(nèi)嵌到其生成的視頻中了。這不僅是對Scaling Law的進一步佐證,同時也對未來具身行業(yè)的數(shù)據(jù)補充,給予了我們很大的信心。

從我們無界動力來說,最令我興奮的,還是成立不到半年時間,我們就成功的讓一群背景各異的超級個體們快速融合成了一支執(zhí)行效率極高的團隊,也基本上完成了每個環(huán)節(jié)的從零到一。

戴若犁:2025年,我女兒考上了一個她特別喜歡的學(xué)校,這個肯定是第一啊。然后我們講回科技圈。過去來跟我們聊數(shù)據(jù)業(yè)務(wù)的業(yè)內(nèi)同仁一般都在聊幾千小時,頂多上萬小時的數(shù)據(jù)。但是就最近美國有一家公司叫Generalist,這家公司大力出奇跡,自己獨立驗證了一把Scaling Law,他們用了27萬小時的數(shù)據(jù)做了訓(xùn)練,并且在這27萬小時之內(nèi)沒有看到任何訓(xùn)練收益的放緩。這件事情之后,來找我們聊的業(yè)內(nèi)同仁們的數(shù)據(jù)單位也都變成了以十萬小時為單位。這也讓具身這個行業(yè)整體認(rèn)識到Scaling Law的邊界其實還很遠(yuǎn)很遠(yuǎn),這件事還是挺讓人興奮的。

問題三:您覺得中美的科技資本環(huán)境有何差異?

戴若犁:美國的早期階段融資中,如果是用SAFE(Simple agreement for equity)這樣的方式融錢,機制相當(dāng)簡化,這是很偉大的。他們也更愿意在小圈子里邊閉環(huán),整個融資的事情就在一個微信群或者group里就能完成,更強調(diào)對創(chuàng)新和試錯的支持,對于創(chuàng)始人的壓力相對比較小。

張玉峰:我感覺關(guān)于堅信一個技術(shù)或堅信一個方向長期投入,也就是資本的耐心方面,美國整體上還是一個更加包容的狀態(tài),這一點確實值得我們繼續(xù)學(xué)習(xí),但也并不是一個特別大的問題。

孫洋:我覺得其實在硅谷,在美國的VC圈,投資一些高風(fēng)險的項目來獲得高回報這件事上,大家收到過很多的正反饋。而在國內(nèi),大家可能更愿意投一些共識類的項目。但我覺得在今天中美在AI這個賽道上,基本上一個同樣的起跑線。希望中國的VC能夠更大膽地去支持創(chuàng)業(yè)者去做一些非共識的事情啊,和冒風(fēng)險的事情。

張帆:今天國內(nèi)的資本市場過度相信共識,我覺得無論是創(chuàng)業(yè)還是技術(shù),其實只有反共識才能帶來競爭力。我們都在追求做更大的芯片,更大的集群,更多的token,token的單價更低,然后我們要做C端,我們要1~2人的公司,快速能拿個100萬美金的ARR坦率講,我覺得這些其實都是偏向于線性思維。

許四清:中國在早期投資領(lǐng)域還有很多值得向硅谷學(xué)習(xí)和借鑒,從投資行為來看,硅谷的風(fēng)險投資中,有接近一半集中在早期投資;中國的這個比例是他們的1/5-1/7,從這個角度看,我們還需要加強。

深度對話:具身、模型、硬件與Agent

To 戴若犁

許四清:諾亦騰本來占了動捕差不多全球七成的市場份額,你為什么把這個諾亦騰機器人拆出來單獨做呢?這個想法的出發(fā)點是什么?

戴若犁:傳統(tǒng)的動作捕捉技術(shù)服務(wù)的都是一些小而美的行業(yè),像影視特效,人機交互,重度科研,體育運動,醫(yī)療健康,它的天花板并沒有那么高,但是很剛需,整個行業(yè)的迭代也不會太快。而機器人這個行業(yè)的進步是非??斓?,這個行業(yè)的成長速度,已經(jīng)是指數(shù)級的速度。

所以我們會需要用不同的團隊,不同的思路,不同的企業(yè)的經(jīng)營方式,也需要用不同的估值和募資的體量去支持這件足夠大的事情。當(dāng)這件事足夠大的時候,其實是特別值得最好的團隊一起進來的,所以就決定成立一家新公司。

許四清:大量的機器人公司在自己做動作捕捉,為什么需要你?

戴若犁:核心其實還是專業(yè)化分工和成本問題。就像臺積電和富士康存在的核心的原因其實是有大量的成本攤銷。對于絕大部分的機器人公司來說,數(shù)據(jù)的Infra的團隊本身不是核心,但卻是一個長期、高投入、高經(jīng)驗要求的團隊,因此規(guī)模體量可能也較小,往往很難在資源、規(guī)模和經(jīng)驗積累方面形成效率優(yōu)勢。

而我們可以在多個客戶和項目之間去攤銷長期的研發(fā)成本,我們專精這件事情的同事持續(xù)積累在數(shù)據(jù)采集、處理與交付上的經(jīng)驗。所以從各個層面上面來說,諾亦騰機器人(Noitom Robotics)作為一個三方的數(shù)據(jù)服務(wù)商,還是有穩(wěn)定的市場空間的。我們的核心的理念是:做核心用戶的非核心任務(wù)的核心供應(yīng)商,這可以說是我們做TO B的精髓。

許四清:展望機器人行業(yè)未來十年,你最期待出現(xiàn)怎樣的顛覆性的進步和變革?

戴若犁:我現(xiàn)在最希望看到的,就是人形機器人的通用性能夠在商業(yè)領(lǐng)域被驗證。

目前其實不管是英偉達還是特斯拉,他們對于人形機器人的執(zhí)著其實是都是建立在底層假設(shè)第一性的基礎(chǔ)上。但事實上,迄今為止商業(yè)領(lǐng)域中不同場景的經(jīng)濟性和適用性仍在探索階段。一邊是專機,也就是專門設(shè)計的特型機器人,另一邊是真人,這個中間的夾縫,是否真的可以通過人形機器人找到穩(wěn)定可持續(xù)的應(yīng)用空間,我認(rèn)為仍然需要時間來檢驗。

如果在未來五到十年內(nèi),能夠看到人形機器人在部分商業(yè)場景中形成清晰的價值閉環(huán),我會認(rèn)為這是對整個行業(yè)非常重要的一步。

許四清:再繼續(xù)追問一下,您認(rèn)為機器人的商業(yè)化驗證最有可能先發(fā)生在商業(yè)領(lǐng)域還是工業(yè)領(lǐng)域?

戴若犁:我認(rèn)為應(yīng)該是在家庭領(lǐng)域。我個人一直不認(rèn)為工業(yè)生產(chǎn)制造當(dāng)中的那個夾縫足夠?qū)?,能夠讓人形機器人找到落地的價值。因為在工業(yè)領(lǐng)域里,特別確定性的任務(wù)就會走向?qū)C,而特別泛化而困難的柔性的任務(wù)就會走向人類,所以中間的夾縫會非常的小。反而是在家庭場景里,雖然實現(xiàn)困難,但是還是會有很多機會。特別是一些在家庭里所謂時空分離的機會,比如掃地機器人這種場景。時空分離下對于容錯性,安全性,隱私性等各方面的容忍程度都會高一些,又不像在工業(yè)領(lǐng)域里非常容易被自動化流水線專機和便宜的人類勞動力去替代,所以這個夾縫會稍微寬一點點。

許四清:最后一個問題,針對剛才提到的27萬小時的訓(xùn)練數(shù)據(jù),在你看來真實數(shù)據(jù)和仿真數(shù)據(jù)之間是一種什么關(guān)系呢?

戴若犁:來自于真實世界的真實數(shù)據(jù)和合成仿真數(shù)據(jù),這兩條路徑肯定是一個協(xié)作狀態(tài)。

我們從最底層來說,機器人需要從數(shù)據(jù)中學(xué)習(xí)的東西可以粗暴地分為兩類,一類叫做規(guī)則rules,另外一類叫做先驗叫prior。這兩類東西里,規(guī)則是可以枚舉和合成的,但人類先驗是無法枚舉和合成的。從這個底層邏輯來說,很難說真實數(shù)據(jù)或者仿真數(shù)據(jù)單一能解決所有問題,大概率這兩者其實是需要合作的。

To 張玉峰

許四清:無界動力提出的通用基礎(chǔ)模型和通用專家模型雙線驅(qū)動,那你們是如何構(gòu)筑你們在這兩個場景里的核心競爭力呢?

張玉峰:先回應(yīng)一下剛才戴總和許總聊的這個話題。我覺得首先,面向具身的基礎(chǔ)模型或者基座模型,最終還是要在真實場景中去得到鍛煉迭代。只在仿真或者在實驗室去做,永遠(yuǎn)難以接近真實場景所需的泛化能力和精準(zhǔn)度,也很難普及開來。我們必須要通過實際的部署來實現(xiàn)規(guī)模化,其實無論是對于大語言模型還是具身來講,規(guī)?;€是一個非常重要的話題。

其次,從路徑上來看,其實我們可以快速回顧一下智能駕駛。過去十年的時間里,有像Waymo這樣的企業(yè),希望一下就能把復(fù)雜的事情做到無人化;也有像Tesla這樣的企業(yè),走漸進式路線,從一開始僅能做到車道線保持,然后學(xué)會了變道、并線、上下匝道再到城區(qū)駕駛,整個過程中都在不斷地采集數(shù)據(jù)。我們會認(rèn)為,漸進式的路線其實是我們具身智能公司能夠去形成突破并構(gòu)建護城河非常關(guān)鍵性的選擇。其實人工采集的訓(xùn)練數(shù)據(jù)量即使達到27萬小時,相比我們整個人類的語料數(shù)據(jù)量還是差很多。將來為了更大數(shù)量級的數(shù)據(jù)采集,要付出的代價會越來越高。它的成本性、可持續(xù)性到底如何,我還是抱有一個問號。

不同于大語言模型或者自然語言處理那個時期,存在著很多既有的專家模型。大模型的出現(xiàn),就基本上把專家模型全都并掉了,實現(xiàn)了快速的“由專到通”。但這件事的前提是有可獲取的、海量的數(shù)據(jù),所以比較容易通過新的算法范式去訓(xùn)練大模型兼并掉各種專用小模型。但是具身智能現(xiàn)在面臨的挑戰(zhàn)是優(yōu)質(zhì)的、尤其是真實場景的真機數(shù)據(jù)非常稀缺,所以很難一蹴而就,我們還是要堅定地走漸進式的發(fā)展路線。

再說到場景選擇,其實從場景到任務(wù),本身有兩個維度,一個是場景的復(fù)雜度和多樣性,一個是任務(wù)和包括被操作物體的復(fù)雜度和多樣性。家庭場景屬于四象限里最靠這個右上角選擇,也就是場景本身和任務(wù)對象都更復(fù)雜的區(qū)域。確實有很多企業(yè)在深耕這個場景,但更多的企業(yè),包括Tesla、Figure等,雖然嘴上講著要進家庭場景,但身體還是很老實地?fù)湓诹薆端場景,包括工業(yè),商業(yè)服務(wù)等。這些場景都能夠讓我們在目前技術(shù)不成熟、數(shù)據(jù)量缺少的情況下,通過做一定的減法,就能夠較快的實現(xiàn)落地閉環(huán)的。

說到我們自己為什么有雙線驅(qū)動策略,其實是要用好這個通用基座模型的通識能力來支持我們的垂類專家模型,使得其能夠在半結(jié)構(gòu)化的工業(yè)制造或者商業(yè)服務(wù)場景去產(chǎn)生價值,再進一步去激活整個數(shù)據(jù)閉環(huán),實現(xiàn)商業(yè)支撐,在這個長坡厚雪的賽道上打一場更持久的仗。

我們的信心來自于我們在過往自動駕駛行業(yè)中,研發(fā)交付超1000萬套的智能駕駛軟硬件產(chǎn)品。然后我們希望通過這種持續(xù)的漸進式的路徑,結(jié)合技術(shù)場景,利用好生態(tài),把我們具身智能的護城河持續(xù)的拓寬。

許四清:你認(rèn)為具身智能的突破是否就依賴世界模型的突破?還是有什么其他路徑?

張玉峰:世界模型這兩年確實非?;穑缓笠惭苌龊芏嗖煌淖痈拍?,也容易讓人混淆。大的類別上肯定有顯式的仿真模擬真實世界的生成式世界模型,比如李飛飛老師正在做的事情或者可交互的視頻生成類大模型,同時也有內(nèi)嵌在模型算法里隱性的,為決策提供物理規(guī)律先驗的隱式世界模型。

先說結(jié)論,我認(rèn)為世界模型是具身智能走向通用的一個非常強大的必要條件。從生物的智能進化路徑上看,自從哺乳動物進化出新皮質(zhì),就擁有了對自身運動和內(nèi)部狀態(tài),以及對外部世界的預(yù)測想象能力,這實際上就是世界模型。這個世界模型和像Sora這樣像素級別構(gòu)建虛擬空間的顯式世界模型不太一樣,它不需要耗費那么大的資源來做像素級還原,但是卻能基于對物理規(guī)律的認(rèn)知,讓包括我們在內(nèi)的哺乳動物擁有預(yù)測、想象、揣測、模擬這個世界可能的變化并更好地在現(xiàn)實世界完成動作的能力。

所以具身智能如果要走向更像人一樣去思考,去模擬,去預(yù)測。從終局來講,其實需要一個類似于人和高等動物一樣內(nèi)置的隱式世界模型。不僅讓機器人知道要做什么動作,還要理解為什么做這個動作,而且能夠去模擬想象做這個動作之后會發(fā)生什么事情。

我們無界動力當(dāng)前更多的是在隱式世界模型方向上做研發(fā),把它內(nèi)嵌在負(fù)責(zé)動作執(zhí)行的VLA模型里。同時顯式世界模型也是有意義的,對于目前數(shù)據(jù)短缺情況下(基于真實數(shù)據(jù)增廣)提供高質(zhì)量的數(shù)據(jù)補充也非常有幫助?,F(xiàn)在自動駕駛行業(yè)也用這種世界模型來做一些corner case 數(shù)據(jù)的增廣和生成,sim2real gap相比以前小了非常多。在隱式和顯式當(dāng)中,我們更側(cè)重于投入在隱式的世界模型上,同時在顯式的世界模型上也會有相應(yīng)的一定量的投入。

To 孫洋

許四清:Looki的第一代產(chǎn)品是以記錄生活作為切入點的,現(xiàn)在產(chǎn)品也非常受歡迎,那這一代產(chǎn)品對Looki而言,是探索人機交互的一個起點呢?還是會繼續(xù)把單一產(chǎn)品做到極致?

孫洋:應(yīng)該說是一個起點吧。我們的核心就是在給AI做眼睛和耳朵,然后讓AI在物理世界里生活。大家可以把具身理解為,它有像人一樣的大腦,然后再加上四肢,能做一些事情。其實Looki在做的事情,就是先把四肢去掉,看能不能先把第二大腦的功能實現(xiàn)

對于第二大腦而言,Looki只是一種形態(tài),未來也可能還會有其他的形態(tài)。這其實是隨著整個硬件供應(yīng)鏈和產(chǎn)業(yè)鏈的發(fā)展而改變的,怎么做到低功耗,怎么能做到無感化,怎么能融入大家的穿搭里去,形態(tài)上未來一定還會有各種各樣的這種延展。

從功能上來講,其實也會隨著模型能力的增強,包括我們自己搭的記憶infra系統(tǒng)的升級,不斷地生長共進。我們最終還是希望搭建一個叫human-centered AI,也就是以人為中心的AI。這件事情的價值在于,今天人類所有和AI的交互還是要鎖在對話框里邊,對于普通用戶來說,每天生活里面發(fā)生的所有事情,我都要轉(zhuǎn)換成語言,轉(zhuǎn)換成prompt,然后才能給到AI的對話框。那我們換一個思路,為什么不能把AI從對話框里拿出來,讓AI自主能看到和聽到物理世界里發(fā)生的事情,這個過程將不再需要用戶再去做一個prompt轉(zhuǎn)換。

我們有一個口號叫做:這個世界就是AI的prompt。這是我們的核心理念,這是一步一步去延展的。我們先把大腦做好,可能最后再把四肢做好,未必說Looki在五年十年后不去做這件事情。通過一個消費電子產(chǎn)品讓大家先用起來,數(shù)據(jù)飛輪能夠轉(zhuǎn)起來,我覺得把啟動器找到這件事兒是最重要的。

下一代產(chǎn)品我們會做proactive AI或者叫real time proactive AI:更適時的主動式的AI。今天我們L 1的產(chǎn)品是需要三段式的,先記錄,然后上傳AI分析,最后給你反饋記憶。到第二代產(chǎn)品L2的時候,適時發(fā)生的所有事情AI都能夠快速給予反饋。L3會是更遠(yuǎn)期的設(shè)想,我們覺得五年之后,模型的能力會讓今天所有的互聯(lián)網(wǎng)服務(wù)都變成Agent,但整個的Agent網(wǎng)絡(luò)里面會出現(xiàn)一個新的角色,這個新的角色就是一個中心的General Agent。這個agent它本身不能實現(xiàn)任何的服務(wù),但是它是非常懂用戶。當(dāng)用戶給他下達一個簡單的指令,General Agent會把這條指令延展成非常豐富的context,然后去對接其他服務(wù)型Agent。

許四清:你認(rèn)為中國的硬件產(chǎn)品在走向全球化的時候,最大的挑戰(zhàn)是什么?

孫洋:我覺得對于AI硬件來說,今天最大的挑戰(zhàn)還是在于data compliance數(shù)據(jù)合規(guī)。因為今天的AI硬件更多都是一個數(shù)據(jù)的入口,這件事情讓數(shù)據(jù)的合規(guī)性變得非常重要。比如說最基本的,你要把數(shù)據(jù)留在當(dāng)?shù)?;第二,你要做該做的?shù)據(jù)審計;然后第三,基于不同的國家,還要對數(shù)據(jù)所有權(quán)有一些規(guī)定。而這些對于之前的消費類硬件來說,并沒有相關(guān)的積累。

To Kay Feng

許四清:Aha快速地構(gòu)筑了非常好的AI科技達人的網(wǎng)絡(luò),你們是如何實現(xiàn)這個快速增長的?

Kay Feng:其實第一個點是這個市場本身的需求就非常強烈。我們服務(wù)客戶的時候,本質(zhì)上客戶花的是他的營銷預(yù)算,我們看到營銷預(yù)算里的一個最大的變化是過去大家可能把錢更多地花在廣告上,但現(xiàn)在其實更多的預(yù)算在往達人營銷遷移。新一代的很多科技產(chǎn)品、AI產(chǎn)品,其實一半以上的預(yù)算都投放在了達人營銷上,而不是傳統(tǒng)的投流廣告上。所以這里面就產(chǎn)生了每年上百萬美金的達人投放預(yù)算,但是這個投放過程在過去是非常低效的,這也成為客戶本身一個非常亟待解決的問題。所以你只要能做到一個比過去的agency更高效,規(guī)模更大,然后體驗更好的產(chǎn)品,那客戶就一定會來嘗試。

另一個角度上,在平臺開始有客戶之后,就會開始有新的達人上來接單,而它是一個自動化的流程。所以那就意味著其實客戶越多,達人就會越多,達人接過一單之后,對平臺有信任,那客戶那一側(cè)的體驗顯然就會更好,那就會有更多客戶進來。這其實就構(gòu)建起來了一個飛輪,他們相互之間不斷地撬動,所以這也是一個雙邊網(wǎng)絡(luò)的獨有優(yōu)勢。

許四清:你們在美國遇到類似的競品多嗎?

Kay Feng:其實從我們目前的情況來看,真正意義上的競爭對手更多還是傳統(tǒng)的人工模式競爭。這是因為我們現(xiàn)在主要服務(wù)的是中型及以上規(guī)模的客戶,在過去,這類客戶在達人營銷上的主流解決方案,基本只有兩種:

一種是外包給 agency,另一種是少數(shù)公司選擇自己搭建一個比較大的內(nèi)部團隊。

從行業(yè)背景來看,達人營銷本身和傳統(tǒng)廣告有比較大的差異。

很多 agency 的核心能力,其實來自創(chuàng)意廣告,或者是上一代以Google、Facebook投流為核心的代理體系,它們在投放和創(chuàng)意上都非常成熟,但并不完全是為達人營銷這種高協(xié)作、高執(zhí)行密度的工作形態(tài)而設(shè)計的。

而達人營銷這個領(lǐng)域,長期以來并沒有形成特別強勢、規(guī)?;腁gency形態(tài),一個很現(xiàn)實的原因是:它本身就是一件高度依賴人力執(zhí)行的事情。

在創(chuàng)意廣告里,一個成熟的人可以管理非常大的預(yù)算體量,一個人就可以承接100萬美金的預(yù)算;但在達人營銷里,預(yù)算規(guī)模一旦上來,對應(yīng)的執(zhí)行人力幾乎是線性增長的,要做100萬美金的達人營銷,可能就需要100個人來做。

所以其實今天在歐美,客戶反而會更迫切地尋找能降低對人工規(guī)模依賴的解決方案,因為如果想規(guī)模化,他的人力成本是真實存在的。

To 張帆

許四清:你原來做通用大模型,現(xiàn)在你要做商業(yè)的強化學(xué)習(xí),是否可以與大家分享一下你對模型的看法和心得嗎?

張帆:首先我覺得一個有意思的點就是在于,我覺得商業(yè)強化學(xué)習(xí)跟基座模型,它不是一個賽道,它是一個延展關(guān)系。市場上一直有一個兩種邏輯的爭論,一種邏輯說將來會有一個超級大一統(tǒng)的模型解決everything;另外一種邏輯說將來市場上會出現(xiàn)無數(shù)的垂類模型,來解決不同的事情。這兩種到底哪種會是未來。

我們先看看人類是怎么做的,我們會發(fā)現(xiàn)人類從5000年前到今天,其實人的腦容量沒有明顯的變化,但是今天的人類比5000年前的人單人的生產(chǎn)力大了1000倍。你可以發(fā)現(xiàn),進化論并沒有把我們每個人進化成一個200斤的腦袋,而是讓我們維持原有的腦袋的size,但是我們解決問題的能力依然可以遠(yuǎn)超原古時代的人類。這個核心的原因和變化就叫做分工,分工之后就是協(xié)作。

分工的邏輯是在于讓每個模型獨立訓(xùn)練,協(xié)作的邏輯是在于讓所有獨立訓(xùn)練的模型解決統(tǒng)一的目標(biāo),從個體智能轉(zhuǎn)化為群體智能。所以你會發(fā)現(xiàn)整個社會的本質(zhì)上是一個超級MOE,這也是我們的底層邏輯。

我覺得在這個階段,你讓大腦的智商再繼續(xù)上升,其實邊際效果已經(jīng)下降了,不經(jīng)濟了。同理,今天的模型已經(jīng)足夠強了,我們?nèi)绾卧诮裉旖o模型構(gòu)建一個大學(xué),讓他從一個標(biāo)準(zhǔn)的智商轉(zhuǎn)變?yōu)闊o數(shù)跟業(yè)務(wù)耦合的最優(yōu)解,從而實現(xiàn)從個體智能到群體智能的飛躍。這也完美符合了OpenAI的AGI的五條路的level 4和level 5。所以我們做這件事的原因其實是基礎(chǔ)模型的延展。

許四清:那你覺得商業(yè)強化學(xué)習(xí),最先在哪些場景上可以實現(xiàn)突破呢?

張帆:我覺得首先取決于我們怎么定義這件事。我們今天把它定義為是一個勞動力市場的事,而不是一個軟件市場。勞動力市場大概是一個50萬億美金的市場,比軟件市場大50倍。在這個市場中,我們的切入有兩個選擇標(biāo)準(zhǔn),一個是今天的市場規(guī)模,今天有哪些工種所占的市場份額是最高的,肯定是我們優(yōu)先選擇的。第二個就是哪些工種,今天是可以完全在數(shù)字空間里解決的,也會是我們優(yōu)先選擇的對象。

許四清:你曾經(jīng)提出整個AI行業(yè)存在供給熱需求冷的狀況,企業(yè)也會被這種狀況帶入這個焦慮驅(qū)動的采購陷阱,你覺得你能改變這個采購陷阱嗎?

張帆:這件事兒是一個很明確的觀察,我們發(fā)現(xiàn)今天其實是一個供給跟需求極度錯配的市場。具體來說,今天所有的人,包括一級二級市場,針對于供給側(cè)幾乎是無條件投入。大家會要更強的芯片,更大的集群和更強的基模,capex也從24年的2000億美金提升到了25年的4000億美金,明年可能就萬億以上。另一方面,模型的成本逐步下降,芯片的性能逐步提升,未來三年我們可能會比現(xiàn)在多1000倍的token的產(chǎn)量,但大家從來沒有懷疑過它能不能被消耗掉。大家都認(rèn)為,只要算力足夠便宜就一定能被消耗掉,我覺得這個其實是不一定。

那么我們再看需求側(cè),MIT之前有一個分享講到今天大概只有5%的PUC是真實落地并且?guī)砹藬?shù)百萬美金的收益。這個跟我們過去兩年在整個市場上看到的情況是高度近似的,今天大模型落地是極其單調(diào)和重復(fù)的,無非就是chatbot、知識庫、合同審核,打標(biāo)簽等,其實根本就沒有切入到核心業(yè)務(wù),有點像具身領(lǐng)域大家都在翻跟頭,但是沒有真正進流水線的邏輯。

許四清:這個非常有意思。所以你看到了大家在大煉鋼鐵一般煉模型和芯片,但你沒有看到大家在需求側(cè)把這些練好的模型和芯片用到極致,你就是想解決這個問題是吧?

張帆:對,我想解決這個問題。我覺得AI其實更多對標(biāo)的是電力,你會發(fā)現(xiàn)電力是通過影響物理世界的方式在影響人類的生產(chǎn)生活,比如說是電梯讓整個城市從平面變成了立體,改變了我們所有人的居住方式,房地產(chǎn)業(yè),城鎮(zhèn)化,地鐵交通一切問題,而不是電力本身。所以今天AI也需要嵌入物理世界,這就是為什么我們覺得TOB很重要。

但是如果要嵌到物理世界,最大的問題就是在于:一個是效果如何直觀觀測,一個是成本如何下降。原來我們所有AI界的人,大家都在做一件事,叫做為知識建模。無論是垂類還是通用,我們都是把人類世界所有知識壓縮到一起放進去,然后壓縮成一個模型。這種方式確實有一定的通用性,但是我們?nèi)稳徽J(rèn)為將來會出現(xiàn)無數(shù)個專業(yè)模型,這就意味著我們不能再靠人標(biāo)了。今天對于模型的調(diào)優(yōu)策略是極度局限的,就是做SFT、prompt優(yōu)化、workflow,我不認(rèn)為這能走到一個真正的終局。所以我們覺得必須要找到一個大一統(tǒng)的方式,用一個標(biāo)準(zhǔn)的手段解決一切垂類環(huán)境跟模型的最優(yōu)匹配。 

寄語2026

孫洋:2026年,我覺得會是非常爭議的一年。這個爭議點在于AI產(chǎn)品上可能會出現(xiàn)的百花齊放,以及大家認(rèn)為26年可能會有很大的bubble。

張玉峰:希望兩邊的學(xué)術(shù)、技術(shù)、產(chǎn)業(yè)都能夠快速發(fā)展,尤其是這個兩地之間的交流、合作、協(xié)同能夠越來越順。

張帆:我覺得26年會是一個AI真正進入物理世界的元年,也是一個商業(yè)強化學(xué)習(xí)落地的元年。25年更多的價值體現(xiàn)在了供給側(cè)的財報,比如英偉達,但我期望26年,我們能看到AI可以給二級市場AI帶來了明顯的業(yè)務(wù)價值的提升。

戴若犁:我們是服務(wù)具身智能這個行業(yè)的,所以我個人的期待其實很樸素:一方面希望馬斯克身體健康,繼續(xù)把人形機器人這條路線往前推;另一方面希望這一波具身智能創(chuàng)業(yè)公司都能走得穩(wěn)、走得遠(yuǎn),希望我的客戶們都越來越好。

Kay Feng:首先26年還是希望AI行業(yè)更好,更多的客戶的產(chǎn)品走過PMF的階段,到達go to market的階段,希望大家的產(chǎn)品能夠在全球更多地區(qū)扎根。

許四清:我對2026年的期望是,具身智能的落地前景能從此變得更加光明。目前具身智能面對的探索環(huán)境與大語言模型截然不同,受限于數(shù)據(jù)匱乏,行業(yè)只能在“小腦”層面進行探索。我希望2026年大家能將探索重心轉(zhuǎn)向“大腦”層面,為具身智能的突破奠定基礎(chǔ)。(本文首發(fā)于鈦媒體APP,由鈦媒體編輯陶天宇整理)

本文系作者 科技不焦慮 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

11:35

A股午評:三大指數(shù)集體上漲,創(chuàng)新藥、鋰電板塊集體爆發(fā)

11:32

國內(nèi)期貨主力合約漲跌不一,碳酸鋰、純苯漲超5%

11:28

光纖概念快速回暖,杭電股份漲停

11:23

2025年中國科幻產(chǎn)業(yè)總營收達1261億元,連續(xù)三年突破千億大關(guān)

11:21

電網(wǎng)設(shè)備概念盤中震蕩回升,長高電新漲停

11:21

零跑A10全球上市,售價6.58萬元起

11:20

智己LS8開啟預(yù)售,價格25.98萬-30.98萬元

11:07

港股鋰電股走強,贛鋒鋰業(yè)漲超7%

11:03

九號公司:與泡泡瑪特達成合作,聯(lián)名電動車將于4月推出

11:02

滬深京三市成交額超1萬億元,較上日此時縮量952億元

10:48

證監(jiān)會首席律師程合紅:開展新一輪公司治理專項行動,加強對減持、程序化交易等市場交易活動的監(jiān)督管理

10:47

證監(jiān)會首席律師程合紅:配合司法機關(guān)研究制定內(nèi)幕交易、操縱市場民事?lián)p害賠償司法解釋,加大先行賠付制度適用力度

10:44

港股恒生科技指數(shù)漲幅擴大至1%

10:43

鋰礦板塊震蕩走高,融捷股份漲停

10:43

全國社保基金理事會:個別組合持有單只股票時間最長達到20年

10:34

證監(jiān)會:資本市場理性投資、價值投資、長期投資的法治基礎(chǔ)進一步夯實

10:33

證監(jiān)會:2025年中長期資金新增入市規(guī)模超一萬億

10:31

社?;饡菏冀K保持戰(zhàn)略定力,堅持長期投資、價值投資、責(zé)任投資

10:30

鋰礦概念反復(fù)活躍,江特電機直線漲停

10:24

騰訊湯道生:Harness工程能力是AI落地關(guān)鍵變量

掃描下載App