AGI-Next圓桌對(duì)話,圖片來源:AGI-Next

AI大模型產(chǎn)業(yè),正演化出多條并行的發(fā)展路徑:從技術(shù)到產(chǎn)品,從To C到To B,從垂直整合到分層協(xié)作。

1月10日,由清華大學(xué)基礎(chǔ)模型北京市重點(diǎn)實(shí)驗(yàn)室、智譜AI發(fā)起的AGI-Next前沿峰會(huì)上,加拿大皇家學(xué)院院士、香港科技大學(xué)榮休教授楊強(qiáng),清華大學(xué)教授、智譜創(chuàng)始人唐杰,Qwen技術(shù)負(fù)責(zé)人林俊旸,以及騰訊”CEO總裁辦公室”首席AI科學(xué)家姚順雨,圍繞AI大模型發(fā)展方向、下一代AI范式、Agent發(fā)展前景以及中國(guó)AI領(lǐng)跑可能性等議題展開了深入討論。

To B市場(chǎng)的價(jià)值彈性正在被打開。企業(yè)愿意為“最強(qiáng)模型”付費(fèi),因?yàn)橹悄艹潭日谂c生產(chǎn)效率形成強(qiáng)相關(guān);而 To C領(lǐng)域的增長(zhǎng)邏輯則更加復(fù)雜,智能提升不必然轉(zhuǎn)化為活躍度與用戶規(guī)模。由此,AI 的“經(jīng)濟(jì)學(xué)”開始與“技術(shù)學(xué)”脫鉤。

在產(chǎn)業(yè)結(jié)構(gòu)上,垂直一體化與,模型與應(yīng)用兩種路線也在并行推進(jìn),To C產(chǎn)品仍然強(qiáng)調(diào)強(qiáng)整合,而To B領(lǐng)域的應(yīng)用創(chuàng)新正在變得更加獨(dú)立與多元。

姚順雨提到的關(guān)鍵點(diǎn)是,To C和To B有明顯的分化趨勢(shì)。對(duì)于消費(fèi)者市場(chǎng),AI更像是一個(gè)加強(qiáng)版的搜索引擎,很多人不知道如何充分利用它的智能。但對(duì)于企業(yè)市場(chǎng),智能程度直接關(guān)系到生產(chǎn)力,大家更愿意為最強(qiáng)的模型付費(fèi)。To B的Agent仍處于上升期,智能提升直接帶來價(jià)值;To C的Agent需更多教育用戶。

林俊旸談到,分化是自然過程,應(yīng)聚焦于解決真實(shí)問題。中國(guó)的SaaS市場(chǎng)與美國(guó)差異大,Coding類AI在國(guó)內(nèi)使用量不如美國(guó)。Agent需與環(huán)境更復(fù)雜交互(如物理實(shí)驗(yàn)),未來可能與具身智能結(jié)合。

從學(xué)術(shù)角度出發(fā),楊強(qiáng)強(qiáng)調(diào),工業(yè)界與學(xué)術(shù)界應(yīng)當(dāng)協(xié)同,學(xué)術(shù)界應(yīng)解決工業(yè)界未深入的理論問題(如智能上限、資源分配、幻覺控制)。借鑒互聯(lián)網(wǎng)發(fā)展路徑,中國(guó)在To C領(lǐng)域可能百花齊放;To B需發(fā)展本土化解決方案(如Palantir式的工程化遷移能力)。

唐杰則表示,他所在的智譜更專注于編碼方向,這可能是接下來競(jìng)爭(zhēng)的關(guān)鍵。“替代搜索”的競(jìng)爭(zhēng)已結(jié)束,下一戰(zhàn)“是讓AI真正做事”。 2026年將出現(xiàn)范式革新,可能圍繞持續(xù)學(xué)習(xí)、記憶、多模態(tài)等方向。

Agen是圓桌共識(shí)的焦點(diǎn)。長(zhǎng)鏈條智能體的能力正在快速躍遷,從自動(dòng)完成數(shù)小時(shí)級(jí)別的工作,走向承擔(dān)以周為單位的復(fù)雜任務(wù)。2026年,被認(rèn)為可能是智能體產(chǎn)生真正經(jīng)濟(jì)價(jià)值的關(guān)鍵節(jié)點(diǎn)。決定AI價(jià)值的不只是模型規(guī)模,更是上下文信息、用戶數(shù)據(jù)與真實(shí)業(yè)務(wù)情境本身,而AI的邊界,正在被重新定義。

以下是圓桌對(duì)話實(shí)錄,經(jīng)鈦媒體編輯整理:

AI大模型分化方向

李廣密:我是Panel的主持人廣密。我剛才在臺(tái)下聽有幾個(gè)感受,第一是唐老師的號(hào)召力很強(qiáng),清華的人才非常好,不僅是國(guó)內(nèi)包括海外,清華人的比例非常高,感覺這一撥好像跟國(guó)內(nèi)學(xué)校在AI這一撥拉開差距了。

第二是我剛才聽?zhēng)讉€(gè)Talk的感受是不止follow、不止開源,不只是Coding,都在探索自己的產(chǎn)品形態(tài)。2025年是中國(guó)開源模型大放異彩的一年,是開源四杰在全球大放異彩的一年,而且是Coding過去一年有10-20倍增長(zhǎng)的一年,包括海外也在提Scaling到底走到哪一步了,有沒有新范式出來了,接下來這個(gè)Panel是到底接下來怎么走是特別有意思的。

接下來邀請(qǐng)幾位嘉賓:楊強(qiáng)教授、唐杰老師、俊旸和順雨。我們先從第一個(gè)比較有意思的話題聊起,硅谷幾家明顯做分化,可以從分化這個(gè)主題先聊起來,Anthropic其實(shí)是對(duì)中國(guó)模型有一個(gè)非常大的啟發(fā),硅谷的競(jìng)爭(zhēng)那么激烈,它沒有完全Follow,全都做,而且是專注到了企業(yè),專注到了Coding,專注到了Agent。我也在想接下來中國(guó)的模型會(huì)分化成自己想要的哪些方向?我覺得分化這個(gè)主題蠻有意思的。順雨上線了,順雨開場(chǎng)給大家講一講,包括你最近在干嘛。

姚順雨:大家好,我現(xiàn)在是不是一個(gè)巨大的臉在會(huì)場(chǎng)?不好意思,今天沒法親自來北京,但是很高興參加這個(gè)活動(dòng)。最近忙著做模型、做產(chǎn)品、做AI,是一個(gè)很正常的狀態(tài)?;貒?guó)的感覺還是挺好的,吃的好很多。

李廣密:順雨,你能展開聊聊你對(duì)模型分化這個(gè)主題的想法嗎?硅谷也都在分化,包括說Sora peck做了Coding,中國(guó)很多模型做了開源,過去Coding提的也很快,包括谷歌也沒有全都做,它現(xiàn)在把全模態(tài)這個(gè)做好,你的老東家重點(diǎn)做To c是橫跨中美的體感,可以講講你的體感,接下來不管是自己也好,各家也好,分化這個(gè)點(diǎn),你是怎么思考的?

姚順雨:我覺得有兩個(gè)大的感受,一個(gè)感受是To C和To B發(fā)生了明顯的分化,另外一個(gè)感受是垂直整合這條路,以及模型和應(yīng)用分層這條路,也開始出現(xiàn)了分化。我先說第一點(diǎn),我覺得很明顯的是當(dāng)大家想到AI就是兩個(gè),ChatGPT,另外一個(gè)Claude code,是做To c和To b的淀粉。非常有意思的一點(diǎn)是我們今天用ChatGPT和去年相比的話,感受差別不是太大。

但是相反,Coding夸張一點(diǎn)來講,已經(jīng)在重塑整個(gè)計(jì)算機(jī)行業(yè)做事的方式,人已經(jīng)不再寫代碼,而是用英語(yǔ)和電腦去交流。我覺得很核心的一點(diǎn),對(duì)于To C來說,大部分人大部分時(shí)候不需要用到這么強(qiáng)的智能,可能今天用ChatGPT和去年相比,寫成交代數(shù)和伽羅瓦理論的能力變強(qiáng)的,但是大部分人大部分時(shí)候感受不到。大部分人尤其是在中國(guó)更多像是搜索引擎的加強(qiáng)版,很多時(shí)候也不知道該怎么去用,把它的智能給激發(fā)出來。但對(duì)于TO B來說,很明顯的一點(diǎn)是智能越高,代表生產(chǎn)力越高,值錢的也越來越多,這些東西都是相關(guān)的。

對(duì)于TO B來講,還有一個(gè)很明顯的點(diǎn),大部分時(shí)候很多人就愿意用最強(qiáng)的模型,一個(gè)模型是200美元/月,第二強(qiáng)或者差一些的模型是50美元/月、20美元/月,我們今天發(fā)現(xiàn)很多美國(guó)的人愿意花溢價(jià)用最好的模型,可能他的年薪是20萬美元,每天要做10個(gè)任務(wù),像一個(gè)非常強(qiáng)的模型可能10個(gè)任務(wù)中,八九個(gè)做對(duì)了,差的是做對(duì)五六個(gè),問題是你不知道這五六個(gè)是哪五六個(gè)的情況下,需要花額外精力去監(jiān)控這個(gè)事情。我覺得無論是人還是模型,在To B這個(gè)市場(chǎng)上發(fā)現(xiàn)了一個(gè)很有意思的現(xiàn)象,強(qiáng)的模型和稍微差點(diǎn),或者弱的模型它的分化會(huì)越來越明顯。我覺得這是第一點(diǎn)觀察。

第二點(diǎn)觀察,垂直整合這條路和模型應(yīng)用分層這條路的區(qū)別,我覺得一個(gè)比較好的例子,比如ChatGPT Agent,相比于用Claude或者Gemini加上Manus這樣的應(yīng)用層產(chǎn)品,過去大家會(huì)認(rèn)為當(dāng)你有垂直整合能力肯定會(huì)做的更好,但起碼今天來看并不一定。首先模型層和應(yīng)用層需要的能力還是挺不一樣的,尤其是對(duì)于To B或者生產(chǎn)力這樣的場(chǎng)景來說,可能更大的預(yù)訓(xùn)練還是一個(gè)非常關(guān)鍵的事情,這個(gè)事情對(duì)于產(chǎn)品公司確實(shí)很難做,但是想要把這么一個(gè)特別好的模型用好,或者這樣的模型有它的溢出能力,也需要在應(yīng)用側(cè)或者環(huán)境這一側(cè)做很多相應(yīng)的事情。

我們會(huì)發(fā)現(xiàn)其實(shí)在To C的應(yīng)用上垂直整合還是成立的,無論是ChatGPT還是豆包,模型和產(chǎn)品是非常強(qiáng)耦合去緊密迭代的,但是對(duì)于To B來說這個(gè)趨勢(shì)似乎是相反的,模型在變的越來越強(qiáng)、越來越好,但同樣會(huì)有很多應(yīng)用層的東西應(yīng)用好的模型在不同的生產(chǎn)力環(huán)節(jié)。這是我的兩個(gè)觀察。

李廣密:因?yàn)轫樣暧幸粋€(gè)新的身份,在中國(guó)的市場(chǎng)下順雨在接下來想的是什么,有哪些鮮明的特點(diǎn)或者關(guān)鍵詞嗎?現(xiàn)在能給大家分享嗎?

姚順雨:我覺得騰訊肯定還是To C基因更強(qiáng)的公司,我覺得我們會(huì)思考怎么樣能夠讓今天的大模型或者說AI的發(fā)展能夠給用戶提供更多價(jià)值,很核心的思考是我們發(fā)現(xiàn)很多時(shí)候我們的環(huán)境來講或者更強(qiáng)的模型,或者很強(qiáng)的模型,很多時(shí)候是額外的Context。

我最近經(jīng)常舉一個(gè)例子,比如我想問我今天該去吃什么?其實(shí)你今天問ChatGPT和你去年問或者明天問都會(huì)差很多。這個(gè)事情想要變好,不是說你需要更大的模型、更強(qiáng)的預(yù)訓(xùn)練、更強(qiáng)的強(qiáng)化學(xué)習(xí)、更強(qiáng)的Agent環(huán)境或者更強(qiáng)的搜索引擎,這個(gè)問題可能需要更多額外的輸入,或者我們叫Context,如果它知道我今天特別冷,我需要吃些暖和的,我在今天這樣的范圍活動(dòng),可能我老婆在另一個(gè)地方吃什么等各種各樣的事情。其實(shí)回答這樣的問題,更多的是額外的。比如我和老婆聊了很多時(shí)間天,我們可以把聊天記錄轉(zhuǎn)發(fā)給元寶,或者把額外的輸入用好,反而會(huì)給用戶帶來很多額外的價(jià)值。這是我們對(duì)To C上的思考。

在To B在中國(guó)確實(shí)是很難的事情,生產(chǎn)力的革命,包括我們今天很多中國(guó)的公司做Coding Agent需要打很多海外市場(chǎng)。我們會(huì)思考怎么把自己先服務(wù)好,像創(chuàng)業(yè)公司做Coding這個(gè)事情和大公司做Coding這個(gè)事情,一個(gè)區(qū)別是作為大公司本身就已經(jīng)有各種各樣的應(yīng)用場(chǎng)景、各種各樣需要生產(chǎn)力變的更好的地方,如果我們的模型能夠在這個(gè)地方做的更好,不僅這個(gè)模型會(huì)有自己獨(dú)特的優(yōu)勢(shì),不僅我們公司本身能得到很好的發(fā)展,很重要的一點(diǎn)是對(duì)于真實(shí)世界場(chǎng)景的數(shù)據(jù)捕捉會(huì)是一個(gè)很有意思的事情。

比如說Cloud,這些創(chuàng)業(yè)公司,他們想要去做更多的Coding Agent的數(shù)據(jù)廠商去標(biāo)注這個(gè)數(shù)據(jù),他們需要利用各種各樣的軟件工程師去想我要去標(biāo)什么樣的數(shù)據(jù)。這個(gè)事情是數(shù)據(jù)公司一共就這么幾家,一共招了這么多人,最終你會(huì)受限,但如果你是一個(gè)10萬人的公司可能會(huì)有一些有意思的嘗試,怎么把真實(shí)世界的數(shù)據(jù)利用好,而不是僅僅依賴于標(biāo)注商或者協(xié)議。

李廣密:多謝順雨。接下來Cue一下俊旸,你怎么看接下來千問未來的生態(tài)位或者分化的考慮,之前你講了多模態(tài),阿里云在To B很強(qiáng),接下來你也提了全模態(tài)可能更多的是To C的,這方面是怎么思考的?

林俊旸:接下來這一句,我也想注入我們自己對(duì)AGI的理解。我覺得今天To B也好,To C也好,我們?cè)诜?wù)真實(shí)的問題,我們想的問題是怎么把人類世界變的更好。你就算做To C的產(chǎn)品也會(huì)分化,今天OpenAI更像一個(gè)平臺(tái)了,但是TO C最終要服務(wù)真實(shí)的這批用戶究竟是誰(shuí)。

今天可能有很多AI會(huì)更偏向medical和log,今天我覺得Coding真的很厲害,我就拜訪它,因?yàn)槲抑浪麄兏蛻艚涣鞣浅6?,這個(gè)是我們還不夠好的一個(gè)點(diǎn),雖然我們擁有巨大的優(yōu)勢(shì),也可能中國(guó)SaaS市場(chǎng)跟美國(guó)確實(shí)不太一樣,他們確實(shí)非常頻繁地跟客戶進(jìn)行交流,很容易發(fā)現(xiàn)很大的機(jī)會(huì)。

今天我跟美國(guó)的很多API廠商聊起來,他們沒有想Coding消耗量那么大,在中國(guó)真的沒有那么大,至少?gòu)奈疫@邊來看,但是在美國(guó),基本上全都是Coding,我覺得這個(gè)事情不是所有人都能Get到的。今天做的一些相關(guān)的一些東西,我覺得也是他們自己在跟客戶看到這個(gè)機(jī)會(huì),我覺得可能大家的分化是自然的分化,我更愿意相信AGI,做AGI該做的事情,順其自然,這是我們?cè)撟龅氖虑椤?/p>

李廣密:多謝俊旸。有請(qǐng)楊強(qiáng)老師談?wù)劮只膯栴}。

楊強(qiáng):分化的問題其實(shí)我更想聊一下工業(yè)界和學(xué)術(shù)界的分化,這個(gè)可能是橫跨美國(guó)和中國(guó)的。一直以來,學(xué)術(shù)界是一個(gè)觀望者,工業(yè)界在領(lǐng)頭往前瘋跑,搞得很多學(xué)術(shù)界的人也在做工業(yè)界的事情,像唐杰老師,這是一個(gè)好事,就好像天體物理學(xué)剛剛開始的時(shí)候是以觀測(cè)為主,伽利略的望遠(yuǎn)鏡,然后才出現(xiàn)牛頓。所以我覺得后面一個(gè)階段,當(dāng)我們有了眾多的穩(wěn)定大模型,進(jìn)入一個(gè)穩(wěn)態(tài)的時(shí)候,我們學(xué)術(shù)界應(yīng)該跟上來。

學(xué)術(shù)界跟上來要解決什么問題呢?工業(yè)界可能還沒來得及解決的一些問題,這也是我一直在考慮的問題,就是說智能的上限在哪里,比如說給你一定的資源,計(jì)算資源或者能源資源,你能做到多好?可以更細(xì)一點(diǎn),比方說我們把這個(gè)資源怎么分配,哪些分配在訓(xùn)練上、哪些分配在推理上?其實(shí)我很早就在做AI,90年代初就做過一個(gè)小實(shí)驗(yàn),如果我們有一定的投入在記憶上,那么這個(gè)記憶能夠幫助推理多少,這個(gè)幫助會(huì)不會(huì)變成一個(gè)反向的,就是說你記的太多了,反而記的噪音會(huì)干擾你的推理,有沒有一個(gè)平衡點(diǎn),我覺得這些問題今天還是適用的。

我最近也在想另外一個(gè)問題,大家學(xué)計(jì)算機(jī)的都必定上計(jì)算機(jī)理論課,里面有一個(gè)重要的定理叫哥德爾不完備定理,大概意思是說一個(gè)大模型不能自證清白,必定有一些幻覺不可能消滅掉,可能你給更多的資源,它會(huì)消滅的更多,所以科學(xué)問題就來了,你多少資源能夠換取多少幻覺的降低或者錯(cuò)誤率的降低,這是有一個(gè)平衡點(diǎn)的,這個(gè)平衡點(diǎn)特別像經(jīng)濟(jì)學(xué),經(jīng)濟(jì)學(xué)的風(fēng)險(xiǎn)和收益的一種平衡,所以我們叫這叫無免費(fèi)午餐定理。像這些東西,我覺得今天就特別適合數(shù)學(xué)界、算法界和學(xué)術(shù)界和工業(yè)界一起做研究,這孕育著一個(gè)巨大的突破。

剛才唐杰老師也提到持續(xù)學(xué)習(xí),我覺得持續(xù)學(xué)習(xí)是一個(gè)特別好的問題,它里面有個(gè)時(shí)間的概念,你在持續(xù)地不斷地學(xué)的過程當(dāng)中,但是你會(huì)發(fā)現(xiàn),比方說你把不同的Agent給串聯(lián)起來,每一個(gè)Agent都不能做到百分之百的話,你在N個(gè)以后它的能力是按指數(shù)下降的,你怎么樣能夠保證它不下降,人類是用一個(gè)方法做這個(gè)事,第一天是學(xué)習(xí),第二天會(huì)在第一天噪音的基礎(chǔ)上學(xué)習(xí),這樣你的能力就類似大模型會(huì)下降。

但是人類有一個(gè)方法就是睡覺、睡眠,我建議大家看一本書叫《我們?yōu)槭裁此X》,是MIT的兩個(gè)教授寫的,非常好玩,它說每天晚上睡覺是在清理噪音,使得第二天你可以把準(zhǔn)確率持續(xù)地提升,不至于是兩個(gè)策略率的疊加。像這些理論的研究孕育著一種新的計(jì)算模式。我們今天可能比較關(guān)注Transformer computer,但是我覺得有必要做一些新的探索,這是工業(yè)界和學(xué)術(shù)界要拉齊。

李廣密:唐老師,我們從外部的感受上,智譜今天更像是走了Anthropic這條路線,就是coding非常強(qiáng),榜單上非??壳?,包括長(zhǎng)程的Agent,您對(duì)分化這個(gè)主題怎么看?

唐杰:我倒覺得回到了最本質(zhì)的問題,早期的時(shí)候還是基座模型,2023年那個(gè)時(shí)候我們第一個(gè)做出Chat的,當(dāng)時(shí)第一個(gè)想法是趕緊把Chat扔在網(wǎng)上上線,當(dāng)時(shí)國(guó)家有規(guī)定,八九月份一起上。當(dāng)時(shí)我的第一感受是十來個(gè)大模型都上來了,而且每一家用戶都沒有那么多,當(dāng)然今天分化的非常嚴(yán)重。

后來我經(jīng)過一年的思考,我覺得其實(shí)這個(gè)已經(jīng)不是真的解決問題,我的第一個(gè)預(yù)判是說它會(huì)替代搜索,我相信今天很多人在用這個(gè)模型替代搜索,到今天我相信大家很多人在開始用這個(gè)模型替代搜索,但是并沒有替代谷歌,谷歌反而把自己的搜索革命了,谷歌自己做了搜索的改進(jìn)。從這個(gè)角度上,我覺得這一仗從DeepSeek出來之后,已經(jīng)沒有了,已經(jīng)結(jié)束了。DeepSeek之后我們應(yīng)該想的是下一仗是什么東西?

我們團(tuán)隊(duì)爭(zhēng)論了很久,下一仗肯定要讓AI做一件事情,做這件事情是什么可以討論一下,那個(gè)時(shí)候廣密還到我們那跟我們交流,廣密的知識(shí)特別淵博,他思考問題很深邃,和他的交流對(duì)我的啟發(fā)非常大,原來我沒有想到,那一次讓我啟發(fā)非常大。后來我們團(tuán)隊(duì)爭(zhēng)論了很多晚上,爭(zhēng)論到最后,可以叫我們的運(yùn)氣,另一方面我們也是把所有的精力放在了Coding上。

下一代AI范式

李廣密:不僅在追求通用能力,大家都有自己的資源稟賦把自己擅長(zhǎng)的點(diǎn)做。接下來第二個(gè)比較有意思的問題,今天這個(gè)時(shí)間點(diǎn)特別特殊,一個(gè)是預(yù)訓(xùn)練過去走了3年,大家都說可能今天走到了七八成的收益,強(qiáng)化學(xué)習(xí)也都成為共識(shí),做到了四五十的空間,后面的數(shù)據(jù)、環(huán)境空間很大,接下來一個(gè)新的范式,唐老師也談到了自主學(xué)習(xí)、自我學(xué)習(xí),因?yàn)榻裉爝@個(gè)會(huì)的主題是接下來的展望Next,我覺得這是一個(gè)特別值得去聊的話題。

我們先從順雨開始,你從領(lǐng)先的OpenAI待過,對(duì)于下一個(gè)范式是怎么思考的?因?yàn)镺penAI是為人類推進(jìn)了前兩個(gè)范式的一家公司,對(duì)第三個(gè)范式,從你的觀察來講,能給大家?guī)硪恍┓窒韱幔?/p>

姚順雨:現(xiàn)在自主學(xué)習(xí)是一個(gè)非常熱門的詞,在硅谷大街小巷咖啡館里面,大家都在談?wù)?,形成了一個(gè)共識(shí)。根據(jù)我的觀察,每個(gè)人對(duì)這個(gè)東西的定義和看法都不一樣,我講兩點(diǎn):第一,這個(gè)事情不是方法論,而是數(shù)據(jù)或者任務(wù)。當(dāng)我們?cè)谡務(wù)撟灾鲗W(xué)習(xí)的時(shí)候,它到底在什么樣的場(chǎng)景下基于什么樣的獎(jiǎng)勵(lì)函數(shù)去做,你在聊天的時(shí)候變的越來越個(gè)性化是一種自主學(xué)習(xí),在寫代碼的時(shí)候越來越熟悉每個(gè)公司獨(dú)特的環(huán)境或者文檔是一種自主學(xué)習(xí),你去探索新的科學(xué),在這個(gè)過程中像一個(gè)博士一樣,從原來不了解有機(jī)化學(xué)是什么,到完成這個(gè)領(lǐng)域的專家,這也是一種自主學(xué)習(xí)。每一種自主學(xué)習(xí)的挑戰(zhàn)或者說方法論都不太一樣。

第二,我不知道這是不是非共識(shí)的,這個(gè)事情其實(shí)已經(jīng)在發(fā)生了,很明顯的,ChatGPT在利用用戶的數(shù)據(jù)不斷彌合人聊天的風(fēng)格是什么,使得能感覺到它的好,這是不是一種自我學(xué)習(xí)?今天Claude已經(jīng)寫了Claude code這個(gè)項(xiàng)目95%的代碼,它在幫助它自己變的更好,這是不是一種自我學(xué)習(xí)?我們當(dāng)時(shí)2022年、2023年的時(shí)候,我去硅谷宣傳這個(gè)工作,我當(dāng)時(shí)寫了第一頁(yè)是說ASI最重要的點(diǎn)是自主學(xué)習(xí)。

今天的AI系統(tǒng)本質(zhì)上都有兩部分,首先它是一個(gè)模型,其次它有個(gè)代碼庫(kù),你怎么去用這個(gè)模型,是用來做推理,還是做Agent,有相應(yīng)的代碼庫(kù),我們今天看Claude code這個(gè)系統(tǒng)本質(zhì)上有兩部分。一部分是部署環(huán)境的一大串相應(yīng)的代碼,kernel、 GPU的環(huán)境是怎樣的。另一部分是怎么樣去使用它,有一大堆相應(yīng)的代碼,無論是GPU的,或者說它的前端還是環(huán)境是什么樣的。

我們做Switch方面大家意識(shí)不到,這些自主學(xué)習(xí)的例子可能還局限在每一個(gè)特定的場(chǎng)景下,沒有讓人感覺到非常大的威力。這個(gè)事情已經(jīng)在發(fā)生了,可能效率或者受限制的限制,有各種各樣的問題,可能這個(gè)事情我個(gè)人的看法它更像是一個(gè)漸變,不是突變,這是我的看法。

李廣密:我再Follow順雨一個(gè)問題,有一些人對(duì)自主學(xué)習(xí)比較樂觀,2016年可以看到一些信號(hào),你覺得自主學(xué)習(xí)看到信號(hào),還有哪些實(shí)際的問題要突破?比如說Long Context也好,模型并行采樣也好,你感覺接下來還有哪些關(guān)鍵條件具備了,這些信號(hào)才會(huì)發(fā)生?

姚順雨:很多人說2026年看到信號(hào),我覺得2025年就看到信號(hào)了,比如cursor他們做的每幾個(gè)小時(shí)都會(huì)用最新的用戶數(shù)據(jù)去進(jìn)行學(xué)習(xí),包括新的模型,也在使用這些真實(shí)環(huán)境下的數(shù)據(jù)去訓(xùn)練,大家覺得這個(gè)東西可能還沒有特別石破天驚,是因?yàn)槭芟抻谒麄儧]有預(yù)訓(xùn)練能力,他們模型效果確實(shí)還不如Claude 4.5 Opus,顯然這是一個(gè)信號(hào)。

最大的問題是想象力,我們很容易想象強(qiáng)化學(xué)習(xí)或者推理這個(gè)范式,如果實(shí)現(xiàn)大概是什么樣,我們可以想象O1,在數(shù)學(xué)題上本來是10分,現(xiàn)在變成了80分,通過這個(gè)強(qiáng)化學(xué)習(xí)有非常強(qiáng)的思維鏈做這個(gè)事情。如果2026年或者2027年我們有一個(gè)范式的發(fā)生,我宣布了一個(gè)新的模型或者新的系統(tǒng)實(shí)現(xiàn)了自我學(xué)習(xí),我們應(yīng)該用什么樣的任務(wù),它應(yīng)該是什么樣的效果,你會(huì)相信它實(shí)現(xiàn)了,它是一個(gè)賺錢的交易系統(tǒng),它可以賺很多錢,它真的解決了人類之前沒法解決的科學(xué)問題還是別的。我覺得可能需要先想象到它長(zhǎng)什么樣。

李廣密:順雨,OpenAI已經(jīng)立了兩次范式科學(xué),如果2027年有新的范式出來,全球范圍內(nèi)的哪家公司繼續(xù)立的范式創(chuàng)新的概率最大?如果說一家公司。

姚順雨:可能OpenAI的概率還是更大,因?yàn)樗虡I(yè)化等各種各樣的變化,它創(chuàng)新的基因已經(jīng)被削弱了,但我覺得它還是最有可能誕生新范式的地方。

李廣密:多謝順雨??D對(duì)2026年新的范式還有什么要聚焦的?

林俊旸:如果從更實(shí)際一點(diǎn)來講的話,剛才講的這個(gè)范式在比較早期階段,RL這個(gè)事情,實(shí)際上我們還沒有做的那么充分,很多潛力沒有打出來。今天我們也看到很多問題在這里發(fā)生,我覺得全球范圍內(nèi)類似的問題還存在。如果要說下一代范式的話,一個(gè)自主學(xué)習(xí),之前跟一個(gè)朋友聊到說人類不能讓AI變的更厲害,比如說你跟AI不斷地交互,只會(huì)讓它上下文變的越來越長(zhǎng),AI變的越來越笨,這是很煩人的事情。這件事情是不是真的能夠發(fā)生?

這還是挺值得思考的,你能吐更多Token讓你變的更強(qiáng),至少O系列一定程度上實(shí)現(xiàn)有沒有可能,就像我真的干30個(gè)小時(shí)真的能夠干出很難的任務(wù),今天大家做超越的事情很難,有沒有可能通過Coding去實(shí)現(xiàn)。從這個(gè)角度來說,AI肯定需要自主進(jìn)化,但究竟你是不是要更新參數(shù),我覺得見仁見智,大家都有不同的技術(shù)手段去實(shí)現(xiàn)這個(gè)事情。

第二點(diǎn)是AI有沒有可能實(shí)現(xiàn)更強(qiáng)的主動(dòng)性,環(huán)境是我的輸入信號(hào),我現(xiàn)在的AI必須得有人類幫助他才能啟動(dòng),但是有沒有可能自己能自主思考,去做一些事情。這引發(fā)了一個(gè)新的問題,就是安全的問題,我非常擔(dān)心安全的問題,不是擔(dān)心它今天講一些不該說的話,最擔(dān)心的是它做一些不該做的事情比如說今天主動(dòng)產(chǎn)生一些想法,往會(huì)場(chǎng)里面扔一顆炸彈,我們肯定不希望不安全的事情發(fā)生。就像培養(yǎng)小孩一樣,我們要給它注入一些正確的方向,但主動(dòng)學(xué)習(xí)是一個(gè)挺重要的范式。

李廣密:俊旸提了主動(dòng)性,自主學(xué)習(xí)看到信號(hào),你感覺可能是在哪些任務(wù)上做什么樣的任務(wù)會(huì)先看到?是訓(xùn)練模型,最強(qiáng)的模型可以提升自己,還是自動(dòng)化的AI研究員?你有期待在哪些地方先看到嗎?

林俊旸:我覺得自動(dòng)化的AI研究員甚至都不是那么需要自主學(xué)習(xí),可能很快訓(xùn)AI這件事情就可以實(shí)現(xiàn),我看我們同學(xué)每天干這個(gè)事情,我覺得很快就被替代掉。我覺得可能更持續(xù)的理解用戶這件事情還挺重要的,比如說過往我們?cè)谧鐾扑]系統(tǒng)的時(shí)候,用戶這個(gè)信息是持續(xù)輸入,讓這個(gè)系統(tǒng)變的更強(qiáng),它的算法變的更簡(jiǎn)單。

在AI這個(gè)時(shí)代它是不是能不更懂你,這些信息的輸入能不能真正成為幫助我們的工具。我覺得如果說自主學(xué)習(xí)的話,可能是跟人的交互上就能做到。但是以什么指標(biāo)進(jìn)行衡量?不太好說,在推薦的時(shí)代下,你做的越好,別人可能點(diǎn)的越多、買的越多,但是在AI時(shí)代覆蓋到人類生活的方方面面的時(shí)候,真正的衡量指標(biāo)是什么,我們不太知道。我感覺今天更大的從技術(shù)上的挑戰(zhàn),我們今天不知道該怎么做,這可能是我們更值得研究的問題。

李廣密:俊旸說到了主動(dòng),包括個(gè)性化,你感覺如果實(shí)現(xiàn)記憶這個(gè)點(diǎn),2026年能看到技術(shù)突破性的跨越嗎?

林俊旸:我個(gè)人觀點(diǎn)是大量的技術(shù)所謂的突破性都是一些觀測(cè)問題,都是在線性發(fā)展的,只是人類對(duì)它的感受非常強(qiáng)烈而已,包括像ChatGPT的出現(xiàn),對(duì)于我們做大模型的人來講都是線性的增長(zhǎng),現(xiàn)在大家都是在做Memory這個(gè)事情,這個(gè)技術(shù)對(duì)還是不對(duì)呢?

很多方案也沒有對(duì)錯(cuò)之分,但做出來的效果,至少拿我們自己獻(xiàn)丑,我們自己的Memory看起來知道我過去干了什么,但是只是記起來過去事情,每次叫一遍我的名字,其實(shí)并不顯得你很聰明,你的Memory有沒有可能到某一個(gè)臨界點(diǎn)的時(shí)候,結(jié)合你的Memory,就像生活當(dāng)中的人一樣,過去大家講電影,它真的很像人,理解你的Memory就是在那一下,人類的感受突然間迸發(fā)。我覺得多多少少也需要一年時(shí)間,很多時(shí)候技術(shù)也沒有發(fā)展那么快。大家比較卷,每天有新的東西,但是技術(shù)在線性的發(fā)展,我們?cè)谟^測(cè)的角度處于指數(shù)上升的階段。

比如說Coding能力的一點(diǎn)點(diǎn)提升,可能就能帶來很多生產(chǎn)價(jià)值,大家就覺得AI發(fā)展的很快,從技術(shù)的進(jìn)展上來說,我們多干一點(diǎn)點(diǎn)事情。每天看我們自己做的事情覺得真的挺土的,那些Bug真的不好意思拿出來跟大家講。如果這樣做,我們已經(jīng)做到這樣的成績(jī),我覺得可能未來算法與infra結(jié)合的更好,可能更大有可為。

李廣密:有請(qǐng)楊強(qiáng)老師。

楊強(qiáng):我一直以來是做聯(lián)邦學(xué)習(xí)的,聯(lián)邦學(xué)習(xí)的主要思想是多個(gè)中心大家協(xié)作。我現(xiàn)在越來越多地看到很多有本地資源不足,但是本地的數(shù)據(jù)又有很多隱私和安全的要求,所以這樣我們就可以想象現(xiàn)在大模型的能力越來越強(qiáng),這種通用型大模型和本地特殊性的小模型或者領(lǐng)域?qū)<业哪P腿绾螀f(xié)作,我覺得這種協(xié)作變的越來越可能。

像美國(guó)ZOOM,就是黃學(xué)東他們做的AI系統(tǒng),他做了一個(gè)很大的基座,這個(gè)基座大家都可以插進(jìn)來,它可以在Decentralise的狀態(tài)下,能夠既保護(hù)隱私,又能夠和通用大模型有效的溝通、協(xié)作。我覺得這種開源模式特別好,一個(gè)是知識(shí)的開源,一個(gè)是Code方面的開源,模型階段。我覺得尤其是像醫(yī)療、金融這樣的場(chǎng)景下,會(huì)越來越多看到這樣的現(xiàn)象發(fā)生。

李廣密:有請(qǐng)?zhí)评蠋煛?/p>

唐杰:我對(duì)今年會(huì)有非常大的范式革新有信心,我不說太細(xì),就像我剛才講的持續(xù)學(xué)習(xí),還有Memory,甚至多模態(tài),我覺得都有可能出現(xiàn)新的范式變革。但我覺得一個(gè)新的趨勢(shì),我說說為什么會(huì)產(chǎn)生這么一個(gè)范式?

我覺得原來其實(shí)工業(yè)界跑的遠(yuǎn)遠(yuǎn)快于學(xué)術(shù)界,我記得去年和前年回到清華跟很多老師聊天的時(shí)候能不能做大模型,很多老師第一是沒卡,也不是沒卡,是卡的數(shù)量幾乎為零,工業(yè)界有1萬片,學(xué)校是0片或者1片,倍數(shù)是1萬次,但是到現(xiàn)在的時(shí)候,很多學(xué)校已經(jīng)有很多卡了,而且很多老師已經(jīng)開始做了很多大模型的相關(guān)研究,包括硅谷那邊有很多老師都開始做模型架構(gòu)、持續(xù)學(xué)習(xí)相關(guān)的研究。

原來我們總覺得工業(yè)界在dominating這些,其實(shí)我覺得今天在2025年底到2026年初的時(shí)候,這一現(xiàn)象不大存在了,可能還有10倍的差,但它已經(jīng)孵化出種子了,我覺得在學(xué)術(shù)界有這個(gè)創(chuàng)新的基因,有這個(gè)可能性,這是第一個(gè)。

我覺得一個(gè)創(chuàng)新的出現(xiàn)一定是某個(gè)事情有大量的投入,并且它的efficiency變成瓶頸了,現(xiàn)在在整個(gè)大模型里面投入已經(jīng)巨大,但是efficiency并不高,也就是我們繼續(xù)Scaling,肯定是有收益的,原來data從2025年初,當(dāng)時(shí)可能10個(gè)TB的數(shù)據(jù),現(xiàn)在30個(gè)T,甚至我們可以Scaling到100個(gè)T,但是100個(gè)T,你Scaling上去以后,你的收益有多少,計(jì)算Cost有多少,變成了這么一個(gè)問題,你不創(chuàng)新,這就變成了可能花掉10個(gè)億、花掉了20個(gè)億,但是你的收益很小,就不值得了。

另外一方面對(duì)于新的智能創(chuàng)新,假如說我們每一次都要重訓(xùn)一個(gè)基座,再重訓(xùn)很多RL,像2024年出RL的時(shí)候,很多人會(huì)覺得我接著訓(xùn),收益表里有,但是到今天的時(shí)候再接著瘋狂的RL,收益也有,但沒有那么大,還是收益效率的問題,可能我們未來也許可以定義,一方面既然要Scaling up,最笨的辦法就是Scaling,Scaling我們會(huì)有收益,Scaling肯定會(huì)帶來智能上界的提升。

第二個(gè)辦法是應(yīng)該定義Intelligence efficiency,就是說智能的效率,我們獲得智能的效率,我們用多少投入能獲得這個(gè)智能的增量,如果我們能用更少的獲得它的增量,而且現(xiàn)在我們已經(jīng)變成了一個(gè)瓶頸,假如能用更少的范式獲得同樣智能的提升,它就變成一個(gè)瓶頸式的事情。所以我覺得2026年一定會(huì)有這樣一個(gè)范式的發(fā)生,我們也在努力,我們希望發(fā)生在我們身上,但也不一定。

2026年,Agent會(huì)有什么變化?

李廣密:我跟唐老師一樣也非常樂觀,每個(gè)領(lǐng)先的模型公司,每年的計(jì)算量有10倍左右,大家手上的計(jì)算資源多了,而且人才也涌入的越來越多,大家手上的卡變多,做的實(shí)驗(yàn)做了,有可能就是某個(gè)試驗(yàn)工程,某個(gè)點(diǎn)就出來了。

剛才唐老師也聊到怎么衡量智能水平的點(diǎn),第三個(gè)是聊聊Agent戰(zhàn)略,最近我跟很多研究員聊,對(duì)2026年還有一個(gè)很大的預(yù)期,Agent今天可以在后臺(tái)推理3-5個(gè)小時(shí),做人類1-2天的工作量,大家期待2026年可以做人類正常工作1-2周的工作量,這也是一個(gè)非常大的變化,它不再只是一個(gè)Chat,而是說真的在自動(dòng)化一整天甚至一周的任務(wù)流。

2026年Agent可能是創(chuàng)造經(jīng)濟(jì)價(jià)值的關(guān)鍵一年。Agent這個(gè)問題,可以讓大家展開聊一聊,順雨剛才提的垂直整合,既有模型,又有Agent產(chǎn)品,包括我們看到硅谷的幾個(gè)公司,從模型到Agent端到端都做了。順雨花了很多時(shí)間做Agent的研究,你對(duì)2026年Agent,比如說Long Agent真的能干人類1-2周的工作,對(duì)Agent戰(zhàn)略,包括從模型公司的出發(fā)點(diǎn),會(huì)怎么思考這個(gè)問題?

姚順雨:我覺得還是像剛剛說的To B和To C不太一樣,目前看起來,我覺得To B的情況現(xiàn)在已經(jīng)達(dá)到了在不斷上升的曲線,目前看起來好像沒有變慢的趨勢(shì)。很有意思的一點(diǎn)是它基本上不做什么創(chuàng)新,就是覺得模型預(yù)訓(xùn)練變大了,老老實(shí)實(shí)的把這些東西做好,只要預(yù)訓(xùn)練不斷地變大,后訓(xùn)練不斷地把這些真實(shí)世界的任務(wù)給做好,會(huì)越來越聰明,它就會(huì)帶來越來越大的價(jià)值。

從某種程度來說,做To B,所有的目標(biāo)這件事更一致,模型的智能越高,解決的任務(wù)越多,在To B下帶來的收益越大。做To C的問題是說,我們都知道DAU或者說產(chǎn)品的指標(biāo)和模型的智能,很多時(shí)候是不相關(guān)的,甚至是相反的關(guān)系,我覺得這是能夠聚焦的另一個(gè)很重要的原因,他只要真的把模型越做越好,他的收益越來越高,所有的事情都是非常好的。

目前看起來,To B或者說生產(chǎn)力的Agent剛剛開始,現(xiàn)在除了模型之外,有兩個(gè)Next,環(huán)境問題或者Deployment問題。在OpenAI之前,我在一個(gè)公司實(shí)習(xí)過,這是一個(gè)To B的公司,我覺得在To B公司工作過有很多收獲,最大的收獲是即使今天的模型不再變好,所有的模型訓(xùn)練全部停止了,但是我們把這些模型部署到世界上各種各樣的公司,已經(jīng)能帶來今天10倍或者100倍的收益,能對(duì)GDP產(chǎn)生5%-10%的影響,但是今天它對(duì)GDP的影響還不到1%。

另外我覺得教育非常重要,我觀察現(xiàn)在人和人的差距非常大,更多時(shí)候不是說人類替代了人類工作,而是會(huì)使用這些工具的人在替代那些不會(huì)使用工具的人,就像當(dāng)年電腦出來,如果轉(zhuǎn)身學(xué)習(xí)編程跟你還在持續(xù)計(jì)算、使用算法,差距是巨大的。今天中國(guó)能做到的最大的有意義的事情是更好的教育,教育大家怎么更好的使用像Claude或者ChatGPT這樣的產(chǎn)品,當(dāng)然Claude可能在中國(guó)用不了,但我們可以用Kimi或者智譜這樣的國(guó)產(chǎn)模型。

李廣密:多謝順雨。有請(qǐng)俊旸分享對(duì)Agent的想法,包括千問也有一個(gè)生態(tài),千問自己做Agent,以及扶持生態(tài)的通用Agent,你也可以展開講一講。

林俊旸:這里可能涉及產(chǎn)品哲學(xué)的問題,當(dāng)然Manus確實(shí)很成功,套殼是不是未來,這本身也是個(gè)話題,今天到這個(gè)環(huán)節(jié),我比較同意你的觀點(diǎn),叫模型即產(chǎn)品。我跟TML的聊,他們叫Research,其實(shí)我挺喜歡這個(gè)事情的,包括我的視角看OpenAI,我覺得還有挺多這種事情,就是挺多Research,自己可以成為產(chǎn)品經(jīng)理,把這個(gè)東西給做起來,包括今天我們自己內(nèi)部的Research都可以做面向真實(shí)世界的東西。

我愿意相信接下來的Agent是可以做到剛才所說的這個(gè)事情,而且跟剛才所提的主動(dòng)學(xué)習(xí)都有比較強(qiáng)烈的關(guān)系,它能干這么長(zhǎng)的時(shí)間,自己就得在這個(gè)過程當(dāng)中進(jìn)化,并且它還要決定去干什么,因?yàn)樗盏降倪@個(gè)指令是非常通用的任務(wù),我們現(xiàn)在Agent已經(jīng)變的托管式的Agent,而不是我要不斷給你來來回回交互的那種形式。

從這個(gè)角度來說,它對(duì)模型的要求是很高的,模型就是這個(gè)Agent本身,Agent就是這個(gè)產(chǎn)品本身,如果它們都是一體化的話,今天做基礎(chǔ)模型本身,其實(shí)也就是在做產(chǎn)品。如果不斷提升模型能力的上限,包括Scaling能做上去,確實(shí)能夠做到這個(gè)事情。我覺得還有一個(gè)點(diǎn)是跟環(huán)境交互有關(guān)系,我們現(xiàn)在交互的環(huán)境還不是很復(fù)雜,這些都還是電腦的環(huán)境。

我有朋友是做AI for Science比較相關(guān)的,比如說今天你干AlphaFold這個(gè)事情,其實(shí)你最后干出來,它還沒有到那一步,比如距離制藥這件事情,就算用今天的AI,不一定能幫到你那么多,因?yàn)槟阋プ鲈噷?shí)驗(yàn),你要去做這些事情才能得到反饋,有沒有可能我們未來AI環(huán)境復(fù)雜到真實(shí)的人類世界的環(huán)境,指揮機(jī)器人去做試驗(yàn),去加快效率。

現(xiàn)在人類的效率非常低,我們還要雇傭很多外包在實(shí)驗(yàn)環(huán)境里面去做實(shí)驗(yàn),如果能達(dá)到這個(gè)點(diǎn),可能才是我想象當(dāng)中Agent能做很長(zhǎng)時(shí)間的活,而不是在電腦當(dāng)中寫個(gè)文件等,這些東西今年很快就可以完成,接下來3-5年的時(shí)間,這個(gè)事情會(huì)更加有意思一些。這個(gè)可能又要跟具身智能結(jié)合在一起。

李廣密:我想Follow俊旸一個(gè)尖銳一點(diǎn)的問題,從你的角度看來,通用的Agent,這個(gè)機(jī)會(huì)是創(chuàng)業(yè)者的嗎?還是說模型公司是時(shí)間問題,總會(huì)把通用Agent做好?

林俊旸:不能因?yàn)槲易龌A(chǔ)模型,我就去做創(chuàng)業(yè)導(dǎo)師,我做不了這個(gè)事情。我只能借成功人士的那句話,做通用Agent最有意思的事情就是長(zhǎng)尾反而是更值得關(guān)注的事情,或者說今天AI更大的魅力是在長(zhǎng)尾,如果是馬太效應(yīng),頭部的東西挺容易解決的,當(dāng)年做推薦的時(shí)候我們看到那個(gè)推薦非常集中,商品都是在頭部,但我們想把尾部的東西推過去,但是我當(dāng)時(shí)做的非常遭殃,我作為一個(gè)干多模態(tài)的人碰到推薦系統(tǒng),我去了解馬太效應(yīng),基本上是奔著死路去的。

今天所謂的AGI就在解決這個(gè)問題,你做通用Agent,能不能把長(zhǎng)尾的問題給解決,今天我一個(gè)用戶,真的尋遍各處都找不到能夠幫我解決這個(gè)問題的,但是在那一刻,我感受到了AI的能力,全世界任何一個(gè)角落,尋遍各處都找不到,但是你卻能幫我解決,這就是AI最大的魅力。要不要做通用Agent呢?我覺得見仁見智,如果你是一套殼高手,套的可以比模型公司做的更好,我覺得可以去做;但如果你沒有這個(gè)信心,這個(gè)事情可能是留給模型公司做模型即產(chǎn)品的,因?yàn)樗麄冇龅絾栴}的時(shí)候,我只要訓(xùn)一訓(xùn)模型,只要燒一燒卡,這個(gè)問題可能就解決了,所以見仁見智。

李廣密:其實(shí)解決長(zhǎng)尾的問題,模型公司算力+數(shù)據(jù),好像解決起來也挺快的。

林俊旸:今天RL最有意思的地方,我們發(fā)現(xiàn)修問題比以前容易,以前修問題很難。我舉個(gè)B端客戶的情況,他們說我們自己要做SSD,你能不能告訴我這個(gè)通用數(shù)據(jù)怎么配比,每次我們都很頭痛,我們覺得對(duì)方不太會(huì)做SSD,他那個(gè)數(shù)據(jù)非常垃圾,但他們可能覺得非常有用。但現(xiàn)在有RL以后,今天很小的一個(gè)數(shù)據(jù)點(diǎn),甚至都不需要標(biāo)注,只要有Query,這個(gè)東西稍微訓(xùn)一訓(xùn),合并起來也非常容易,這可能是今天技術(shù)的魅力。

李廣密:多謝俊旸,有請(qǐng)楊強(qiáng)老師。

楊強(qiáng):我覺得Agent出現(xiàn),應(yīng)該有四個(gè)階段,一個(gè)是目標(biāo)的定義,是人為定義的,還是自動(dòng)定義的,這是目標(biāo)。第二是說規(guī)劃,就是中間的Action,規(guī)劃可以由人定義,也可以AI自動(dòng)定義,這樣自然就分為四個(gè)階段了,我覺得我們現(xiàn)在在一個(gè)非常初級(jí)的階段,目標(biāo)也是人定義的,規(guī)劃也是由人來做的,所以現(xiàn)在的這些Agent的軟件系統(tǒng),基本上是更高級(jí)的階段,但是我預(yù)料未來會(huì)出現(xiàn)一個(gè)大模型觀察人的工作,尤其是把data給使用起來。最后目標(biāo)也可以是大模型來定義,規(guī)劃也可以由大模型定義,所以Agent應(yīng)該是由大模型內(nèi)生的一個(gè)native的系統(tǒng)。

李廣密:有請(qǐng)?zhí)平芾蠋煛?/p>

唐杰:我覺得有幾個(gè)方面決定了Agent未來的走勢(shì):第一,Agent本身有沒有解決人類的事情,而這個(gè)事情是不是有價(jià)值,價(jià)值有多大?比如說原來的Agent像GPT-S出來也做了很多Agent,那時(shí)候你會(huì)發(fā)現(xiàn)那個(gè)Agent非常簡(jiǎn)單,最后發(fā)現(xiàn)promoment就解決了,這時(shí)候大部分Agent慢慢就死掉了。

第一個(gè)是解決Agent這個(gè)事情多有價(jià)值,以及真的能夠幫到人。第二,做這個(gè)事情咱們Cost有多大,如果Cost的特別大,這個(gè)時(shí)候也是一個(gè)問題,就像剛才俊旸說的,也許調(diào)用一個(gè)API就能把這個(gè)問題解決了,但是反過來,假如調(diào)到API就能解決,這個(gè)API本身有可能覺得當(dāng)這件事情價(jià)值很大的時(shí)候,就會(huì)把它做進(jìn)去,這是個(gè)矛盾,非常矛盾,基座的應(yīng)用永遠(yuǎn)是矛盾。

最后,做應(yīng)用的速度。如果說我有個(gè)時(shí)間窗,能夠拉開半年的時(shí)間窗,迅速把這個(gè)應(yīng)用滿足了,半年以后,要么迭代,要么怎么接,怎么能往前走也是一個(gè)方面。大模型到現(xiàn)在更多的是在拼速度、拼時(shí)間,也許我們代碼正確了,也許我們就會(huì)在這方面走的更遠(yuǎn)一點(diǎn),但也許失敗以后就半年,半年就沒了,今年我們只是在Coding,在Agent這一塊做了一點(diǎn)點(diǎn),現(xiàn)在我們Coding的調(diào)用量都還不錯(cuò),我覺得更多的也是一個(gè)方向,做Agent未來也是一個(gè)方向。

未來3-5年,中國(guó)AI領(lǐng)跑的可能性

李廣密:多謝,因?yàn)檫^去模型公司既要追通用能力,可能它的優(yōu)先級(jí)上沒有花那么多精力去探索,通用能力追上來之后,我們更多的期待2026年智譜、千問有更多自己的Claude時(shí)刻和Memory時(shí)刻,我覺得這是非常值得去預(yù)期的。

第四個(gè)問題,也是最后一個(gè)意思,比較有意思,這個(gè)活動(dòng)這個(gè)時(shí)間點(diǎn)需要展望未來,我挺想問大家一個(gè)問題,在三年和五年以后,全球最領(lǐng)先的AI公司是中國(guó)團(tuán)隊(duì)的概率有多大?我們從今天的跟隨者變成未來的引領(lǐng)者,這個(gè)文化包括關(guān)鍵條件到底還有哪些需要去做好的?就是未來3-5年,我就想這個(gè)概率有多大,以及需要哪些關(guān)鍵條件?順雨經(jīng)歷過硅谷跟中國(guó)兩個(gè)體感的,你對(duì)概率的判斷和需要哪些關(guān)鍵條件的判斷是怎么樣的?

姚順雨:我覺得概率還挺高的,我還是挺樂觀的。目前看起來,任何一個(gè)事情一旦被發(fā)現(xiàn),在中國(guó)就能夠很快的復(fù)現(xiàn),在很多局部做的更好,包括之前制造業(yè)、電動(dòng)車這樣的例子已經(jīng)不斷地發(fā)生。我覺得可能有幾個(gè)比較關(guān)鍵的點(diǎn),一個(gè)可能是中國(guó)的光刻機(jī)到底能不能突破,如果最終算力變成了Bottleneck(音),我們能不能解決算力問題,我們有很好的電力優(yōu)勢(shì),有很好的基礎(chǔ)設(shè)施的優(yōu)勢(shì)。主要的瓶頸,一個(gè)是產(chǎn)能,包括光刻機(jī),以及軟件生態(tài)。

如果這個(gè)問題解決,我覺得會(huì)是很大的幫助。另一個(gè)問題,除了To C之外,能不能有更成熟或者更好的To B的市場(chǎng),或者有沒有機(jī)會(huì)在國(guó)際的商業(yè)環(huán)境競(jìng)爭(zhēng)。今天我們看到很多做生產(chǎn)力或者做To B的模型或者應(yīng)用,還是會(huì)誕生在美國(guó),因?yàn)橹Ц兑庠父鼜?qiáng)的,文化更好,今天在國(guó)內(nèi)做這個(gè)事情很難,所以大家都會(huì)選擇出?;蛘邍?guó)際化的事情,這兩個(gè)是比較大的客觀上的因素。

更重要的是主觀上的概念,最近我在跟很多人聊天,我們的感受是在中國(guó)有非常多非常強(qiáng)的人才,任何一個(gè)事情只要被證明能做出來,很多人都會(huì)非常積極地嘗試,并且想做的更好。我覺得中國(guó)想要突破新的范式或者做非常冒險(xiǎn)事情的人可能還不夠多,這里面有經(jīng)濟(jì)環(huán)境、商業(yè)環(huán)境包括文化的因素,如果增加一點(diǎn),主觀上有沒有更多有創(chuàng)業(yè)精神或者冒險(xiǎn)精神的人,真的想要去做前沿探索或者新的范式突破的事情。

目前來看,一個(gè)范式一旦發(fā)生,我們可以用很少的卡、很高的效率去局部做的更好,我們到底能不能引領(lǐng)新的范式,這可能是今天中國(guó)唯一要解決的問題,因?yàn)槠渌凶龅氖虑?,無論是商業(yè),還是產(chǎn)業(yè)設(shè)計(jì),還是做工程,我們某種程度上已經(jīng)比美國(guó)做的更好。

李廣密:我再Follow順雨一個(gè)問題,你對(duì)中國(guó)Lab里面的研究文化有什么要呼吁的嗎?你也感受過OpenAI也好,包括灣區(qū)DeepMind研究文化,中國(guó)的研究文化跟美國(guó)的研究文化有什么差異的地方?這個(gè)研究文化對(duì)作為一個(gè)AI Native的公司,有哪些根本性的影響?你有呼吁和建議嗎?

姚順雨:我覺得每個(gè)地方的研究文化都很不一樣,美國(guó)實(shí)驗(yàn)室的區(qū)別可能比中美實(shí)驗(yàn)室的差別還要大,在中國(guó)也一樣。我個(gè)人覺得有兩點(diǎn),一點(diǎn)是說在中國(guó)大家還是更喜歡做更安全的事情,比如說今天預(yù)訓(xùn)練這個(gè)事情已經(jīng)被證明可以做出來了,其實(shí)這個(gè)事情也非常難做,有很多技術(shù)問題要解決,但只要這件事情一旦被證明能做出來,我們都很有信心幾個(gè)月或者一段時(shí)間內(nèi)就把這個(gè)問題搞清楚,但如果今天讓一個(gè)人說探索一個(gè)長(zhǎng)期記憶或者持續(xù)學(xué)習(xí),這個(gè)事情大家不知道怎么做、不知道能不能做起來,這個(gè)事情還是比較困難的。

可能不只是大家更喜歡做確定性的事情、不太愿意做創(chuàng)新性的事情,很重要的一點(diǎn)是文化的積累或者整體的認(rèn)知,其實(shí)是需要時(shí)間沉淀的事情,OpenAI在2022年就開始做這個(gè)事情了,國(guó)內(nèi)2023年開始做了,對(duì)這個(gè)東西的理解會(huì)有一些差異,或者說中國(guó)沒有這么大,我覺得可能很多也就是時(shí)間問題,當(dāng)你積累了文化或者底蘊(yùn)更深的時(shí)候,潛移默化的程度可能會(huì)影響人的做事方式,但是它很微妙,很難通過榜單去體現(xiàn)。

中國(guó)對(duì)于刷榜或者數(shù)字看的更重一些,包括DeepSeek做的比較好的一點(diǎn),他們可能沒有那么關(guān)注榜單的數(shù)字,可能會(huì)更注重,第一,什么是正確的事情;第二,什么是你自己能體驗(yàn)出好或者不好的。我覺得這還是挺有意思的,因?yàn)槟憧碈laude模型可能在編程或者軟件工程的榜單上也不是最高的,但大家都知道這個(gè)東西是最好用的,我覺得這還是需要大家能夠走出這些榜單的束縛,能夠堅(jiān)持自己覺得是不是正確的過程。

李廣密:多謝順雨。請(qǐng)俊旸說說概率和挑戰(zhàn)。

林俊旸:這個(gè)問題是個(gè)危險(xiǎn)的問題,理論上這個(gè)場(chǎng)合是不可以潑冷水的,但如果從概率上來說,我可能想說一下我感受到的中國(guó)和美國(guó)的差異,比如說美國(guó)的Computer可能整體比我們大1-2個(gè)數(shù)量級(jí),但我看到不管是OpenAI還是什么,他們大量的Computer投入到的是下一代的Research當(dāng)中去,我們今天相對(duì)來說捉襟見肘,光交付可能就已經(jīng)占據(jù)了我們絕大部分的Computer,這會(huì)是一個(gè)比較大的差異在這里。

這可能是歷史以來就有的問題,創(chuàng)新是發(fā)生在有錢的人手里,還是窮人手里,窮人不是沒有機(jī)會(huì),我們覺得這些富哥真的很浪費(fèi)卡,他們訓(xùn)了這么多東西,可能訓(xùn)了很多也沒什么用,但今天窮的話,比如今天所謂的算法Infra聯(lián)合優(yōu)化的事情,如果你真的很富,就沒有什么動(dòng)力去做這個(gè)事情。我覺得可能更進(jìn)一步的,剛才順雨提到光刻機(jī)的問題,未來有可能還有一個(gè)點(diǎn),如果從軟硬結(jié)合的角度,是不是真的有可能做出來。

比如說我們下一代這個(gè)模型和芯片,有可能是一起把它給做出來的。我在2021年的時(shí)候在做大模型,因?yàn)榘⒗镒鲂酒?,在找我說能不能預(yù)測(cè)一下三年之后這個(gè)模型是不是Transformer,三年之后這個(gè)模型是不是多模態(tài),為什么是三年呢?他說我們需要三年時(shí)間才能留片。我當(dāng)時(shí)的回答是三年之后,在不在阿里巴巴,我都不知道!但我今天還在阿里巴巴,他果然還是Transformer,果然還是多模態(tài),我非常懊悔為什么當(dāng)時(shí)沒有催他去做,當(dāng)時(shí)我們的交流非常雞同鴨講,他給我講了一大堆東西,我完全聽不懂,我給他講,他也不知道我們?cè)谧鍪裁?,就錯(cuò)過了這個(gè)機(jī)會(huì)。

這個(gè)機(jī)會(huì)有沒有可能再來一次?我們雖然是一群窮人,是不是窮則生變,創(chuàng)新的機(jī)會(huì)會(huì)不會(huì)發(fā)生在這里?今天我們教育在變好,我屬于90年代靠前一些的,順雨屬于90年代靠后一點(diǎn)的,我們團(tuán)隊(duì)里面有很多00后,我感覺大家的冒險(xiǎn)精神變的越來越強(qiáng),美國(guó)人天然有非常強(qiáng)烈的冒險(xiǎn)精神,一個(gè)很典型的例子是當(dāng)時(shí)電動(dòng)車剛出來,甚至天棚漏水的情況下,甚至開車會(huì)意外身亡的情況下,依然會(huì)有很多富豪們都愿意去做這個(gè)事情。

但在中國(guó),我相信富豪們是不會(huì)去干這個(gè)事情的,大家會(huì)做一些很安全的事情。今天大家的冒險(xiǎn)精神開始變的更好,中國(guó)的營(yíng)商環(huán)境也在變的更好的情況下,我覺得是有可能帶來一些創(chuàng)新的。概率沒那么大,但真的有可能。

李廣密:如果派一個(gè)數(shù)字呢?

林俊旸:您是說百分之多少?

李廣密:對(duì),三年到五年后,中國(guó)最領(lǐng)先的那個(gè)公司,是一家中國(guó)公司的概率。

林俊旸:我覺得是20%吧,20%已經(jīng)非常樂觀了,因?yàn)檎娴挠泻芏鄽v史積淀的原因在這里。

李廣密:我再Follow一個(gè)問題,比如說中國(guó)的模型跟美國(guó)的模型差距,有的地方在追上來,有的地方他們的算力在拉大,你內(nèi)心中Gap變大的恐懼感強(qiáng)嗎?

林俊旸:今天你干這一行就不能恐懼,必須得有非常強(qiáng)的心態(tài),對(duì)于我們的心態(tài)來說,能干這一行就非常不錯(cuò)了,能做大模型這件事情已經(jīng)非常幸運(yùn)了。我覺得還是看你的初心是什么,剛才順雨提到一個(gè)點(diǎn),你的模型不一定那么強(qiáng)在C端里邊是OK的。我可能轉(zhuǎn)換成另外一個(gè)角度去思考這個(gè)問題,我們的模型為人類社會(huì)帶來了什么樣的價(jià)值,只要我相信我這個(gè)東西能夠?yàn)槿祟惿鐣?huì)帶來充分的價(jià)值,能夠幫助人類,就算不是最強(qiáng)的,我也愿意接受。

李廣密:多謝俊旸。有請(qǐng)楊老師,因?yàn)槟?jīng)歷過很多AI的周期,也看過很多中國(guó)的AI公司變成世界最強(qiáng),您對(duì)這個(gè)問題的判斷。

楊強(qiáng):我們可以回顧一下互聯(lián)網(wǎng)的發(fā)展,一開始也是從美國(guó)開始,但中國(guó)很快就趕上了,而且應(yīng)用像微信,是世界第一的。我想AI是一個(gè)技術(shù),它并不是一個(gè)終端的產(chǎn)品,但我們中國(guó)有很多聰明才智會(huì)把這個(gè)產(chǎn)品發(fā)揮到極致,不管是To B還是To C,但我可能更看好To C,因?yàn)榘倩R放,中國(guó)人集思廣益,但To B可能會(huì)有一些限制,像付費(fèi)意愿、企業(yè)文化等也在改變。

我最近也在觀察商業(yè)方向跟商學(xué)院的一些同學(xué)探討,比方說美國(guó)有一個(gè)公司叫Palantir,它的一個(gè)理念是不管AI現(xiàn)在發(fā)展到什么階段,我總是能在AI里面發(fā)現(xiàn)一些好的東西應(yīng)用在企業(yè)上,中間肯定有g(shù)ap,我們要給它彌合,它有一個(gè)辦法叫本體,用的是本體的方法。我觀察了一下,大概的思想是我們之前做的遷移學(xué)習(xí),就是說把一個(gè)通用的Solution能夠應(yīng)用到一個(gè)具體的實(shí)踐當(dāng)中,用一個(gè)本體來做知識(shí)的遷移,這個(gè)方法非常巧妙。當(dāng)然它是通過一種工程的方法,叫前端工程師FDE來解決的。

不管怎么樣,我覺得像這種就非常值得我們學(xué)習(xí),我覺得中國(guó)的企業(yè)像AI Native的公司應(yīng)該發(fā)展出這樣一些To B的Solution來,我相信會(huì)的。所以我覺得To C肯定是百花齊放的,To B也會(huì)很快的跟上來。

李廣密:多謝楊老師。有請(qǐng)?zhí)评蠋煛?/p>

唐杰:首先我覺得確實(shí)要承認(rèn)在中美,無論是做研究,尤其是企業(yè)界的AI Lab,我覺得和美國(guó)是有差距的,但我覺得在未來中國(guó),現(xiàn)在慢慢變的越來越好,尤其是90后、00后這一代企業(yè),遠(yuǎn)遠(yuǎn)好過之前。

有一次我在一個(gè)會(huì)上說我們這一代最不幸運(yùn),上一代也在繼續(xù)工作,我們也在工作,所以我們還沒有出頭之日,很不幸的是下一代已經(jīng)出來了,世界已經(jīng)交給下一代了,已經(jīng)把我們這一代無縫跳過了。這是開玩笑的。中國(guó)也許的機(jī)會(huì):第一,一群聰明人真的敢做特別冒險(xiǎn)的事,我覺得現(xiàn)在是有的,00后這一代,包括90后這一代是有的,包括俊旸、Kimi、順雨都非常愿意冒風(fēng)險(xiǎn)來做這樣的事情。

第二,咱們的環(huán)境可能更好一些,無論是國(guó)家的環(huán)境,比如說大企業(yè)和小企業(yè)之間的競(jìng)爭(zhēng),創(chuàng)業(yè)企業(yè)之間的問題,包括我們的營(yíng)商環(huán)境,像剛才俊旸說的,我還在做交付,我覺得如果把這個(gè)環(huán)境建設(shè)的更好,讓一群敢于冒險(xiǎn)的聰明人有更多的時(shí)間去做這樣創(chuàng)新的事情,比如說讓俊旸有更多的時(shí)間做創(chuàng)新的事情,這是第二個(gè),也許是我們政府,包括我們國(guó)家可以幫忙改善的事情。

第三,回到我們每個(gè)人自己身上,就是我們能不能堅(jiān)持。我們能不能愿意在一條路上敢做、敢冒險(xiǎn),而且環(huán)境還不錯(cuò)。我覺得環(huán)境肯定不會(huì)是最好的,永遠(yuǎn)不會(huì)想著環(huán)境是最好的,我們恰恰是幸運(yùn),我們經(jīng)歷環(huán)境從原來沒那么好,到慢慢變得更好的一個(gè)時(shí)代,我們是經(jīng)歷者,也許就是財(cái)富,包括經(jīng)歷收獲最多的人,如果我們笨笨的堅(jiān)持,也許走到最后的就是我們。感謝大家!

李廣密:感謝唐老師。我們也很想呼吁,應(yīng)該把更多的資源資金投入到中國(guó)的AGI行業(yè),有更多的算力,讓更多AI年輕的研究員搓卡,有可能搓個(gè)三五年,中國(guó)有三五個(gè)自己的伊莉亞,這是我們未來三五年很期待的。非常感謝大家。(本文首發(fā)于鈦媒體APP,編輯|李程程)

本文系作者 LCC_Beta版 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

2026-01-11 22:36

特朗普被曝正考慮多個(gè)干涉伊朗方案

2026-01-11 21:46

稀土指數(shù)正式上線

2026-01-11 21:44

阿塞拜疆單體最大的風(fēng)電項(xiàng)目正式完工

2026-01-11 21:34

中國(guó)U23男足戰(zhàn)勝澳大利亞隊(duì)

2026-01-11 21:31

貝森特:美國(guó)財(cái)政部有足夠資金支付任何關(guān)稅退款

2026-01-11 21:31

伊朗總統(tǒng):政府認(rèn)可和平抗議行為,愿與抗議團(tuán)體會(huì)面

2026-01-11 21:27

下周(1月12日-18日)市場(chǎng)大事預(yù)告

2026-01-11 21:05

特朗普:將不會(huì)再有石油或資金流入古巴

2026-01-11 20:38

興業(yè)證券王涵:新興市場(chǎng)股市市值與企業(yè)盈利上升空間剛剛打開

2026-01-11 20:36

境內(nèi)ETF單次分紅再創(chuàng)紀(jì)錄,滬深300ETF華泰柏瑞分紅測(cè)算達(dá)110億元

2026-01-11 20:34

超20家A股上市公司本周披露并購(gòu)重組最新公告

2026-01-11 20:10

1月11日新聞聯(lián)播速覽22條

2026-01-11 20:07

中信建投:銅必將接力金銀,行情仍未結(jié)束

2026-01-11 20:06

國(guó)家數(shù)據(jù)局召開數(shù)據(jù)產(chǎn)權(quán)登記座談會(huì)

2026-01-11 20:04

香港高鐵連接內(nèi)地站點(diǎn)本月將新增16個(gè)

2026-01-11 19:55

同濟(jì)大學(xué)成立機(jī)械工程與機(jī)器人學(xué)院、汽車與能源學(xué)院

2026-01-11 19:49

規(guī)避潛在財(cái)富稅,谷歌聯(lián)合創(chuàng)始人將商業(yè)實(shí)體遷出加州

2026-01-11 19:41

伊朗總統(tǒng):美以指使“暴徒”在伊朗制造不穩(wěn)定局勢(shì)

2026-01-11 19:28

MiniMax:已于1月9日悉數(shù)行使超額配股權(quán)

2026-01-11 19:20

香港運(yùn)輸署今年將推動(dòng)自動(dòng)駕駛車輛無人化測(cè)試

掃描下載App