![]()
圖片來(lái)源:智譜
1月8日,智譜正式在港股上市,開(kāi)盤報(bào)120港元/股,較發(fā)行價(jià)上漲3.27%,市值突破528億港元。
當(dāng)日,清華大學(xué)計(jì)算機(jī)系教授、智譜創(chuàng)立發(fā)起人兼首席科學(xué)家唐杰發(fā)布內(nèi)部信,要用“咖啡”的精神做AGl,“上癮”便是人生的精彩所在,無(wú)論是研究,還是其它事,只要專注、努力,就一定能做好。
他在內(nèi)部信中坦言,“現(xiàn)實(shí)也是殘酷的,All-in不僅需要堅(jiān)定的信念,也需要極其強(qiáng)大的資金、團(tuán)隊(duì)支持,更需要精準(zhǔn)的預(yù)判。”
在內(nèi)部信中,唐杰特意提到了Deepseek和梁文鋒對(duì)其帶來(lái)的警醒和思考。他表示,當(dāng)時(shí)并沒(méi)有意識(shí)到梁文鋒對(duì)AGI如此執(zhí)著,感謝他讓自己有了不一樣的思考,選擇對(duì)AGI技術(shù)的執(zhí)著追求,不斷探索AGI的上界,同時(shí)精準(zhǔn)的未來(lái)預(yù)判成為下一步智譜需要不斷改進(jìn)和升華的地方。
總體來(lái)說(shuō),2025年在模型側(cè),智普如期完成了年初定下的4月發(fā)一個(gè)“穩(wěn)住陣腳”的模型、年中發(fā)一個(gè)“上牌桌”的模型(即成為one of the best)、年底發(fā)一個(gè)Top1的模型的整體戰(zhàn)略。
唐杰在內(nèi)部信中還明確提出,2026年智譜的目標(biāo)是成為國(guó)際領(lǐng)跑的大模型企業(yè)。他透露,很快將會(huì)推出GLM-5,GLM-5通過(guò)進(jìn)一步的Scaling和很多全新技術(shù)改進(jìn),讓AI幫大家完成更多真實(shí)任務(wù)。
唐杰還指出,已經(jīng)廣泛使用近10年的Transformer架構(gòu)已經(jīng)顯露出一些不足,包括超長(zhǎng)上下文的計(jì)算開(kāi)銷、記憶機(jī)制、更新機(jī)制等。這些都需要探索全新的模型架構(gòu),發(fā)現(xiàn)新的Scaling范式,通過(guò)芯片-算法協(xié)同設(shè)計(jì)等技術(shù)提高計(jì)算效率。
而當(dāng)前主流的RLVR范式雖然在數(shù)學(xué)和代碼領(lǐng)城取得了成功,唐杰認(rèn)為其依賴人工構(gòu)造可驗(yàn)證環(huán)境的局限性也日益凸顯,今年需要探索更通用的RL范式,支持AI不僅能在人類指令下完成特定任務(wù),更要能理解并執(zhí)行跨越數(shù)小時(shí)甚至數(shù)天的長(zhǎng)時(shí)程任務(wù)。
唐杰認(rèn)為,最具挑戰(zhàn)性的探索,是開(kāi)啟通往持續(xù)學(xué)習(xí)與自主進(jìn)化的道路。當(dāng)前所有主流的AI模型,其智能在部署后基本上是靜態(tài)的,它們通過(guò)一次性的、耗資巨大的訓(xùn)練過(guò)程獲得知識(shí),然后在應(yīng)用中逐漸過(guò)時(shí)。這與人腦能夠從與世界的持續(xù)交互中不斷學(xué)習(xí)、進(jìn)化的方式截然不同。智譜將會(huì)對(duì)下一代學(xué)習(xí)范式——在線學(xué)習(xí)(Online Learning)或持續(xù)學(xué)習(xí)(Continual Learning)進(jìn)行前瞻性布局。
他還透露,智譜內(nèi)部設(shè)立了一個(gè)全新部門——X-Lab,這個(gè)部門將致力于前沿性探索,包括全新的模型架構(gòu)、新的認(rèn)知范式、還將孵化新項(xiàng)目,不局限于軟件或是硬件。
同時(shí),他還表示,智譜也會(huì)擴(kuò)大對(duì)外投資,不僅僅是戰(zhàn)略聯(lián)合已有的被投企業(yè),也要開(kāi)辟新的版圖,讓整個(gè)行業(yè)貫通起來(lái),一起繁榮。
在內(nèi)部信中,唐杰還強(qiáng)調(diào),“我們不是一家傳統(tǒng)公司,我們也不打算成為其中之一,我們希望成為一家一切皆有可能發(fā)生的AI原生公司:打造不斷提升智能上界的下一代模型,研發(fā)AI為核心的產(chǎn)品服務(wù)用戶。”
以下是唐杰內(nèi)部信全文:
用“咖啡”的精神做AGl
在香港科技大學(xué)做短期訪問(wèn)時(shí),和楊強(qiáng)教授在實(shí)驗(yàn)室一樓的咖啡廳偶然碰到。我說(shuō)這幾天咖啡喝得太多,感覺(jué)有點(diǎn)上癮,需要戒一戒了。
楊老師說(shuō):“為什么要戒呢?上癮也不一定是壞事呀,如果我們做研究能像喝咖啡一樣上癮,又何愁研究做不好呢?”
是啊,“上癮”便是人生的精彩所在,無(wú)論是研究,還是其它事,只要專注、努力,就一定能做好。
“讓機(jī)器像人一樣思考”是智譜自始至終的愿景和理想,也是智譜人持之以恒奮斗的唯一目標(biāo)。2018年底,在人腦認(rèn)知的雙系統(tǒng)理論的啟發(fā)下,我們?cè)O(shè)計(jì)了一個(gè)擁有快思考+慢思考的機(jī)器“認(rèn)知”系統(tǒng)。
2019年我們正式成立智譜,開(kāi)始嘗試探索AGI,實(shí)現(xiàn)“讓機(jī)器像人一樣思考”的宏偉愿景,這里的最大挑戰(zhàn)可能是直到今天也沒(méi)有人包括我們自己能夠給出一個(gè)準(zhǔn)確的AGI定義以及如何實(shí)現(xiàn)AGI的技術(shù)路徑,也許這正是探索AGI的魅力所在。
我們處在歷史上一個(gè)從未有過(guò)的非凡時(shí)刻,一個(gè)技術(shù)再一次顛覆式地改變世界的時(shí)刻。大模型不僅是通用人工智能的關(guān)鍵底座,更有望成為驅(qū)動(dòng)生產(chǎn)力變革的核心引擎。
回顧一路走來(lái)的歷程,我們能走到今天的一個(gè)重要原因是,我們始終堅(jiān)持做讓用戶真正用得上的AI技術(shù),只有真正有人用的理論、技術(shù)或產(chǎn)品才能最終成為AGI之路上的重要成就。當(dāng)然,不是所有的創(chuàng)新都能成功,我們也有很多有風(fēng)險(xiǎn)的項(xiàng)目都以失敗告終,但這也往往教會(huì)了我們從失敗中汲取力量,這讓智譜變得更強(qiáng)大,對(duì)AGI的理解也更深刻。更重要的是,這讓我們注重實(shí)用的同時(shí),不再只盯著短期收益:幫助用戶、幫助國(guó)家、幫助全球科技進(jìn)步成為智譜的長(zhǎng)期目標(biāo)。
2020年,我們推出了自己的大模型算法架構(gòu)GLM,并開(kāi)始嘗試訓(xùn)練100億參數(shù)的基座模型,模型很成功,得到包括美團(tuán)在內(nèi)的很多企業(yè)試用,這是一個(gè)很大膽的嘗試,因?yàn)楫?dāng)年還是BERT模型橫行的小模型時(shí)代。
但當(dāng)時(shí)的成功距離我們夢(mèng)想中的AGI還遙不可及,一部分原因是模型的知識(shí)量還不夠大,而另一部分原因則是模型還不會(huì)像人一樣推理思考。
2021到2022年,大模型發(fā)展并不順利,大多數(shù)人并不接受“讓機(jī)器像人一樣思考”這種類似登月一樣的瘋狂計(jì)劃,也不認(rèn)為這可能是個(gè)非常大的技術(shù)變革機(jī)會(huì),或者害怕失敗。
我們還是決定賭一把,用更多數(shù)據(jù)訓(xùn)練一個(gè)1300億參數(shù)的大模型。這個(gè)決策很難,因?yàn)檫€不能影響公司總體發(fā)展節(jié)奏,為此我們成立了兩個(gè)專門的小型創(chuàng)新團(tuán)隊(duì),一個(gè)負(fù)責(zé)模型訓(xùn)練,這就是后來(lái)公司的GLM三劍客;另一個(gè)則獨(dú)立負(fù)責(zé)MaaS平臺(tái)建設(shè),當(dāng)時(shí)這兩個(gè)小團(tuán)隊(duì)可能互相都不知道對(duì)方的存在。
2022年中,GLM-130B訓(xùn)出來(lái)了,其中很多精細(xì)的設(shè)計(jì)引起了全球關(guān)注;同時(shí)MaaS平臺(tái)上線,也就是現(xiàn)在的bigmodel.cn,有了第一批真正的API用戶。隨后,我們正式在公司成立了AI 院,專注下一代大模型研發(fā);成立MaSS平臺(tái)部,負(fù)責(zé)對(duì)外提供大模型API服務(wù)。
有時(shí)候,我們需要找到有足夠大膽夢(mèng)想的人(甚至專門投入更多精力去找這樣的人),一個(gè)大膽宏偉的目標(biāo)也許決定了一半的成功。
2023年,我和國(guó)內(nèi)一個(gè)頂尖的創(chuàng)業(yè)前輩(其實(shí)他比我小不少)聊AI可能對(duì)未來(lái)的改變,我們一致認(rèn)為AI會(huì)顛覆搜索、顛覆瀏覽器,會(huì)給每個(gè)人帶來(lái)一個(gè)全新的AI助手;甚至有了這個(gè)AI助手后,我們也不再需要應(yīng)用商店,反之我們可能需要為AI打造一個(gè)“API商店”,可能這個(gè)API商店的底層邏輯就是顛覆現(xiàn)有的操作系統(tǒng);隨后,也許更重大的顛覆是計(jì)算機(jī)本身,因?yàn)閷脮r(shí)我們可能不是需要一個(gè)給人用的計(jì)算機(jī)了,而是適合Al的計(jì)算機(jī),這個(gè)變革發(fā)生的意義將是無(wú)窮的,因?yàn)樗鼘氐字厮苡?jì)算機(jī)底層邏輯,挑戰(zhàn)計(jì)算機(jī)界用了80年的奠基石——馮·諾伊曼體系,聊到這里的時(shí)候,我們不約而同覺(jué)得我們對(duì)AI的投入還太少了,還不夠All-in。
現(xiàn)實(shí)也是殘酷的,All-in不僅需要堅(jiān)定的信念,也需要極其強(qiáng)大的資金、團(tuán)隊(duì)支持,更需要精準(zhǔn)的預(yù)判。
2023到2024年是全球大模型的爆發(fā)年,大廠紛紛“All-in”大模型,國(guó)內(nèi)也掀起創(chuàng)業(yè)高潮,百模大戰(zhàn)、各種AI助手層出不窮,我們可能也有失誤,有技術(shù)的也有商業(yè)的。
現(xiàn)在復(fù)盤,可能原因是我們自己在追逐AGI的路上有迷失的時(shí)候,會(huì)被眼前的短期收益迷惑。AGI是個(gè)技術(shù)變革,技術(shù)是平權(quán)的,是公開(kāi)透明的,是要讓所有人都能用得上并從中獲益。
隨后DeepSeek的出現(xiàn)警醒了我們,文鋒2023年創(chuàng)業(yè)的時(shí)候和我聊過(guò),當(dāng)時(shí)我并沒(méi)有意識(shí)到他對(duì)AGI如此執(zhí)著,感謝他帶給我很多不一樣的思考。選擇對(duì)AGI技術(shù)的執(zhí)著追求,不斷探索AGI的上界,同時(shí)精準(zhǔn)的未來(lái)預(yù)判成為下一步智譜需要不斷改進(jìn)和升華的地方。這兩年讓我們經(jīng)歷很多,更重要的是“強(qiáng)化學(xué)習(xí)”了我們對(duì)AGI、對(duì)公司治理和商業(yè)競(jìng)爭(zhēng)的認(rèn)知。
2025年初,我們喊出了“定力”與“成就”的口號(hào),要求大家保持定力,不驕不躁,不妄自菲薄,成就智譜每個(gè)人手上的事,成就自己。年初的時(shí)候,一切都那么難,模型效果達(dá)不到預(yù)期,全國(guó)上下價(jià)格戰(zhàn),殺出重圍需要找到一個(gè)精準(zhǔn)的突破口。
我們堅(jiān)守了陣地,終于找到Coding作為突破口,如果說(shuō)4月份GLM-4.1的發(fā)布像是象征性的試探,那7月底的GLM-4.5的發(fā)布幾乎更是一場(chǎng)決戰(zhàn),所有技術(shù)、平臺(tái)、業(yè)務(wù)團(tuán)隊(duì)捏一把汗,日日夜夜加班,我們終于迎來(lái)一場(chǎng)久違的勝利,接著GLM-4.6和GLM-4.7讓我們模型能力方面和那些國(guó)際頂尖模型并駕齊驅(qū),我們的GLM-4.7在包括AA、競(jìng)技場(chǎng)等多項(xiàng)評(píng)測(cè)中獲得開(kāi)源模型、國(guó)產(chǎn)模型的SOTA,來(lái)自用戶側(cè)的模型Coding和Agent真實(shí)體感也非常好,MaSS平臺(tái)的日活用戶增加了20倍,日收入增加近30倍。來(lái)自全球184個(gè)國(guó)家的15萬(wàn)開(kāi)發(fā)者朋友為GLM Coding Plan付費(fèi)。
總體來(lái)說(shuō),在模型側(cè)我們?nèi)缙谕瓿闪四瓿醵ㄏ碌?月發(fā)一個(gè)“穩(wěn)住陣腳”的模型、年中發(fā)一個(gè)“上牌桌”的模型(即成為one of the best)、年底發(fā)一個(gè)Top1的模型的整體戰(zhàn)略。這為我們后續(xù)繼續(xù)沖刺AGI技術(shù)高地打下重要根基。
我們的“主權(quán)AI”也迎來(lái)全新進(jìn)展:馬來(lái)西亞國(guó)家級(jí)MaSS平臺(tái)基于Z.ai開(kāi)源模型構(gòu)建,GLM成為馬來(lái)的國(guó)民級(jí)模型。主權(quán)AI出海是我參加了總書(shū)記座談會(huì)后被總書(shū)記的“中國(guó)AI要走出國(guó)門”感召,但說(shuō)實(shí)話我也不知道應(yīng)該怎么做,我們的國(guó)際團(tuán)隊(duì)敢拼敢打敢成事。
業(yè)務(wù)方面,我們敢于競(jìng)爭(zhēng),切實(shí)服務(wù)客戶,再次完成了年度超一倍的營(yíng)收增長(zhǎng)。在種種困難和機(jī)遇并存的情況下,今天,我們以一種幾乎不可能的姿勢(shì)成為了全球大模型第一股,這表明了市場(chǎng)對(duì)我們技術(shù)與商業(yè)價(jià)值的認(rèn)可。“Make imposible possible”——還記得我們?cè)?jīng)說(shuō)過(guò)的嗎?這一年來(lái),蛻變最大的可能是一群一線的年輕人,因?yàn)楹芏嗫雌饋?lái)不可能的事,他們真的做到了。
2026年,公司的目標(biāo)是成為國(guó)際領(lǐng)跑的大模型企業(yè):
- GLM-5。很快GLM-5將跟大家見(jiàn)面,通過(guò)進(jìn)一步的Scaling和很多全新技術(shù)改進(jìn),相信GLM-5會(huì)帶給大家很多新奇體臉,讓AI幫大家完成更多真實(shí)任務(wù)。
- 全新的模型架構(gòu)設(shè)計(jì)。已經(jīng)廣泛使用近10年的Transformer架構(gòu)已經(jīng)顯露出一些不足,包括超長(zhǎng)上下文的計(jì)算開(kāi)銷、記憶機(jī)制、更新機(jī)制等。這些都需要探索全新的模型架構(gòu),發(fā)現(xiàn)新的Scaling范式,通過(guò)芯片-算法協(xié)同設(shè)計(jì)等技術(shù)提高計(jì)算效率。
- 具有更強(qiáng)泛化能力的RL。當(dāng)前主流的RLVR范式雖然在數(shù)學(xué)和代碼領(lǐng)城取得了成功,但其依賴人工構(gòu)造可驗(yàn)證環(huán)境的局限性也日益凸顯,今年需要探索更通用的RL范式,支持AI不僅能在人類指令下完成特定任務(wù),更要能理解并執(zhí)行跨越數(shù)小時(shí)甚至數(shù)天的長(zhǎng)時(shí)程任務(wù)。
- 最具挑戰(zhàn)性的探索,是開(kāi)啟通往持續(xù)學(xué)習(xí)與自主進(jìn)化的道路。當(dāng)前所有主流的AI模型,其智能在部署后基本上是靜態(tài)的,它們通過(guò)一次性的、耗資巨大的訓(xùn)練過(guò)程獲得知識(shí),然后在應(yīng)用中逐漸過(guò)時(shí)。這與人腦能夠從與世界的持續(xù)交互中不斷學(xué)習(xí)、進(jìn)化的方式截然不同。我們需要對(duì)下一代學(xué)習(xí)范式——在線學(xué)習(xí)(Online Learning)或持續(xù)學(xué)習(xí)(Continual Learning)進(jìn)行前瞻性布局。
我們不是一家傳統(tǒng)公司,我們也不打算成為其中之一,我們希望成為一家一切皆有可能發(fā)生的AI原生公司:打造不斷提升智能上界的下一代模型,研發(fā)AI為核心的產(chǎn)品服務(wù)用戶。我們要讓AI成為每個(gè)人最得力的助手,幫助我們完成任務(wù)。我們認(rèn)為還需要利用AI參與治理公司降本增效、做到更公平。
隨著時(shí)間的推移,一個(gè)公司往往會(huì)習(xí)慣于做同樣的事情,做漸進(jìn)式的改進(jìn),這會(huì)限制我們的創(chuàng)新力。但在AI時(shí)代,一切都是變革式的,我們需要有點(diǎn)“不舒服”才能保持創(chuàng)新力,才能提出革命性的想法推動(dòng)下一個(gè)大的增長(zhǎng)領(lǐng)域。
現(xiàn)在我們?cè)谥亲V內(nèi)部設(shè)立了一個(gè)全新部門X-lab,這個(gè)部門將致力于前沿性探索,包括全新的模型架構(gòu)、新的認(rèn)知范式、還將孵化新項(xiàng)目,不局限于軟件或是硬件。同時(shí),我們也會(huì)擴(kuò)大對(duì)外投資,不僅僅是戰(zhàn)略聯(lián)合已有的被投企業(yè),也要開(kāi)辟新的版圖,讓整個(gè)行業(yè)貫通起來(lái),一起繁榮。在X-lab每個(gè)人的使命就是做完全顛覆式的創(chuàng)新。同時(shí),我們也會(huì)擴(kuò)大對(duì)外投資部門的規(guī)模。
今天是智譜生命中激動(dòng)人心的一天,是智譜歷史上一個(gè)重要的里程碑,更是智譜一個(gè)全新時(shí)代的開(kāi)啟,我很喜歡Z.ai這個(gè)品牌,Z是字母表中的最后一個(gè),代表終極境地,我們希望在AGI的探索歷程上能走到智能的終極境地,這是我們努力的目標(biāo)。我們非常興奮:
- 有一個(gè)雄心勃勃、改變世界的事業(yè)
- 著跟長(zhǎng)遠(yuǎn)利益、放眼未來(lái)
- 更加專注,探索AGI的本質(zhì)
- 用AI賦能偉大的企業(yè)家和公司的蓬勃發(fā)展
- 用更精準(zhǔn)的預(yù)判抓住企業(yè)發(fā)展機(jī)遇
- 最終,希望我們能夠?yàn)槿祟惿鐣?huì)帶來(lái)不一樣的AI,切實(shí)推動(dòng)人類福祉的進(jìn)步。
這是一個(gè)無(wú)與倫比的開(kāi)心時(shí)刻,這種開(kāi)心不是一時(shí)的多巴胺,而是探索AGI之路上積累起來(lái)的內(nèi)啡肽,讓我們更加專注,腳踏實(shí)地,持續(xù)前行!
(作者|張敏,編輯|李程程)

快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
成為全球大模型第一股,這頭銜一拿,行業(yè)地位直接穩(wěn)了
智譜 1 月 8 號(hào)港股上市,市值直接破 528 億港元,這開(kāi)局也太猛了
琢磨全新的 RL 范式和持續(xù)學(xué)習(xí)范式,這技術(shù)探索夠前沿的
就算面對(duì)好多未知,也一直做用戶能用的 AI,不搞虛頭巴腦的
2026 年還要擴(kuò)大對(duì)外投資,想貫通行業(yè)一起發(fā)展,思路挺長(zhǎng)遠(yuǎn)
上市當(dāng)天唐杰發(fā)內(nèi)部信,既回顧過(guò)去又展望未來(lái),挺鼓舞人心的
唐杰說(shuō)要做 AI 原生公司,還得推動(dòng)人類福祉,格局一下就打開(kāi)了
被 DeepSeek 警醒后及時(shí)調(diào)整,能正視失誤還改正,這公司夠靈活
專注 AGI 這么多年,沒(méi)被短期利益帶偏,這份定力太難得了
做 AI 不只是拼技術(shù),還得想著推動(dòng)人類福祉,這立意就不一樣