圖片來源:智譜
1月8日,智譜正式在港股上市,開盤報120港元/股,較發(fā)行價上漲3.27%,市值突破528億港元。
當日,清華大學計算機系教授、智譜創(chuàng)立發(fā)起人兼首席科學家唐杰發(fā)布內部信,要用“咖啡”的精神做AGl,“上癮”便是人生的精彩所在,無論是研究,還是其它事,只要專注、努力,就一定能做好。
他在內部信中坦言,“現實也是殘酷的,All-in不僅需要堅定的信念,也需要極其強大的資金、團隊支持,更需要精準的預判。”
在內部信中,唐杰特意提到了Deepseek和梁文鋒對其帶來的警醒和思考。他表示,當時并沒有意識到梁文鋒對AGI如此執(zhí)著,感謝他讓自己有了不一樣的思考,選擇對AGI技術的執(zhí)著追求,不斷探索AGI的上界,同時精準的未來預判成為下一步智譜需要不斷改進和升華的地方。
總體來說,2025年在模型側,智普如期完成了年初定下的4月發(fā)一個“穩(wěn)住陣腳”的模型、年中發(fā)一個“上牌桌”的模型(即成為one of the best)、年底發(fā)一個Top1的模型的整體戰(zhàn)略。
唐杰在內部信中還明確提出,2026年智譜的目標是成為國際領跑的大模型企業(yè)。他透露,很快將會推出GLM-5,GLM-5通過進一步的Scaling和很多全新技術改進,讓AI幫大家完成更多真實任務。
唐杰還指出,已經廣泛使用近10年的Transformer架構已經顯露出一些不足,包括超長上下文的計算開銷、記憶機制、更新機制等。這些都需要探索全新的模型架構,發(fā)現新的Scaling范式,通過芯片-算法協同設計等技術提高計算效率。
而當前主流的RLVR范式雖然在數學和代碼領城取得了成功,唐杰認為其依賴人工構造可驗證環(huán)境的局限性也日益凸顯,今年需要探索更通用的RL范式,支持AI不僅能在人類指令下完成特定任務,更要能理解并執(zhí)行跨越數小時甚至數天的長時程任務。
唐杰認為,最具挑戰(zhàn)性的探索,是開啟通往持續(xù)學習與自主進化的道路。當前所有主流的AI模型,其智能在部署后基本上是靜態(tài)的,它們通過一次性的、耗資巨大的訓練過程獲得知識,然后在應用中逐漸過時。這與人腦能夠從與世界的持續(xù)交互中不斷學習、進化的方式截然不同。智譜將會對下一代學習范式——在線學習(Online Learning)或持續(xù)學習(Continual Learning)進行前瞻性布局。
他還透露,智譜內部設立了一個全新部門——X-Lab,這個部門將致力于前沿性探索,包括全新的模型架構、新的認知范式、還將孵化新項目,不局限于軟件或是硬件。
同時,他還表示,智譜也會擴大對外投資,不僅僅是戰(zhàn)略聯合已有的被投企業(yè),也要開辟新的版圖,讓整個行業(yè)貫通起來,一起繁榮。
在內部信中,唐杰還強調,“我們不是一家傳統公司,我們也不打算成為其中之一,我們希望成為一家一切皆有可能發(fā)生的AI原生公司:打造不斷提升智能上界的下一代模型,研發(fā)AI為核心的產品服務用戶。”
在香港科技大學做短期訪問時,和楊強教授在實驗室一樓的咖啡廳偶然碰到。我說這幾天咖啡喝得太多,感覺有點上癮,需要戒一戒了。
楊老師說:“為什么要戒呢?上癮也不一定是壞事呀,如果我們做研究能像喝咖啡一樣上癮,又何愁研究做不好呢?”
是啊,“上癮”便是人生的精彩所在,無論是研究,還是其它事,只要專注、努力,就一定能做好。
“讓機器像人一樣思考”是智譜自始至終的愿景和理想,也是智譜人持之以恒奮斗的唯一目標。2018年底,在人腦認知的雙系統理論的啟發(fā)下,我們設計了一個擁有快思考+慢思考的機器“認知”系統。
2019年我們正式成立智譜,開始嘗試探索AGI,實現“讓機器像人一樣思考”的宏偉愿景,這里的最大挑戰(zhàn)可能是直到今天也沒有人包括我們自己能夠給出一個準確的AGI定義以及如何實現AGI的技術路徑,也許這正是探索AGI的魅力所在。
我們處在歷史上一個從未有過的非凡時刻,一個技術再一次顛覆式地改變世界的時刻。大模型不僅是通用人工智能的關鍵底座,更有望成為驅動生產力變革的核心引擎。
回顧一路走來的歷程,我們能走到今天的一個重要原因是,我們始終堅持做讓用戶真正用得上的AI技術,只有真正有人用的理論、技術或產品才能最終成為AGI之路上的重要成就。當然,不是所有的創(chuàng)新都能成功,我們也有很多有風險的項目都以失敗告終,但這也往往教會了我們從失敗中汲取力量,這讓智譜變得更強大,對AGI的理解也更深刻。更重要的是,這讓我們注重實用的同時,不再只盯著短期收益:幫助用戶、幫助國家、幫助全球科技進步成為智譜的長期目標。
2020年,我們推出了自己的大模型算法架構GLM,并開始嘗試訓練100億參數的基座模型,模型很成功,得到包括美團在內的很多企業(yè)試用,這是一個很大膽的嘗試,因為當年還是BERT模型橫行的小模型時代。
但當時的成功距離我們夢想中的AGI還遙不可及,一部分原因是模型的知識量還不夠大,而另一部分原因則是模型還不會像人一樣推理思考。
2021到2022年,大模型發(fā)展并不順利,大多數人并不接受“讓機器像人一樣思考”這種類似登月一樣的瘋狂計劃,也不認為這可能是個非常大的技術變革機會,或者害怕失敗。
我們還是決定賭一把,用更多數據訓練一個1300億參數的大模型。這個決策很難,因為還不能影響公司總體發(fā)展節(jié)奏,為此我們成立了兩個專門的小型創(chuàng)新團隊,一個負責模型訓練,這就是后來公司的GLM三劍客;另一個則獨立負責MaaS平臺建設,當時這兩個小團隊可能互相都不知道對方的存在。
2022年中,GLM-130B訓出來了,其中很多精細的設計引起了全球關注;同時MaaS平臺上線,也就是現在的bigmodel.cn,有了第一批真正的API用戶。隨后,我們正式在公司成立了AI 院,專注下一代大模型研發(fā);成立MaSS平臺部,負責對外提供大模型API服務。
有時候,我們需要找到有足夠大膽夢想的人(甚至專門投入更多精力去找這樣的人),一個大膽宏偉的目標也許決定了一半的成功。
2023年,我和國內一個頂尖的創(chuàng)業(yè)前輩(其實他比我小不少)聊AI可能對未來的改變,我們一致認為AI會顛覆搜索、顛覆瀏覽器,會給每個人帶來一個全新的AI助手;甚至有了這個AI助手后,我們也不再需要應用商店,反之我們可能需要為AI打造一個“API商店”,可能這個API商店的底層邏輯就是顛覆現有的操作系統;隨后,也許更重大的顛覆是計算機本身,因為屆時我們可能不是需要一個給人用的計算機了,而是適合Al的計算機,這個變革發(fā)生的意義將是無窮的,因為它將徹底重塑計算機底層邏輯,挑戰(zhàn)計算機界用了80年的奠基石——馮·諾伊曼體系,聊到這里的時候,我們不約而同覺得我們對AI的投入還太少了,還不夠All-in。
現實也是殘酷的,All-in不僅需要堅定的信念,也需要極其強大的資金、團隊支持,更需要精準的預判。
2023到2024年是全球大模型的爆發(fā)年,大廠紛紛“All-in”大模型,國內也掀起創(chuàng)業(yè)高潮,百模大戰(zhàn)、各種AI助手層出不窮,我們可能也有失誤,有技術的也有商業(yè)的。
現在復盤,可能原因是我們自己在追逐AGI的路上有迷失的時候,會被眼前的短期收益迷惑。AGI是個技術變革,技術是平權的,是公開透明的,是要讓所有人都能用得上并從中獲益。
隨后DeepSeek的出現警醒了我們,文鋒2023年創(chuàng)業(yè)的時候和我聊過,當時我并沒有意識到他對AGI如此執(zhí)著,感謝他帶給我很多不一樣的思考。選擇對AGI技術的執(zhí)著追求,不斷探索AGI的上界,同時精準的未來預判成為下一步智譜需要不斷改進和升華的地方。這兩年讓我們經歷很多,更重要的是“強化學習”了我們對AGI、對公司治理和商業(yè)競爭的認知。
2025年初,我們喊出了“定力”與“成就”的口號,要求大家保持定力,不驕不躁,不妄自菲薄,成就智譜每個人手上的事,成就自己。年初的時候,一切都那么難,模型效果達不到預期,全國上下價格戰(zhàn),殺出重圍需要找到一個精準的突破口。
我們堅守了陣地,終于找到Coding作為突破口,如果說4月份GLM-4.1的發(fā)布像是象征性的試探,那7月底的GLM-4.5的發(fā)布幾乎更是一場決戰(zhàn),所有技術、平臺、業(yè)務團隊捏一把汗,日日夜夜加班,我們終于迎來一場久違的勝利,接著GLM-4.6和GLM-4.7讓我們模型能力方面和那些國際頂尖模型并駕齊驅,我們的GLM-4.7在包括AA、競技場等多項評測中獲得開源模型、國產模型的SOTA,來自用戶側的模型Coding和Agent真實體感也非常好,MaSS平臺的日活用戶增加了20倍,日收入增加近30倍。來自全球184個國家的15萬開發(fā)者朋友為GLM Coding Plan付費。
總體來說,在模型側我們如期完成了年初定下的4月發(fā)一個“穩(wěn)住陣腳”的模型、年中發(fā)一個“上牌桌”的模型(即成為one of the best)、年底發(fā)一個Top1的模型的整體戰(zhàn)略。這為我們后續(xù)繼續(xù)沖刺AGI技術高地打下重要根基。
我們的“主權AI”也迎來全新進展:馬來西亞國家級MaSS平臺基于Z.ai開源模型構建,GLM成為馬來的國民級模型。主權AI出海是我參加了總書記座談會后被總書記的“中國AI要走出國門”感召,但說實話我也不知道應該怎么做,我們的國際團隊敢拼敢打敢成事。
業(yè)務方面,我們敢于競爭,切實服務客戶,再次完成了年度超一倍的營收增長。在種種困難和機遇并存的情況下,今天,我們以一種幾乎不可能的姿勢成為了全球大模型第一股,這表明了市場對我們技術與商業(yè)價值的認可。“Make imposible possible”——還記得我們曾經說過的嗎?這一年來,蛻變最大的可能是一群一線的年輕人,因為很多看起來不可能的事,他們真的做到了。
2026年,公司的目標是成為國際領跑的大模型企業(yè):
我們不是一家傳統公司,我們也不打算成為其中之一,我們希望成為一家一切皆有可能發(fā)生的AI原生公司:打造不斷提升智能上界的下一代模型,研發(fā)AI為核心的產品服務用戶。我們要讓AI成為每個人最得力的助手,幫助我們完成任務。我們認為還需要利用AI參與治理公司降本增效、做到更公平。
隨著時間的推移,一個公司往往會習慣于做同樣的事情,做漸進式的改進,這會限制我們的創(chuàng)新力。但在AI時代,一切都是變革式的,我們需要有點“不舒服”才能保持創(chuàng)新力,才能提出革命性的想法推動下一個大的增長領域。
現在我們在智譜內部設立了一個全新部門X-lab,這個部門將致力于前沿性探索,包括全新的模型架構、新的認知范式、還將孵化新項目,不局限于軟件或是硬件。同時,我們也會擴大對外投資,不僅僅是戰(zhàn)略聯合已有的被投企業(yè),也要開辟新的版圖,讓整個行業(yè)貫通起來,一起繁榮。在X-lab每個人的使命就是做完全顛覆式的創(chuàng)新。同時,我們也會擴大對外投資部門的規(guī)模。
今天是智譜生命中激動人心的一天,是智譜歷史上一個重要的里程碑,更是智譜一個全新時代的開啟,我很喜歡Z.ai這個品牌,Z是字母表中的最后一個,代表終極境地,我們希望在AGI的探索歷程上能走到智能的終極境地,這是我們努力的目標。我們非常興奮:
這是一個無與倫比的開心時刻,這種開心不是一時的多巴胺,而是探索AGI之路上積累起來的內啡肽,讓我們更加專注,腳踏實地,持續(xù)前行!
(作者|張敏,編輯|李程程)
快報
根據《網絡安全法》實名制要求,請綁定手機號后發(fā)表評論
成為全球大模型第一股,這頭銜一拿,行業(yè)地位直接穩(wěn)了
智譜 1 月 8 號港股上市,市值直接破 528 億港元,這開局也太猛了
琢磨全新的 RL 范式和持續(xù)學習范式,這技術探索夠前沿的
就算面對好多未知,也一直做用戶能用的 AI,不搞虛頭巴腦的
2026 年還要擴大對外投資,想貫通行業(yè)一起發(fā)展,思路挺長遠
上市當天唐杰發(fā)內部信,既回顧過去又展望未來,挺鼓舞人心的
唐杰說要做 AI 原生公司,還得推動人類福祉,格局一下就打開了
被 DeepSeek 警醒后及時調整,能正視失誤還改正,這公司夠靈活
專注 AGI 這么多年,沒被短期利益帶偏,這份定力太難得了
做 AI 不只是拼技術,還得想著推動人類福祉,這立意就不一樣