但在前一天宣傳模型,后一天就宣告離開的情況下,千問大模型(下稱Qwen)裂開了一條縫隙,外部得以嗅到來自阿里內(nèi)部變化的氣息。
一天后,阿里集團CEO吳泳銘簽發(fā)了林俊旸的離職令,并以前所未有的姿態(tài)組建了一個由集團最高權(quán)力核心構(gòu)成的“三人小組”,這個三人小組包括吳泳銘、阿里云CTO周靖人和現(xiàn)任餓了么董事長兼CEO的范禹,共同接管Qwen資源調(diào)度的問題。
放在今天,Qwen在中國開源生態(tài)的貢獻上有目共睹,但帶頭做出Qwen2.5、Qwen3系列模型的兩個技術(shù)負責人周暢和林俊旸,先后離開了阿里。
在這場離職風暴的中心,隱藏著一個關(guān)于“實驗室理想”與“AI帝國”如何注定分離的命題:
阿里需要的,是一個能夠證明阿里AI實力的先進模型,為阿里拿下 AI 時代的新入口;一個能在MaaS戰(zhàn)場上,為阿里云收割付費Token消耗的穩(wěn)定引擎。而林俊旸追求的,是極致的開源精神和垂直整合的組織架構(gòu)。
兩者的故事中,誰都沒錯,但林俊旸和阿里,已經(jīng)逐漸來到了分道揚鑣的岔路口。
要理解這場離職風暴的深層邏輯,需要將時間撥回更久以前。
在林俊旸之前,阿里巴巴在大模型領(lǐng)域已經(jīng)經(jīng)歷了一次核心人才的變化。
第一次,以周暢為首的AI團隊跳槽,是阿里Qwen團隊技術(shù)骨干出走的一個關(guān)鍵節(jié)點。
曾作為阿里P9級別員工的周暢,選擇加入了字節(jié)跳動。據(jù)悉,加入字節(jié)后,周暢不僅獲得字節(jié)4-2職級,相當于連跳兩級,且薪資高達千萬級別,比之前翻了好幾倍。
周暢的離職,不僅是因為薪資,一部分原因也在于對個人對技術(shù)路線的偏好。據(jù)晚點LatePost報道,彼時的周暢看好多模態(tài)方向,但放在2024年,也就是大廠集中押注大語言模型的情況下,周暢看中了字節(jié)視覺團隊拋來的橄欖枝。
人才的流失,顯然引起了阿里的警覺。作為接過周暢重任、擔任阿里Qwen模型團隊的技術(shù)負責人,從校招P6級別進入阿里,到幾年內(nèi)多次升職,林俊旸成為了阿里最年輕的P10級別員工。
用馬云的話說,離職無非兩種原因,一是錢沒有給到位,二是“心委屈了”。林俊旸的走,顯然屬于后一種。
3月4日凌晨,林俊旸在X上宣布離職,到第二天阿里批準離職。兩天時間內(nèi),通過阿里員工發(fā)言和媒體報道,基本已經(jīng)還原出林俊旸的離開,其中難免有和阿里組織的摩擦問題。
最影響到Qwen本身發(fā)展的,可能是對團隊內(nèi)部資源不足的摩擦。
一個小切口是,林俊旸需要牽頭為Qwen碼來更多資源,難免對Qwen團隊內(nèi)部是否為AI Infra額外投入、投入多少的想法不同。
林俊旸本人對Infra非常看重,這一點,他也在公開場合強調(diào)過。
“今天還有一個激動人心的事情,算法和Infra聯(lián)合優(yōu)化的事情是真真實實存在的。”林俊旸在AGI-Next峰會上說,“除了像DeepSeek提到的提升訓練效率、節(jié)省資源成本外,我們要完成難度高的任務,都需要Infra的相關(guān)支持。”林俊旸說。
雖然阿里有額外的機器學習平臺PAI負責提供這部分的支撐,但在林俊旸看來,還需要進一步加碼,比如在團隊中招聘更多相應人才。在林俊旸的社媒平臺中,也公開放出過招聘Infra相關(guān)人才的信息。

林俊旸在社交媒體上招RL Infra崗位人員
對Infra的看重,不只是林俊旸對阿里的判斷。落在今年對AI失意的騰訊身上,Infra也成了“天才少年”、OpenAI前研究員姚順雨加盟后的重點之一。
在光錐智能此前的文章《騰訊重構(gòu)AI的1000天》中,也曾提及,在騰訊年會上,內(nèi)部表示,此前模型訓練的一些問題原因可能在于基礎(chǔ)設施Infra的不足。在姚順雨進入騰訊后,公司單獨成立了AI Infra部門和AI Data部門,區(qū)別于之前的部門架構(gòu),TEG中和AI訓推相關(guān)的工作不再和其他業(yè)務合并,而是獨立為AI服務。
但在后期,林俊旸希望自建Infra的實現(xiàn)并不順遂。在晚點播客中,提及林俊旸為了達成相關(guān)目標,發(fā)生了越過周靖人向阿里集團CEO兼阿里云CEO吳泳銘尋求HeadCount(正職名額)的情況。所幸最終,林俊旸如愿以償。
至于在其它資源上的不足,在3月4日阿里內(nèi)部召開的會議中,阿里也承認了這一點。據(jù)智能涌現(xiàn)報道,關(guān)于招聘問題、內(nèi)部算力有限問題,周靖人表示,團隊處于“資源緊張狀態(tài)”,內(nèi)外差異有很多歷史原因,未來會進一步規(guī)劃。
在“為什么做”的問題上,阿里與林俊旸之間同樣存在深刻的裂痕。
作為純技術(shù)人才,林俊旸在Qwen開源模型名氣的打響上,起到濃墨重彩的一筆。也是在AGI-Next峰會上,林俊旸曾經(jīng)分享過團隊為什么會考慮做小尺寸模型,起始是因為團隊中有人曾建議開源用于預訓練試驗的1.8B小尺寸模型,會對一些開發(fā)者起到幫助。

林俊旸
林俊旸對開源政策的激進,也在公開發(fā)言中有所體現(xiàn)。他曾表示,自己希望推進Qwen3-Max大模型的開源,但未能如愿。
“全尺寸、多模態(tài)、重開源”的策略,幫助阿里在開源社區(qū)中建立了無可匹敵的生態(tài)優(yōu)勢。以最新發(fā)布的Qwen3.5為例,除了最先開源的版本,阿里還后續(xù)發(fā)布了Qwen3.5系列的0.8B、2B、4B和9B四款小尺寸模型,在X上獲得了馬斯克的點贊。
但在阿里的視角中,從追求AGI的愿景上,阿里需要的是一個能夠領(lǐng)先于“六小虎”和字節(jié)、騰訊的多模態(tài)大模型;于阿里云需要靠MaaS擴張業(yè)務的情況下,集團希望有一個能打的大模型,像Kimi K2.5、字節(jié)豆包模型那樣,在API上收入進一步擴大。
在Qwen核心人員百余人、資源有限的情況下,Qwen系列的旗艦模型在國內(nèi)大模型混戰(zhàn)中,無法做到在所有系列中都拿到最好成績。
以最新發(fā)布的Qwen 3.5旗艦模型為例,作為一個參數(shù)397B的原生多模態(tài)大模型,講究“力大磚飛”的情況下,讓它和月之暗面萬億參數(shù)級別的Kimi-K2.5放在一起比分數(shù),似乎有些尷尬。在Coding當前更看重模型質(zhì)量階段,Qwen3.5雖然做到了性價比優(yōu)勢,但它不是當前“掰腕子”的核心。換言之,Qwen3.5的發(fā)力和阿里內(nèi)部的期許,走偏了。
回顧之前Qwen2.5、Qwen3系列大模型,阿里當前在模型生態(tài)上的成績有目共睹,甚至被稱為“源神”。但在大模型發(fā)展如此迅速的情況下,阿里也依然很著急。
出于對AI的焦慮,挖人、組織架構(gòu)的調(diào)整,就變成了順理成章的思路,這一點在大廠上,基本是必選項。
在谷歌擔任L7級別、參與Gemini研發(fā)的周浩,是阿里從硅谷挖回來的人才。據(jù)悉,周浩將接手的是Qwen團隊的后訓練負責人一職,這也對應了前后訓練負責人郁博文的離開。
人才是第一步,接下來,阿里將到對準內(nèi)部,開始對組織架構(gòu)動刀。據(jù)悉,這也是引爆林俊旸和阿里沖突的導火索之一。
多家媒體報道,通義實驗室近期計劃將Qwen團隊分拆,從涵蓋不同訓練流程和模態(tài)的“垂直整合”體系,變成預訓練、后訓練、文本、多模態(tài)等一個個分開的水平分工團隊。更進一步的是通義實驗室內(nèi)部之間的合并,比如將Qwen負責圖像模態(tài)的部分并入負責圖像生成的通義萬相。語音模型部分并入通義百靈。
但在林俊旸之前所在的架構(gòu)來說,他更堅信“垂直整合”的思路——將模型訓練的全流程,從數(shù)據(jù)處理、架構(gòu)設計、預訓練、后訓練到推理部署,都控制在同一個團隊內(nèi)部,形成高度協(xié)同的閉環(huán)。
而在這種整合完成、Qwen模型團隊分割成多個水平團隊后,留給林俊旸的位置和空間變得有限。在劉大一恒繼續(xù)擔任預訓練負責人、周浩擔任后訓練負責人的情況下,林俊旸原定的位置成迷,且職責范圍相比于之前“一手抓訓練、模型”的情況,壓縮到分管某個領(lǐng)域的位置。
可以預見的是,在完成組織架構(gòu)調(diào)整后,阿里還需要一位類似姚順雨、吳永輝之類的技術(shù)大牛,來把控這個進一步擴大、拆分的組織架構(gòu)。
至此,林俊旸和阿里,走到了不得不分手的岔路口。
在 AI 時代,核心頂級人才從來不缺機會,也擁有比普通人更理想的追求;但在時代的巨變前,科技巨頭需要把握根據(jù)趨勢不斷調(diào)整方向盤,以確保整體的利益最大化。這里沒有絕對的對與錯。
我們祝愿林俊旸能夠在“狂飆”的AI大模型行業(yè)中,找到自己的位置;也祝阿里在下定決心修整組織架構(gòu)后,能夠做出心目中的Qwen-4,在旗艦模型中找到自己理想的生態(tài)位。
快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論