目前確定的信息是,林俊旸是昨天下午提的離職,阿里那邊剛開始走流程。同一天,Qwen的后訓(xùn)練負責人郁博文也正式離職,他的工作由年初從谷歌挖過來的zhou姓高管接任。

林俊旸去年剛晉升,是阿里最年輕的P10,外界擔心他突然離開給Qwen后續(xù)模型研發(fā)和更新帶來不確定性。

這種擔心不太必要。

林俊旸和郁博文等固然是Qwen系列模型的核心功臣,大模型領(lǐng)域單兵能力的重要性也確實相比過去大幅提升,但阿里整個AI研發(fā)體系不可能只依賴于兩三個重要的技術(shù)骨干。

我不相信Qwen因為林俊旸離開就會徹底隕落,就像我不太相信鵝廠招來姚順雨就能扭轉(zhuǎn)局面一樣。

1

先梳理下林俊旸和郁博文等人離開的原因。

有傳言是說,阿里內(nèi)部對現(xiàn)有的開源模式有分歧,覺得開源的成本投入不劃算,或者認為開源影響了阿里云賣自己的API。

這個說法不合理。我倒不是說阿里內(nèi)部沒有這種討論,而是因為林俊旸是做模型基礎(chǔ)研發(fā),模型開源還是閉源,都不影響他工作結(jié)果的價值。就算阿里突然全面轉(zhuǎn)向閉源,模型研發(fā)照樣得有人帶,后訓(xùn)練這些照樣得繼續(xù)做。

按照這個邏輯,唯一能把這兩件事統(tǒng)一起來的,就是林俊旸確實有不可妥協(xié)的開源理想。給個P10又怎樣,只要Qwen轉(zhuǎn)向閉源,勞資立馬撂挑子不干。

這種可能性有,但確實很小。不只是林俊旸走了,郁博文這些也走了,不可能說這些人都要當Richard Stallman吧。

而且綜合各方面的消息,林俊旸的離開比較突然。

說是昨天下午通義開了場內(nèi)部會議,會上產(chǎn)生分歧,林俊旸當場離開,幾小時后就在X平臺上宣布了離職的消息。林俊旸級別高,阿里如果真的想調(diào)整開源戰(zhàn)略,這種業(yè)務(wù)負責人多少有點提前的吹風和討論。

所以林俊旸突然離開,最大可能還是跟通義最近的組織調(diào)整有關(guān)。

而這個組織調(diào)整的原因,應(yīng)該不是直接出于開源和閉源的戰(zhàn)略有重大變化。今天阿里算是全球模型開源的扛把子,

HF上下載量一直保持領(lǐng)先。但阿里開源的整體狀態(tài)是三角形:中腰部模型能力很強,但參數(shù)量最大的最強模型表現(xiàn)是有差距的。

阿里如果只是想做B端,通過云服務(wù)賣API,這個問題還沒有那么關(guān)鍵,因為開源跟閉源是兩個賽道。然而阿里從去年11月開始,已經(jīng)明牌要參與這輪AI入口爭奪。

因為千問APP起步晚了對手一年多,需要投入更多資源追上對手,整個春節(jié)檔阿里為千問投入的預(yù)算也是最多的。這些措施取得了明顯效果,千問APP用戶快速增長,目前已經(jīng)甩開元寶,但仍然低于豆包。

從純B端向B/C兩端兼顧的轉(zhuǎn)向,對Qwen的模型能力提出了更高的要求。集團層面,Qwen也得更多配合千問APP的產(chǎn)品團隊,因為后者當下是集團最大的優(yōu)先級。

林俊旸直接負責的Qwen團隊隸屬于通義實驗室,后者由阿里云CTO周靖人負責。

通義正計劃將Qwen團隊分拆,從涵蓋不同訓(xùn)練流程和模態(tài)的 “垂直整合” 體系,轉(zhuǎn)變成預(yù)訓(xùn)練、后訓(xùn)練、文本、多模態(tài)等一個個分開的水平分工團隊,這些團隊仍隸屬通義實驗室。

晚點報道提到,林俊旸并不認可這種分開拆散團隊的做法,他認為預(yù)訓(xùn)練、后訓(xùn)練,乃至 Infra 和訓(xùn)練團隊應(yīng)該更緊密地結(jié)合和溝通。

這個描述其實非常有意思,值得推敲一番。

預(yù)訓(xùn)練、后訓(xùn)練這些團隊本身就是各自存在的,為什么在Qwen下面就是垂直整合,分拆過后就是水平分工呢?整個通義實驗室依舊在周靖人博士的領(lǐng)導(dǎo)之下,各團隊之間的拉通對齊怎么就不能做繼續(xù)做呢?

按照互聯(lián)網(wǎng)公司喜歡講的管理學(xué)模型,甚至可以說這讓組織結(jié)構(gòu)進一步扁平化,有利于提高信息傳遞的效率。

當然這只是理論上,而理論跟實際往往有相當?shù)木嚯x。林俊旸和Qwen團隊已經(jīng)經(jīng)過了長時期磨合,保持著高強度產(chǎn)出,做這種分拆一定意味著大量的組織摩擦和不確定性。

2

這些動作無法避免的后果是,林俊旸的“勢力范圍”在縮減。

他領(lǐng)導(dǎo)的Qwen團隊從去年中開始組建自己的Infra團隊,代替原來阿里云的人工智能平臺PAI。也就是說,Qwen團隊在逐步補齊所有LLM訓(xùn)練需要的基礎(chǔ)設(shè)施。

OpenAI infra負責人翁家翌前段時間提到,真正拉開openai和meta差距的就在于infra上。他認為這其中的關(guān)鍵在于誰的RL infa BUG相對更少,訓(xùn)練迭代更快。

所以可以推測,林俊旸對于由阿里云PAI來負責通義各業(yè)務(wù)的infra不滿意,因此要單獨組建infra團隊。

但阿里內(nèi)部對Qwen團隊的投入產(chǎn)生評價本身就是有分歧的,這種團隊擴充或許進一步加劇了這種分歧,拉大了集團高管跟林俊旸團隊的張力。據(jù)說甚至有高管對除夕夜亮相發(fā)布的 Qwen-3.5 并不完全滿意,稱其是一個 “半成品”。

最終的局面就變成,一邊是林俊旸和Qwen團隊感覺受到了集團的資源掣肘,另一邊則是集團對Qwen表現(xiàn)也不滿意,要大調(diào)組織架構(gòu),提升產(chǎn)出并且加強跟C端產(chǎn)品的閉環(huán)。

今天還流出一份吳媽給通義團隊開會的摘要,信息量很多但不保真。

看起來從谷歌挖過來的zhou姓高管,是林俊旸離職的導(dǎo)火索。zhou擔心自己融不進Qwen團隊,所以要求掛到周靖人下面。晚點報道也提到,zhou確實是直接向周靖人匯報。

這個細節(jié)如果屬實,那基本意味著zhou跟林早就是要二選一。

因為zhou是搞后訓(xùn)練的,搞后訓(xùn)練的跟統(tǒng)籌模型研發(fā)的不對付,還向頂頭上司“告御狀”,暗示對方要排擠我,這后面抬頭不見低頭見的,哪里還有合作的可能。

既然最后zhou的訴求得到了滿足,成功入職了,就說明周靖人和集團當時已經(jīng)在兩個人之間做出了選擇。

本文系作者 象先志 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習,不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

10:52

現(xiàn)貨黃金向上觸及4700美元

10:52

奢侈品股跌至2022年以來最低,受需求擔憂加劇影響

10:48

中央決定:姚來英任國家煙草專賣局黨組書記

10:47

美登月版圖巨變,NASA擬讓SpaceX替代波音核心職能

10:44

體育概念震蕩拉升,共創(chuàng)草坪漲停

10:43

小米汽車:新一代SU7“準現(xiàn)車”鎖單后預(yù)計1—5周即可交付

10:42

壓力大會加重皮炎,中國科學(xué)家首次發(fā)現(xiàn)科學(xué)證據(jù)

10:41

高盛擬4月啟動績效裁員,規(guī)?;驗?%-3%

10:38

今日MMLC電池級碳酸鋰(早盤)價格較昨日上漲50元/噸

10:36

世貿(mào)組織:中東沖突或拖累全球貿(mào)易增長前景

10:35

消息稱英特爾本月底CPU漲價10%

10:34

籌資1000億美元,亞馬遜貝索斯擬設(shè)立基金收購制造企業(yè)并引入AI

10:29

工信部部長李樂成調(diào)研信息技術(shù)創(chuàng)新應(yīng)用和未來產(chǎn)業(yè)發(fā)展研究工作

10:28

滬深兩市成交額突破1萬億,較上一日此時放量超400億

10:27

美國批準部分俄羅斯原油的交付與銷售

10:24

預(yù)測市場Kalshi完成新一輪超10億美元融資,估值達220億美元

10:22

德國汽車半導(dǎo)體公司Elmos考慮出售,市值23億歐元

10:22

章源鎢業(yè)上調(diào)3月下半月長單采購報價

10:21

太空光伏概念震蕩走強,拉普拉斯?jié)q近10%

10:20

聯(lián)邦快遞第三財季業(yè)績和展望均超預(yù)期,盤后股價大漲逾9%

掃描下載App