事后來看,這幾年的積累對他后來的職業(yè)軌跡至關(guān)重要。
一方面,他在阿里最核心的電商業(yè)務(wù)里完成了大規(guī)模工程落地的訓(xùn)練,知道怎么把實驗室里的算法落地。
另一方面,他在這個過程中結(jié)識了一支愿意跟他走的核心團隊。
2020年前后,周暢的工作方向開始轉(zhuǎn)變。
阿里達(dá)摩院啟動了一個叫做Multi-Modality to Multi-Modality Multitask Mega-transformer(多模態(tài)到多模態(tài)多任務(wù)超大規(guī)模Transformer模型)的項目,下文簡稱M6。
這個項目由阿里與清華大學(xué)聯(lián)合推出。周暢是這個項目的核心參與者,與他一起署名的還有兩個后來在千問故事里反復(fù)出現(xiàn)的名字:林俊旸和周靖人。
2021年3月,M6正式發(fā)布,參數(shù)規(guī)模1000億,是當(dāng)時全球多模態(tài)預(yù)訓(xùn)練領(lǐng)域最大的模型。3個月后,達(dá)摩院進(jìn)一步將M6推到了萬億參數(shù)級別,并且在訓(xùn)練效率上做了大幅優(yōu)化。
與同等規(guī)模的模型相比,M6的能耗降低超過八成,效率提升近11倍。
M6在中文場景下實現(xiàn)了文本與圖像等多模態(tài)的統(tǒng)一預(yù)訓(xùn)練,構(gòu)建了一個超過1.9TB圖像和292GB文本的大規(guī)模中文多模態(tài)數(shù)據(jù)集,覆蓋百科、網(wǎng)頁、商品描述等多種場景。
這套方法論后來被直接應(yīng)用到阿里的電商推薦和內(nèi)容生成業(yè)務(wù)中,M6-Rec等衍生工作在阿里集團內(nèi)部獲得了廣泛部署。
論文發(fā)表于KDD 2021這類的頂會上,周暢與林俊旸、周靖人共同署名。
還有一點很重要,M6也是Qwen在多模態(tài)方面的技術(shù)前身。
2023年,ChatGPT在全球范圍內(nèi)引發(fā)大模型熱潮,阿里迅速整合達(dá)摩院資源組建通義實驗室。周暢在M6的技術(shù)基礎(chǔ)上帶隊研發(fā)通義千問大模型,擔(dān)任技術(shù)負(fù)責(zé)人,直接向阿里云CTO周靖人匯報。
接下來的一年多時間里,周暢團隊先是在2023年8月首次開源Qwen-7B,此后陸續(xù)推出Qwen-VL視覺語言模型Qwen-Audio音頻理解模型、CodeQwen代碼模型,以及Qwen1.5-MoE混合專家模型,覆蓋了文本、視覺、音頻、代碼等多個模態(tài)方向。
2024年6月,也就是周暢離職前夕,千問團隊發(fā)布了Qwen2。前文提到了,Qwen2取得了巨大的成功,也讓阿里在整個開源模型界獲得了不小的名聲。
截至目前,周暢的論文累計被引用超過30000次。其中引用最多的一篇就是Qwen2技術(shù)報告,被引用次數(shù)超過 8000 次。
如果學(xué)術(shù)論文也按微信公眾號的文章那么算,這篇大概可以理解為是10萬+。
到周暢離開時,通義千問開源模型的累計下載量已突破700萬次。
千問能走到今天,離不開周暢搭建的那套從M6延續(xù)下來的技術(shù)根基。
2024年7月,網(wǎng)傳周暢即將離職創(chuàng)業(yè)。
當(dāng)時他還在阿里云系統(tǒng)中,尚未正式走完流程,但多個獨立信源確認(rèn)他已經(jīng)決定要走。離職時,他還簽署了競業(yè)協(xié)議。
然后事情的發(fā)展出乎所有人意料。
僅僅兩個多月后的10月,周暢就被曝出已經(jīng)低調(diào)加入字節(jié)跳動。不是創(chuàng)業(yè),是跳槽,而且跳到了阿里最直接的競爭對手那里。
字節(jié)給周暢開出的條件4-2職級(也有知情人稱其現(xiàn)在職級為5-1)、八位數(shù)年包。
換算成阿里職級,這大約相當(dāng)于連跳兩級、薪資也翻好幾倍。隨行的團隊成員也拿到了4-1、3-2的職級。
2024年11月,阿里正式申請競業(yè)仲裁的消息傳開,接近通義的業(yè)內(nèi)人士確認(rèn)“情況屬實”。
“辭職創(chuàng)業(yè)就是個幌子,就是怕被競業(yè),”一位和字節(jié)關(guān)系很近的獵頭,在此前接受第一財經(jīng)采訪時這樣說道。“但這次瞞不住了,來字節(jié)的不止周暢一個人,他手底下的團隊還有十多個人也跟著跳槽了。”
截至2026年3月,這起勞動仲裁的最終審理結(jié)果、賠償裁定等核心信息,涉事的兩家AI巨頭、包括周暢本人從未對外公開披露。
勞動仲裁案件以不公開審理為法定原則,雙方均未發(fā)布案件細(xì)節(jié)。目前能確認(rèn)的只是阿里提起仲裁后,案件已按法定流程完成審理。
加入字節(jié)后,周暢被安排在Seed團隊的“多模態(tài)交互與世界模型”部門。
Seed是字節(jié)跳動的大模型與基礎(chǔ)研究團隊,也是整個公司在AI方向上最受重視的業(yè)務(wù)之一,對周暢來說也屬于是老本行了。
2025年2月,一個重要人物的到來改變了Seed的格局。前谷歌DeepMind研究副總裁、谷歌最高職級L10的谷歌Fellow吳永輝加入字節(jié),擔(dān)任Seed基礎(chǔ)研究負(fù)責(zé)人,直接向CEO梁汝波匯報。
吳永輝是南京大學(xué)校友,在谷歌工作了17年的老將,曾主導(dǎo)谷歌神經(jīng)機器翻譯系統(tǒng)GNMT的研發(fā),也參與了Gemini大模型的工作。
吳永輝的到來重構(gòu)了Seed團隊的匯報架構(gòu),多名算法和技術(shù)負(fù)責(zé)人被重新安排向吳永輝匯報,其中就包括周暢。
從后來的發(fā)展來看,吳永輝是非常看重周暢的。
2025年7月,字節(jié)豆包視覺多模態(tài)生成負(fù)責(zé)人楊建朝宣布“暫時休息”。楊建朝師從被稱為“計算機視覺之父”的黃煦濤,在字節(jié)負(fù)責(zé)文生圖、文生視頻等視覺AI方向。最新消息顯示,他正在視頻模型領(lǐng)域啟動創(chuàng)業(yè)。
他休假后,周暢正式接手了這塊業(yè)務(wù)。緊接著,視覺基礎(chǔ)模型研究負(fù)責(zé)人馮佳時也離職。
兩次人事變動疊加,周暢的管轄范圍從原來的多模態(tài)交互和世界模型,擴展到了文生圖Seedream、文生視頻Seedance等全線視覺AI產(chǎn)品。至此,他已經(jīng)成為Seed團隊中多模態(tài)方向的主要負(fù)責(zé)人。
接手視覺全線之后,周暢團隊把Qwen時期的高密度產(chǎn)出模式帶到了Seed里。
文生圖方向,團隊完成了Seedream從3.0到4.0再到5.0的快速迭代。
Seedream 3.0實現(xiàn)了原生2K輸出和3秒級生成速度,Seedream 4.0將分辨率推至4K并統(tǒng)一了生成與編輯架構(gòu),2026年2月發(fā)布的Seedream5.0 進(jìn)一步引入了物理感知和語義推理能力。
文生視頻方向的成果更是顯著。
文章開頭就提到,Seedance 2.0在2026年2月7日低調(diào)上線,其帶來的影響卻遠(yuǎn)超預(yù)期。
Seedance 2.0支持原生2K分辨率、多鏡頭敘事、四模態(tài)輸入(文本+圖像+視頻+音頻)、多語種口型同步等專業(yè)級功能。
經(jīng)過實際測算,一個5秒特效鏡頭的制作成本,可以從3000塊錢(人力一個月)降至3塊錢(AI兩分鐘)。
短劇行業(yè)也因此被改寫成為“AI短劇行業(yè)”,DataEye預(yù)估,受AI技術(shù)降本增效的推動,2026年國內(nèi)漫劇用戶規(guī)模將從2025年的約1.2億增至2.8億。
值得一提的是,最新消息顯示,此前離職的Qwen大模型后訓(xùn)練負(fù)責(zé)人郁博文,已正式加入字節(jié)跳動,擔(dān)任Seed團隊視覺模型與多模態(tài)交互團隊后訓(xùn)練負(fù)責(zé)人。
這位Qwen來的后輩,與周暢在Seed再一次攜手共事。
事實上,Seed團隊近年來,一直都有阿里相關(guān)業(yè)務(wù)的核心團隊成員轉(zhuǎn)身來投,這一趨勢可以追溯到周暢入職的數(shù)年前。
例如,曾在阿里負(fù)責(zé)拍立淘等項目、擔(dān)任視覺搜索負(fù)責(zé)人的黃偉麟,在2020年前后離開阿里并加入字節(jié)視覺與多模態(tài)研究體系;
阿里前語音AI負(fù)責(zé)人盧璐則2022年前后加入字節(jié),負(fù)責(zé)語音與多模態(tài)大模型研究;
此外,曾在達(dá)摩院從事文檔理解與多模態(tài)研究的葉清浩,在2022年前后離開阿里,其學(xué)術(shù)主頁目前顯示任職于字節(jié)Seed團隊。
換言之,字節(jié)的多模態(tài)研究體系里,阿里來的“外援”還真不少。
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論