文 | 版面之外,作者|畫畫
2026年4月,中國AI圈將迎來一次罕見的同臺競技。
DeepSeek V4,梁文鋒打磨已久的多模態(tài)大模型,計劃正式上線。
幾乎同一時間,騰訊混元新模型也將發(fā)布,負責人是姚順雨,2025年底剛剛回國,頂著騰訊總辦首席AI科學家的Title走馬上任。
兩家公司,一南一北,一個初創(chuàng),一個巨頭。
一個是用量化私募思路顛覆了AI行業(yè)的理工男,一個是被騰訊用最高規(guī)格從海外請回來的學術派。
他們幾乎不可能在同一張牌桌上出現(xiàn),但4月,他們都要交卷。
這不是巧合,這是一個節(jié)點。
1、騰訊的那個決定
要理解4月意味著什么,必須回到2025年初騰訊做的那個決定。
彼時國內(nèi)大模型市場,百度有文心,阿里有通義,字節(jié)有豆包,各家都在跑馬圈地。騰訊混元排不進第一梯隊,產(chǎn)品端的元寶幾乎沒有存在感。
就在這個時候,騰訊選擇在元寶里接入DeepSeek。
這個決定在當時被很多人解讀為務實之舉,與其死撐自研,不如先用最好的模型把用戶留住。
但它同時也是一個承認:在大模型能力這件事上,我們現(xiàn)在不如一家創(chuàng)業(yè)公司。
元寶的數(shù)據(jù)驗證了這個決定的正確性。
接入DeepSeek之后,用戶和活躍度明顯回升。這是騰訊用流量換了時間,用元寶已有的產(chǎn)品生態(tài)和微信QQ的導流能力,換來了姚順雨團隊自研模型的窗口期。
但時間窗口終究有限。一旦混元最新的版本上線,騰訊面臨的第一個真實問題是:留在元寶里的用戶,到底認的是哪個名字?
這不是能靠市場調(diào)研回答的問題,它只能靠4月之后的留存數(shù)據(jù)來回答。
2、DeepSeek的另一道難題
DeepSeek這邊,面對的是一種完全不同性質的壓力。
V3發(fā)布之后,DeepSeek的數(shù)字是這樣的:上線至2025年2月9日,累計下載超過1.1億次,周活躍用戶最高接近9700萬。
這個量級,已經(jīng)接近Twitter在鼎盛期的日活水平,對于一個發(fā)布不到半年的AI應用,當時幾乎沒有先例。
更大的影響發(fā)生在行業(yè)層面。V3發(fā)布后,英偉達單日市值蒸發(fā)約6000億美元,美國科技圈開始重新討論算力軍備競賽的邏輯是否成立。
DeepSeek用一個開源模型,在成本和效率上同時挑戰(zhàn)了大模型必須靠暴力堆算力的行業(yè)共識。
但這組數(shù)字和這段敘事,也同時變成了V4必須背負的重量。
市場對V4的預期,不是比V3更好,而是能不能再次重新定義。這是一個很難完成的任務,因為V3已經(jīng)把天花板拉得很高。
梁文鋒選擇的應對方式,是讓V4的迭代方向足夠具體,而不是繼續(xù)打效率革命的旗號。
從論文節(jié)奏看,這個準備早就開始了。
2025年12月,署名包含梁文鋒團隊的《mHC: Manifold-Constrained Hyper-Connections》發(fā)表,方向是底層架構的連接方式優(yōu)化;
2026年1月,梁文鋒署名的《Conditional Memory via Scalable Lookup》提出條件記憶機制,在推理過程中,模型可以根據(jù)條件動態(tài)檢索和激活相關記憶,而不是把所有歷史上下文都塞進一個固定窗口里。
這兩篇論文,距離V4發(fā)布只有幾個月。它們不是學術展示,更像是產(chǎn)品路線圖的技術背書。
V4還有一條線被單獨提出,深度適配國產(chǎn)芯片,并有望成為首個完全運行在國產(chǎn)算力生態(tài)上的頂級大模型。
在此之前,所有頂級大模型的訓練和推理都高度依賴英偉達的GPU。華為昇騰、寒武紀等國產(chǎn)芯片在性能和軟件生態(tài)上與英偉達仍有差距,適配工作遠比聽起來復雜。
如果V4真的跑通了,意味著中國大模型產(chǎn)業(yè)鏈上最關鍵的一環(huán),算力依賴第一次出現(xiàn)了可被驗證的替代路徑。
3、兩條路,同一個終點
有意思的是,DeepSeek和騰訊在技術路線上正在往同一個方向收攏:長上下文、長期記憶、Agent可用性。
這不是巧合,這是整個行業(yè)正在形成的共識。下一代AI競爭的核心,不再是誰的參數(shù)更多,而是誰能真正記住用戶、理解上下文、在復雜任務中持續(xù)工作。
但兩家公司走向這個終點的路徑截然不同。
DeepSeek的做法是從底層架構動刀,條件記憶機制是要在模型本身的記憶方式上做根本性改變。
騰訊的做法是先定義評測標準,CL-bench提出了一套衡量上下文學習能力的新基準。
如果這套標準被學術圈和行業(yè)接受,騰訊就獲得了一個敘事上的主動權:你的模型好不好,要按我定的標準。
兩種路徑,代表了兩種不同的競爭策略。做出更好的產(chǎn)品,和定義什么叫更好的產(chǎn)品,是兩件事。
歷史上,后者有時候比前者活得更久。但前提是,你定的標準得被別人接受。如果DeepSeek V4的能力直接碾壓了CL-bench設定的評測維度,那套標準就只是騰訊的自我評分。
4、四月之后
4月會到來,兩張考卷會被打開,市場會給出它的判斷。
但真正值得追問的問題,比誰的模型更好要復雜得多。
第一個問題:騰訊能不能接住用戶的切換?
從接入DeepSeek到推出自研混元,這條路如果走通,騰訊的體量、數(shù)據(jù)、場景接入,微信、QQ、騰訊視頻、游戲、企業(yè)微信,一旦有了夠用的底座,這些場景的價值才能被真正釋放出來。
但如果切換之后用戶留存下滑,騰訊可能需要重新評估自己在這場競爭里的位置。
第二個問題:DeepSeek能不能守住國產(chǎn)第一的位置?
V3之后,DeepSeek已經(jīng)不只是一個產(chǎn)品,它是一個標準、一種敘事。
V4需要證明,這不是偶然,而是一種可持續(xù)的能力。
尤其是在國產(chǎn)芯片這條線上,如果跑通了,DeepSeek將擁有一個其他頂級大模型都沒有的敘事,而這個敘事的價值,可能比模型本身還要大。
第三個問題,也是最大的問題:誰在爭定義權?
大模型的下半場,不只是誰的能力更強,更是誰來定義下一代AI應該是什么樣的。
梁文鋒的答案是:開源、高效、記憶力強、跑在自己的芯片上。
姚順雨和騰訊的答案是:深度融合場景、長上下文、Agent友好。這兩個答案并不互斥,但代表了兩種不同的路徑,一個是從模型出發(fā)往應用走,一個是從應用出發(fā)往模型走。
4月,只是一個節(jié)點。真正的答案,可能需要整個2026年來慢慢揭曉。
但有一件事是確定的,2025年初,元寶接入DeepSeek的那一刻,是中國AI格局的一次重組,大公司第一次公開承認,創(chuàng)業(yè)公司在核心技術上跑到了前面。
2026年4月,如果混元和V4同時亮相,將是另一次重組的開始,不再是誰領先的問題,而是各自走哪條路的問題。
中國AI的故事,正在從賽跑變成分道。
而分道,往往比賽跑,更有意思。
【版面之外】的話:
兩家公司,兩種路徑,一個時間點。
真正有意思的,不是分數(shù)。是在這兩張答卷里,會看到兩種完全不同的安全感。
DeepSeek的安全感,來自把東西做出來,開源、高效、跑在自己的芯片上,這套打法能持續(xù)。
騰訊的安全感,來自把東西放進去,放進微信里,放進QQ里,放進游戲里。
4 月的交卷,對于騰訊來說,不是為了向外界證明什么,本質上是為了把元寶的大腦,從 DeepSeek 那里贖回來。







快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論
標題寫錯了,是梁文鋒