![]()
根據(jù)多方分析和披露,Qwen3-Max是一個(gè)參數(shù)量達(dá)到萬億級別的“龐然大物”,而巨大的體量也著實(shí)為其帶來了相匹配的實(shí)力:在SWE-Bench Verified上獲得了69.6分的世界級成績;在考驗(yàn)Agent能力的Tau2-Bench上,超越了Claude Opus 4;在AIME等高難度推理任務(wù)上,其“Thinking”變體甚至取得了驚人的滿分或接近滿分的表現(xiàn)。
阿里不惜投入巨量資源,將Qwen3-Max推向SOTA,其戰(zhàn)略意圖清晰而堅(jiān)定。這本質(zhì)上是一場只有巨頭才能玩得起的“3A游戲”。
正如在游戲行業(yè),3A大作意味著高昂的開發(fā)成本、頂級的制作水準(zhǔn)和龐大的宣發(fā)資源,大模型領(lǐng)域的“規(guī)模競賽”亦是如此。它是通過人力、財(cái)力、物力的極致堆砌,構(gòu)建起一道后來者難以逾越的性能壁壘和算力門檻。 目的很明確:在AGI的終極敘事中,必須手握一張能與OpenAI平起平坐的“王牌”,借以鞏固自身(尤其是云業(yè)務(wù))的優(yōu)勢,最后再依靠規(guī)模化應(yīng)用實(shí)現(xiàn)盈利。在企業(yè)客戶選擇云服務(wù)商時(shí),一個(gè)“全球第三”的旗艦?zāi)P?,其象征意義和信任背書價(jià)值千金。
然而,這場“登頂”的盛宴之下,潛藏著“參數(shù)陷阱”的冰冷現(xiàn)實(shí)。
第一個(gè)沖突在于“規(guī)模”與“成本”的邊際效益。萬億參數(shù)帶來了性能的提升,但也帶來了指數(shù)級增長的訓(xùn)練成本和推理成本。根據(jù)阿里云官網(wǎng)公布的價(jià)格,Qwen3-Max(0-32K檔)的輸入價(jià)格約為8.64元/百萬Tokens,輸出價(jià)格更是高達(dá)43.2元/百萬Tokens。這種定價(jià),注定了它只能是少數(shù)頭部企業(yè)在核心、高價(jià)值場景中才能負(fù)擔(dān)的“奢侈品”。當(dāng)性能提升的邊際收益,開始難以覆蓋其高昂的推理成本時(shí),“規(guī)模競賽”就觸碰到了商業(yè)落地的“玻璃天花板”。
第二個(gè),則是開源策略與商業(yè)變現(xiàn)的矛盾。在國內(nèi)AI賽道中,“開源”正在成為行業(yè)的大勢所趨,然而矛盾在于,當(dāng)一個(gè)性能“足夠好”的開源模型可以免費(fèi)、私有化部署時(shí),有多少開發(fā)者還愿意為其閉源的、價(jià)格高昂的模型支付溢價(jià)?開源模型雖然“教育”了市場,卻也親手“稀釋”了其旗艦API的商業(yè)價(jià)值。
一方面是巨頭的“3A游戲”,那么另一方面,以DeepSeek的“破價(jià)”則是資源相對薄弱的創(chuàng)業(yè)公司被迫選擇的“另辟蹊徑”。
財(cái)力雄厚的巨頭可以豪賭Scaling Law,但對于創(chuàng)業(yè)公司而言,除非擁有OpenAI那樣能撬動千億美元的戰(zhàn)略合作,否則在“參數(shù)陷阱”面前幾乎沒有試錯(cuò)空間。 它們唯一的活路,就是通過極致的技術(shù)優(yōu)化——從架構(gòu)到算法再到工程——在有限的算力里“擠”出更多的能力,為自己,也為客戶“擠”出寶貴的利潤空間。
而對于DeepSeek而言,從其聲名鵲起,便是因?yàn)樗?ldquo;破價(jià)”之所以在行業(yè)內(nèi)引發(fā)地震,因?yàn)樗皇?ldquo;補(bǔ)貼換市場”的互聯(lián)網(wǎng)舊劇本,而是由硬核技術(shù)驅(qū)動的“效率革命”。
![]()
據(jù)了解,DeepSeek能夠有降價(jià)50%以上的底氣,來自于一個(gè)關(guān)鍵的技術(shù)突破:DSA(DeepSeek Sparse Attention)。
在傳統(tǒng)Transformer架構(gòu)中,注意力機(jī)制的計(jì)算復(fù)雜度是O(n^2)(n為序列長度),即每個(gè)Token都要和上下文中的所有其他Token進(jìn)行計(jì)算。在處理長文本時(shí),這種“全局關(guān)注”會帶來災(zāi)難性的算力消耗。
DeepSeek V3.2-Exp(總參數(shù)量671B,激活參數(shù)37B的MoE模型)則徹底重寫了這一規(guī)則。DSA機(jī)制通過引入“Lightning Indexer”(閃電索引器)和“fine-grained selector”(細(xì)粒度選擇器),實(shí)現(xiàn)了兩階段的智能篩選。它不再“蠻力”地關(guān)注所有內(nèi)容,而是像一個(gè)高效的速讀者,先快速索引、評估上下文的重要性,然后只讓當(dāng)前Token與那些“真正相關(guān)”的Token進(jìn)行精細(xì)計(jì)算。
其結(jié)果是,在處理長文本任務(wù)時(shí),DSA“極大減少了每層處理的Token數(shù)量”,從而“大幅削減了推理成本和處理時(shí)間”。最關(guān)鍵的一點(diǎn)是,根據(jù)DeepSeek的官方評測,V3.2-Exp的性能與V3.1-Terminus保持在同一水平。
這徹底改變了游戲的性質(zhì)。DeepSeek證明了,通過算法和架構(gòu)的極致創(chuàng)新,可以在不犧牲模型質(zhì)量的前提下,將推理成本壓縮一半甚至更多。
這是對“規(guī)模派”的一次精準(zhǔn)“降維打擊”。它向市場傳遞了一個(gè)清晰的信號:AI的競爭,已經(jīng)從單純比拼“肌肉”(參數(shù)規(guī)模)的1.0時(shí)代,進(jìn)入了比拼“神經(jīng)效率”(算法與工程優(yōu)化)的2.0時(shí)代。
高階模型所形成的巨大價(jià)格鴻溝,正是當(dāng)前AI產(chǎn)業(yè)核心矛盾的爆發(fā)點(diǎn)。在這道鴻溝的兩側(cè),是中小企業(yè)和巨頭們截然不同的命運(yùn)。
對于數(shù)以萬計(jì)的中小企業(yè)、初創(chuàng)公司和獨(dú)立開發(fā)者而言,以DeepSeek為代表的“技術(shù)破價(jià)”無異于開辟了一片“新大陸”。在此之前,AI應(yīng)用的成本是一只“攔路虎”,如今結(jié)束技術(shù)手段,正將AI的成本屬性從“咨詢費(fèi)”拉向“水電費(fèi)”。當(dāng)API成本降低50%甚至90%時(shí),AI應(yīng)用的“可行性”就可以完成“從0到1”。
正如行業(yè)分析師所指出的,DeepSeek的低成本創(chuàng)新,正在推動AI應(yīng)用“從頭部企業(yè)壟斷轉(zhuǎn)向長尾場景滲透”。這符合“杰文斯悖論”(Jevons Paradox)的經(jīng)典邏輯:技術(shù)效率的提升(成本降低)并不會減少總消耗,反而會因?yàn)殚T檻的降低而激發(fā)海量的、前所未有的新需求,最終帶來算力總需求的爆發(fā)式增長。
然而,中小企業(yè)的狂歡,映襯出的卻是頭部巨頭的焦慮。DeepSeek的“技術(shù)破價(jià)”更是將這場沖突推向了高潮。
事實(shí)上,一場殘酷的“API價(jià)格戰(zhàn)”早已在國內(nèi)AI巨頭(如阿里、百度、騰訊、字節(jié))之間打響。早在2024年,字節(jié)豆包的“白菜價(jià)”就已迫使阿里云(Qwen-Long降價(jià)97%)和百度(文心兩大主力模型免費(fèi))倉促應(yīng)戰(zhàn)。巨頭們不惜大幅降低API單價(jià),甚至將中小型模型免費(fèi),其核心目的就是“搶占AI云市場”的入口。 他們試圖用“模型補(bǔ)貼”換取“云客戶”,將用戶鎖定在自己的生態(tài)高墻內(nèi)。
這場“價(jià)格戰(zhàn)”與“效率戰(zhàn)”的疊加,讓巨頭們陷入了經(jīng)典的兩難困境。
一位不愿透露姓名的大模型頭部企業(yè)從業(yè)者在一次模擬采訪中這樣表述:“我們內(nèi)部現(xiàn)在很分裂。一方面,你必須跟進(jìn)(降價(jià)),市場份額丟了就再也回不來了,云業(yè)務(wù)的增長指望著這個(gè)。另一方面,旗艦?zāi)P停ㄈ鏠wen3-Max)的推理成本是實(shí)打?qū)嵉?,降價(jià)就是‘割肉’。”
“我們現(xiàn)在的策略是分裂的:用免費(fèi)的中小模型去‘跑量’,穩(wěn)住開發(fā)者生態(tài);同時(shí)用頂尖的旗艦?zāi)P腿?lsquo;立標(biāo)桿’,服務(wù)那些真正愿意為0.1分性能提升付費(fèi)的頭部客戶。”但在靠效率的創(chuàng)業(yè)公司的“攪局”之下,巨頭用‘規(guī)模’砸出來的性能溢價(jià),正在被他們迅速拉平。
這段基于行業(yè)普遍現(xiàn)狀的模擬表述,精準(zhǔn)地道出了巨頭的“利潤保衛(wèi)戰(zhàn)”有多么艱難。他們試圖用“云服務(wù)+模型”的生態(tài)綁定構(gòu)建“護(hù)城河”,但在絕對的性價(jià)比面前,這種綁定的吸引力正在受到嚴(yán)峻考驗(yàn)。
Qwen3-Max的“登頂”和DeepSeek V3.2-Exp的“破價(jià)”,看似是兩條背道而馳的路線,但它們聯(lián)手導(dǎo)演的這場“極限沖突”,實(shí)際上共同終結(jié)了大模型競爭的“蠻荒時(shí)代”,并提前揭示了“中場戰(zhàn)事”的終局走向。
首先,未來“規(guī)模派”和“效率派”必然走向融合。
“規(guī)模派”同樣意識到單純堆料的不可持續(xù)。Qwen3-Max本身采用先進(jìn)的MoE(混合專家)架構(gòu),就是其主動吸收“效率”技術(shù)的明證。未來,巨頭們必須將DSA這類稀疏算法和極致的推理優(yōu)化,作為其旗艦?zāi)P偷?ldquo;標(biāo)配”,否則其“規(guī)模”將因成本過高而喪失意義。
而“效率派”也不會永遠(yuǎn)停留在“性價(jià)比”的舒適區(qū)。它們必須利用“技術(shù)破價(jià)”換來的海量市場和數(shù)據(jù)飛輪,反哺更高性能、更大規(guī)模模型的研發(fā)。否則,它們也將在“效率”的單一維度上,陷入新一輪的“內(nèi)卷”。
其次,這場沖突正在倒逼AI產(chǎn)業(yè)回歸商業(yè)本質(zhì):從“模型跑分”轉(zhuǎn)向“應(yīng)用價(jià)值”。
當(dāng)最頂尖的模型和性價(jià)比最高的模型同時(shí)擺在貨架上,客戶的選擇不再是盲目的“追高”,而是精準(zhǔn)的“適配”。市場被清晰地劃分:少數(shù)高敏、高價(jià)值的場景去追逐頂尖模型的極限性能;而海量的、對成本敏感的“長尾應(yīng)用”,則會擁抱效率模型的極致效率。
這場由“規(guī)模”和“效率”共同導(dǎo)演的戲劇性沖突,其真正的價(jià)值在于“擠出”了AI的泡沫。它迫使所有玩家——無論是手握萬億參數(shù)的巨頭,還是掌握效率利器的新貴——都必須回答同一個(gè)終極問題:
你所提供的智能,究竟為客戶創(chuàng)造了多少可衡量的價(jià)值?
在AI的中場戰(zhàn)事中,誰能率先回答好這個(gè)問題,誰才能定義下半場。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論