根據(jù)多方分析和披露,Qwen3-Max是一個(gè)參數(shù)量達(dá)到萬億級別的“龐然大物”,而巨大的體量也著實(shí)為其帶來了相匹配的實(shí)力:在SWE-Bench Verified上獲得了69.6分的世界級成績;在考驗(yàn)Agent能力的Tau2-Bench上,超越了Claude Opus 4;在AIME等高難度推理任務(wù)上,其“Thinking”變體甚至取得了驚人的滿分或接近滿分的表現(xiàn)。

阿里不惜投入巨量資源,將Qwen3-Max推向SOTA,其戰(zhàn)略意圖清晰而堅(jiān)定。這本質(zhì)上是一場只有巨頭才能玩得起的“3A游戲”。

正如在游戲行業(yè),3A大作意味著高昂的開發(fā)成本、頂級的制作水準(zhǔn)和龐大的宣發(fā)資源,大模型領(lǐng)域的“規(guī)模競賽”亦是如此。它是通過人力、財(cái)力、物力的極致堆砌,構(gòu)建起一道后來者難以逾越的性能壁壘和算力門檻。 目的很明確:在AGI的終極敘事中,必須手握一張能與OpenAI平起平坐的“王牌”,借以鞏固自身(尤其是云業(yè)務(wù))的優(yōu)勢,最后再依靠規(guī)模化應(yīng)用實(shí)現(xiàn)盈利。在企業(yè)客戶選擇云服務(wù)商時(shí),一個(gè)“全球第三”的旗艦?zāi)P?,其象征意義和信任背書價(jià)值千金。

然而,這場“登頂”的盛宴之下,潛藏著“參數(shù)陷阱”的冰冷現(xiàn)實(shí)。

第一個(gè)沖突在于“規(guī)模”與“成本”的邊際效益。萬億參數(shù)帶來了性能的提升,但也帶來了指數(shù)級增長的訓(xùn)練成本和推理成本。根據(jù)阿里云官網(wǎng)公布的價(jià)格,Qwen3-Max(0-32K檔)的輸入價(jià)格約為8.64元/百萬Tokens,輸出價(jià)格更是高達(dá)43.2元/百萬Tokens。這種定價(jià),注定了它只能是少數(shù)頭部企業(yè)在核心、高價(jià)值場景中才能負(fù)擔(dān)的“奢侈品”。當(dāng)性能提升的邊際收益,開始難以覆蓋其高昂的推理成本時(shí),“規(guī)模競賽”就觸碰到了商業(yè)落地的“玻璃天花板”。

第二個(gè),則是開源策略與商業(yè)變現(xiàn)的矛盾。在國內(nèi)AI賽道中,“開源”正在成為行業(yè)的大勢所趨,然而矛盾在于,當(dāng)一個(gè)性能“足夠好”的開源模型可以免費(fèi)、私有化部署時(shí),有多少開發(fā)者還愿意為其閉源的、價(jià)格高昂的模型支付溢價(jià)?開源模型雖然“教育”了市場,卻也親手“稀釋”了其旗艦API的商業(yè)價(jià)值。

“破價(jià)”的利刃:創(chuàng)業(yè)公司“另辟蹊徑”的效率革命

一方面是巨頭的“3A游戲”,那么另一方面,以DeepSeek的“破價(jià)”則是資源相對薄弱的創(chuàng)業(yè)公司被迫選擇的“另辟蹊徑”。

財(cái)力雄厚的巨頭可以豪賭Scaling Law,但對于創(chuàng)業(yè)公司而言,除非擁有OpenAI那樣能撬動千億美元的戰(zhàn)略合作,否則在“參數(shù)陷阱”面前幾乎沒有試錯(cuò)空間。 它們唯一的活路,就是通過極致的技術(shù)優(yōu)化——從架構(gòu)到算法再到工程——在有限的算力里“擠”出更多的能力,為自己,也為客戶“擠”出寶貴的利潤空間。

而對于DeepSeek而言,從其聲名鵲起,便是因?yàn)樗?ldquo;破價(jià)”之所以在行業(yè)內(nèi)引發(fā)地震,因?yàn)樗皇?ldquo;補(bǔ)貼換市場”的互聯(lián)網(wǎng)舊劇本,而是由硬核技術(shù)驅(qū)動的“效率革命”。

 

 

據(jù)了解,DeepSeek能夠有降價(jià)50%以上的底氣,來自于一個(gè)關(guān)鍵的技術(shù)突破:DSA(DeepSeek Sparse Attention)。

在傳統(tǒng)Transformer架構(gòu)中,注意力機(jī)制的計(jì)算復(fù)雜度是O(n^2)(n為序列長度),即每個(gè)Token都要和上下文中的所有其他Token進(jìn)行計(jì)算。在處理長文本時(shí),這種“全局關(guān)注”會帶來災(zāi)難性的算力消耗。

DeepSeek V3.2-Exp(總參數(shù)量671B,激活參數(shù)37B的MoE模型)則徹底重寫了這一規(guī)則。DSA機(jī)制通過引入“Lightning Indexer”(閃電索引器)和“fine-grained selector”(細(xì)粒度選擇器),實(shí)現(xiàn)了兩階段的智能篩選。它不再“蠻力”地關(guān)注所有內(nèi)容,而是像一個(gè)高效的速讀者,先快速索引、評估上下文的重要性,然后只讓當(dāng)前Token與那些“真正相關(guān)”的Token進(jìn)行精細(xì)計(jì)算。

其結(jié)果是,在處理長文本任務(wù)時(shí),DSA“極大減少了每層處理的Token數(shù)量”,從而“大幅削減了推理成本和處理時(shí)間”。最關(guān)鍵的一點(diǎn)是,根據(jù)DeepSeek的官方評測,V3.2-Exp的性能與V3.1-Terminus保持在同一水平。

這徹底改變了游戲的性質(zhì)。DeepSeek證明了,通過算法和架構(gòu)的極致創(chuàng)新,可以在不犧牲模型質(zhì)量的前提下,將推理成本壓縮一半甚至更多。

這是對“規(guī)模派”的一次精準(zhǔn)“降維打擊”。它向市場傳遞了一個(gè)清晰的信號:AI的競爭,已經(jīng)從單純比拼“肌肉”(參數(shù)規(guī)模)的1.0時(shí)代,進(jìn)入了比拼“神經(jīng)效率”(算法與工程優(yōu)化)的2.0時(shí)代。

夾縫中的“新大陸”:API價(jià)格戰(zhàn)與巨頭的“利潤保衛(wèi)戰(zhàn)”

高階模型所形成的巨大價(jià)格鴻溝,正是當(dāng)前AI產(chǎn)業(yè)核心矛盾的爆發(fā)點(diǎn)。在這道鴻溝的兩側(cè),是中小企業(yè)和巨頭們截然不同的命運(yùn)。

對于數(shù)以萬計(jì)的中小企業(yè)、初創(chuàng)公司和獨(dú)立開發(fā)者而言,以DeepSeek為代表的“技術(shù)破價(jià)”無異于開辟了一片“新大陸”。在此之前,AI應(yīng)用的成本是一只“攔路虎”,如今結(jié)束技術(shù)手段,正將AI的成本屬性從“咨詢費(fèi)”拉向“水電費(fèi)”。當(dāng)API成本降低50%甚至90%時(shí),AI應(yīng)用的“可行性”就可以完成“從0到1”。

正如行業(yè)分析師所指出的,DeepSeek的低成本創(chuàng)新,正在推動AI應(yīng)用“從頭部企業(yè)壟斷轉(zhuǎn)向長尾場景滲透”。這符合“杰文斯悖論”(Jevons Paradox)的經(jīng)典邏輯:技術(shù)效率的提升(成本降低)并不會減少總消耗,反而會因?yàn)殚T檻的降低而激發(fā)海量的、前所未有的新需求,最終帶來算力總需求的爆發(fā)式增長。

然而,中小企業(yè)的狂歡,映襯出的卻是頭部巨頭的焦慮。DeepSeek的“技術(shù)破價(jià)”更是將這場沖突推向了高潮。

事實(shí)上,一場殘酷的“API價(jià)格戰(zhàn)”早已在國內(nèi)AI巨頭(如阿里、百度、騰訊、字節(jié))之間打響。早在2024年,字節(jié)豆包的“白菜價(jià)”就已迫使阿里云(Qwen-Long降價(jià)97%)和百度(文心兩大主力模型免費(fèi))倉促應(yīng)戰(zhàn)。巨頭們不惜大幅降低API單價(jià),甚至將中小型模型免費(fèi),其核心目的就是“搶占AI云市場”的入口。 他們試圖用“模型補(bǔ)貼”換取“云客戶”,將用戶鎖定在自己的生態(tài)高墻內(nèi)。

這場“價(jià)格戰(zhàn)”與“效率戰(zhàn)”的疊加,讓巨頭們陷入了經(jīng)典的兩難困境。

一位不愿透露姓名的大模型頭部企業(yè)從業(yè)者在一次模擬采訪中這樣表述:“我們內(nèi)部現(xiàn)在很分裂。一方面,你必須跟進(jìn)(降價(jià)),市場份額丟了就再也回不來了,云業(yè)務(wù)的增長指望著這個(gè)。另一方面,旗艦?zāi)P停ㄈ鏠wen3-Max)的推理成本是實(shí)打?qū)嵉?,降價(jià)就是‘割肉’。”

“我們現(xiàn)在的策略是分裂的:用免費(fèi)的中小模型去‘跑量’,穩(wěn)住開發(fā)者生態(tài);同時(shí)用頂尖的旗艦?zāi)P腿?lsquo;立標(biāo)桿’,服務(wù)那些真正愿意為0.1分性能提升付費(fèi)的頭部客戶。”但在靠效率的創(chuàng)業(yè)公司的“攪局”之下,巨頭用‘規(guī)模’砸出來的性能溢價(jià),正在被他們迅速拉平。

這段基于行業(yè)普遍現(xiàn)狀的模擬表述,精準(zhǔn)地道出了巨頭的“利潤保衛(wèi)戰(zhàn)”有多么艱難。他們試圖用“云服務(wù)+模型”的生態(tài)綁定構(gòu)建“護(hù)城河”,但在絕對的性價(jià)比面前,這種綁定的吸引力正在受到嚴(yán)峻考驗(yàn)。

超越“規(guī)模”與“效率”,AI價(jià)值正被再定義

Qwen3-Max的“登頂”和DeepSeek V3.2-Exp的“破價(jià)”,看似是兩條背道而馳的路線,但它們聯(lián)手導(dǎo)演的這場“極限沖突”,實(shí)際上共同終結(jié)了大模型競爭的“蠻荒時(shí)代”,并提前揭示了“中場戰(zhàn)事”的終局走向。

 

首先,未來規(guī)模派效率派必然走向融合。

“規(guī)模派”同樣意識到單純堆料的不可持續(xù)。Qwen3-Max本身采用先進(jìn)的MoE(混合專家)架構(gòu),就是其主動吸收“效率”技術(shù)的明證。未來,巨頭們必須將DSA這類稀疏算法和極致的推理優(yōu)化,作為其旗艦?zāi)P偷?ldquo;標(biāo)配”,否則其“規(guī)模”將因成本過高而喪失意義。

而“效率派”也不會永遠(yuǎn)停留在“性價(jià)比”的舒適區(qū)。它們必須利用“技術(shù)破價(jià)”換來的海量市場和數(shù)據(jù)飛輪,反哺更高性能、更大規(guī)模模型的研發(fā)。否則,它們也將在“效率”的單一維度上,陷入新一輪的“內(nèi)卷”。

其次,這場沖突正在倒逼AI產(chǎn)業(yè)回歸商業(yè)本質(zhì):從“模型跑分”轉(zhuǎn)向“應(yīng)用價(jià)值”。

當(dāng)最頂尖的模型和性價(jià)比最高的模型同時(shí)擺在貨架上,客戶的選擇不再是盲目的“追高”,而是精準(zhǔn)的“適配”。市場被清晰地劃分:少數(shù)高敏、高價(jià)值的場景去追逐頂尖模型的極限性能;而海量的、對成本敏感的“長尾應(yīng)用”,則會擁抱效率模型的極致效率。

這場由規(guī)模效率共同導(dǎo)演的戲劇性沖突,其真正的價(jià)值在于擠出AI的泡沫。它迫使所有玩家——無論是手握萬億參數(shù)的巨頭,還是掌握效率利器的新貴——都必須回答同一個(gè)終極問題:

你所提供的智能,究竟為客戶創(chuàng)造了多少可衡量的價(jià)值?

在AI的中場戰(zhàn)事中,誰能率先回答好這個(gè)問題,誰才能定義下半場。

本文系作者 大模型之家 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報(bào)

更多

2026-03-26 23:08

國內(nèi)商品期貨夜盤收盤多數(shù)上漲,對二甲苯期貨主力合約漲1.95%

2026-03-26 23:07

部分船舶通過伊朗“管控系統(tǒng)”通行霍爾木茲海峽

2026-03-26 23:07

五一視界2025年?duì)I收增21%,發(fā)布全球首款“物理直覺”世界模型

2026-03-26 23:00

伊拉克南部油田產(chǎn)量暴跌8成

2026-03-26 22:59

華虹公司:2025年凈利潤3.77億元,同比下降1.04%

2026-03-26 22:49

日本本州東部遠(yuǎn)海發(fā)生6.3級地震,震源深度10千米

2026-03-26 22:37

華虹半導(dǎo)體擬更名為“華虹宏力”,統(tǒng)一滬港兩地證券簡稱

2026-03-26 22:28

具身智能領(lǐng)域首個(gè)行業(yè)標(biāo)準(zhǔn)正式發(fā)布

2026-03-26 22:27

美國解除對白俄羅斯十余家實(shí)體制裁

2026-03-26 22:25

中國國航:2025年凈虧損17.7億元,同比大幅擴(kuò)大

2026-03-26 22:12

興業(yè)銀行:2025年凈利潤774.69億元,同比增長0.34%

2026-03-26 22:08

國際奧委會明確:奧運(yùn)女子組賽事僅限生理女性參加

2026-03-26 22:08

96個(gè)中央部門集中向社會公開預(yù)算

2026-03-26 21:58

Meta股價(jià)觸及2025年5月以來最低水平,最新下跌2.6%

2026-03-26 21:51

美團(tuán)財(cái)報(bào)電話會:預(yù)計(jì)Q1餐飲外賣的單均虧損環(huán)比優(yōu)化幅度會好于Q4

2026-03-26 21:42

伊朗通過中間人回應(yīng)美15點(diǎn)?;鹛嶙h,提出明確前提條件

2026-03-26 21:41

國臺辦回應(yīng)臺灣民眾黨前主席柯文哲一審被判17年

2026-03-26 21:34

納斯達(dá)克中國金龍指數(shù)跌超2%

2026-03-26 21:31

美股開盤:三大指數(shù)集體低開,芯片存儲板塊普跌

2026-03-26 21:29

云南銅業(yè):2025年凈利潤同比下降7.31%,擬10派2.3元

掃描下載App