價(jià)格只是表象,真正驅(qū)動(dòng)OpenAI做這件事的,是整個(gè)行業(yè)的使用趨勢(shì)已經(jīng)發(fā)生了根本性轉(zhuǎn)向。

輕量化小模型主要有調(diào)用成本低、響應(yīng)快這兩大特征,不少證據(jù)表明小模型已經(jīng)成為當(dāng)前AI落地最具性價(jià)比、最具增長(zhǎng)潛力的選擇。

在OpenRouter本月度最受歡迎LLM排行榜前十中,輕量化模型占到了6個(gè)席位,它們參數(shù)量普遍集中在數(shù)十億至數(shù)百億級(jí)別,和Claude Opus這類動(dòng)輒數(shù)千億甚至萬(wàn)億參數(shù)的通用旗艦大模型形成鮮明的差異。

榜單Top 2席位被輕量化小模型包攬,第1名MiniMax M2.5以8.29T tokens的調(diào)用量斷層領(lǐng)跑全榜,月度漲幅高達(dá) 476%;第2名Google Gemini 3 Flash Preview,調(diào)用量也達(dá)到4.24T tokens,遠(yuǎn)超多數(shù)通用旗艦大模型。

Hugging Face Hub的模型下載量統(tǒng)計(jì)同樣印證了這一趨勢(shì):92.48%的下載量來(lái)自少于10億參數(shù)的模型,86.33% 為5億以下,69.83% 為2億以下。

大模型也進(jìn)入了薄利多銷的時(shí)代。

1B+參數(shù)量的模型,即便包含多款輿論熱度極高的開源大模型,整體下載占比僅為7.52%,不足輕量化模型的十分之一,這說(shuō)明大模型的高關(guān)注度,似乎并未轉(zhuǎn)化為真實(shí)的落地與采用。

從OpenAI自身的商業(yè)賬本來(lái)看,做小模型更是一道必答題。

今年2月底,OpenAI宣布ChatGPT全球每周活躍用戶已突破9億,付費(fèi)用戶約5000 萬(wàn),付費(fèi)轉(zhuǎn)化率僅約5%左右,絕大多數(shù)用戶仍停留在免費(fèi)版本。這也成為其未來(lái)商業(yè)化最核心的增長(zhǎng)空間。

絕大多數(shù)的C端付費(fèi)用戶,核心使用場(chǎng)景是日常對(duì)話、文案潤(rùn)色、信息檢索、輕量代碼編寫等高頻輕量需求。

這類場(chǎng)景完全不需要GPT-5.4這類旗艦大模型的極限復(fù)雜推理能力,百億級(jí)以內(nèi)的輕量化小模型足以覆蓋大部分需求,同時(shí)又能提供毫秒級(jí)響應(yīng)、無(wú)排隊(duì)等待的使用體驗(yàn),完美匹配絕大多數(shù)用戶的核心訴求。

說(shuō)了這么多“為什么”,接下來(lái)看看這兩款模型到底交出了怎樣的答卷——畢竟,飼料便宜了,蝦的個(gè)頭要是也縮水了,那就不叫降本增效,叫偷工減料。

mini、nano能力幾何

mini和nano的優(yōu)勢(shì)就只是小和便宜嗎?

No No No

根據(jù)OpenAI官網(wǎng)的一系列跑分測(cè)試,可以說(shuō)它們能力表現(xiàn)也很突出。

在業(yè)內(nèi)公認(rèn)最權(quán)威的AI程序員測(cè)試SWE-bench Pro 中,GPT-5.4 mini的準(zhǔn)確率達(dá)到了54.4%,表現(xiàn)極具殺傷力,逼近滿血版GPT-5.4的57.7%。

GPT-5.4 nano的準(zhǔn)確率為52.4%,再考慮到它極低的成本,非常適合作為快速迭代的代碼審查和輔助子agent。

以下兩張圖表看得更直觀,橫軸分別代表模型的響應(yīng)時(shí)長(zhǎng)和所用成本,縱軸均表示模型在任務(wù)中的準(zhǔn)確率。

GPT-5.4雖然準(zhǔn)確率穩(wěn)居第一,但是在橫軸上卻延伸了太遠(yuǎn),也就是不僅思考久,燒的錢還多。而nano和mini的折線則整體居于坐標(biāo)圖左側(cè),標(biāo)志了它們極高的性價(jià)比。

它們只是犧牲了一點(diǎn)點(diǎn)終極的邏輯上限,就換來(lái)了極快的響應(yīng)速度和極低的成本。

對(duì)此,不少網(wǎng)友戲稱:小龍蝦的飼料費(fèi)終于被打下來(lái)了。

的確,mini和nano未來(lái)可能會(huì)成為養(yǎng)蝦的主流API選擇。

在OSWorld-Verified(真實(shí)電腦環(huán)境操作測(cè)試)中,GPT-5.4 mini達(dá)到了72.1%的準(zhǔn)確率,幾乎追平了滿血旗艦版的75%。

這項(xiàng)測(cè)試主要是讓AI像人一樣,通過(guò)看顯示器、動(dòng)鼠標(biāo)、敲鍵盤來(lái)使用一臺(tái)真的電腦,包括使用Chrome、Office、VS Code等軟件。

這才是OpenClaw等agent玩家最看重的指標(biāo)。

過(guò)去讓AI操控電腦,AI經(jīng)常會(huì)瞎點(diǎn)或者反應(yīng)遲鈍。mini版本的這個(gè)高分意味著,它識(shí)別按鈕、滑塊、輸入框的精度極高,在一些自動(dòng)化任務(wù)上可以更加得心應(yīng)手。

然而,也不是所有場(chǎng)景都適合用小模型。

nano模型在OSWorld-Verified上的得分僅為39.0%,甚至低于上一代GPT-5 mini的42.0%。

這意味著在需要精細(xì)操控電腦界面的復(fù)雜任務(wù)上,nano還力有不逮。

同樣,對(duì)于需要深度推理、長(zhǎng)鏈條邏輯的高難度任務(wù),旗艦版GPT-5.4仍然不可替代。

小模型的價(jià)值不在于取代大模型,而在于和大模型搭配使用——把對(duì)的模型放在對(duì)的位置,才是子agent架構(gòu)真正的精髓。

這也恰恰是nano和mini發(fā)布的深層意義,它們不是來(lái)?yè)屍炫灠骘埻氲?,而是?lái)幫旗艦版分擔(dān)那些“高射炮打蚊子”的活兒。

當(dāng)大模型不再需要親自處理每一個(gè)瑣碎步驟,整個(gè)系統(tǒng)的效率和成本結(jié)構(gòu)都會(huì)發(fā)生質(zhì)變。

OpenAI想打的不是一場(chǎng)簡(jiǎn)單的價(jià)格戰(zhàn),OpenAI內(nèi)心OS是這樣的:“我可以每個(gè)token少賺你點(diǎn)錢,但是我要讓你多用我的小模型,把總收入抬上去。”

典型的薄利多銷。

過(guò)去“便宜”是國(guó)產(chǎn)模型的護(hù)城河,可是這道護(hù)城河正在被填平。對(duì)普通開發(fā)者和企業(yè)用戶而言,AI可能很快就會(huì)變成各行各業(yè)用得起、跑得快的新基礎(chǔ)設(shè)施。

小龍蝦的飼料費(fèi)打下來(lái)了,養(yǎng)蝦的門檻也在悄悄降低。接下來(lái)的問(wèn)題是:誰(shuí)能養(yǎng)出最肥的蝦?

本文系作者 字母AI 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

07:31

內(nèi)塔尼亞胡:以方將“暫?!笨找u伊朗能源設(shè)施

07:29

伊朗發(fā)動(dòng)“真實(shí)承諾-4”第65、66輪軍事行動(dòng),首次使用升級(jí)版“卡德爾”導(dǎo)彈

07:24

美軍或奪島以迫使伊朗開放霍爾木茲海峽

07:17

六國(guó)發(fā)表聯(lián)合聲明:準(zhǔn)備采取措施保障霍爾木茲海峽安全

07:14

美股收評(píng):三大指數(shù)齊跌,光通信概念逆市走強(qiáng),閃迪續(xù)刷新高

2026-03-19 22:58

內(nèi)存漲價(jià)潮席卷全球,32G內(nèi)存條從800元暴漲到3800元

2026-03-19 22:57

團(tuán)隊(duì)版 OpenClaw (Clawith)宣布開源

2026-03-19 22:54

多家航司國(guó)際航線燃油附加費(fèi)上調(diào)

2026-03-19 22:22

美股光通信概念股強(qiáng)勢(shì)拉升,Applied Optoelectronics 漲超6%

2026-03-19 22:13

ST泉為:公司及實(shí)控人、董事長(zhǎng)褚一凡因涉嫌信息披露違法違規(guī)被證監(jiān)會(huì)立案調(diào)查

2026-03-19 22:03

現(xiàn)貨黃金跌3.78%,報(bào)4636.60美元/盎司

2026-03-19 22:02

東方財(cái)富:發(fā)布2026-2028年股東分紅回報(bào)規(guī)劃

2026-03-19 21:55

美元指數(shù)日內(nèi)走低0.50%,最低報(bào)99.70

2026-03-19 21:51

首都在線:2025年虧損1.7億元

2026-03-19 21:35

中國(guó)聯(lián)通:2025年凈利潤(rùn)同比增長(zhǎng)1.1%,擬派發(fā)全年股利約51.12億元

2026-03-19 21:35

納斯達(dá)克中國(guó)金龍指數(shù)跌3.0%,報(bào)6804.11點(diǎn)

2026-03-19 21:34

美股開盤:三大指數(shù)集體低開,美光科技跌超8%

2026-03-19 21:18

3月19日美股盤前要聞

2026-03-19 21:16

歐洲央行:維持三大關(guān)鍵利率不變,符合市場(chǎng)預(yù)期

2026-03-19 21:08

NYMEX鉑金主力合約跌超9%,報(bào)1870.1美元/盎司

掃描下載App