2024年7月,豆包掀起大模型降價(jià)風(fēng)潮的影響出現(xiàn),因?yàn)榘哑炫災(zāi)P偷挠?jì)費(fèi)標(biāo)準(zhǔn)從「幾分錢」降低到「幾厘錢」,幾乎是以一己之力憑空創(chuàng)造出了大模型公有云這個(gè)市場(chǎng);
2025年2月,DeepSeek-R1全球爆火,不但打響了大模型領(lǐng)域的成本革命,也把AI云的負(fù)載壓力從預(yù)訓(xùn)練切換到了推理,從此開源模型百花齊放,進(jìn)一步促進(jìn)了模型商品化的滲透率。
整個(gè)連鎖反應(yīng)的結(jié)果,就是MaaS(模型即服務(wù))這種商業(yè)模式的拔地而起,以及最早布局MaaS的火山引擎,現(xiàn)在拿到了49.2%的市場(chǎng)份額,相當(dāng)于全行業(yè)的半壁江山。注意,這個(gè)統(tǒng)計(jì)并不包括豆包、抖音等字節(jié)內(nèi)部產(chǎn)品,完全是外部企業(yè)客戶的調(diào)用量。
當(dāng)然,MaaS只是AI云的賽道之一,基于統(tǒng)計(jì)口徑的不同,阿里云、百度云也都能在IaaS、PaaS等賽道拿到另外的第一名,但就含金量而言,MaaS是最能證明大模型行業(yè)發(fā)展情況的晴雨表。
因?yàn)镸aaS的調(diào)用量大,也夠直接,模型好不好用、該怎么改的評(píng)測(cè)集,都是只有通過調(diào)用才能得到的信息,賣GPU是拿不到這類數(shù)據(jù)的,所以火山引擎從一開始就是把MaaS作為AI云的核心目標(biāo),這對(duì)兄弟部門的豆包也有幫助:
「大的使用量,才能打磨出好模型,并且大幅降低模型推理的單位成本?!?/p>
MaaS是一個(gè)邊緣創(chuàng)新的典型產(chǎn)物,因?yàn)闋I(yíng)收和利潤(rùn)的起點(diǎn)都很低,傳統(tǒng)云廠商都不太看得上,還是賣算力最賺錢,像是甲骨文這種千億美金級(jí)別的鎖單帶動(dòng)股價(jià)飆漲,才是聚光燈下的主流敘事。
但是對(duì)于開發(fā)者來說,原生化的AI云才是剛需,去買算力部署模型,門檻天然就高,比如我們都知道,DeepSeek已經(jīng)是大模型里的價(jià)格屠夫了,但要訓(xùn)練一套完整的DeepSeek MoE模型,至少需要320張GPU,這就不是普通開發(fā)者能說上就上的。
所以MaaS這種群眾路線的服務(wù)才越來越受歡迎,它相當(dāng)于一家模型商店,把市面上的模型都封裝到了云上,開發(fā)者不必關(guān)心技術(shù)細(xì)節(jié),只需按量付費(fèi),直接調(diào)用模型的核心能力——文本生成、圖像識(shí)別、語音轉(zhuǎn)換等——為己所用。
有個(gè)對(duì)MaaS模式的體驗(yàn)形容特別恰當(dāng):拎包入住,豐儉由人。
Quest Mobile在2025中國(guó)移動(dòng)互聯(lián)網(wǎng)半年大報(bào)告里也提到過一個(gè)點(diǎn),在國(guó)內(nèi)的AI應(yīng)用側(cè),插件產(chǎn)品的規(guī)模要明顯高于原生產(chǎn)品,什么意思呢,就是大家期待的殺手級(jí)App,可能并沒有那么快出現(xiàn),與此同時(shí),AI又已經(jīng)變得無處不在了,以新功能的形式。
![]()
在這個(gè)滲透過程里,MaaS市場(chǎng)就是最大的幕后功臣,一個(gè)社交產(chǎn)品的開發(fā)者,如果想要新增一個(gè)AI頭像的繪制功能,完全可以不用重復(fù)造輪子,專門訓(xùn)練一個(gè)圖片模型出來,而是可以像去超市購物那樣,在MaaS市場(chǎng)里挑一個(gè)價(jià)格和性能最適合的,然后用接口的方式加到自己的產(chǎn)品里,即開即用。
美國(guó)BI平臺(tái)Databricks的負(fù)責(zé)人今年也說過來自業(yè)務(wù)側(cè)的反饋:「大多數(shù)企業(yè)并不想成為AI專家,他們只是需要開箱化的AI解決方案,而且微調(diào)和管理開源模型的復(fù)雜性對(duì)他們而言依然是一個(gè)難以跨越的門檻?!?/p>
所以像是OpenAI和Anthropic在面對(duì)免費(fèi)平替的開源模型時(shí)還是非常能打,而擁有企業(yè)級(jí)服務(wù)經(jīng)驗(yàn)的Salesforce和Oracle也在老樹新芽般的高速增長(zhǎng),模型的原始智能水平固然重要,但更值錢的地方在于它驅(qū)動(dòng)產(chǎn)品的質(zhì)量和可用性。
某種意義上,MaaS才是真正的大模型競(jìng)技場(chǎng),像是火山引擎之所以占有率獨(dú)一檔,就是因?yàn)樗軈R聚市面上最新、最領(lǐng)先的模型,還是用超市的比喻來理解,就是供應(yīng)鏈的競(jìng)爭(zhēng)力制勝,比如Google的新圖片模型nano-banana刷屏之后,唯一能跟上硬剛的,就是字節(jié)的Seedream 4.0,剛剛登頂LMArena,而在火山引擎,這些頂級(jí)模型都在擺貨架上「予取予求」。
而且即便有微調(diào)和訓(xùn)推需求,火山引擎的Infra效率也是行業(yè)領(lǐng)先的,像是DeepSeek-V3.1這種開源模型在火山引擎上的表現(xiàn)指標(biāo)也非常漂亮,這些都會(huì)最終體現(xiàn)到開發(fā)者的體驗(yàn)端,形成用量越多、進(jìn)步越快的正循環(huán)。
前幾天看到有條推文,說OpenAI曾經(jīng)明確表示GPT-4o、o1、o3、o3-mini這樣說命名對(duì)用戶來說太不友好了,要用GPT-5來做統(tǒng)一和簡(jiǎn)化,現(xiàn)在來看,這話OpenAI只做到了一半,確實(shí)只有GPT-5一個(gè)模型了,然而我們看到迎面走來的方陣分別是:GPT-5、GPT-5 auto、GPT-5 thinking、GPT-5 pro、GPT-5-mini、GPT-5-nano??
本質(zhì)上,模型商品化的主要瓶頸,還是Tokens不夠用,于是不得不人為設(shè)置各種檔位,在讓大模型變成自來水那樣按需取用的生活資源這件事情上,MaaS平臺(tái)的用武之地和長(zhǎng)期價(jià)值,一定會(huì)與日俱增。
前幾個(gè)月我還在說,基于Google的Q2財(cái)報(bào),Google云5月的Tokens調(diào)用量是480萬億次,到了7月就漲到了980萬億次,不但增長(zhǎng)極高,而且單月就已經(jīng)相當(dāng)于去年中國(guó)公有云總計(jì)調(diào)用次數(shù)的8倍之多了。
但在對(duì)齊比較對(duì)象之后,就會(huì)發(fā)現(xiàn)如果讓豆包「出戰(zhàn)」,在規(guī)模上甚至是可以和Google正面硬剛的:
火山引擎在6月的一次大會(huì)上披露過,截至2025年5月,豆包大模型的日均Tokens調(diào)用量是16.4萬億次,拉到月均來算,就是500億次以上,比同期的Google只多不少。
換句話說,這個(gè)行業(yè)還沒有到?jīng)_刺的階段,但頭部大模型廠商都已經(jīng)跑出了沖刺的速度,增長(zhǎng)速度一個(gè)比一個(gè)嚇人,云上一日,人間一年,我就感覺到快。
你們也可以參與預(yù)測(cè)一下,半年后IDC公布2025年全年中國(guó)大模型公有云的Tokens調(diào)用量時(shí),會(huì)出現(xiàn)一個(gè)什么量級(jí)的數(shù)字?
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論