2024年7月,豆包掀起大模型降價(jià)風(fēng)潮的影響出現(xiàn),因?yàn)榘哑炫災(zāi)P偷挠?jì)費(fèi)標(biāo)準(zhǔn)從「幾分錢」降低到「幾厘錢」,幾乎是以一己之力憑空創(chuàng)造出了大模型公有云這個(gè)市場(chǎng);

2025年2月,DeepSeek-R1全球爆火,不但打響了大模型領(lǐng)域的成本革命,也把AI云的負(fù)載壓力從預(yù)訓(xùn)練切換到了推理,從此開源模型百花齊放,進(jìn)一步促進(jìn)了模型商品化的滲透率。

整個(gè)連鎖反應(yīng)的結(jié)果,就是MaaS(模型即服務(wù))這種商業(yè)模式的拔地而起,以及最早布局MaaS的火山引擎,現(xiàn)在拿到了49.2%的市場(chǎng)份額,相當(dāng)于全行業(yè)的半壁江山。注意,這個(gè)統(tǒng)計(jì)并不包括豆包、抖音等字節(jié)內(nèi)部產(chǎn)品,完全是外部企業(yè)客戶的調(diào)用量。

當(dāng)然,MaaS只是AI云的賽道之一,基于統(tǒng)計(jì)口徑的不同,阿里云、百度云也都能在IaaS、PaaS等賽道拿到另外的第一名,但就含金量而言,MaaS是最能證明大模型行業(yè)發(fā)展情況的晴雨表。

因?yàn)镸aaS的調(diào)用量大,也夠直接,模型好不好用、該怎么改的評(píng)測(cè)集,都是只有通過調(diào)用才能得到的信息,賣GPU是拿不到這類數(shù)據(jù)的,所以火山引擎從一開始就是把MaaS作為AI云的核心目標(biāo),這對(duì)兄弟部門的豆包也有幫助:

「大的使用量,才能打磨出好模型,并且大幅降低模型推理的單位成本?!?/p>

MaaS是一個(gè)邊緣創(chuàng)新的典型產(chǎn)物,因?yàn)闋I(yíng)收和利潤(rùn)的起點(diǎn)都很低,傳統(tǒng)云廠商都不太看得上,還是賣算力最賺錢,像是甲骨文這種千億美金級(jí)別的鎖單帶動(dòng)股價(jià)飆漲,才是聚光燈下的主流敘事。

但是對(duì)于開發(fā)者來說,原生化的AI云才是剛需,去買算力部署模型,門檻天然就高,比如我們都知道,DeepSeek已經(jīng)是大模型里的價(jià)格屠夫了,但要訓(xùn)練一套完整的DeepSeek MoE模型,至少需要320張GPU,這就不是普通開發(fā)者能說上就上的。

所以MaaS這種群眾路線的服務(wù)才越來越受歡迎,它相當(dāng)于一家模型商店,把市面上的模型都封裝到了云上,開發(fā)者不必關(guān)心技術(shù)細(xì)節(jié),只需按量付費(fèi),直接調(diào)用模型的核心能力——文本生成、圖像識(shí)別、語音轉(zhuǎn)換等——為己所用。

有個(gè)對(duì)MaaS模式的體驗(yàn)形容特別恰當(dāng):拎包入住,豐儉由人。

Quest Mobile在2025中國(guó)移動(dòng)互聯(lián)網(wǎng)半年大報(bào)告里也提到過一個(gè)點(diǎn),在國(guó)內(nèi)的AI應(yīng)用側(cè),插件產(chǎn)品的規(guī)模要明顯高于原生產(chǎn)品,什么意思呢,就是大家期待的殺手級(jí)App,可能并沒有那么快出現(xiàn),與此同時(shí),AI又已經(jīng)變得無處不在了,以新功能的形式。

在這個(gè)滲透過程里,MaaS市場(chǎng)就是最大的幕后功臣,一個(gè)社交產(chǎn)品的開發(fā)者,如果想要新增一個(gè)AI頭像的繪制功能,完全可以不用重復(fù)造輪子,專門訓(xùn)練一個(gè)圖片模型出來,而是可以像去超市購物那樣,在MaaS市場(chǎng)里挑一個(gè)價(jià)格和性能最適合的,然后用接口的方式加到自己的產(chǎn)品里,即開即用。

美國(guó)BI平臺(tái)Databricks的負(fù)責(zé)人今年也說過來自業(yè)務(wù)側(cè)的反饋:「大多數(shù)企業(yè)并不想成為AI專家,他們只是需要開箱化的AI解決方案,而且微調(diào)和管理開源模型的復(fù)雜性對(duì)他們而言依然是一個(gè)難以跨越的門檻?!?/p>

所以像是OpenAI和Anthropic在面對(duì)免費(fèi)平替的開源模型時(shí)還是非常能打,而擁有企業(yè)級(jí)服務(wù)經(jīng)驗(yàn)的Salesforce和Oracle也在老樹新芽般的高速增長(zhǎng),模型的原始智能水平固然重要,但更值錢的地方在于它驅(qū)動(dòng)產(chǎn)品的質(zhì)量和可用性。

某種意義上,MaaS才是真正的大模型競(jìng)技場(chǎng),像是火山引擎之所以占有率獨(dú)一檔,就是因?yàn)樗軈R聚市面上最新、最領(lǐng)先的模型,還是用超市的比喻來理解,就是供應(yīng)鏈的競(jìng)爭(zhēng)力制勝,比如Google的新圖片模型nano-banana刷屏之后,唯一能跟上硬剛的,就是字節(jié)的Seedream 4.0,剛剛登頂LMArena,而在火山引擎,這些頂級(jí)模型都在擺貨架上「予取予求」。

而且即便有微調(diào)和訓(xùn)推需求,火山引擎的Infra效率也是行業(yè)領(lǐng)先的,像是DeepSeek-V3.1這種開源模型在火山引擎上的表現(xiàn)指標(biāo)也非常漂亮,這些都會(huì)最終體現(xiàn)到開發(fā)者的體驗(yàn)端,形成用量越多、進(jìn)步越快的正循環(huán)。

前幾天看到有條推文,說OpenAI曾經(jīng)明確表示GPT-4o、o1、o3、o3-mini這樣說命名對(duì)用戶來說太不友好了,要用GPT-5來做統(tǒng)一和簡(jiǎn)化,現(xiàn)在來看,這話OpenAI只做到了一半,確實(shí)只有GPT-5一個(gè)模型了,然而我們看到迎面走來的方陣分別是:GPT-5、GPT-5 auto、GPT-5 thinking、GPT-5 pro、GPT-5-mini、GPT-5-nano??

本質(zhì)上,模型商品化的主要瓶頸,還是Tokens不夠用,于是不得不人為設(shè)置各種檔位,在讓大模型變成自來水那樣按需取用的生活資源這件事情上,MaaS平臺(tái)的用武之地和長(zhǎng)期價(jià)值,一定會(huì)與日俱增。

前幾個(gè)月我還在說,基于Google的Q2財(cái)報(bào),Google云5月的Tokens調(diào)用量是480萬億次,到了7月就漲到了980萬億次,不但增長(zhǎng)極高,而且單月就已經(jīng)相當(dāng)于去年中國(guó)公有云總計(jì)調(diào)用次數(shù)的8倍之多了。

但在對(duì)齊比較對(duì)象之后,就會(huì)發(fā)現(xiàn)如果讓豆包「出戰(zhàn)」,在規(guī)模上甚至是可以和Google正面硬剛的:

火山引擎在6月的一次大會(huì)上披露過,截至2025年5月,豆包大模型的日均Tokens調(diào)用量是16.4萬億次,拉到月均來算,就是500億次以上,比同期的Google只多不少。

換句話說,這個(gè)行業(yè)還沒有到?jīng)_刺的階段,但頭部大模型廠商都已經(jīng)跑出了沖刺的速度,增長(zhǎng)速度一個(gè)比一個(gè)嚇人,云上一日,人間一年,我就感覺到快。

你們也可以參與預(yù)測(cè)一下,半年后IDC公布2025年全年中國(guó)大模型公有云的Tokens調(diào)用量時(shí),會(huì)出現(xiàn)一個(gè)什么量級(jí)的數(shù)字?

本文系作者 闌夕 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

2026-02-08 22:51

孫穎莎奪得乒乓球亞洲杯女單冠軍

2026-02-08 22:50

王楚欽奪得乒乓球亞洲杯男單冠軍

2026-02-08 22:37

泰國(guó)國(guó)會(huì)下議院選舉進(jìn)行計(jì)票

2026-02-08 22:37

崔東樹:1月乘用車市場(chǎng)新車降價(jià)力度算術(shù)平均達(dá)到3.7萬元

2026-02-08 22:08

馬克?古爾曼:蘋果計(jì)劃于2月23日當(dāng)周向開發(fā)者發(fā)布iOS 26.4測(cè)試版

2026-02-08 21:15

全球首個(gè)以機(jī)器人為主角的大型晚會(huì)首播

2026-02-08 20:52

下周(2月9日-15日)市場(chǎng)大事預(yù)告

2026-02-08 20:17

2月8日新聞聯(lián)播速覽18條

2026-02-08 19:50

比特幣升破71000美元,日內(nèi)漲4.19%

2026-02-08 19:11

全球第四大汽車巨頭Stellantis上一交易日跌超23%,去年下半年預(yù)虧超1550億元

2026-02-08 19:01

出口民調(diào):日本執(zhí)政聯(lián)盟預(yù)計(jì)獲得眾議院過半席位

2026-02-08 18:53

Alphabet 確認(rèn) Gemini 月活用戶突破7.5億,2026年支出計(jì)劃翻倍

2026-02-08 18:42

彤程新材料集團(tuán)股份有限公司遞表港交所

2026-02-08 18:29

馬斯克:36個(gè)月內(nèi)或30個(gè)月內(nèi)太空將成為人類部署AI的首選

2026-02-08 18:25

中央氣象臺(tái)發(fā)布沙塵暴藍(lán)色預(yù)警

2026-02-08 18:23

本周新增瀚天天成、芯碁微裝等5家境外發(fā)行上市備案企業(yè)

2026-02-08 18:18

本周新增永志半導(dǎo)體、博??档?4家企業(yè)完成境內(nèi)IPO輔導(dǎo)備案

2026-02-08 17:22

四川長(zhǎng)虹:擬將大數(shù)據(jù)公司58.33%股權(quán)轉(zhuǎn)讓給長(zhǎng)虹控股集團(tuán)

2026-02-08 17:12

國(guó)投白銀LOF:2月9日開市起至10:30停牌

2026-02-08 17:00

杉杉股份:若重整成功,公司實(shí)際控制人將變更為安徽省國(guó)資委

掃描下載App