這也是Google和Anthropic封禁那些在訂閱制下進(jìn)行全自動(dòng)調(diào)用的賬戶,因?yàn)橛嗛嗁M(fèi)用是有限的,遠(yuǎn)遠(yuǎn)覆蓋不了全自動(dòng)調(diào)用的算力成本。
當(dāng)消耗量指數(shù)級(jí)增長(zhǎng)時(shí),單位Token的價(jià)格優(yōu)勢(shì),就成了決定生死的競(jìng)爭(zhēng)力。
這個(gè)成本優(yōu)勢(shì)不是憑空掉下來(lái)的,底層是電力和工程的支撐。
算力的盡頭是電力。
中國(guó)工業(yè)用電比美國(guó)低30%到40%,中西部綠電甚至低50%到70%。加上中國(guó)工業(yè)用電盤(pán)子大,可以充分利用谷電訓(xùn)練模型,這構(gòu)成了中國(guó)AI企業(yè)的物理成本護(hù)城河。
另一頭,是被迫卷出來(lái)的工程能力。從2024年4月起,中國(guó)AI企業(yè)就在尖端芯片斷供的狀態(tài)下活著,拿不到最好的卡,就把手里的卡壓榨到極限。
中國(guó)模型普遍采用混合專家架構(gòu),這一技術(shù)路線重構(gòu)了算力消耗邏輯。一個(gè)幾千億參數(shù)的模型,處理簡(jiǎn)單問(wèn)題時(shí)只激活其中一小部分“專家網(wǎng)絡(luò)”,這種“按需激活”的模式,省電省算力。
最后是開(kāi)源生態(tài)的正向循環(huán)。
過(guò)去一年,中國(guó)大模型在全球的Token消耗占比增長(zhǎng)了421%。斯坦福的報(bào)告說(shuō),2024年8月到2025年8月,中國(guó)開(kāi)發(fā)者貢獻(xiàn)了Hugging Face總下載量的17.1%,略高于美國(guó)的15.8%。
開(kāi)源生態(tài)降低了全球開(kāi)發(fā)者的使用門(mén)檻,也讓中國(guó)模型在持續(xù)的技術(shù)反饋里快速迭代,能力和價(jià)格的綜合優(yōu)勢(shì)在擴(kuò)大。如硅谷投資人Aditya Agarwal所說(shuō):“50%以上的大模型調(diào)用通過(guò)廉價(jià)的開(kāi)源模型完成,中國(guó)模型實(shí)際在支持大部分AI應(yīng)用,美國(guó)同行甚至無(wú)法替代。”
中國(guó)AI模型出海的成功,是技術(shù)架構(gòu)創(chuàng)新+極致成本控制+開(kāi)源生態(tài)+場(chǎng)景適配共同作用的結(jié)果,也是系統(tǒng)性優(yōu)勢(shì)的集中爆發(fā)。
如果說(shuō)調(diào)用量數(shù)據(jù)解釋了中國(guó)AI“有多強(qiáng)”,那么接下來(lái)需要回答的是:這些Token究竟通過(guò)什么路徑流向全球?
過(guò)去幾年,中國(guó)AI出海的主流方式是“應(yīng)用輸出”,即,把AI能力封裝成APP,送到海外用戶手里。字節(jié)的Gauthmath、美圖的影像產(chǎn)品、快手的KLING AI,走的都是這條路。
到今天,這條路徑依然在貢獻(xiàn)可觀的用戶規(guī)模和收入。
以Talkie為例,這款情感陪伴類應(yīng)用覆蓋全球200多個(gè)國(guó)家,在北美Z世代中滲透率持續(xù)提升。用戶在和AI角色聊天的過(guò)程中,每一句話都在消耗Token。這類C端收入占Minimax收入的70%以上,且仍在快速增長(zhǎng)中:2026 年 2 月日均 Token 消耗量達(dá)到了2025 年 12 月的 6 倍以上。
字節(jié)的Gauthmath在美國(guó)拍照搜題市場(chǎng)拿下47%的份額,成功替代老牌產(chǎn)品Mathway,也是同樣的邏輯。
這類模式不直接按Token向用戶收費(fèi),而是通過(guò)訂閱、內(nèi)購(gòu)、廣告變現(xiàn)。但從底層看,它們消耗的依然是中國(guó)算力,是中國(guó)AI出海的“用戶基本盤(pán)”。
如果把AI出海比作一條產(chǎn)業(yè)鏈,應(yīng)用是下游,算力是上游。中國(guó)企業(yè)先在下游做產(chǎn)品、做流量,然后向上游走,做底層、做基建。
一方面,通過(guò)API管道式輸出,直接把算力做成水電煤。
海外開(kāi)發(fā)者通過(guò)OpenRouter等聚合平臺(tái),調(diào)用中國(guó)大模型的API,推理在中國(guó)本土的數(shù)據(jù)中心完成,按Token付費(fèi)。整個(gè)過(guò)程,算力不出境,電力不出境,只有價(jià)值通過(guò)Token跨境交付。
這是一種典型的“賣水賣電”生意。開(kāi)發(fā)者不需要自己部署模型,不需要買顯卡,就能讓?xiě)?yīng)用跑在中國(guó)的模型上。
據(jù)報(bào)道,月之暗面負(fù)責(zé)API服務(wù)的團(tuán)隊(duì)近期快速擴(kuò)編,以獨(dú)立業(yè)務(wù)分支形式直接向總裁張予彤匯報(bào)。組織層面的調(diào)整,足以說(shuō)明API業(yè)務(wù)的重要性正在快速上升。
從商業(yè)角度看,這類模式的優(yōu)勢(shì)在于可規(guī)?;?、利潤(rùn)率可觀,而且隨著Agent時(shí)代到來(lái),單次任務(wù)的Token消耗量指數(shù)級(jí)增長(zhǎng),API業(yè)務(wù)的想象空間還在放大。
另一方面,通過(guò)構(gòu)建開(kāi)源生態(tài),為算力輸出修路。
阿里通義千問(wèn)、DeepSeek系列選擇了一條看起來(lái)“免費(fèi)”的路:把模型權(quán)重、工具鏈、工程范式全部開(kāi)源,海外開(kāi)發(fā)者可以免費(fèi)下載,在本地服務(wù)器上部署。
免費(fèi)圖的是讓中國(guó)模型進(jìn)入全球開(kāi)發(fā)者的默認(rèn)工具箱,成為他們技術(shù)棧的一部分。當(dāng)一個(gè)開(kāi)發(fā)者用熟了開(kāi)源模型,他未來(lái)開(kāi)發(fā)商業(yè)應(yīng)用時(shí),自然會(huì)優(yōu)先考慮調(diào)用同系列的API。
基于阿里和DeepSeek開(kāi)源模型的衍生模型上傳量,已經(jīng)超過(guò)基于美國(guó)主流模型的。這意味著全球開(kāi)發(fā)者正在中國(guó)開(kāi)源模型的基礎(chǔ)上,生長(zhǎng)出一個(gè)龐大的技術(shù)生態(tài)。生態(tài)一旦形成,遷移成本就極高。
可以說(shuō),今天的中國(guó)AI出海,不再是單一的“應(yīng)用輸出”,而是一個(gè)三層結(jié)構(gòu):底層是開(kāi)源生態(tài),通過(guò)開(kāi)放換取開(kāi)發(fā)者心智;中間層是API算力輸出,直接把Token賣給全球開(kāi)發(fā)者,是商業(yè)化的核心引擎;頂層是應(yīng)用輸出,用產(chǎn)品觸達(dá)終端用戶,既是流量入口,也是算力消耗的重要場(chǎng)景。
三層相互支撐,共同說(shuō)明,中國(guó)算力正在成為全球AI的底層基礎(chǔ)設(shè)施。
OpenRouter平臺(tái)上的數(shù)字確實(shí)亮眼,但OpenRouter不代表全貌。
消費(fèi)級(jí)市場(chǎng)(開(kāi)發(fā)者、初創(chuàng)公司、Agent應(yīng)用)的決策鏈條短,核心指標(biāo)是性價(jià)比+上手快。開(kāi)發(fā)者用哪個(gè)模型,往往自己說(shuō)了算。這個(gè)邏輯下,中國(guó)模型的“便宜量又足”是絕對(duì)優(yōu)勢(shì)。
企業(yè)級(jí)市場(chǎng)不一樣。政府、金融、醫(yī)療、關(guān)鍵基礎(chǔ)設(shè)施,決策鏈條長(zhǎng),涉及合規(guī)、安全、審計(jì)、供應(yīng)商穩(wěn)定性等等。
海外的企業(yè)級(jí)市場(chǎng)就更復(fù)雜了。
所以,有一個(gè)問(wèn)題是繞不開(kāi)的,即,在國(guó)際競(jìng)爭(zhēng)中,純商業(yè)方面的競(jìng)爭(zhēng)優(yōu)勢(shì),比如好用、成本低,可能還不夠。
比如,此前的英偉達(dá)H200被禁止出口。雖然現(xiàn)在已經(jīng)可以進(jìn)口英偉達(dá)H200,但在AI競(jìng)爭(zhēng)層面,美國(guó)的政策指不定又會(huì)出現(xiàn)什么“反復(fù)”,而當(dāng)前推理集群還是離不開(kāi)英偉達(dá)的H100/H200。
當(dāng)然,封鎖具有雙面性,一方面會(huì)使得訓(xùn)練成本上升,模型迭代速度放緩,另一方面正是這種背景,倒逼工程優(yōu)化提升效率,國(guó)產(chǎn)芯片取得進(jìn)展。
但風(fēng)險(xiǎn)同樣存在。銀河證券的研報(bào)指出,全球模型迭代周期正在縮短,主流模型更新頻率已由半年縮短至數(shù)月。如果核心能力提升速度放緩,成本優(yōu)勢(shì)可能在高端市場(chǎng)迅速失去吸引力。
大摩首席經(jīng)濟(jì)學(xué)家邢自強(qiáng)認(rèn)為,Token出海肯定是有空間的,但不要過(guò)度吹捧中國(guó)的開(kāi)源大模型、Token出海借助電力優(yōu)勢(shì),而忽視了地緣政治與安全考量。
他舉例稱,中國(guó)在5G設(shè)備領(lǐng)域同樣有性價(jià)比和技術(shù)優(yōu)勢(shì),但從2018、2019年之后,歐美不少電信網(wǎng)絡(luò)中,中國(guó)的5G基站還是被替代了。
在企業(yè)級(jí)市場(chǎng),對(duì)價(jià)格敏感的中小企業(yè)可能被中國(guó)模型的性價(jià)比穿透,但在政府、金融、醫(yī)療等涉及數(shù)據(jù)主權(quán)和關(guān)鍵基礎(chǔ)設(shè)施的領(lǐng)域,準(zhǔn)入邏輯從“性價(jià)比”轉(zhuǎn)向“合規(guī)信任、品牌認(rèn)知與生態(tài)鎖定”。
美國(guó)正通過(guò)投資審查、標(biāo)準(zhǔn)制定、數(shù)據(jù)主權(quán)規(guī)則,系統(tǒng)性地構(gòu)筑企業(yè)級(jí)市場(chǎng)的準(zhǔn)入門(mén)檻。
這意味著地緣政治的“天花板”正在降低。
2025年12月,美國(guó)政府提出所謂的“硅和平倡議”(Pax Silica),聲稱要把擁有全球頂尖科技企業(yè)或其他優(yōu)勢(shì)資源的國(guó)家聯(lián)合起來(lái),以確保“供應(yīng)鏈安全”等。
專業(yè)人士認(rèn)為,這是試圖用規(guī)則、投資與項(xiàng)目清單重塑全球技術(shù)分工與資本流向,看起來(lái)是走向了重塑生態(tài),實(shí)際上是包裝下的排他性整合。
這個(gè)“他”是誰(shuí),不言而喻。
從芯片封鎖到“硅和平倡議”,從遏制發(fā)展到規(guī)則輸出,美國(guó)的目標(biāo)是從生態(tài)層面重塑游戲規(guī)則、掌握話語(yǔ)權(quán)。
所以,模型調(diào)用量反超,是階段性的成果,但也是故事的一半。
AI出海的下半場(chǎng),需要在保持成本優(yōu)勢(shì)的同時(shí),面對(duì)更多、更復(fù)雜的問(wèn)題,有的問(wèn)題可以靠提升模型性能、系統(tǒng)效率、競(jìng)爭(zhēng)力來(lái)解決,有的問(wèn)題沒(méi)有答案。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論