圖片來(lái)源@視覺(jué)中國(guó)
文|冰鑒科技研究院
距ChatGPT3.5發(fā)布已近一年,大模型狂熱開(kāi)始逐步降溫:GPU禁運(yùn)及長(zhǎng)期燒錢的事實(shí),讓國(guó)內(nèi)的大模型企業(yè),不得不加速商業(yè)化考量。
目前,大模型的B端應(yīng)用已經(jīng)出現(xiàn)各種定價(jià)方法,包括按照時(shí)間段收費(fèi)、按調(diào)用量收費(fèi)以及各種包含硬件的一站式解決方案。其中,按照調(diào)用量定價(jià)的大模型又可以分為token計(jì)費(fèi)以及按照查詢次數(shù)收費(fèi)。
![]()
與此同時(shí),國(guó)外的大模型先行者實(shí)現(xiàn)收入激增,比如微軟,每月大模型應(yīng)用的收入已經(jīng)達(dá)到數(shù)千萬(wàn)人民幣,并且保持20%以上的月均增速。OpenAI公司收入增長(zhǎng)也超出預(yù)期。The Information援引知情人士報(bào)道,按照OpenAI目前的營(yíng)收增速,這家公司有望在未來(lái)12個(gè)月內(nèi)通過(guò)銷售AI軟件和算力產(chǎn)生超過(guò)10億美元的收入,高于該公司此前對(duì)股東報(bào)告的收入預(yù)測(cè)。
不過(guò),國(guó)內(nèi)大模型的商業(yè)化之路比國(guó)外同行要慢半拍,在模仿后者的商業(yè)化道路上可能荊棘遍地。
ChatGPT可以針對(duì)C端客戶收取月費(fèi),但國(guó)內(nèi)大模型想向C端收費(fèi)絕非易事。先做大C端用戶規(guī)模,再向廣告主收費(fèi)是互聯(lián)網(wǎng)企業(yè)的不二法門;至于要求苛刻的B端客戶,大模型廠商能否說(shuō)服他們付費(fèi),并形成穩(wěn)定的SaaS訂閱收入模式,還有很長(zhǎng)的路要走。
目前,通用大模型平臺(tái)偏愛(ài)按token計(jì)費(fèi),但國(guó)內(nèi)國(guó)外的token標(biāo)準(zhǔn)并沒(méi)有統(tǒng)一,國(guó)內(nèi)一些大模型平臺(tái)1 token等于1個(gè)漢字,一些平臺(tái)理解為1.5個(gè)漢字,還有1.8個(gè)漢字。除此之外,各家收費(fèi)計(jì)算口徑也不一樣,以千tokens計(jì)價(jià),價(jià)差最高達(dá)上百倍,每1000 tokens收費(fèi)在0.008元至0.876元人民幣之間。
1、 什么是token?
Token是用來(lái)計(jì)量大模型輸入、輸出的基本單位,也可以直觀的理解為“字”或“詞”。但是目前并沒(méi)有統(tǒng)一計(jì)量標(biāo)準(zhǔn),各家大模型平臺(tái)根據(jù)自己的偏好“隨意”定義。如騰訊1token≈1.8個(gè)漢字,通義千問(wèn)、千帆大模型等1token=1個(gè)漢字,對(duì)于英文文本來(lái)說(shuō),1個(gè)token通常對(duì)應(yīng)3至4個(gè)字母。市場(chǎng)急需統(tǒng)一口徑。
具體計(jì)價(jià)時(shí),大模型按照tokens計(jì)量,且服務(wù)輸入和服務(wù)輸出均收費(fèi)。目前,ChatGPT對(duì)輸入和輸出收取不同費(fèi)用,而國(guó)內(nèi)的大模型輸入和輸出收取費(fèi)用一樣。如千帆大模型對(duì)收費(fèi)解釋如下:
1.2 tokens計(jì)價(jià)
各家企業(yè)的大模型tokens計(jì)價(jià)五花八門,同一家企業(yè)也推出不同大模型,收費(fèi)也不盡相同。此外,同一個(gè)產(chǎn)品不同時(shí)間段使用,收費(fèi)還不一樣。如百川智能的大模型Baichuan 53B,其00:00 ~ 8:00收費(fèi)為0.01元/千 tokens,而8:00 ~ 24:00收費(fèi)為0.02元/千 tokens 。
具體來(lái)講,科大訊飛目前對(duì)外開(kāi)放了星火大模型V1.5、V2.0和V3.0等三個(gè)版本,其刊例價(jià)分別為0.18元/萬(wàn)tokens、0.36元/萬(wàn)tokens、0.36元/萬(wàn)tokens。目前針對(duì)個(gè)人客戶可以免費(fèi)試用200萬(wàn)tokens,針對(duì)企業(yè)客戶可以免費(fèi)試用500萬(wàn)tokens。就企業(yè)客戶而言,科大訊飛為每個(gè)版本的大模型各推出了四個(gè)收費(fèi)套餐,其中V3.0和V2.0版本價(jià)格相同,且是V1.5的兩倍,具體價(jià)格如下表:
![]()
騰訊混元大模型提供 API 接入方式,采用后付費(fèi)日結(jié)模式:為每個(gè)在白名單中的已實(shí)名騰訊云企業(yè)賬號(hào)提供累計(jì)10萬(wàn) tokens 的免費(fèi)調(diào)用額度;以資源包的形式發(fā)放到騰訊云賬號(hào)中,優(yōu)先扣除。在免費(fèi)額度用完后,按如下價(jià)格進(jìn)行計(jì)費(fèi):
![]()
OpenAI推出了多款商業(yè)化大模型,分別是GPT-4、GPT-3.5 Turbo,F(xiàn)ine-tuning models、Embedding models等。OpenAI公司各大模型定價(jià)相差較大,其中GPT-4-32k context輸出服務(wù)收費(fèi)最貴,每1000 token收費(fèi)0.12美元,折合成人民幣0.876元。
![]()
國(guó)內(nèi)國(guó)外大模型定價(jià)相差百倍,文心一言和通義千問(wèn)(qwen-turbo)僅0.008元/1k token。
![]()
按照tokens計(jì)算,各家公司部分大模型的輸入和輸出計(jì)價(jià)如下圖:
![]()
除了按照token計(jì)費(fèi),一些AI助手按月收費(fèi)。如微軟開(kāi)發(fā)的AI編程工具GitHub Copilot,目前已經(jīng)擁有150萬(wàn)用戶。針對(duì)個(gè)人客戶,GitHub Copilot收費(fèi)是每月10美元,或者每年100美元;針對(duì)企業(yè)客戶,對(duì)應(yīng)收費(fèi)是19美元/月。按照微軟最新財(cái)報(bào),互聯(lián)網(wǎng)巨頭通過(guò)大模型,帶動(dòng)周邊業(yè)務(wù),如office,搜索引擎bing,云業(yè)務(wù)Azure等營(yíng)收大幅增長(zhǎng),也是一種商業(yè)化的模式。
除此之外,OpenAI公司推出的ChatGPT,針對(duì)客戶也有按月付費(fèi)的服務(wù),目前為每人每月20美元。除此之外,OpenAI通過(guò)客戶注冊(cè)賬戶使用的企業(yè)電子郵箱統(tǒng)計(jì)分析發(fā)現(xiàn),已經(jīng)有80%的世界五百?gòu)?qiáng)企業(yè)員工開(kāi)始使用ChatGPT進(jìn)行工作。
另?yè)?jù)Techcrunch報(bào)道,相關(guān)數(shù)據(jù)顯示,9月ChatGPT在iOS和安卓應(yīng)用端的下載量達(dá)到1560萬(wàn)次,單月總收入458萬(wàn)美元。
![]()
11月1日,文心一言推出會(huì)員模式,單月購(gòu)買59.9元/月,連續(xù)包月定價(jià)49.9元/月,開(kāi)通會(huì)員后,付費(fèi)會(huì)員可以使用文心大模型 4.0。此外,文心一言聯(lián)合會(huì)員——“文心一言會(huì)員+文心一格白銀會(huì)員”定價(jià)99元/月,白銀會(huì)員享有AI編輯改圖修圖等更多權(quán)益。
不過(guò),按月收費(fèi)的模式在C端用戶方面成本高企,即使微軟也依然虧損嚴(yán)重。今年頭幾個(gè)月,微軟在這個(gè)項(xiàng)目上平均每個(gè)用戶每月虧損超過(guò) 20 美元,一些用戶造成的損失高達(dá) 80 美元。不過(guò), GitHub Copilot的整體收入在持續(xù)增加。
令人意外的是,ChatGPT的知名度雖然最高,但在軟件商店中并不是收入規(guī)模最大的人工智能應(yīng)用,而是一款名為 Ask AI 的競(jìng)品。
根據(jù)App Store中該應(yīng)用介紹——Ask AI旨在簡(jiǎn)化用戶的工作并擴(kuò)展知識(shí),提供精確的答案來(lái)幫助用戶完成任務(wù)。
該應(yīng)用不僅收取每周4.99美元訂閱費(fèi)用,還因?yàn)橄螺d量巨大,已經(jīng)超過(guò)2500萬(wàn)次,吸引了商家投放廣告,每月獲得數(shù)百萬(wàn)美元收入。據(jù)Appfigures 的數(shù)據(jù)顯示,Ask AI的訂閱和廣告累計(jì)收入超過(guò)1600萬(wàn)美元。按月計(jì)算,從 今年5月份的 648 萬(wàn)美元上升到了8月份的 655萬(wàn)美元,9 月份略有下降,至 551 萬(wàn)美元,但這一數(shù)字仍高于 ChatGPT 在軟件商店的收入。因此,只要下載量或者使用量足夠大,未來(lái)廣告收入也將成為大模型商業(yè)化的主要收入來(lái)源。
另?yè)?jù) Data.ai App IQ 統(tǒng)計(jì),截至 2023 年 8 月,iOS App Store 與 Google Play 已累計(jì)發(fā)布超 1000 款生成式 AI功能應(yīng)用,全球總下載量已突破 8 億次。其中,一款名叫Artimind的以生成 AI 圖片為主要功能的全新應(yīng)用,已獲得近 150 萬(wàn)安裝量。
國(guó)內(nèi),也有一些類似的產(chǎn)品推出,未來(lái)也可能實(shí)現(xiàn)廣告收入,如科大訊飛的基于大模型的產(chǎn)品訊飛星火上線首日 14 小時(shí)用戶突破 100 萬(wàn),迅速登上 AppStore 免費(fèi)總排行榜第一。
與按照token計(jì)價(jià)略有不同,一些大模型產(chǎn)品按照調(diào)用次數(shù)收費(fèi)。
在2023年釘釘生態(tài)大會(huì)上,釘釘將大模型商業(yè)化與釘釘現(xiàn)有服務(wù)融合,落地應(yīng)用場(chǎng)景的商業(yè)化方案是按照調(diào)用次數(shù)收費(fèi)。具體來(lái)看,在釘釘專業(yè)版年費(fèi)9800元基礎(chǔ)上,增加1萬(wàn)元即可獲得20萬(wàn)次大模型調(diào)用額度;增加2萬(wàn)元即可獲得45萬(wàn)次大模型調(diào)用額度,相當(dāng)于一次調(diào)用平均5分錢左右。
除此之外,Ask AI等大模型產(chǎn)品針對(duì)C端客戶也推出了按需購(gòu)買的服務(wù)。
對(duì)于大型企事業(yè)單位,如銀行、保險(xiǎn)、信托公司、高校等,偏愛(ài)大模型企業(yè)提供定制化服務(wù)或者一站式服務(wù)。服務(wù)內(nèi)容不僅包括大模型系統(tǒng),還包括服務(wù)器等硬件產(chǎn)品等一站式解決方案。如近期清華大學(xué)準(zhǔn)備花費(fèi)700萬(wàn)元,公開(kāi)采購(gòu)大模型系統(tǒng)教學(xué)實(shí)踐平臺(tái)。該采購(gòu)不僅包括大模型系統(tǒng),還包括24臺(tái)服務(wù)器(GPU的FP32計(jì)算精度≥80TFLOPS),4臺(tái)服務(wù)器(GPU的FP32計(jì)算精度≥35TFLOPS),1臺(tái)可編程交換機(jī)。山東商業(yè)職業(yè)技術(shù)學(xué)院云計(jì)算產(chǎn)業(yè)學(xué)院發(fā)布大模型技術(shù)賦能中心采購(gòu)項(xiàng)目,預(yù)算116.466萬(wàn)元,也要求提供相關(guān)硬件產(chǎn)品。
![]()
與此同時(shí),市面上一些企業(yè)也發(fā)布了人工智能一站式解決方案,如華為發(fā)布FusionCubeA3000訓(xùn)/推超融合一體機(jī)。該產(chǎn)品支持兩種商業(yè)模式:昇騰一站式方案和第三方GPU一站式方案,除了自研OceanStorA300高性能存儲(chǔ)節(jié)點(diǎn)外,其余GPU服務(wù)器、交換機(jī)、AI平臺(tái)軟件向伙伴開(kāi)放,為大模型伙伴提供開(kāi)箱即用的部署體驗(yàn),實(shí)現(xiàn)一站式交付。
燒錢如流水,大模型的商業(yè)變現(xiàn)顯得更為急切,但是與巨大的投入成本相比,當(dāng)前的收入能否覆蓋各項(xiàng)成本支出仍未可知。
冰鑒科技研究院認(rèn)為,在產(chǎn)品定價(jià)方面,大模型企業(yè)針對(duì)C端客戶的產(chǎn)品按月收費(fèi),針對(duì)B端客戶,按照調(diào)用量(token、次數(shù))計(jì)價(jià)可能是明智的選擇。雖然C端客戶付費(fèi)意愿不強(qiáng),但只要用戶量足夠大,大模型公司就可以從廣告主處獲得補(bǔ)償,類似Ask AI。企業(yè)客戶由于工作需求,付費(fèi)能力更強(qiáng),日常使用調(diào)用量較大,按照調(diào)用量收費(fèi)才能更好的覆蓋成本。除此之外,由于大型企業(yè)擁有更強(qiáng)的付費(fèi)能力,為銀行、大型央企、國(guó)企、上市公司等提供定制化、一站式服務(wù),可以為大模型企業(yè)帶來(lái)更多收入。比如目前一些大型銀行在公布大模型采購(gòu)服務(wù)時(shí),服務(wù)內(nèi)容就不僅包括AI軟件與模型開(kāi)發(fā)服務(wù),還包括大模型GPU服務(wù)器、GPU專用存儲(chǔ)服務(wù)器、IB交換機(jī)等硬件采購(gòu)。
不過(guò),紅杉資本的文章《Generative AI’s Act Two》提到,當(dāng)前生成式AI客戶參與度較低。與一些消費(fèi)公司擁有60%-65%的日活或者月活相比,生成式AI應(yīng)用程序的中位數(shù)僅僅14%,這意味著用戶還沒(méi)有在生成式人工智能產(chǎn)品中找到足夠的價(jià)值來(lái)每天使用它們。因此,大模型平臺(tái)必須進(jìn)一步優(yōu)化產(chǎn)品,讓生成式AI結(jié)果更加滿足用戶需求。
展望未來(lái),訓(xùn)練成本、芯片采購(gòu)成本不斷攀升,嚴(yán)重阻礙大模型升級(jí)迭代,而占比最大的是AI芯片成本,如何降低芯片成本成為大模型企業(yè)的當(dāng)務(wù)之急!
據(jù)伯恩斯坦分析師Stacy Rasgon分析,如果ChatGPT的查詢規(guī)模增長(zhǎng)到谷歌搜索的十分之一,OpenAI的 GPU采購(gòu)成本高達(dá)480億美元,另外,還需要每年支付160億美元芯片運(yùn)維成本。
面對(duì)巨額成本,除了等待芯片價(jià)格下降外,大模型企業(yè)也在想辦法制造芯片,如OpenAI不僅考慮自研芯片,還投資了3家芯片公司,其中包括美國(guó)算力芯片公司Cerebras。這家公司造出了世界最大的芯片,擁有1.2萬(wàn)個(gè)晶體管、面積大過(guò)ipad。
國(guó)內(nèi)的大模型企業(yè)面臨的壓力尤甚。
隨著美國(guó)不斷收緊AI芯片出口,不僅面臨著芯片難買、還面臨著價(jià)格飛漲的窘境。10月17日,美國(guó)商務(wù)部工業(yè)與安全局(BIS)進(jìn)一步收緊對(duì)尖端人工智能芯片的出口管制,嚴(yán)格限制英偉達(dá)和其他芯片制造商向中國(guó)銷售高性能半導(dǎo)體。根據(jù)新規(guī)受到管制的英偉達(dá)芯片涉及 A100、A800、H100、H800、L40,甚至包括RTX4090。
與此同時(shí),相關(guān)芯片存貨價(jià)格翻倍式上漲,A800、H100等每臺(tái)已經(jīng)漲到150萬(wàn)以上,RTX 4090顯卡價(jià)格更是從原本的1.5萬(wàn)元飆升至3萬(wàn)元以上,其他芯片更是有價(jià)無(wú)市。芯片等價(jià)格飛漲導(dǎo)致國(guó)內(nèi)大模型企業(yè)研發(fā)支出成倍增長(zhǎng),企業(yè)盈利狀況不斷惡化。科大訊飛今年三季度歸屬于上市公司股東的凈利潤(rùn)同比下降81.86%,其表示主要原因系公司在通用人工智能認(rèn)知大模型等方面堅(jiān)定投入。
種種不利條件,導(dǎo)致剛起步的國(guó)內(nèi)大模型企業(yè)在與國(guó)外同行競(jìng)爭(zhēng)時(shí),面臨著算力不足,大模型優(yōu)化升級(jí)滯后,從而引起客戶付費(fèi)意愿不足的窘境。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
大模型的應(yīng)用和發(fā)展涉及到大量的數(shù)據(jù)和算力資源,同時(shí)也面臨著各種安全和隱私方面的風(fēng)險(xiǎn)
與國(guó)外不同的是,國(guó)內(nèi)大模型企業(yè)要想向C端用戶收費(fèi)并非易事
大模型的商業(yè)化需要建立科學(xué)的風(fēng)險(xiǎn)評(píng)估和管理機(jī)制
雖然國(guó)內(nèi)大模型企業(yè)在商業(yè)化方面比國(guó)外同行要慢半拍,但這也意味著國(guó)內(nèi)市場(chǎng)存在巨大的商業(yè)機(jī)會(huì)
在模仿國(guó)外商業(yè)化模式的過(guò)程中,國(guó)內(nèi)大模型企業(yè)需要不斷創(chuàng)新和探索,以適應(yīng)國(guó)內(nèi)市場(chǎng)的特點(diǎn)和需求
隨著技術(shù)的不斷進(jìn)步和應(yīng)用的不斷深入,大模型在B端市場(chǎng)的商業(yè)化前景仍然非常廣闊