火山引擎也不提及模型的私有化部署。譚待表示“搞私有化、一體機,在AI時代完全不work”。不過,一些行業(yè)人士表示,這給豆包大模型在部分行業(yè)市場落地帶來阻力。它只能用支持私有化部署的工具如HiAgent搭配DeepSeek等開源模型,開展業(yè)務(wù)。
![]()
譚待也被幾次問及豆包手機問題,雖然這并不是他負(fù)責(zé)的業(yè)務(wù)。他以汽車座艙服務(wù)舉例,強調(diào)這種以agent的自然交互方式,是手機和各種終端需要的體驗,感覺有非常大的智能空間。而這次主題峰會上,一個有趣的事情是,火山引擎首先介紹了其安全產(chǎn)品。譚待稱“沒有其他云企業(yè)這樣做”,理由是不把安全解決好,大家用起來不放心,并稱市場大、責(zé)任也更大。展區(qū)內(nèi)也有合作伙伴認(rèn)為,安全是關(guān)乎字節(jié)下一步業(yè)務(wù)的關(guān)鍵。
以下是譚待會后與媒體、自媒體部分Q&A整理(有部分問題整合):
Q:會上公布了豆包大模型日均調(diào)用量超過50萬億tokens,這些tokens是集中在某些行業(yè),還是比較分散?是否有行業(yè)占比超過5%或10%,另外個人用量占比是怎樣的?
譚待:行業(yè)分布上,早期肯定是偏C端的行業(yè)漲得更快一些,比如互聯(lián)網(wǎng)、零售包括手機、汽車,然后是教育。我們也看到在企業(yè)B端用量也有很多的,比如有一個客戶內(nèi)部做了100多個智能體,每天有幾十億的token消耗?,F(xiàn)在,我們“萬億tokens俱樂部”(累計tokens使用量超過了1萬億)的企業(yè)有100家,比AWS多一些。
個人應(yīng)用情況符合“二八定理”,即80%的用戶是個人,20%是企業(yè)(概數(shù)),但企業(yè)占了tokens調(diào)用的80%、個人20%。此前云時代,企業(yè)和個人用量占比是8.5:1.5,現(xiàn)在AI時代可能是7.5:2.5,我覺得未來可能個人還會再高一點。
Q:最近競爭對手在大力做C端,希望短期內(nèi)把token調(diào)用量提升3倍,競爭很猛烈,你們怎么應(yīng)對?
譚待:競爭不關(guān)鍵。首先,增長3倍和5倍,假設(shè)你是對的,但是明年市場能漲10倍呢?大家看的就不是存量的競爭,不是零和博弈,而是一起把這個市場做大。別的云廠商現(xiàn)在也很重視MaaS,我覺得挺好。第二,這件事本身的天花板很高,如果對手投入這么大,能帶來更多的人、更多的想法,我覺得特別好,這樣我們就一起把這個事情做大,加速AI落地社會的發(fā)展。
Q:AWS判斷,未來他們MaaS平臺帶來的token收入會跟EC2計算產(chǎn)品不相上下,EC2目前在AWS盤子里占比30%-40%,你認(rèn)為趨勢會是這樣嗎?
譚待:我比較同意這個趨勢,這里面涉及到云業(yè)務(wù)轉(zhuǎn)型的問題。如果我們看芯片的出貨量,兩年前GPU的出貨量就已經(jīng)超過CPU了。MaaS還有另外一個邏輯,從GPU的訓(xùn)練轉(zhuǎn)向推理,這還有個過程。我們很早就說MaaS是非常重要的事情。
Q:整個云的轉(zhuǎn)型會面臨很多挑戰(zhàn),怎么解決存量業(yè)務(wù)的轉(zhuǎn)型,如何解決激勵問題?
譚待:首先是戰(zhàn)略問題。你所有策略是服務(wù)于戰(zhàn)略目標(biāo)的,戰(zhàn)略取舍還要看長期、短期。我覺得主要我們也是繼承了字節(jié)的一貫做法,非??撮L期。比如,2030年會發(fā)生什么變化,倒推你能知道什么是重要的,再看看明年做的事情和重要的事情是不是相符。
很可能有的公司知道未來的變化,但是明年做的事情就不一樣,因為有財報壓力、職業(yè)經(jīng)理人有業(yè)績壓力。我們從大的文化層面鼓勵大家首先是看長期,只要把這個看清楚了,就有很多策略做好這個事情,比如可以組一些專門的團(tuán)隊,也可以在這部分上給大家激勵翻倍,投資也是一樣的。
我覺得現(xiàn)在一個很重要的點,云處于一個大的變革里面,還是應(yīng)該讓技術(shù)強的人負(fù)責(zé),這是很重要的;如果在平穩(wěn)期可以讓銷售強的人負(fù)責(zé)。
Q:這次發(fā)布AgentKit、多模態(tài)數(shù)據(jù)湖背后的邏輯?
譚待:你看技術(shù)變化要看它的內(nèi)核,以前幾輪大的變化中第一個是PC互聯(lián)網(wǎng),內(nèi)核是網(wǎng)站,數(shù)據(jù)庫MySQL等就是那個時候起來的;到了移動互聯(lián)網(wǎng),圍繞APP,包括NoSQL云原生數(shù)據(jù)庫規(guī)模漲了10倍。
現(xiàn)在到了AI時代,Web和APP都會在,但是背后很多邏輯會變成Agent,當(dāng)然也會有原生的AI Agent出來,你的架構(gòu)設(shè)計就要圍繞Agent來看。
就要考慮Agent要有什么樣的runtime、中間件、數(shù)據(jù)湖以及DevOps相關(guān)的東西。Agent帶來了一些新需求,比如Sandbox(沙箱)、權(quán)限管理等。Agent是按需創(chuàng)造,也跟以前不一樣,傳統(tǒng)應(yīng)用是少數(shù)的表,每個表特別大,Agent是創(chuàng)建特別多的表,每個表很小,隨時創(chuàng)建隨時刪掉,這些都是開發(fā)范式帶來的,因為這些開發(fā)邏輯不是人做的,是Agent做的,你需要底層響應(yīng)好這樣的需求。數(shù)據(jù)也是一樣的,Agent處理任務(wù)時,要跟數(shù)據(jù)湖怎么來打通,我覺得這是一個理念思維的變化。
Q:火山引擎被認(rèn)為是字節(jié)技術(shù)能力的外溢,這種外溢對的影響是怎樣的?
譚待:包括國內(nèi)阿里,海外AWS、谷歌都是自己能力的外溢,因為現(xiàn)在技術(shù)的投入非常大,如果你原來不是一個能夠外溢的業(yè)務(wù),你很難在云計算上保持足夠的領(lǐng)先,包括微軟是OS的外溢,Oracle有傳統(tǒng)數(shù)據(jù)庫的能力,大致都是這樣的邏輯。
云這個事情,也需要有一個時間點。比如我們最開始外溢的是一些工具,大家想要的就是抖音同款,這個外溢最容易,應(yīng)該是2020年我剛加入字節(jié)時就在做的事情。第二個外溢是我們的規(guī)模優(yōu)勢,我們發(fā)現(xiàn)抖音的服務(wù)器中國最多,把這些外溢出來不就可以打造很便宜的云嗎?彈性好、成本低就可以進(jìn)入到云市場,2021年我們正式做了云服務(wù)。
字節(jié)在AI上一直非常堅持,從成立就做推薦算法,這就是AI的一種表現(xiàn)形式;視頻影像創(chuàng)作、視頻分發(fā)都是。2022年我們就確定了AI是我們很重要的方向。AI也不是一蹴而就的,首先解決訓(xùn)練的問題,2023年基本上所有的AI創(chuàng)業(yè)公司都在火山引擎上做模型訓(xùn)練,訓(xùn)練完了再干應(yīng)用,應(yīng)用才能發(fā)揮更大的價值,所以我們應(yīng)該是2023年下半年第一次推出了火山方舟(MaaS 大模型服務(wù)平臺),2024年年中推出了豆包大模型。
我覺得一個很重要的事,是你自己要做過,我們做過豆包,豆包的產(chǎn)品也是用的火山方舟,我們內(nèi)外是一體的,這里面的坑我們都踩了非常多遍,這樣抽象出來變成產(chǎn)品對外是一種優(yōu)勢。
Q:可以看到阿里最近各個業(yè)務(wù)加大2C,大家都在加大2C和2B,邏輯是什么?
譚待:我們以前講大數(shù)據(jù),C端很難體驗到背后的東西,但是模型是C端、B端都可以很容易體驗到,我覺得大模型其實2C、2B之間會有一個很好的協(xié)同。
同時,模型讓個體的能力變得更強,以前大家覺得2B軟件特別難用,因為它更多考慮的是流程設(shè)計的好不好;但到了大模型時代,這些東西可能通過Agent一句話就完成了,所以一個人能做一個團(tuán)隊的事情,這個時候個體的體驗就很關(guān)鍵。反過來,我覺得這是字節(jié)一個很大的優(yōu)勢,因為我們是比較會把體驗做好的。
Q:今年7月的報告稱企業(yè)用AI工具產(chǎn)生的實際生產(chǎn)力在行業(yè)之間的分化有很大差距,傳統(tǒng)行業(yè)相對落后一點,ROI不高,你們在客戶拓展上是否看到過類似的gap,這怎樣影響你們在市場上的重點?
譚待:取決于你怎么看這個事情,有的行業(yè)起量特別快,但是天花板低;有的行業(yè)是起量特別慢,但是天花板很高。比如說最早模型肯定是在陪伴聊天起量很快,但是聊天天花板不高。我自己覺得模型最大的價值以后肯定不是說幫人去寫點打油詩,生產(chǎn)一些合成的照片。我覺得模型最大的價值肯定還是更好的幫人成長,教育、醫(yī)療,做新的科研,這些天花板都是非常好的,tokens用量也是非常大的。
Q:想問問在手機軟件方面,包括汽車,您認(rèn)為要增強哪些創(chuàng)新?
譚待:我說說汽車,搭載大模型之后,用人對話的方式就能理解。你說冷了,就幫你調(diào)溫度;你說打開天窗,它就知道打開遮陽板而不是天窗。你突然想聽一首歌,只記得歌詞,就能把它放出來了。甚至以后可以直接在車上點餐。新人一般要幫團(tuán)隊點咖啡,有的要糖有的不要特別復(fù)雜,自己操作半小時過去了,現(xiàn)在一兩句話就幫你做了,以后這個能力可以平移到車上,你開到哪提前說在公司樓下給我把咖啡點了,停完車去拿就好了。
這種交互就是自然的以agent的方式,就像人跟它交互一樣,這個在手機上、在車上,在各種各樣的終端上,我覺得未來都會是這樣一個體驗,我感覺是有非常大的智能空間的。
Q:12月18日ChatGPT發(fā)布了Agent商店,你是否認(rèn)為2026年是Agent的大爆發(fā)之年?
譚待:如果看中國市場,今年算是Agent元年。不知道你說的大爆發(fā)是多大,明年肯定會有很多更有價值的Agent涌現(xiàn),比如AI幫你寫PPT,明年可能非常好;AI做短劇、漫劇明年品質(zhì)會有很大提升。以后營銷素材,會根據(jù)用戶畫像生成他喜歡的素材。
從這些角度,我覺得會帶來非常多的爆發(fā)。我們的一個客戶,2024年有50多個Agent,2025年增長到200多個,明年肯定會更多。這么多Agent就要管理好,要協(xié)同,還要做運營的事情。我們也是按這個邏輯把模型MaaS、Agent開發(fā)和Agent運營相關(guān)的產(chǎn)品服務(wù)搞好。
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論