騰訊集團(tuán)高級(jí)執(zhí)行副總裁湯道生在會(huì)上發(fā)表演講
打造一個(gè)“智能體”(Agent),在現(xiàn)階段來說已經(jīng)不是一個(gè)問題。但要打造出一個(gè)既實(shí)用又能高效解決業(yè)務(wù)流中問題的智能體,仍然是一個(gè)值得深入探討的大問題。
面對(duì)這個(gè)行業(yè)性的“大問題”,將“產(chǎn)品為王”奉為圭臬的騰訊,在打造“智能體”產(chǎn)品的過程中,又著重考慮了哪些問題?
在日前舉行的2025騰訊AI產(chǎn)業(yè)應(yīng)用峰會(huì)上,騰訊云副總裁、騰訊云智能負(fù)責(zé)人,騰訊優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲就騰訊云在智能體方面的技術(shù)及產(chǎn)品設(shè)計(jì)邏輯,做了諸多回應(yīng),并特別提及了騰訊在智能體設(shè)計(jì)上的幾個(gè)“細(xì)節(jié)”:
關(guān)于智能回退,在真實(shí)的智能體使用中,執(zhí)行到某個(gè)節(jié)點(diǎn)經(jīng)常會(huì)需要“回頭”修改前面的內(nèi)容(比如行程修改等等)。騰訊云的智能體開發(fā)平臺(tái),在工作流模式下引入了一個(gè)具備“全局視野”的智能體,能夠處理跨節(jié)點(diǎn)的回跳邏輯,并基于對(duì)整體流程結(jié)構(gòu)的理解來做出判斷和引導(dǎo),實(shí)現(xiàn)一種“有意識(shí)”的交互。
關(guān)于文檔比對(duì),在很多企業(yè)場景中,同一個(gè)業(yè)務(wù)文檔會(huì)存在多個(gè)版本。比如保險(xiǎn)公司推出的壽險(xiǎn)產(chǎn)品,不同年份的版本可能差異很小,但都會(huì)被上傳到知識(shí)庫。這會(huì)導(dǎo)致問答時(shí)混淆使用。而文檔比對(duì)工具,使得用戶可以清晰地看到不同版本之間的具體差異。
關(guān)于問答對(duì)強(qiáng)化,智能體在企業(yè)中的應(yīng)用往往對(duì)問答的準(zhǔn)確性有著較高要求。由于基礎(chǔ)大模型在相同Prompt下可能產(chǎn)生不同的輸出結(jié)果,因此,強(qiáng)化從文檔中自動(dòng)生成準(zhǔn)確問答對(duì)的能力顯得尤為重要。企業(yè)可以對(duì)這些問答對(duì)進(jìn)行審核、校驗(yàn),確保準(zhǔn)確后再發(fā)布。
相比于一些智能體產(chǎn)品在宣發(fā)時(shí)只講單個(gè)智能體功能,而忽視實(shí)際體驗(yàn)而言,吳運(yùn)聲對(duì)智能體研發(fā)細(xì)節(jié)上的考量,考慮到了使用智能體的“人”的真實(shí)體驗(yàn):智能體不僅僅是“答”,還要在企業(yè)使用場景的現(xiàn)實(shí)業(yè)務(wù)中對(duì)答案負(fù)責(zé)。
吳運(yùn)聲認(rèn)為,在 ToB 場景下,智能體的本質(zhì)是一種新的應(yīng)用形態(tài)。它和傳統(tǒng)軟件最核心的區(qū)別在于,具備自主規(guī)劃能力,可以根據(jù)用戶的自然語言指令,自主調(diào)用工具,甚至多個(gè) Agent 協(xié)同完成一個(gè)復(fù)雜任務(wù)。這種范式和過去軟件預(yù)設(shè)流程有本質(zhì)不同。所以智能體開發(fā)有三個(gè)問題需要被核心關(guān)注:
1. 如何實(shí)現(xiàn)更精準(zhǔn)地自主規(guī)劃與執(zhí)行
2. 如何實(shí)現(xiàn)多 Agent 協(xié)同的復(fù)雜任務(wù)處理
3. 如何構(gòu)建更高效的工具調(diào)用機(jī)制
會(huì)議當(dāng)天,騰訊還宣布了在智能體落地上的一個(gè)重要實(shí)踐, QQ瀏覽器升級(jí)為AI瀏覽器,上線QBot,首批灰度4個(gè)Agent,其中包括AI高考通。
在騰訊的大模型落地版圖中,瀏覽器是必要且必須擁抱AI Agent的場景。這已經(jīng)在現(xiàn)有市場得到驗(yàn)證:前不久,由于Safari瀏覽器中的谷歌搜索次數(shù)出現(xiàn)首次下降,谷歌股價(jià)暴跌。Gartner曾預(yù)測,到2026年,傳統(tǒng)搜索可能會(huì)下降25%。這意味著,傳統(tǒng)瀏覽器如果不AI化,那么將被AI瀏覽器取代。
反過來看,Agent也并不是要沖擊傳統(tǒng)瀏覽器市場,如果結(jié)合得好,這可能是個(gè)雙贏得選擇。對(duì)于QQ瀏覽器也是如此,其迭代的一個(gè)核心思路是:Agent的加入不是重構(gòu)瀏覽器,而是讓瀏覽器的搜索體驗(yàn)可以更加高效,優(yōu)先讓Agent優(yōu)化傳統(tǒng)瀏覽器的痛點(diǎn),是QQ瀏覽器在AI時(shí)代首要考慮的問題。
在此前的使用中,QQ瀏覽器的用戶或許已明顯感受到QQ瀏覽器提供的強(qiáng)大的工具功能,諸如PDF轉(zhuǎn)Word等。這也是QQ瀏覽器此前很長一段時(shí)間的一個(gè)功能定位:工具串聯(lián)。
Agent到來之后,QQ瀏覽器認(rèn)為,基于之前豐富的網(wǎng)頁工具,如果這些工具能被模型絲滑調(diào)用,無論是token消耗數(shù)量還是計(jì)算時(shí)間成本都會(huì)降低。因此QQ瀏覽器AI化目前的重要任務(wù)只有一個(gè):如何讓Agent絲滑調(diào)用“工具”。
“更側(cè)重解決瀏覽器原始行為,通過大模型技術(shù)來提升瀏覽器基礎(chǔ)功能的效率,而不是做特別泛或特別廣的復(fù)雜性。“QQ瀏覽器QBot產(chǎn)品負(fù)責(zé)人劉漢博表示。
以“下載”這個(gè)每天都在使用的環(huán)節(jié)為例,瀏覽器用戶經(jīng)常遇到的問題是,下載源不靠譜、頁面打不開或內(nèi)容隱藏較深等。模型能否具備一定的反思和學(xué)習(xí)能力,能理解人類的真實(shí)需求,自動(dòng)完成多步操作:用戶只需發(fā)出一個(gè)指令,QQ瀏覽器便能迅速定位并下載最精確的內(nèi)容。
“如果Agent具備了使用瀏覽器的能力,那它的‘行為邊界’就大大拓展了,可以覆蓋很多真實(shí)場景。這也是平臺(tái)賦予開發(fā)者和客戶‘想象空間’的關(guān)鍵。”吳運(yùn)聲表示。
未來,騰訊也在研發(fā)本地電腦的沙箱能力(Computer Use 插件),讓Agent可以操作本地軟件、編輯文檔、調(diào)用工具,就像一個(gè)“虛擬操作員”。“你設(shè)想一下,如果一個(gè)Agent不僅能上網(wǎng),還能幫你打開Excel自動(dòng)填報(bào)表格、用Photoshop批量裁剪圖片,那它在企業(yè)內(nèi)部的價(jià)值就會(huì)非常大。”
智能體之外,騰訊的另一大重注賽道是知識(shí)庫。一方面,結(jié)合了企業(yè)私域知識(shí)的智能體在思考、執(zhí)行和決策上會(huì)更加精準(zhǔn);另一方面,比起智能體執(zhí)行任務(wù),“大模型+知識(shí)庫輔助個(gè)人和企業(yè)提效”在短期來看更有確定性。
大模型的幻覺問題短期內(nèi)難以解決,而企業(yè)級(jí)場景對(duì)準(zhǔn)確性的要求又非常高,通過企業(yè)知識(shí)庫讓大模型“學(xué)習(xí)”專業(yè)領(lǐng)域的知識(shí)是一個(gè)解法??梢哉f,大模型讓企業(yè)更加需要知識(shí)庫。
綜合騰訊內(nèi)部的這一戰(zhàn)略判斷,在當(dāng)天的大會(huì)上,騰訊樂享正式升級(jí)為樂享知識(shí)庫,在知識(shí)整合沉淀、知識(shí)更新、權(quán)限管理、AI問答等層面為企業(yè)用戶提供服務(wù),提升知識(shí)流轉(zhuǎn)效率,也進(jìn)一步讓企業(yè)能打造懂自身知識(shí)的AI助手。
據(jù)騰訊云副總裁、騰訊樂享業(yè)務(wù)負(fù)責(zé)人答治茜回憶,騰訊樂享業(yè)務(wù)起源于2008年前后有內(nèi)部信息分享功能的km項(xiàng)目,2017年正式對(duì)外提供服務(wù),大模型浪潮到來之后,騰訊內(nèi)部決定將樂享定位為大模型時(shí)代具備知識(shí)管理功能的知識(shí)庫。
“一個(gè)很明顯的變化,還是技術(shù)上的變化。知識(shí)庫產(chǎn)品的形態(tài),完美和大模型的能力做了非常好地結(jié)合。它既用到了大模型本身的通用能力,同時(shí)又通過知識(shí)庫的嫁接,完成了知識(shí)的沉淀、積累和進(jìn)一步的精細(xì)化的提煉。所以,讓大模型真正地走向生產(chǎn)環(huán)節(jié),真正地走向應(yīng)用,知識(shí)庫是我們看起來,目前看到一個(gè)非常明確的場景。”答治茜表示。
他也補(bǔ)充,目前,企業(yè)使用Agent已經(jīng)形成趨勢,往后推幾年,當(dāng)企業(yè)內(nèi)Agent遍地開花時(shí),智能體的AI問答數(shù)據(jù)提取亟需一個(gè)統(tǒng)一的‘裁判’,而不是各說各話?;诖?,騰訊認(rèn)為,未來企業(yè)當(dāng)中,Agent搭配知識(shí)庫將會(huì)是一個(gè)核心需求場景。
為什么大模型技術(shù)能夠?yàn)楫a(chǎn)品帶來如此多改變?實(shí)際上,過去用傳統(tǒng) AI 技術(shù)實(shí)現(xiàn)上述能力時(shí),抽取關(guān)鍵詞、生成摘要這類任務(wù),對(duì)語言理解能力要求很高,效果并不理想。對(duì)“2008年北京奧運(yùn)會(huì)”這種長實(shí)體的識(shí)別非常依賴詞典或規(guī)則,擴(kuò)展性很差。但現(xiàn)在有了大模型,特別是多模態(tài)大模型,在語義理解、上下文建模、內(nèi)容切分、標(biāo)簽生成等方面都有顯著提升。
總結(jié)來講,大模型在技術(shù)上的突破,讓之前成為問題的問題被迎刃解決。而騰訊作為一家強(qiáng)產(chǎn)品基因的公司,在新技術(shù)打開想象力之后,讓產(chǎn)品更好用成為本能。
用吳運(yùn)聲的一句話來說,比起智能體數(shù)量的增長,騰訊更關(guān)注的是:如何將大模型、智能體技術(shù)真正融入企業(yè)的業(yè)務(wù)流程,以滿足企業(yè)的真實(shí)業(yè)務(wù)需求。“這不是一個(gè)簡單的‘產(chǎn)品交付’,而是構(gòu)建了一個(gè)高度可組合、可擴(kuò)展的平臺(tái),企業(yè)可以在上面構(gòu)建適配自己場景的復(fù)雜應(yīng)用。”(本文首發(fā)鈦媒體APP 作者 |秦聰慧)
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
大模型讓產(chǎn)品大變樣,騰訊這次跟得夠緊!
騰訊做產(chǎn)品果然在行,連文檔比對(duì)功能都想到了!
騰訊的可擴(kuò)展平臺(tái),以后能玩出啥新花樣?
企業(yè) AI 助手能提升多少工作效率?
把技術(shù)融到業(yè)務(wù)里,騰訊這步棋下得妙!
智能回退功能,用一次就愛上!
智能回退功能,修改長文檔再也不用來回翻!
多 Agent 協(xié)同處理任務(wù),復(fù)雜工作能秒變簡單?
樂享知識(shí)庫權(quán)限管理,不用擔(dān)心資料外泄了!
騰訊要把新技術(shù)塞進(jìn)業(yè)務(wù)流程,這執(zhí)行力沒誰了!