千問(wèn)C端事業(yè)群總裁吳嘉表示,“AI在擁有超強(qiáng)大腦之后,開始長(zhǎng)出了能夠觸達(dá)真實(shí)世界的手和腳,在生活中實(shí)實(shí)在在地替用戶‘干活’。千問(wèn)是第一個(gè)真正能幫你辦事的AI,我們的獨(dú)特優(yōu)勢(shì)在于‘Qwen最強(qiáng)模型’與‘阿里最豐富生態(tài)’的結(jié)合。AI辦事時(shí)代才剛剛開始,一些能力還在探索,我們將一步步邁進(jìn),將千問(wèn)App打造為最強(qiáng)大的人類AI助手,真正讓AI幫助到每一個(gè)人。”
千問(wèn)想做Agent,路人皆知。
在Manus、豆包手機(jī)、智譜GLM等Agent形態(tài)產(chǎn)品先后推出的背景下,不同產(chǎn)品也走出了不同路徑,各家都在用自己的資源稟賦和產(chǎn)品哲學(xué)去定義“AI 該如何進(jìn)入真實(shí)世界”,千問(wèn)的獨(dú)特性在于阿里巴巴生態(tài)的貫通。
Manus代表的是通用型任務(wù)Agent,它沒(méi)有什么歷史資源和包袱,強(qiáng)調(diào)的是跨工具、跨流程的自動(dòng)化執(zhí)行能力,把復(fù)雜任務(wù)拆解為步驟,再通過(guò)模型調(diào)度工具完成閉環(huán),更像一個(gè)“數(shù)字員工”,Meta收購(gòu)Manus,看中的也是其想象空間。
豆包手機(jī)走的是AI原生終端路線,豆包沒(méi)有把Agent看做一個(gè)App,而是嵌入到操作系統(tǒng)和硬件層面,讓 AI 接管搜索、拍照、記錄、導(dǎo)航、購(gòu)物等行為,當(dāng)然目前有一些安全法規(guī)等方面的限制。
智譜 GLM 更偏向能力底座 + Agent 平臺(tái)的方向。它強(qiáng)調(diào)的是大模型能力的工程化、組件化,讓 Agent 成為可以被企業(yè)和開發(fā)者自由組合的生產(chǎn)工具。與 Manus 的“成品型 Agent”不同,GLM 更像是在提供“造 Agent 的能力”。

千問(wèn)的第一步是生態(tài)型 Agent + 真實(shí)業(yè)務(wù)閉環(huán),它不是單純做一個(gè)通用 Agent,也不是只做模型底座,而是把Agent直接嵌進(jìn)一個(gè)已經(jīng)極其成熟的商業(yè)與生活服務(wù)生態(tài)里,讓 AI 從一開始就擁有“能辦事”的能力。
在發(fā)布會(huì)上,吳嘉現(xiàn)場(chǎng)演示AI外賣功能,只需給千問(wèn)App下達(dá)一句話指令,“幫我點(diǎn)40杯霸王茶姬的伯牙絕弦”,千問(wèn)App迅速調(diào)用淘寶閃購(gòu)下單,無(wú)需任何跳轉(zhuǎn)即在端內(nèi)完成AI支付。這一能力的背后,是千問(wèn)與淘寶閃購(gòu)、支付寶原生AI支付能力“AI付”的系統(tǒng)級(jí)打通。
就在四天前,谷歌剛剛宣布與沃爾瑪?shù)攘闶凵痰腁I購(gòu)物合作計(jì)劃,但目前尚未上線。阿里領(lǐng)先于谷歌,成為全球首個(gè)實(shí)現(xiàn)多品類AI購(gòu)物功能的科技公司。
阿里之所以能領(lǐng)先于谷歌推出AI購(gòu)物,核心在于其獨(dú)特的“模型+生態(tài)”垂直整合能力。與谷歌試圖通過(guò)UCP協(xié)議連接外部零售商的“開放聯(lián)盟”模式不同,千問(wèn)App依托的是阿里內(nèi)部龐大且深度的生態(tài)協(xié)同——底層是Qwn大模型,上層直接打通淘寶商品庫(kù)、支付寶支付體系及本地生活服務(wù)體系。這種深度整合有效解決了AI Agent落地中最棘手的“決策信任”與“支付斷點(diǎn)”難題。
Agent形態(tài)產(chǎn)品不甚新鮮,行業(yè)對(duì)此也基本祛魅,但矛盾點(diǎn)依然是日益泛濫的Agent和難以解決的真實(shí)問(wèn)題,阿里巴巴也意識(shí)到了這些關(guān)鍵點(diǎn),于阿里巴巴生態(tài)體系內(nèi),可以最大化做好協(xié)同,同時(shí)盡可能將體驗(yàn)做深。在做好阿里巴巴內(nèi)部生態(tài)Agent的基礎(chǔ)上,未來(lái)千問(wèn)走向通用型Agent是順理成章的事。
接入淘寶后,千問(wèn)App可以真正幫助用戶解決“買什么、怎么選、值不值得買”的難題。千問(wèn)App不僅能根據(jù)用戶的真實(shí)需求給出購(gòu)物建議,更能基于淘寶龐大的商品數(shù)據(jù)庫(kù)和評(píng)價(jià)體系,智能生成具體的商品推薦方案。用戶只需一個(gè)指令,即可在千問(wèn)App完成從消費(fèi)決策到交易的閉環(huán)。
吳嘉表示,對(duì)于消費(fèi)場(chǎng)景,互聯(lián)網(wǎng)上的營(yíng)銷信息繁雜、噪音巨大。如何訓(xùn)練模型的理解分辨能力很關(guān)鍵。千問(wèn)App不僅僅依靠世界知識(shí),更能利用阿里巴巴獨(dú)特的交易和服務(wù)數(shù)據(jù)來(lái)增強(qiáng)模型,從而保障AI購(gòu)物功能保持客觀和準(zhǔn)確。
![]()
千問(wèn)能“調(diào)得動(dòng)”淘寶、支付寶、飛豬、高德這些 App,本質(zhì)上是一整套系統(tǒng)工程。例如統(tǒng)一的能力接口層(API 化),阿里生態(tài)里每個(gè) App 本來(lái)都是獨(dú)立系統(tǒng),要讓千問(wèn)能調(diào)用,第一步是把這些能力標(biāo)準(zhǔn)化成“機(jī)器能用”的接口,包括下單接口、查詢接口、支付接口等。其中的工作量極大,相當(dāng)于一次生態(tài)級(jí)的“AI 化改造”。
再如Agent 調(diào)度與工具編排系統(tǒng),千問(wèn)并不像豆包手機(jī)那樣,直接“點(diǎn)”某個(gè)App,那樣就無(wú)需做對(duì)應(yīng)App的改造,千問(wèn)是將用戶一句話拆解成多個(gè)子任務(wù),選擇合適的工具并按順序調(diào)用,輸出結(jié)果饋給用戶,其中涉及到任務(wù)編排引擎等能力。
這一系列“辦事能力”的爆發(fā),源于千問(wèn)底層技術(shù)的突破:千問(wèn)大模型Coding能力的大幅提升,使其能實(shí)時(shí)構(gòu)建工具;全模態(tài)理解能力的突破,讓千問(wèn)能夠看懂界面聽懂聲音同時(shí)讀懂圖文報(bào)表;最后是超長(zhǎng)上下文的處理能力大幅提升復(fù)雜上下文的交付上限。
基于這些技術(shù)能力突破,千問(wèn) “任務(wù)助理”功能在App和Web端開始定向邀測(cè)。該功能具備類人化的多步驟規(guī)劃能力,覆蓋應(yīng)用開發(fā)、Office辦公、咨詢調(diào)研及生活辦事等核心場(chǎng)景,支持一鍵處理報(bào)表整理、研報(bào)撰寫及小工具生成等復(fù)雜任務(wù)。測(cè)試結(jié)束后,該功能將面向用戶免費(fèi)開放。(本文作者 | 張帥,編輯 | 蓋虹達(dá))
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論