約瑟夫·熊彼特的“創(chuàng)造性破壞”理論,形象地描述了創(chuàng)新對(duì)舊有體系的沖擊。
字節(jié)旗下“豆包手機(jī)助手”近期的激進(jìn)行動(dòng),正是對(duì)現(xiàn)有App生態(tài)“沙盒隔離”機(jī)制的一次超前且充滿爭(zhēng)議的“創(chuàng)造性破壞”式試驗(yàn)。
這次試驗(yàn)以一種近乎“硬剛”的方式,將智能體發(fā)展必須解決的核心問題——隱私安全、行業(yè)規(guī)范與責(zé)任歸屬,提前擺在了臺(tái)面上。
12月1日,字節(jié)跳動(dòng)豆包團(tuán)隊(duì)發(fā)布豆包手機(jī)助手技術(shù)預(yù)覽版。開發(fā)者和科技愛好者可以在豆包與中興合作的工程樣機(jī)nubia M153 上,體驗(yàn)豆包手機(jī)助手的技術(shù)預(yù)覽版本。其核心功能是實(shí)現(xiàn)跨應(yīng)用、跨任務(wù)的自動(dòng)化操作,例如“幫我用微信給某人轉(zhuǎn)賬500元”或“幫我預(yù)定明天去上海的機(jī)票”。
然而,豆包手機(jī)助手發(fā)布3天后,有試用NubiaM153工程樣機(jī)的用戶反饋,出現(xiàn)無法正常登陸微信的情況。爭(zhēng)議就此引爆。
在技術(shù)路徑上,為了實(shí)現(xiàn)一些看似科幻的功能,豆包助手采取了獲取高權(quán)限(如INJECT_EVENTS,俗稱“上帝權(quán)限”)的技術(shù)路線。直接讀取屏幕信息并模擬用戶點(diǎn)擊的做法,如同在現(xiàn)有的App生態(tài)隔離墻上鑿開了一個(gè)洞。
面對(duì)輿論壓力,微信團(tuán)隊(duì)回應(yīng)表示,可能觸發(fā)了其安全風(fēng)控機(jī)制。豆包團(tuán)隊(duì)也緊急下線了涉及微信的操作功能,并強(qiáng)調(diào)目前產(chǎn)品僅面向行業(yè)人士測(cè)試,不會(huì)存儲(chǔ)用戶隱私數(shù)據(jù)用于模型訓(xùn)練。
抖音副總裁李亮也下場(chǎng)評(píng)論表示,地圖規(guī)劃路線和實(shí)時(shí)導(dǎo)航,肯定需要讀取地理位置,M語音聊天也需要調(diào)用麥克風(fēng),甚至通訊錄權(quán)限,這些都是為了功能實(shí)現(xiàn)必須獲得的用戶信息,認(rèn)為只要是用戶許可就不存在侵犯隱私的行為。豆包手機(jī)助手是經(jīng)過用戶授權(quán),才能完成操作手機(jī)的任務(wù),所有權(quán)限的使用在官網(wǎng)的隱私安全白皮書中都有明確的披露,并不存在一些謠言所說的“入侵”“越權(quán)”等行為。
至此,一場(chǎng)技術(shù)探路之旅演變成了一場(chǎng)關(guān)乎行業(yè)底線的風(fēng)波。
綜合來看,豆包此次“硬剛”主流App生態(tài)的激進(jìn)策略,并非無的放矢。其背后,實(shí)則反映了字節(jié)跳動(dòng)在AI時(shí)代的多重戰(zhàn)略考量。
首先,是對(duì)AI時(shí)代“超級(jí)入口”的卡位焦慮。在移動(dòng)互聯(lián)網(wǎng)時(shí)代,微信和支付寶憑借其社交和支付功能,牢牢占據(jù)了最重要的流量入口。
傳統(tǒng)AI助手如早期Siri、小愛同學(xué)等,本質(zhì)上是基于預(yù)設(shè)指令的功能調(diào)用工具,用戶需手動(dòng)觸發(fā)特定操作,且不同應(yīng)用間的任務(wù)無法連貫執(zhí)行。這類助手更像是"應(yīng)用遙控器",始終停留在滿足單一功能需求的層面,難以應(yīng)對(duì)復(fù)雜場(chǎng)景下的多步驟任務(wù)處理。
進(jìn)入AI時(shí)代,能夠統(tǒng)攬全局、跨應(yīng)用操作的AI Agent被視為新的潛在入口。字節(jié)跳動(dòng)迫切需要抓住這個(gè)戰(zhàn)略機(jī)遇,通過技術(shù)創(chuàng)新實(shí)現(xiàn)“換道超車”,打破騰訊和阿里的流量壟斷。
雖然挑戰(zhàn)之旅阻礙重重,但以目前AI Agent的發(fā)展態(tài)勢(shì),智能體跨生態(tài)、跨應(yīng)用的協(xié)作幾乎已經(jīng)成為未來圖景中的必然選擇。
AI Agent的核心價(jià)值在于“協(xié)同”與“執(zhí)行”,在當(dāng)前App各自為政的生態(tài)下,最快捷、最有效的實(shí)現(xiàn)方式就是直接在系統(tǒng)層面獲取權(quán)限。豆包選擇了一條最難、但最直接的技術(shù)路線,試圖用技術(shù)創(chuàng)新倒逼行業(yè)變革。
字節(jié)跳動(dòng)可能的判斷是,未來的手機(jī)操作系統(tǒng)將是“AI優(yōu)先”的,所以選擇了對(duì)“AI原住民”操作系統(tǒng)押注。通過與手機(jī)廠商的深度合作,豆包試圖將自己的AI能力植入操作系統(tǒng)的底層,成為AI手機(jī)時(shí)代的“基礎(chǔ)設(shè)施”。
可以說,這次激進(jìn)動(dòng)作是一次瞄準(zhǔn)未來的戰(zhàn)略布局。
無論最終結(jié)果如何,豆包手機(jī)助手這次充滿爭(zhēng)議的嘗試都具有劃時(shí)代的意義。我們可以將豆包手機(jī)助手定義為“智能體協(xié)同領(lǐng)域的一次超前實(shí)驗(yàn)”,因?yàn)樗鼘I Agent發(fā)展中不可避免的核心矛盾以最尖銳的方式呈現(xiàn)出來,促使行業(yè)正視這些挑戰(zhàn):
其一,功能實(shí)現(xiàn)與數(shù)據(jù)隱私的根本沖突。AI Agent越強(qiáng)大,需要的權(quán)限就越高,對(duì)用戶隱私的潛在威脅越大。功能主義與隱私保護(hù)之間的平衡,是智能體發(fā)展必須解決的首要難題。
其二,技術(shù)創(chuàng)新與行業(yè)規(guī)范的博弈。豆包試圖打破現(xiàn)有的App沙盒機(jī)制,而微信則堅(jiān)守其安全城墻。這反映了創(chuàng)新者與守成者之間對(duì)規(guī)則制定權(quán)的激烈爭(zhēng)奪。行業(yè)急需一套新的規(guī)范來指導(dǎo)AI Agent與傳統(tǒng)App的協(xié)同,避免無序競(jìng)爭(zhēng)。
其三,多方責(zé)任主體的認(rèn)定。一旦使用豆包助手導(dǎo)致財(cái)產(chǎn)損失或數(shù)據(jù)泄露,責(zé)任應(yīng)由誰承擔(dān)?是提供AI技術(shù)的豆包?是提供工程機(jī)的努比亞?還是被操作的第三方應(yīng)用,抑或是用戶自身?責(zé)任邊界的模糊嚴(yán)重阻礙了AI Agent的大規(guī)模應(yīng)用。
作為此次事件的被動(dòng)應(yīng)戰(zhàn)方,微信和支付寶等超級(jí)App不可能對(duì)AI Agent的發(fā)展坐視不理。此次風(fēng)波對(duì)其未來的發(fā)展提供了重要啟示,也迫使其重新審視自身的戰(zhàn)略。
一方面,護(hù)城河依然堅(jiān)固,但并非不可逾越。微信的安全風(fēng)控機(jī)制成功阻擊了豆包的侵入,證明了其在用戶安全和生態(tài)掌控上的強(qiáng)大能力。然而,這也暴露了超級(jí)App在功能自動(dòng)化協(xié)同方面的“孤島效應(yīng)”。在AI時(shí)代,這種封閉性可能會(huì)成為用戶體驗(yàn)的瓶頸。
另一方面,主動(dòng)開放與規(guī)范接入是必由之路。如果超級(jí)App繼續(xù)完全封閉,將阻礙整個(gè)AI生態(tài)的發(fā)展,也可能被用戶詬病。未來,微信和支付寶需要探索在安全可控的前提下,以規(guī)范化的API接口或行業(yè)標(biāo)準(zhǔn)協(xié)議,向可信賴的AI Agent有限開放核心能力。
最積極的應(yīng)對(duì)方式,莫過于超級(jí)App基于自身龐大的生態(tài)和用戶數(shù)據(jù),研發(fā)自己的AI Agent能力,將AI功能內(nèi)置化,從而將主導(dǎo)權(quán)牢牢掌握在自己手中。
不過,智能體的未來,必然是協(xié)同的未來,但這種協(xié)同必須建立在信任與規(guī)范的基礎(chǔ)之上。(本文首發(fā)鈦媒體APP,文 | DeepWrite秦報(bào)局,作者|秦聰慧 )
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論