阿里千問所代表的「雙重授權機制」,是一種基于開放協(xié)議的合作模式。在這種模式下,AI Agent通過標準化授權協(xié)議與第三方服務進行對接,所有的數(shù)據(jù)交換都在結構化的接口中完成,權限邊界清晰可控,每一次操作都有完整的審計日志。這就像是外交渠道——走正門,遞國書,在明面上進行。
也是在不久前,豆包手機問世,則代表了另一種技術路線:「讀屏加模擬點擊」。它通過屏幕OCR識別界面元素,然后模擬人類點擊、勾選等觸控操作來完成任務。這種方式繞過了應用的邏輯層,直接在表現(xiàn)層進行操作,繞開了第三方平臺的配合或授權。形象地說,更像是翻窗入室——雖然也能進去辦事。
讀屏模擬路線最大優(yōu)勢在于部署速度快、覆蓋范圍廣。由于不需要與任何平臺進行商務談判或技術對接,廠商可以單方面實現(xiàn)對幾乎所有應用的接管能力,這種「即插即用」的特性使其在市場競爭中具有明顯的先發(fā)優(yōu)勢。
但從用戶側來看,這種便利性還是會打一些折扣。讀屏+模擬點擊路線,需要模擬人類點擊,需要跳轉App,再一頁一頁去翻、去識別、去填寫,而如果是兩個Agent之間簽有協(xié)議,瞬間就完成信息授權和互通。
業(yè)內人士認為,模擬點擊的便利性是有代價的,存在安全隱患和責任真空。API授權路線雖然部署緩慢、覆蓋范圍受限于平臺開放意愿,但它提供了精確的權限粒度控制和清晰的責任歸屬。
從資金安全和用戶隱私角度考慮,讓我們具體想象一個場景:用戶對AI說「幫我把余額寶的錢轉到銀行卡」。在讀屏模式下,為了完成這個任務,AI必須具備讀取屏幕上所有信息的能力,這意味著它實際上能看到用戶所有的賬戶余額、所有的交易記錄、所有的聯(lián)系人信息,并且可以模擬點擊任何按鈕——包括轉賬給任意賬戶。
還有一個敏感場景是好友之間的對話,特別是對方不知情的情況下,讓Agent幫自己回復信息,是節(jié)省了打字的麻煩,但讀屏讀的是當前頁面全部信息,很敏感的信息也會一覽無余,這一點上讀屏模式可能還是得拿出令人信服的風控方案。
責任歸屬的模糊性或許是最棘手的問題。假設AI誤操作導致轉錯賬或買錯股票,或者把一張情侶之間的照片發(fā)給了恰好同名的第三方,在API模式下,有完整的調用日志、授權記錄和明確的接口語義,可以清晰地追溯責任。但在讀屏模式下,AI Agent說它看到的是這個按鈕,App則說按鈕當時不在那個位置,整個事件無法復現(xiàn)、無法審計、無法鎖定責任。這種責任真空在金融場景中尤其不可忽視。
而從互聯(lián)網生態(tài)健康度的角度看,讀屏模式本質上是一種「寄生」關系,它鼓勵的是對抗而非合作。平臺一旦發(fā)現(xiàn)自己的應用被這種方式「入侵」,自然會采取技術反制措施,這將導致一場無休止的攻防戰(zhàn)。相反,API模式創(chuàng)造的是「共生」關系——Agent廠商獲得能力,平臺獲得流量和生態(tài)位,用戶獲得便利,各方都受益。
站在更加宏觀視角,讀屏模擬點擊路線,很可能使得滴滴、攜程、美團這類具有線下履約網絡的平臺,其線上的高利潤環(huán)節(jié)被繞開,商業(yè)價值被削弱,這會對產業(yè)產生巨大震蕩,Agent是幫用戶節(jié)省了三秒鐘,地球上就此消失了若干家世界五百強,這種路線,在當前經濟社會狀況下,應該是不會得到各方首推的。
我猜想一下趨勢可能的走向,在未來一到兩年的短期內,讀屏模式會在非敏感場景快速普及,比如查天氣、內容消費這類場合。而涉及到金融、支付和聊天場景,需要更加審慎。
![]()
站在旁觀者角度來看此次千問發(fā)布會,有一個意義是很突出的,阿里生態(tài)選擇雙重授權路線,能率先卡住A2A路線,有機會成為行業(yè)標準制定者,建立一個生態(tài)聯(lián)盟,有利于先把朋友搞得多多的。
合理推測,2026年,阿里必會推出自己定義的AI手機,甚至對于大多數(shù)頭部互聯(lián)網平臺來說,盡快推出自己定義的Agent手機,都是件迫在眉睫的事。
在AI敘事的另一個大國,2026年1月,谷歌也在行動,它聯(lián)合Shopify、沃爾瑪?shù)热蛄闶蹣I(yè)巨頭,發(fā)布「通用商務協(xié)議」(UCP),前沿探路者們都在試圖爭奪標準定義權。
在三到五年的中期,我預計會出現(xiàn)類似「Agent Protocol」的行業(yè)標準,主流應用會提供官方的Agent接入點,讀屏模式將退化為「最后手段」,用于那些尚未適配的長尾應用。
讀屏模擬是「證明Agent有用」的捷徑,API授權是「讓Agent可信」的必經之路。前者適合開荒探路,后者適合長久定居。站在不想被一眼看穿的普通用戶,以及產業(yè)能健康發(fā)展的角度,我們還是希望雙重授權的A2A模式,成為最終行業(yè)標準和共識,大家一起走得更加平穩(wěn)一點。
快報
根據(jù)《網絡安全法》實名制要求,請綁定手機號后發(fā)表評論