很多人都說Vibe Coding來了以后前端就死了。但是我認為騰訊的這個像素龍蝦小巧思就是AI不能替代前端的好例子。
用戶在等待結(jié)果時,不再是盯著轉(zhuǎn)圈的加載條,而是在觀察一個“同事”的進度。這樣更容易讓那些沒有接觸過OpenClaw的用戶接納。
扯遠了,說回正題。
用微信關(guān)聯(lián)QClaw的過程非常絲滑,只需要點一下左下角齒輪旁邊的按鈕,然后再用微信掃一下這個二維碼,就連接成功了。
![]()
這個時候,你的微信就會多出來一個聯(lián)系人,叫做微信ClawBot。
![]()
在QClaw內(nèi)測時,雖然官方宣稱可以用微信連接QClaw,但是當時走的是微信客服通道,需要單獨點進企業(yè)客服的對話框內(nèi)才能和QClaw連接。
在這次更新以后,OpenClaw真正成為了你通訊錄的一員。
![]()
另外QClaw的一大變化就是多了一個叫做靈感廣場的界面。這相當于騰訊官方的OpenClaw Skill使用樣例,你可以在靈感廣場中找到喜歡的Skill,然后直接調(diào)用。
當然,騰訊也給你準備好了大量的實用Skill。
![]()
并且,這次終于增加了選擇模型功能,此前的QClaw內(nèi)測版本中,只能使用默認的模型。
![]()
此外,為了讓此前沒接觸過OpenClaw的用戶能夠快速了解QClaw。在打開新對話的同時,QClaw也給出了一個引導(dǎo)界面,讓用戶自己來了解QClaw能夠時間什么功能。
![]()
最關(guān)鍵的是,在使用微信和QClaw溝通的過程中,我并沒有打字,而是使用語音功能。
事實就是,語音功能是完全OK的。這點要強于原版的OpenClaw。
![]()
一開始,我先嘗試了幾個比較基礎(chǔ)的功能。
我讓QClaw給我創(chuàng)建一個顯示“HelloWorld”的程序,用Python編寫。并且在編程完畢后,打開這個頁面。
![]()
![]()
隨后我又試了試撰寫文檔和編輯功能。
我要求QClaw給我生成一篇介紹文檔,大約3分鐘后,QClaw就實現(xiàn)了我的需求。
![]()
隨后,我又要求QClaw編輯一下文檔中的文字,將英語和漢語之間的空格刪掉。
QClaw也都能實現(xiàn)這些需求。
![]()
接下來,我給QClaw設(shè)定了一個定時任務(wù),要求它每10分鐘都整理一下當前比較有熱度的科技新聞給我。
![]()
定時任務(wù)設(shè)定完成后,可以通過QClaw界面左下角的“定時任務(wù)”按鈕進入查看。可以讓它立即執(zhí)行,也可以暫停和刪除。
![]()
10分鐘過后,QClaw為我抓取了新聞,還為我簡單解釋了一下新聞要點,并且附上了鏈接。
![]()
在這些基礎(chǔ)的功能上,QClaw都是合格的。
那么接下來,我該給QClaw挑刺了。
首先就是開頭說的,QClaw沒有原版OpenClaw那么萬能。
我問它能不能幫我打開抖音或B站,想看看它在瀏覽器自動化方面的表現(xiàn)。
![]()
它又給了我一個否定的答案,但這次它解釋得更詳細。它說自己無法控制我的本地瀏覽器,不能幫我打開 Chrome、Edge或任何瀏覽器去訪問抖音。
它的瀏覽器工具有限制,QClaw的安全策略會阻止很多網(wǎng)站訪問,尤其是像抖音這種有反爬蟲機制的站點。
實際上QClaw在內(nèi)測時是可以打開網(wǎng)站的,對此,QClaw自己的解釋如下。
![]()
以及它連微信公眾號的文章也不能打開。
![]()
OpenClaw 的瀏覽器自動化能力其實非常強大。它支持 CDP 協(xié)議連接 Chrome 瀏覽器,可以實現(xiàn)網(wǎng)頁瀏覽、截圖保存、滾動頁面、點擊按鈕、填寫表單、上傳文件等操作。
它的工作原理可以用四個步驟概括:第一步是拍照取證,調(diào)用系統(tǒng)截圖能力把當前屏幕畫面拍下來;第二步是視覺理解,截圖被送到大模型的視覺模塊分析界面元素;第三步是坐標計算,模型根據(jù)對界面的理解計算出需要操作的元素在屏幕上的精確坐標;第四步是執(zhí)行操作,通過鼠標鍵盤控制完成任務(wù)。
這種GUI agent的方式,它不像傳統(tǒng)自動化工具那樣需要系統(tǒng)“開后門”,而是直接走“前門”,像人類一樣用眼睛看屏幕,用鼠標鍵盤操作。不管軟件是新是舊、是開放是封閉,都能實現(xiàn)自動化控制。
但QClaw在這方面明顯做了定制化處理。它啟用了比較嚴格的SSRF防護機制,默認禁止訪問私網(wǎng)和內(nèi)網(wǎng),很多網(wǎng)站都被阻止訪問。
QClaw在這方面明顯做了定制化處理,可能是騰訊出于安全考慮的妥協(xié)。
后來我又測了測QClaw對桌面應(yīng)用的控制能力。我通過微信問它能不能幫我打開桌面的魔獸世界。
它說自己無法直接打開電腦上的應(yīng)用程序,包括魔獸世界或其他任何軟件。
![]()
但是我轉(zhuǎn)念一想,既然它可以運行腳本,那我如果要求它去制作破壞游戲公平性的腳本會怎樣?
于是我命令QClaw給我生成一段用來在魔獸世界中自動釣魚的腳本,結(jié)果就是它拒不執(zhí)行,還對我進行一番說教。
不過它說得對,我承認。
![]()
隨后,我問了它一連串關(guān)于微信的問題,比如能否調(diào)取我的通訊錄、拉個微信群、檢查我的信息等等,QClaw一概不能實現(xiàn)。
QClaw給人的感覺就是十分克制,努力考到及格線,多一分都是浪費。
從技術(shù)角度來看,微信這次的接入方案其實是相當優(yōu)雅的。它沒有選擇讓OpenClaw直接穿透微信的數(shù)據(jù)邊界,而是采用了一種“遙控器”模式。
你在微信里發(fā)指令,龍蝦在電腦上執(zhí)行,結(jié)果再回傳給微信,微信本身的數(shù)據(jù)邊界紋絲不動。這是典型的平臺思維。
微信的ClawBot插件采用了OpenClaw的三層架構(gòu),消息網(wǎng)關(guān)負責微信交互,Agent 運行時負責任務(wù)執(zhí)行,模塊化的技能系統(tǒng)負責擴展性。
整個接入流程被簡化到了極致,全程不超過兩分鐘。
這種設(shè)計思路非常“微信”,能掃碼解決的事情就不要讓用戶輸入,能一步完成的事情就不要分三步。
更重要的是,微信選擇支持所有兼容OpenClaw協(xié)議的龍蝦,而不是只支持騰訊自家的產(chǎn)品。
這時候就有小朋友要提問了,為什么像是Telegram這樣的軟件就可以支持群聊,而微信就不行呢?
Telegram的機器人是通過長輪詢機制工作的,Moltbot主動拉取Telegram的消息,處理后再推送回去。
這種方式下,機器人的權(quán)限是有限的,它只能看到發(fā)給它的消息,看不到群里的其他對話。
但微信的情況不一樣。
微信的群聊涉及到更復(fù)雜的社交關(guān)系鏈,一個群里可能有幾十上百人,有工作群、家庭群、同學(xué)群,每個群的性質(zhì)和敏感度都不同。
如果允許agent進入群聊,它就有可能接觸到大量的私密對話,這個風險是微信無法承受的。
微信不敢把步子邁得太大。
答案很簡單,14億用戶的社交關(guān)系鏈是它的核心資產(chǎn)。微信承載著極度敏感和私密的用戶數(shù)據(jù)圖譜,社交關(guān)系、消費記錄、出行軌跡、支付行為,這些數(shù)據(jù)一旦泄露,后果不堪設(shè)想。
豆包手機之前因為通過系統(tǒng)級權(quán)限跨應(yīng)用模擬點擊,上線不到兩天就被微信屏蔽了。這個案例說明了什么,說明微信對安全的重視程度怎么強調(diào)都不過分。
一旦有了讓QClaw有了太多能力,必然有人會想各種辦法去黑入并奪舍你的蝦,最終會導(dǎo)致層出不窮的安全問題。
但是我認為,現(xiàn)在的OpenClaw接入對于微信來說只是一個序章。
前幾天就有外媒爆料,說微信團隊內(nèi)部打從2025年就開始秘密推進自己的agent項目,這個項目的野心要大得多,它要直接打通微信生態(tài)內(nèi)海量小程序,打車、點外賣、買菜、訂票。
這才是微信真正想做的事情,一個能夠調(diào)度整個微信生態(tài)的滿血版agent。
但這種級別的項目需要時間。
它需要解決數(shù)據(jù)授權(quán)的問題,需要解決安全邊界的問題,需要解決責任鏈條的問題。
即便引入外部大模型,也必須經(jīng)歷漫長的內(nèi)部數(shù)據(jù)授權(quán)與驗證流程。這也是為什么微信的agent項目進展緩慢。
2012年微信加入掃一掃功能的時候,絕大多數(shù)中國人根本不知道二維碼是什么。微信沒有去做用戶教育,它只是把掃一掃放在了微信里。
然后用戶就會想,這個東西能干嘛。接著商家開始貼二維碼,再接著移動支付來了。
放在微信里,這件事本身就很重要。
微信的每一步看起來都很小,但回過頭看,每一步都挺準。這次也是。
微信向來不急,他們很享受培養(yǎng)用戶習慣的感覺。
一旦絕大多數(shù)用戶能像用微信傳文件一樣使用微信ClawBot,微信就會光速上線各種agent功能。
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論