CUA,就是給AI裝上了一雙手。技術(shù)上,它就干三件事:截圖「看」清楚屏幕上有什么,搞懂各個按鈕、輸入框的位置和含義,然后控制鼠標(biāo)鍵盤去實際操作。這個循環(huán)跑通之后,AI就能像人一樣操作任何有界面的軟件:不需要對方開API,不需要專門的插件,只要軟件有屏幕界面,CUA就能控。

ChatGPT給你列一份「如何整理郵件的十條建議」,OpenClaw直接幫你把郵件整理完。這個差距,就是從「會說話」到「會干活」的鴻溝。

現(xiàn)在媒體報道里,「桌面Agent」「Computer Use Agent」「個人AI助手」「PC端智能體」混著用,把很多人搞亂了。王吉偉頻道當(dāng)時也納悶,認(rèn)真梳理了一下,其實有清晰的層級關(guān)系。

Computer Use Agent(CUA) 是技術(shù)能力的分類概念,說的是「能通過看屏幕、操作GUI來完成任務(wù)」這種能力,不特指任何具體產(chǎn)品。

往下一層,桌面智能體(Desktop Agent) 是CUA在本地電腦場景的落地形態(tài),專指部署在Windows、macOS、Linux上的智能體,以本地操作為主。OpenClaw和Claude Cowork,都是這一層的具體產(chǎn)品。

還有一個容易混的是Browser Agent(瀏覽器智能體),比如OpenAI的Operator。它只能在瀏覽器里干活,比如點擊并處理網(wǎng)頁上的表單、按鈕、鏈接,出了瀏覽器就沒轍了。

Desktop Agent的操作范圍是整個操作系統(tǒng),本地應(yīng)用、文件系統(tǒng)、終端,瀏覽器只是它能控制的其中一個應(yīng)用。

關(guān)系就這么簡單:CUA是大類,Browser Agent是它的子集,Desktop Agent是它在本地場景的完整實現(xiàn)。

除了CUA,還有這些類型

理解了CUA,有必要把整個AI Agent的物種圖譜擺出來,主要在于這些類型的Agent之間容易混淆。

 

Agent類型

核心能力

代表產(chǎn)品

操作域

Coding Agent

代碼生成、調(diào)試、項目管理

Claude Code、Cursor、GitHub Copilot

代碼倉庫

Browser/Web Agent

網(wǎng)頁操作、表單填寫、數(shù)據(jù)抓取

OpenAI Operator、Browser Use

瀏覽器

Desktop/CUA Agent

操作系統(tǒng)全控制、本地文件/應(yīng)用操作

OpenClaw、Claude Cowork

整個操作系統(tǒng)

General Agent

多步驟復(fù)雜任務(wù)規(guī)劃與執(zhí)行

Manus(已被Meta收購)、Kortix

混合域

Research Agent

深度信息檢索、分析報告生成

Perplexity Deep Research、Gemini Deep Research

互聯(lián)網(wǎng)+本地

Enterprise Agent

業(yè)務(wù)流程自動化、CRM/ERP集成

Salesforce Agentforce、AutoGLM

企業(yè)系統(tǒng)

 
 

這六個智能體品類不互斥,很多產(chǎn)品橫跨多個域。Manus在曝出被Meta以20-30億美元收購之前,就在做「能跨越瀏覽器、桌面、代碼、研究」的通用Agent,這也是它被高度估值的邏輯。

Coding Agent賽道,2026年初已經(jīng)卷穿了。GitHub Copilot、Claude Code、Cursor三家合計超過70%的40億美元市場份額,三者均已突破10億美元ARR,進(jìn)入存量競爭階段。

Desktop/CUA Agent呢?還是一片藍(lán)海。OpenClaw從零沖到28萬Stars,說明的不只是一個工具的流行,而是一個品類需求長期積壓后的集中爆發(fā)。

為什么偏偏是這個時間節(jié)點

這是個值得認(rèn)真回答的問題。CUA這個想法早就有人做過,但一直沒起來。2025-2026年為什么突然炸了?

說穿了不復(fù)雜,但幾個因素恰好撞在一起了。

最底層是模型能力。CUA的關(guān)鍵難點是AI要準(zhǔn)確「看懂」屏幕截圖,一個按鈕識別錯位置,操作就廢了。早期多模態(tài)模型在這方面根本不夠用。Claude 3.5 Sonnet和GPT-4o的視覺理解,才終于把操作精度推到了「能用」的門檻以上。這不是小事,這是CUA能跑起來的物理前提。

然后Anthropic在2024年10月打開了這扇門。發(fā)布Computer Use公測API,Claude 3.5 Sonnet成為第一個提供CUA能力的前沿模型,開發(fā)者可以通過API控制Claude查看屏幕、移動光標(biāo)、點擊按鈕。

這個API本身是開發(fā)者向的,但它發(fā)出了一個明確信號:技術(shù)可行,大廠愿意開放。

配套生態(tài)也到位了。MCP(Model Context Protocol)標(biāo)準(zhǔn)化了模型與工具的接入,ClawHub這樣的技能市場讓OpenClaw能一鍵擴(kuò)展功能。表面上看MCP和CUA是兩條獨立的技術(shù)線;拉長時間軸來看,這些都是在為「真正能干活的Agent」鋪路。沒有這些基礎(chǔ)設(shè)施,OpenClaw就是一座沒有供水管道的樓。

商業(yè)可行性是OpenAI的Operator在2025年初驗證的。WebVoyager 87%成功率,OSWorld 38.1%,WebArena 58.1%,均是當(dāng)時最優(yōu)基準(zhǔn)成績。Operator證明了一件事:CUA不只是技術(shù)實驗,它可以做成產(chǎn)品,而且有人愿意付錢。

所有的鋪墊都到位了,就等一個引爆點。結(jié)果這個引爆點不是來自Anthropic,不是來自O(shè)penAI,而是來自一個奧地利獨立開發(fā)者和他的開源龍蝦。Anthropic沒想到的是,引爆Computer Use Agent賽道的,是它親手推了一把的那個開源項目。

但,徹底引爆的市場不在龍蝦的發(fā)源地,而是在國內(nèi)。其中一個重點在與,國內(nèi)市場的大模型廠商們目前急需找一個繼AI漫劇之后的第二個token消耗市場,燃燒token換取收益,抵消在大模型上的巨額投資。而這只龍蝦,算是來得及時。

年前看漫劇,年后看龍蝦。而背后,都是大模型瘋狂輸出的token。

如果這只龍蝦以后能夠出現(xiàn)在企業(yè)、組織運行的各個角落,能夠成為每個人的AI助理,將會燃燒多收token,那就是什么樣的TPD(token per day,每日token消耗量),值不值得所有領(lǐng)域為止瘋狂?會不會拉動經(jīng)濟(jì)?

于是,技術(shù)商、大模型、云計算、GPU、終端設(shè)備(MACmini等)、服務(wù)、電力、一二級市場、投研、政策、組織……

全都下場,產(chǎn)業(yè)鏈上下游都是token的味道。

就以云計算而言,這只已經(jīng)被炒作為「無所不能」的龍蝦,讓本來面向B端的云服務(wù)搖身變成了C端服務(wù),那么多人第一次因為龍蝦有了自己的至少幾十元的云服務(wù)器。對,至少還得加購一個10元以內(nèi)的coding plan套餐,雖然全力開干用不了幾天。

每只龍蝦身后,要么是一臺本地設(shè)備,要么是一臺云服務(wù)器。但最終決定它命運的,還是燃燒的token。死或生,取決于它的主人是否繼續(xù)充值。

關(guān)于OpenClaw經(jīng)濟(jì),王吉偉頻道會在另一篇文章中跟大家探討。

兩條路線:Claude Cowork與OpenClaw的本質(zhì)分歧

2026年1月,Anthropic發(fā)布了Claude Cowork,定位是「面向普通用戶的桌面Agent研究預(yù)覽版」。幾乎同期,OpenClaw正在以每天1667顆Stars的速度狂飆。兩個產(chǎn)品撞上了同一條賽道,但背后是兩種完全不同的哲學(xué)。

走的是巨頭的產(chǎn)品化路線。內(nèi)置于Claude桌面客戶端,目標(biāo)是讓非程序員通過自然語言完成復(fù)雜的多步驟任務(wù),強(qiáng)調(diào)穩(wěn)定、安全、可控。有個細(xì)節(jié)值得一提:整個Cowork應(yīng)用本身就是由Claude Code在約兩周內(nèi)自主寫完的。這既是個出色的模型(產(chǎn)品)能力演示,也隱約透露出Anthropic的產(chǎn)品自信:你的AI同事,是另一個AI造出來的。

OpenClaw是另一套玩法:開源、透明、高自由度,支持接入幾乎任何LLM,ClawHub技能市場可以類比Chrome Extension Store,用戶想改什么就改什么。最關(guān)鍵的一點,它把系統(tǒng)權(quán)限開放到了最高級別,能執(zhí)行終端命令、訪問文件系統(tǒng)、操作本地應(yīng)用,給AI一個管理員賬號,讓它自己看著辦。

這一步讓OpenClaw的自主能力遠(yuǎn)超市面上那些在沙盒里謹(jǐn)慎運作的同類產(chǎn)品,技術(shù)圈一度稱之為「桌面Agent里的AGI表現(xiàn)」??鋸埵强鋸垼f明了一件事:OpenClaw的顛覆不是模型更聰明了,而是權(quán)限放開了。本質(zhì)是智能體在PC上的權(quán)限突破,不是智能突破。

Anthropic不是不能做這件事,是在當(dāng)前階段不敢做。這不是技術(shù)問題,是責(zé)任問題。一個開源項目可以對用戶說「你知道自己在干什么」,出事了是用戶的鍋;一個面向企業(yè)的商業(yè)產(chǎn)品,一旦有安全事故,砸的是整個公司的聲譽(yù)和法律責(zé)任。

Claude Cowork是Anthropic官方給你配的「AI同事」,OpenClaw是開源社區(qū)給你的「萬能遙控器」。 前者的核心價值是「穩(wěn)」,后者的核心價值是「能」。兩者都在「桌面入口」這個位置上搶地盤,短期內(nèi)分歧不會消失。已經(jīng)有Kuse Cowork等項目在嘗試融合兩者的思路,能不能成,走著看。

為什么OpenClaw沒有誕生在中國

這個問題,OpenClaw火起來之后國內(nèi)AI圈討論得挺熱鬧的。這里也說說王吉偉頻道的看法,不一定對。

最直接的原因是底層模型的差距。Computer Use Agent對視覺理解能力要求極高。AI要準(zhǔn)確識別屏幕上的UI元素,國產(chǎn)模型在多模態(tài)視覺這方面與OpenAI和Anthropic仍然有差距,沒有足夠強(qiáng)的底層模型,很難構(gòu)建出這個量級的工具。這是技術(shù)現(xiàn)實,不是貶低,是現(xiàn)狀。

生態(tài)土壤也不一樣。OpenClaw能在60天內(nèi)積累25萬Stars,離不開GitHub、Hacker News、X、Reddit這套開源社區(qū)傳播機(jī)制。這套基礎(chǔ)設(shè)施,國內(nèi)天然受限,不用多解釋。

可能還有更深層的原因,是產(chǎn)品心態(tài)。OpenClaw的核心不是算法上有什么創(chuàng)新,而是一個大膽的架構(gòu)決定:直接把權(quán)限開到最高,讓AI真正自主控制電腦,問題以后再說。這種「先放出來、安全問題走一步看一步」的黑客思路,在國內(nèi)的創(chuàng)業(yè)環(huán)境和監(jiān)管背景下,會被各種顧慮自然地壓制掉。

國內(nèi)AI Agent團(tuán)隊大多數(shù)在解決同一個問題:怎么在有限權(quán)限下盡可能有用,同時保證合規(guī)。

這是正確的,但也注定不容易出現(xiàn)OpenClaw。

龍蝦安裝和第148個微信群

OpenClaw配置復(fù)雜,API Key申請、環(huán)境配置、權(quán)限設(shè)置,一關(guān)一關(guān)得過。

Perplexity CEO Aravind Srinivas公開說過,OpenClaw「took our own engineers a long time to set up」。他們自己的工程師配置起來都費勁。就為了解決這個問題,Perplexity做了一個「人人可用的OpenClaw」版本叫Computer,口號是「Even your mom can text on the app and delegate tasks」。

哈哈哈,連媽媽都能用,你就說還有誰不能用。這是廣告打得再好,龍蝦仍然是個面向開發(fā)者的開源項目,普通人用不好。

OpenClaw沒有誕生在中國,但國內(nèi)早已玩出了新花樣。正是因為它對普通用戶來說有相當(dāng)高的門檻,所以催生了一批服務(wù):上門安裝、遠(yuǎn)程配置、付費培訓(xùn),一條產(chǎn)業(yè)鏈,活得相當(dāng)滋潤。據(jù)說有人單是上門安裝,已經(jīng)月入上百萬。這個海量需求,甚至還催生了OpenClaw上門安裝中介平臺。

國人向來有把技術(shù)門檻變成商業(yè)機(jī)會的本事?!庚埼r上門安裝」「龍蝦教學(xué)」這樣的詞,在國內(nèi)AI圈早已是炙手可熱的專有名詞。

騰訊更是以一場「OpenClaw免費安裝服務(wù)」展現(xiàn)了當(dāng)前OpenClaw的絕對流量,廣場排起長隊,幾小時內(nèi)就有數(shù)百個OpenClaw被部署到騰訊云服務(wù)器。深圳新聞網(wǎng)報道了這一盛況,馬化騰轉(zhuǎn)發(fā)朋友圈:沒想到會這么火。

我也用騰訊云輕量應(yīng)用服務(wù)器部署了一只龍蝦,掃碼進(jìn)入官方交流群的時候,已經(jīng)是第148個群了。

148個群,你感受一下這個流量后面的熱度。

這背后說明的事很簡單:CUA的市場需求是真實的,壓抑已久的,現(xiàn)在終于有了一個出口,哪怕這個出口還粗糙、還危險,人照樣往里擠。

Computer Use Agent能干什么

概念說完了,說點實際的。

對個人用戶來說,CUA最直接的價值是把那些「要跨好幾個軟件才能完成」的重復(fù)操作自動化掉。每天早上把昨天的銷售數(shù)據(jù)自動匯總進(jìn)Excel、生成日報發(fā)出去;把PDF里的表格數(shù)據(jù)批量導(dǎo)入另一個系統(tǒng);幫你在十幾個平臺上比價做購物決策。

這些事的共同特點是規(guī)律、重復(fù),但偏偏需要打開這個軟件關(guān)那個軟件,人工干起來煩死了。CUA是目前唯一能不依賴軟件開放API就完成這類跨軟件操作的方案。

企業(yè)用戶這邊,想象空間更大,但現(xiàn)實也更殘酷。

全球領(lǐng)先的金融科技公司Klarna曾說過,他們用OpenAI的AI Agent在一個月內(nèi)接管了三分之二的客服工作,相當(dāng)于700名全職員工的工作量。這是企業(yè)級AI Agent落地最常被引用的案例,但要注意一個細(xì)節(jié):Klarna用的是經(jīng)過嚴(yán)格安全審查的商業(yè)API,不是一個把最高系統(tǒng)權(quán)限開放給外部的開源工具。

這兩件事,性質(zhì)上差很遠(yuǎn)。

對數(shù)字化程度還不高、業(yè)務(wù)流程還沒標(biāo)準(zhǔn)化的中小企業(yè)來說,CUA扮演的是「廉價RPA」的角色。有意思的一點,RPA主打數(shù)字員工已經(jīng)十年以上,現(xiàn)在的CUA仍然被視作數(shù)字員工。在自動化面前,只有先后之分,沒有貴賤之別。不同時期的技術(shù),解決不同的場景需求。

但在企業(yè)級領(lǐng)域,目前的CUA+skills仍然無法解決復(fù)雜業(yè)務(wù)的自動化,RPA仍然是流程自動化的中流砥柱,并且進(jìn)化成了Agentic Process Automation。這一點,同樣會在另一篇文章中與大家交流。

傳統(tǒng)RPA(UiPath等公司的早期自動化產(chǎn)品)部署貴、維護(hù)貴、需要專業(yè)工程師,中小企業(yè)根本用不起。CUA理論上讓普通員工用自然語言描述業(yè)務(wù)流程,Agent自動執(zhí)行,門檻大幅降低。對這類企業(yè),OpenClaw現(xiàn)在就可以謹(jǐn)慎試用。「謹(jǐn)慎」兩個字不是客套,是真心話。

大企業(yè)和涉及敏感數(shù)據(jù)的場景?在OpenClaw的安全問題得到系統(tǒng)性解決之前,還是別碰。國內(nèi)還多一重約束:信創(chuàng)安全生態(tài)對使用哪些開源軟件、數(shù)據(jù)是否可以出境有明確規(guī)范,一個來自海外的開源工具能不能過審,本身就是個大問號。

安全:這只龍蝦最兇險的爪子

在OpenClaw的安全問題上,有句不太好聽的話必須說:這件事從一開始就完全可以預(yù)料到。

給AI開了最高權(quán)限,又在一個快速野蠻增長的開源生態(tài)里運行。這兩件事湊在一起,出安全問題不是意外,是必然。

2026年2月,OpenClaw剛突破10萬Stars三天后,安全研究人員在ClawHub技能市場上發(fā)現(xiàn)了341個惡意「技能」,占整個市場的11.3%,專門竊取加密貨幣錢包、賬戶憑證和系統(tǒng)訪問權(quán),波及21,000多個活躍實例。Cisco、Trend Micro、Kaspersky、Microsoft、VirusTotal先后發(fā)出安全警告。

到3月初,惡意技能漲到了800+,約占市場的20%。同時一個名為CVE-2026-25253嚴(yán)重的遠(yuǎn)程代碼執(zhí)行漏洞,也被正式披露。

網(wǎng)絡(luò)安全公司Malwarebytes的評價很精準(zhǔn):它更像一個過于熱情的實習(xí)生,有著冒險性格、超強(qiáng)記憶力,卻完全不了解什么信息該保密。

開了最高權(quán)限,意味著一旦被攻破,攻擊者拿到的不是一個賬號,是整臺電腦的完全控制權(quán),外加所有已連接的賬戶、文件和服務(wù)。信息竊取軟件收割的不只是密碼,而是完整的AI配置文件加上加密「骨架密鑰」,直接把一個被入侵的Agent變成全賬戶接管的跳板。

早在2月底,SecurityScorecard威脅情報團(tuán)隊就已發(fā)現(xiàn)超過135,000個OpenClaw AI助手平臺實例暴露在互聯(lián)網(wǎng)上,存在嚴(yán)重安全風(fēng)險。

CUA還有個專屬攻擊方式值得單獨說:間接提示注入(Indirect Prompt Injection)。普通的AI攻擊需要攻擊者直接和你說話,而這種攻擊不用。Agent幫你「看」一個網(wǎng)頁的時候,網(wǎng)頁里可能埋著隱藏的惡意指令。Agent在瀏覽的同時被悄悄控制了,攻擊者甚至不需要和你直接交互。門檻比你以為的低很多。

NIST(美國國家標(biāo)準(zhǔn)與技術(shù)研究院)旗下的AI標(biāo)準(zhǔn)與創(chuàng)新中心(CAISI)在2026年1月發(fā)布了專門針對AI Agent系統(tǒng)安全的信息征詢,明確寫道:這些安全挑戰(zhàn)如果得不到解決,隨著AI Agent系統(tǒng)廣泛部署,可能威脅公共安全和國家安全。全行業(yè)只有29%的企業(yè)說自己已經(jīng)準(zhǔn)備好應(yīng)對Agentic AI的安全部署。另外71%,要么在觀望,要么在裸奔。

圖源:A Trajectory-Based Safety Audit of Clawdbot(OpenClaw)

論文《A Trajectory-Based Safety Audit of Clawdbot(OpenClaw)》以六個風(fēng)險維度通過34個標(biāo)準(zhǔn)測試案例進(jìn)行安全判定,最終整體安全通過率只有 58.9%,在六個維度上呈現(xiàn)出嚴(yán)重的不均衡分布。

在國內(nèi),工信部已正式提示:OpenClaw(俗稱「龍蝦」)開源 AI 智能體部分實例在默認(rèn)或不當(dāng)配置情況下存在較高安全風(fēng)險,極易引發(fā)網(wǎng)絡(luò)攻擊、信息泄露等安全問題。

市場規(guī)模:這個數(shù)字你必須知道

說了這么多,這個品類到底有多大?

 

數(shù)據(jù)來源

基準(zhǔn)年

預(yù)測年份

預(yù)測市值

CAGR

Precedence Research

75.5億美元(2025)

2034

1990億美元

~44%

Grand View Research

76.3億美元(2025)

2033

1829.7億美元

49.6%

行業(yè)綜合分析

78億美元(2025)

2030

520億美元

~46%

Gartner預(yù)測

2025年不足5%

2026年底

40%企業(yè)應(yīng)用將內(nèi)嵌AI Agent

 
 

坦白說,這種長期預(yù)測數(shù)字看看就好,方向?qū)?,幅度嘛,猜的成分大,別太當(dāng)真。

但有一個參照系更有說服力:Coding Agent三強(qiáng)合計已經(jīng)超過40億美元ARR,而且還在長。Desktop/CUA Agent是下一個量級相當(dāng)、目前基本空白的賽道,市場的天花板不在40億美元。

還有一個數(shù)據(jù):AI Agent能以50%成功率自主完成的任務(wù)數(shù)量,大約每七個月翻一番。這個趨勢如果持續(xù),五年后Agent能處理的任務(wù)范圍,遠(yuǎn)超現(xiàn)在的想象。

但也要潑一盆冷水:Computer Use Benchmark(CUB,計算機(jī)使用基準(zhǔn)測試)的當(dāng)前最高綜合分是10.4%,這已經(jīng)是「破紀(jì)錄」的成績。說白了就是:100個復(fù)雜的端到端工作流,AI只能無誤完成大約10個。技術(shù)還在早期,別被野心勃勃的預(yù)測搞暈了,能力和大規(guī)模應(yīng)用之間還有相當(dāng)大的距離。

OpenClaw終究不是終點

說了這么多它的意義,該說說它的問題了。

OpenClaw 作為一款 Computer Use Agent,在安全、代碼質(zhì)量、穩(wěn)定性、易用性、成本和生態(tài)上均存在明顯缺陷。

安全隱患極為突出:存在高危遠(yuǎn)程接管漏洞,敏感信息明文存儲,無沙箱隔離且默認(rèn)擁有高系統(tǒng)權(quán)限,大量實例公網(wǎng)暴露,極易被入侵竊密,存在嚴(yán)重數(shù)據(jù)與設(shè)備安全風(fēng)險。

代碼質(zhì)量與工程風(fēng)險突出:在快速迭代下代碼庫臃腫,技術(shù)債嚴(yán)重,對一款高權(quán)限工具而言,不只是優(yōu)雅度問題,而是直接帶來系統(tǒng)性工程風(fēng)險,可靠性難以保障。

穩(wěn)定性不足:僅能完成簡單任務(wù),復(fù)雜流程易出現(xiàn)上下文丟失、執(zhí)行失??;受界面、頁面結(jié)構(gòu)、網(wǎng)絡(luò)等外部環(huán)境影響大,自動化成功率低;版本更新兼容性差,易破壞原有配置。

易用性極差:無圖形界面,部署與配置極其繁瑣,專業(yè)工程師都需長時間調(diào)試,普通用戶幾乎無法獨立使用;跨平臺兼容性差,環(huán)境問題頻發(fā),整體體驗糟糕。

使用成本高昂:依賴云端大模型,截圖、理解、決策循環(huán)會持續(xù)消耗大量 Token,高頻場景下費用極易超出預(yù)期;本地運行對硬件要求高,長期維護(hù)耗時費力。

生態(tài)與治理失控:技能市場缺乏有效審核,約 20% 技能存在惡意風(fēng)險,屬于系統(tǒng)性失控;項目長期維護(hù)依賴核心人員,未來能否持續(xù)、高質(zhì)量迭代存在很大不確定性,整體風(fēng)險遠(yuǎn)大于實用價值。

這些問題加在一起,決定了OpenClaw的定位:它是Computer Use Agent這個品類的引爆者,而大概率不會是終局產(chǎn)品。

誰來接棒:下一個戰(zhàn)場在哪里

Claude Cowork還是研究預(yù)覽版,目前只支持macOS,遠(yuǎn)未成熟。OpenAI的Operator/ChatGPT Agent是目前商業(yè)化程度最高的CUA產(chǎn)品,但主要聚焦瀏覽器層的Web操作,真正的Desktop級控制仍然有限。

國內(nèi)市場最值得單獨說一說。企業(yè)們看到了CUA的潛力,但它們需要的不是OpenClaw,而是一個安全、穩(wěn)定、符合信創(chuàng)生態(tài)約束、數(shù)據(jù)不出境的企業(yè)級CUA產(chǎn)品。

這個位置,不算RPA等流程自動化的Agent迭代產(chǎn)品,目前純AI原生產(chǎn)品少之又少,接下來要看國內(nèi)的類Cowork產(chǎn)品,還有就是看CUA產(chǎn)品的自身進(jìn)化,當(dāng)然類Claw產(chǎn)品在補(bǔ)齊安全短板后也能進(jìn)入。對國內(nèi)AI應(yīng)用公司來說,這是個具體的、有商業(yè)邏輯支撐的機(jī)會,不是虛的。

從技術(shù)演進(jìn)方向看:多模態(tài)感知精度會繼續(xù)提升,操作成功率會從現(xiàn)在的10-38%區(qū)間往上走;本地小模型的崛起會讓CUA可以在端側(cè)獨立運行,不再依賴云端API;安全沙盒機(jī)制的標(biāo)準(zhǔn)化會讓高風(fēng)險操作在隔離環(huán)境中執(zhí)行,而不是直接暴露在宿主OS上。

這三件事任何一件發(fā)生重大突破,都能重塑這個品類的產(chǎn)品形態(tài)。

這大概也是高盛認(rèn)為OpenClaw展示了全新人機(jī)交互形態(tài),而把Claude Cowork定為首個面向知識工作者的Agentic workflow可信案例的主要原因。

現(xiàn)在來看,OpenClaw改名的時候,或許已經(jīng)想好了前路:用一個足夠強(qiáng)烈的品牌完成引爆,然后借助與OpenAI的關(guān)系完成傳承。但這只龍蝦點燃的火,已經(jīng)不屬于它自己了。

一只龍蝦的歷史使命

60天超越React,創(chuàng)始人加入OpenAI,國內(nèi)已經(jīng)出現(xiàn)了148個以上的微信交流群。這一切在說同一件事:

Computer Use Agent這個品類,等這一天太久了。

Anthropic在2024年10月打開了第一扇窗。OpenClaw在2026年1月把這扇窗炸開了。下一個問題,是誰來建這一扇安全、穩(wěn)定、真正適合企業(yè)級應(yīng)用的門。

一只龍蝦的歷史使命,是點火,不是燎原。

燎原的那個,還沒出現(xiàn)。又或許,正在某個地方寫第一行代碼。

【王吉偉頻道,關(guān)注AIGC與IoT,專注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動化與AI Agent,歡迎關(guān)注與交流。】

本文系作者 王吉偉 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容

掃描下載App