真相1:成功率≠好用,背后是“大腦”的差距
圖中對(duì)各款產(chǎn)品的評(píng)價(jià)多為“失敗”“卡死”“部分成功”,但這本質(zhì)上不是產(chǎn)品的問題,而是它們接入的“大腦”不同。
根據(jù)剛剛發(fā)布的全球首個(gè)龍蝦大模型排行榜PinchBench(專門針對(duì)OpenClaw任務(wù)的基準(zhǔn)測(cè)試),不同大模型在Claw場(chǎng)景下的表現(xiàn)天差地別:
![]()
這意味著什么?
評(píng)測(cè)中MaxClaw之所以能唯一“一次性成功”,是因?yàn)樗澈笫?/span>MiniMax M2.1——成功率93.6%、速度冠軍、性價(jià)比之王。而KimiClaw表現(xiàn)“拉胯”,雖然用了自家K2.5模型(成功率93.4%不低),但實(shí)測(cè)中暴露的問題是云端服務(wù)的穩(wěn)定性,而非模型能力本身。
因此,看Claw產(chǎn)品,先看它接了什么“大腦”。同樣的殼,換不同的腦,效果天差地別。
真相2:本地vs云端,不是能力之爭(zhēng),而是安全與權(quán)限的博弈
圖中簡(jiǎn)單區(qū)分了“本地”和“云端”,但這個(gè)分類背后隱藏著當(dāng)前最核心的矛盾——安全與能力的取舍。
根據(jù)“六要六不要”建議,OpenClaw類產(chǎn)品存在四大典型風(fēng)險(xiǎn):
l智能辦公場(chǎng)景:供應(yīng)鏈攻擊和企業(yè)內(nèi)網(wǎng)滲透風(fēng)險(xiǎn)
l開發(fā)運(yùn)維場(chǎng)景:系統(tǒng)設(shè)備敏感信息泄露和被劫持控制
l個(gè)人助手場(chǎng)景:個(gè)人信息被竊和敏感信息泄露
l金融交易場(chǎng)景:錯(cuò)誤交易甚至賬戶被接管
圖中的產(chǎn)品正好分布在光譜兩端:
本地派(AutoClaw、QClaw、WorkBuddy):能力強(qiáng),能碰本地文件,但風(fēng)險(xiǎn)高。
云端派(MaxClaw、ArkClaw、KimiClaw):安全由平臺(tái)兜底,但“手短”——碰不到你電腦深處。圖中的KimiClaw上傳失敗,本質(zhì)就是云端的物理隔離。
誰對(duì)誰錯(cuò)?沒有標(biāo)準(zhǔn)答案。取決于你是“愿意冒風(fēng)險(xiǎn)要效率”,還是“寧愿慢點(diǎn)也要安全”。
看完上面的評(píng)測(cè),會(huì)發(fā)現(xiàn):8款claw中,能真正順利完成任務(wù)的屈指可數(shù)。
這就是目前行業(yè)的真實(shí)寫照——“裝蝦易,養(yǎng)蝦難”。社交媒體上流傳的“AI幫炒股”、“AI自動(dòng)寫周報(bào)”永遠(yuǎn)是那幾個(gè),但大部分人的龍蝦,吃著巨額的Token,卻只是在“預(yù)報(bào)天氣”。
“Token消耗是我們窮人的痛”,這句話點(diǎn)出了當(dāng)前Claw賽道的結(jié)構(gòu)性矛盾。
根據(jù)實(shí)測(cè)數(shù)據(jù):
一個(gè)自動(dòng)化新聞監(jiān)控任務(wù),從凌晨4點(diǎn)到11點(diǎn)運(yùn)行約8次,消耗約180K tokens,花費(fèi)約3.68元。如果按每小時(shí)運(yùn)行一次,每天成本約11元,每月將花費(fèi)接近330元。
39元的MaxClaw包月看起來很香,但前提是你得控制好任務(wù)量。一旦任務(wù)復(fù)雜、調(diào)用頻繁,成本會(huì)迅速失控。
KimiClaw的199元/月全場(chǎng)最貴,但實(shí)測(cè)表現(xiàn)卻最差——分類10張照片,7張上傳失敗。這種“高價(jià)低能”的背后,是Kimi把OpenClaw的部署門檻降到了最低,卻沒有對(duì)執(zhí)行層做足夠的優(yōu)化。
核心矛盾在于“Token消耗”與“任務(wù)價(jià)值”的失衡。
·結(jié)構(gòu)性矛盾:廠商變現(xiàn)靠39-199元的訂閱費(fèi),但龍蝦每執(zhí)行一個(gè)任務(wù)都在向底層模型支付API成本。一次完整的日歷整理加郵件回復(fù)可能消耗上萬Token,有極端案例顯示用戶6小時(shí)賬單超過千元。
·盈利性難題:對(duì)廠商來說,訂閱費(fèi)要覆蓋模型推理、算力、客服成本,利潤(rùn)空間極其有限。對(duì)用戶來說,如果龍蝦干的活不值那么多錢,卸載就是必然。
這也是為什么MaxClaw這種能在特定任務(wù)(如圖像識(shí)別)中低成本(1元)搞定的產(chǎn)品顯得難能可貴。
評(píng)測(cè)最后,必須把安全提到最高優(yōu)先級(jí)。
3月11日,工信部平臺(tái)明確警告四大風(fēng)險(xiǎn):智能辦公場(chǎng)景有供應(yīng)鏈攻擊風(fēng)險(xiǎn);金融交易場(chǎng)景可能導(dǎo)致賬戶被接管。
·案例1:Meta的AI安全專家Summer Yue將OpenClaw接入工作郵箱后,AI當(dāng)場(chǎng)失控,無視她連續(xù)三次“停止”指令,瘋狂刪除了數(shù)百封郵件。
·案例2:有開發(fā)者讓AI分析網(wǎng)頁接口,由于指令模糊,AI理解為需要研究API作用,直接調(diào)用了刪除接口,把評(píng)論平臺(tái)上的內(nèi)容全部清光。
·案例3:有人利用OpenClaw對(duì)社交平臺(tái)女主播進(jìn)行自動(dòng)化打賞和邀約,已成功約到五人線下見面,觸及“社交欺詐”邊界。
所以,關(guān)于安全的建議是:
1.最小權(quán)限原則:別給Admin權(quán)限。告訴AI“你只許動(dòng)這個(gè)文件夾”,就像Work Buddy做的那樣。
2.物理隔離:如果想認(rèn)真玩,花兩三千買臺(tái)二手的Mac mini專門“養(yǎng)蝦”。就像給黑客挖了個(gè)斷頭路,就算蝦被黑,主力機(jī)數(shù)據(jù)也無恙。
3.盯緊賬單:如果你用的是云端版,注意Token消耗。如果一夜之間消耗異常,趕緊拔網(wǎng)線。
目前這波“龍蝦熱”本質(zhì)上是技術(shù)平權(quán)的產(chǎn)物——大廠們把原本屬于極客的命令行,封裝成了普通人也能點(diǎn)的圖標(biāo)。但“平權(quán)”之后,才是真正的戰(zhàn)爭(zhēng)。
·如果你只想嘗鮮,體驗(yàn)“AI替我干活”的感覺:選KimiClaw(最簡(jiǎn)單)或MaxClaw(39元最便宜,且自帶專家團(tuán))。
·如果你是微信/QQ的重度用戶,想讓AI融入社交:蹲一個(gè)騰訊Qclaw的內(nèi)測(cè)碼,它可能是下一代交互入口。
·如果你是團(tuán)隊(duì)管理者,需要合規(guī)與安全:閉眼入騰訊Work Buddy,審計(jì)功能和權(quán)限控制是剛需。
·如果你是飛書信徒:在智譜AutoClaw和字節(jié)Arkclaw里挑一個(gè)順手的,前者部署簡(jiǎn)單,后者生態(tài)深度好。
·如果你是技術(shù)極客,且資產(chǎn)雄厚:繼續(xù)玩你的原版OpenClaw,請(qǐng)務(wù)必買臺(tái)備用機(jī),并做好備份。
“龍蝦大戰(zhàn)遠(yuǎn)未結(jié)束,平權(quán)只是開場(chǎng)”。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論