"幫我點(diǎn)一杯奶茶。"

"幫我在京東上買一個籃球。"

"幫我在貓眼上買一張電影票。"

豆包手機(jī)和各家APP的控制權(quán)爭奪戰(zhàn)還未有一個結(jié)果,千問點(diǎn)外賣的操作也只是深度打通了自家的生態(tài),如今火遍全網(wǎng)的小龍蝦(OpenClaw)也沒能解決跨端自動化的難題。

但近日,兩位來自某硬件大廠的工程師張志勇和單文榜,卻用自研的Agent ZeroFlow?;诰邆涠嗄B(tài)能力的國產(chǎn)大模型,在安卓設(shè)備、Chrome 瀏覽器及 PC 桌面上完美實現(xiàn)了多模態(tài)操控能力ZeroFlow可以像真人一樣看屏幕、點(diǎn)擊、滑動、輸入,完成一系列復(fù)雜的跨端自動化任務(wù)。

不一樣的技術(shù)路線

在實現(xiàn)跨端自動化任務(wù)的嘗試上,豆包手機(jī)和智譜的AutoGLM走的是截然不同的技術(shù)路線。

豆包手機(jī)通過與手機(jī)廠商合作,拿到了非常高的權(quán)限,可以繞過用戶或app的授權(quán)環(huán)節(jié),但這也直接點(diǎn)燃了app廠商們的抵抗情緒,引發(fā)了后續(xù)一系列的封禁動作。

智譜開源的AutoGLM則是基于adb協(xié)議拿到的操作權(quán)限,但這個模式無法直接在用戶手機(jī)上跑通,所以AutoGLM走的是遠(yuǎn)程虛擬機(jī)模式,在虛擬機(jī)里用adb操作用戶的手機(jī)。這種模式信任成本較高。

而ZeroFlow的解決方案核心依賴的是 Android 無障礙服務(wù)(Accessibility Service)。無障礙服務(wù)原本是 Android 為視障用戶設(shè)計的系統(tǒng)級輔助功能,申請該權(quán)限后,Agent可以讀取屏幕內(nèi)容,獲取當(dāng)前界面所有文本、按鈕、輸入框的位置和內(nèi)容。同時,Agent可以模擬人類操作,執(zhí)行點(diǎn)擊、長按、滑動、輸入文字等手勢。這套方案高度依賴Agent和底層模型的多模態(tài)操作能力,理論上是一套無法被App廠商封禁的解決方案。

原理聽起來很簡單,但實際的開發(fā)過程遠(yuǎn)比想象復(fù)雜。張志勇對創(chuàng)投家表示,其中一個最大的難點(diǎn)在于國內(nèi)的很多網(wǎng)頁在設(shè)計之初,為了防止自動化操作(本質(zhì)上是"反爬蟲"和"反外掛"的延伸),設(shè)計了很多的驗證步驟和工程上的"隱藏"。比如你看到一個按鈕在這里,但很有可能它的真實元素在一個非常遠(yuǎn)的地方。這讓從代碼維度理解網(wǎng)頁變得十分困難,但從多模態(tài)維度就相對簡單多了,這也正是有些大模型無法讀取網(wǎng)頁鏈接但可以讀取網(wǎng)頁截圖的根本原因。

另一方面,如何用最少的截圖讓Agent理解正確的意圖,也是一個工程優(yōu)化上的難點(diǎn)。

單文榜對創(chuàng)投家表示,網(wǎng)頁上的廣告彈窗、自動跳轉(zhuǎn)都會給多模態(tài)理解造成干擾。用最強(qiáng)的多模態(tài)模型去理解,肯定可以給出最正確的答案,但是消耗的Token成本卻不一定是普通用戶能夠承受的。如何用便宜的模型、截取最少的圖、達(dá)到最好的理解效果,這也是非常有挑戰(zhàn)的工程難題。

安全與便捷的平衡

當(dāng)聊到是否擔(dān)心大廠做出同質(zhì)化產(chǎn)品時,張志勇表示并不擔(dān)心。大廠基于自身的生態(tài)隔離,即使有這個技術(shù),也無法去實現(xiàn)真正跨平臺、跨端的自動化操作,因為一旦一家大廠下場,就會被其他大廠針對,這一點(diǎn)正是創(chuàng)業(yè)團(tuán)隊的優(yōu)勢。

ZeroFlow借鑒了OpenClaw的開源理念,針對安全性、模型適配性、便捷性進(jìn)行了深度架構(gòu)設(shè)計與優(yōu)化。

OpenClaw的核心安全風(fēng)險在于它作為"擁有工具調(diào)用能力的AI"本身,能執(zhí)行shell命令、讀寫文件、發(fā)送消息、訪問網(wǎng)絡(luò),如果prompt被注入攻擊或誘導(dǎo),可能導(dǎo)致主機(jī)被控制、敏感數(shù)據(jù)泄露等問題。

ZeroFlow通過沙箱隔離+小模型脫敏機(jī)制應(yīng)對這一風(fēng)險。一方面在workspace將用戶的敏感信息如密鑰信息隔離隱藏,讓AI自己都無法輕易找到敏感文件;另一方面,用小模型監(jiān)控所有用戶與大模型的信息交互,如遇到敏感信息,將會進(jìn)行脫敏加密處理。這樣用戶存儲在云端的敏感文件既無法被輕易找到,找到了也無法輕易解析。雙重機(jī)制下,ZeroFlow讓普通用戶在享受Agent便利的同時,隱私也得到最大程度的保護(hù)。

在便捷性上,ZeroFlow將龍蝦的使用門檻降到了新的"低度"。整個部署過程極度貼近互聯(lián)網(wǎng)產(chǎn)品使用習(xí)慣,幾乎感受不到。只需要打開瀏覽器,在網(wǎng)站上注冊一個賬號,就可以在對話框開始使用了。

OpenClaw因為基于OpenAI/Anthropic的Tool Calling規(guī)范設(shè)計,與國產(chǎn)模型的適配上一直存在一些問題。而ZeroFlow針對國內(nèi)主流大模型(如 Kimi、DeepSeek 等)做了工程調(diào)優(yōu),不但優(yōu)化了工具調(diào)用上的體驗,還優(yōu)化了提示詞工程,將提示詞長度平均縮短了近40%,顯著降低了Token成本。

張志勇對創(chuàng)投家表示,普通用戶使用ZeroFlow的Token成本大約可以降低30%。

從編程智能體到通用Agent

ZeroFlow的誕生并非一次蹭流量的粗暴套殼。

當(dāng)大語言模型的浪潮剛剛涌現(xiàn)的時候,張志勇和單文榜團(tuán)隊就站在了最前沿。彼時,他們沒有追逐某個宏大敘事,而是在解決一個極其具體的痛點(diǎn),如何讓工程師從繁復(fù)的編碼細(xì)節(jié)中解放出來,將智識真正用在創(chuàng)造上。于是,他們內(nèi)部孵化了第一代編程智能體,一個懂得上下文、能夠預(yù)判意圖、會主動補(bǔ)全邏輯的"代碼伙伴"。

這個工具在他們的工程體系內(nèi)悄然生長。從 GPT-3.5 時代的樸素提示詞工程,到多輪對話記憶、工具調(diào)用、代碼審查閉環(huán)……每一次迭代,都是被真實需求逼出來的進(jìn)化。幾年間,這套系統(tǒng)幫助他們自身的研發(fā)效率實現(xiàn)了數(shù)倍級別的躍升。

OpenClaw爆發(fā)的時間點(diǎn)上,張志勇回憶,他們坐在會議室里,看著那些演示視頻,沉默了很久。不是因為震驚,而是因為他們認(rèn)出了某種熟悉的東西,他們走過的路,正在被更廣闊的世界重新走一遍。

那一刻,他們意識到,三年來鍛造的不只是一個編程工具,而是一套關(guān)于'讓智能體真正理解人類意圖并持續(xù)執(zhí)行'的方法論。

"如果這套方法論能讓工程師效率倍增,它為什么不能讓每一個行業(yè)的每一個人,都獲得同樣的解放?"于是,ZeroFlow 誕生了。

"一個人會走得更快"

從左至右為單文榜、張志勇

"我覺得Agent確實能讓所有人的生活質(zhì)量獲得提升,所有人都應(yīng)該被解放出來做一些更高位的事情,但現(xiàn)階段最大的問題就是普通人接入的成本還是太高了。不僅指擁有一只龍蝦,更是讓這只龍蝦能夠自由地跨端自動化替主人解決真實場景下的問題。所以,我們想做的就是一個0接入成本、打開瀏覽器就能用的通用Agent。"張志勇說到。

“ZeroFlow不是編程助手的平替,而是將編程智能體的核心范式(理解意圖 → 規(guī)劃路徑 → 調(diào)用工具 → 持續(xù)執(zhí)行 → 反饋迭代)遷移到了更廣泛的知識工作場景中。財務(wù)分析、運(yùn)營流程、內(nèi)容生產(chǎn)、數(shù)據(jù)洞察……凡是有重復(fù)、有邏輯、有輸出的地方,都是 ZeroFlow 可以駐扎的領(lǐng)地。”單文榜表示。

當(dāng)被問到為什么不選擇在前司內(nèi)部實現(xiàn)自己的理想時,張志勇和單文榜相視一笑:"我覺得一群人肯定會走得更遠(yuǎn),但一個人會走得更快。對于這個時代而言,快可能更重要。"

目前,依零科技已獲得個人天使和尚勢資本的近千萬天使輪投資,資金將主要用于產(chǎn)品功能的進(jìn)一步完善和推廣。

轉(zhuǎn)載請注明出處、作者和本文鏈接。
聲明:文章內(nèi)容僅供參考、交流、學(xué)習(xí)、不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容
  • 感覺是有想法的技術(shù)人哈哈,很贊??

    回復(fù) 3月18日 · via iphone

快報

更多

07:31

內(nèi)塔尼亞胡:以方將“暫?!笨找u伊朗能源設(shè)施

07:29

伊朗發(fā)動“真實承諾-4”第65、66輪軍事行動,首次使用升級版“卡德爾”導(dǎo)彈

07:24

美軍或奪島以迫使伊朗開放霍爾木茲海峽

07:17

六國發(fā)表聯(lián)合聲明:準(zhǔn)備采取措施保障霍爾木茲海峽安全

07:14

美股收評:三大指數(shù)齊跌,光通信概念逆市走強(qiáng),閃迪續(xù)刷新高

2026-03-19 22:58

內(nèi)存漲價潮席卷全球,32G內(nèi)存條從800元暴漲到3800元

2026-03-19 22:57

團(tuán)隊版 OpenClaw (Clawith)宣布開源

2026-03-19 22:54

多家航司國際航線燃油附加費(fèi)上調(diào)

2026-03-19 22:22

美股光通信概念股強(qiáng)勢拉升,Applied Optoelectronics 漲超6%

2026-03-19 22:13

ST泉為:公司及實控人、董事長褚一凡因涉嫌信息披露違法違規(guī)被證監(jiān)會立案調(diào)查

2026-03-19 22:03

現(xiàn)貨黃金跌3.78%,報4636.60美元/盎司

2026-03-19 22:02

東方財富:發(fā)布2026-2028年股東分紅回報規(guī)劃

2026-03-19 21:55

美元指數(shù)日內(nèi)走低0.50%,最低報99.70

2026-03-19 21:51

首都在線:2025年虧損1.7億元

2026-03-19 21:35

中國聯(lián)通:2025年凈利潤同比增長1.1%,擬派發(fā)全年股利約51.12億元

2026-03-19 21:35

納斯達(dá)克中國金龍指數(shù)跌3.0%,報6804.11點(diǎn)

2026-03-19 21:34

美股開盤:三大指數(shù)集體低開,美光科技跌超8%

2026-03-19 21:18

3月19日美股盤前要聞

2026-03-19 21:16

歐洲央行:維持三大關(guān)鍵利率不變,符合市場預(yù)期

2026-03-19 21:08

NYMEX鉑金主力合約跌超9%,報1870.1美元/盎司

1

掃描下載App