Manus 不算是在基座大模型上的技術(shù)突破,而是在 AI 實際落地、增加應(yīng)用場景和適用人群方面的創(chuàng)造?!?/p>
業(yè)內(nèi)普遍認為,對答式的聊天機器人,最多能夠提供一些簡單的工作幫助,執(zhí)行復(fù)雜工作,最終還是需要通過搭建 AI Agent 的工作流?!?/p>
但,Agent 的搭建,有門檻,不僅有技術(shù)上的門檻,更有認知思維、結(jié)構(gòu)化能力上的門檻,并不是所有用戶,都有把工作拆解成詳細 SOP 的能力。在 Manus 的邏輯下,創(chuàng)建工作流 SOP 這個最難的事情,由 AI 來完成,于是,每一個用戶,通過簡單的自然語言對答,就能獲得接近于 Agent 的產(chǎn)出結(jié)果,幾乎就是直接可用的程度?!?/p>
今天全網(wǎng)刷屏的文章,主要還都是 Manus 功能的簡單介紹,熟悉我的朋友們都知道,我一貫主張不僅要分析產(chǎn)品,也要深挖產(chǎn)品背后的邏輯,以及其對應(yīng)著的趨勢。所以這篇文章,我們就基于 Manus,對 AI 產(chǎn)品和 AI 落地,進行深度分析和預(yù)判?!?/p>
Manus 的特點是,它能夠自主進行工作流的拆解,然后按照拆解的順序,每一步都調(diào)用最合適的大模型,進行任務(wù)處理?!?/p>
就好像一個非常卷的 J 人同事,每一項工作,都提前拆出詳細的執(zhí)行計劃表,然后按照計劃表嚴格執(zhí)行,最終做出來的效果,肯定不會差?!?/p>
比如讓 Manus 整理一份 OpenAI 的組織架構(gòu)圖,它不會直接去貿(mào)然干這個事兒,而是會先進行一個任務(wù)拆解,來明確,做好這個事情,都需要哪些具體的細致的步驟,然后根據(jù)自己拆解的步驟,再逐項自動執(zhí)行任務(wù),最終產(chǎn)出用戶“直接可用”的結(jié)果?!?/p>
這個“直接可用”太重要了,如果過去真的深度使用過 AI,都知道,之前的聊天式 AI,看起來洋洋灑灑一大段回復(fù),但是實際要用,就發(fā)現(xiàn)很多地方不符合現(xiàn)實,還得人工大改。
![]()
所以 Manus 的工作邏輯,其實就是 Agent,通過完成工作流的拆解,解決具體實際的問題?!?/p>
Agent 中文名叫做 AI 代理或者智能體,說白了就是一個能按照工作流,執(zhí)行實際的、專業(yè)的工作的機器人,解決實際的具體問題,讓它按照適配公司業(yè)務(wù)的流程,進行各種具體的工作,就好像一個真正的同事一樣。
如果只是在 AI 對話框中進行簡單的對話,AI 能夠進行的工作很有限,AI 的產(chǎn)出物也不太可控?;貧w到我們實際的工作中,任何工作都有一個流程和標準的限制,才能讓產(chǎn)出的結(jié)果,達到預(yù)定的標準?!?/p>
比如「為公司業(yè)務(wù)寫一條小紅書」這項工作,如果讓 AI 直接進行工作,產(chǎn)出的結(jié)果基本是不可用的,因為命題太大了,小紅書運營包含著多種不同的工種環(huán)節(jié),很難通過一句話,就完成一個復(fù)合度相對較高的工作。
那如果想要 AI 完成好這項工作,其實得給 AI 規(guī)定好工作步驟:
在每個環(huán)節(jié),AI 都只解決一個具體的問題,然后把許多個 AI 的工作串起來,成為 AI 工作流?!?/p>
所以,對話聊天的 AI,最多只是提供些靈感,真正要解決生產(chǎn)力的問題,就必須得靠融合了 SOP 的 AI Agent?!?/p>
這也是我一貫的觀點,協(xié)作體系是人類社會改變生產(chǎn)力的利器,AI 只有通過工作流,才能夠完美融入人類的生產(chǎn)關(guān)系中?!?/p>
Manus 的出現(xiàn),意味著 Agent 的發(fā)展,實際上進入第三階段:
![]()
在第一個階段,ChatGPT 這樣的對答式機器人,通過一問一答的方式,逐一解決問題。這個過程中,人類依然是主導,能否把 AI 用好,取決于提問人的水平,只有思路非常清晰、結(jié)構(gòu)化能力非常強的提問人,才能讓 AI 解決實際問題?!?/p>
第二個階段,通過“扣子”這樣的智能體平臺,搭建分步驟執(zhí)行的 Agent,這一階段也是當前 AI 應(yīng)用層落地的主要方式。既然不是所有人都能通過 AI 問答,解決實際問題,那我們就把能解決問題的步驟,固定下來,讓 AI 每次都按照驗證過的步驟逐一執(zhí)行,并且集成多種不同能力的 AI,讓 AI 只在自己最擅長的環(huán)節(jié)做事,這樣一來,只要有一個人成功,那么其他人不需要結(jié)構(gòu)化能力,也能夠達到同樣的效果?!?/p>
第三個階段,在今天早上看到了黎明,就是以 Manus 為代表的通用 Agent。拆解工作流這個環(huán)節(jié),也讓 AI 替代,用戶又回到了簡單的問答模式。但問題簡單,AI 執(zhí)行的過程并不簡單,通用 Agent 能夠按照工作流的方式,高質(zhì)量完成問題,讓產(chǎn)出結(jié)果,達到可用狀態(tài)。
如果說過去 AI 大模型的火爆,大多數(shù)人只能湊個熱鬧的話,毫無疑問,通用 Agent 是讓所有普通人,也能夠在具體工作中,用上易用的 AI,解決真實世界的實際問題。只有解決實際問題,AI 對于生產(chǎn)力和生產(chǎn)關(guān)系的變革,才會真正來臨?!?/p>
在 Manus 開發(fā)團隊的介紹中,Manus 被稱為“多智能體系統(tǒng)”?!?/p>
![]()
什么是“多智能體系統(tǒng)”?其實就是一個系統(tǒng)里面,集成了多個大模型,然后由一個調(diào)度中心,根據(jù)不同的任務(wù),調(diào)用最合適的大模型。
幾家頭部大模型公司,都在不斷推出更強的 AI 大模型,前一天某個大模型剛剛登頂?shù)谝?,轉(zhuǎn)天就被下一個大模型超越,城頭變幻大王旗,你方唱罷我登場。
但是,單純的堆參數(shù)和跑分,其實與真實使用,還是有很大的差距。實際上,每一家的大模型,都有自己所擅長的領(lǐng)域,比如 Claude 極為擅長編碼、DeepSeek 的推理模型對于中文的控制很強、豆包大模型對于語音識別獨步世界、可靈的視頻模型非常領(lǐng)先?!?/p>
既然短期之內(nèi),很難有樣樣都強的“水桶模型”,那何不根據(jù)任務(wù)的實際情況,讓大模型協(xié)作起來,讓他們只做自己擅長的工作?這便是“多智能體”思路的來源?!?/p>
事實上,在之前的探索和嘗試中,就有過這樣的先例?!?/p>
前不久,Berkeley 伯克利搞了只有 7B 參數(shù)的小模型,在 Arena 全球模型排行中拿到了 1400 分,這個分數(shù),用了 20 萬張顯卡訓練的 Gork3,就也才剛達到這個水平?!?/p>
這個 7B 的小模型,其實就是一個分類器,它只做一件事,就是把用戶發(fā)給他的提問,進行分類篩選,然后去指揮 GPT、Gemini、DeepSeek 這些"大模型"干活,堪稱 AI 屆的牛馬領(lǐng)導。
![]()
這其實也是 Manus 的邏輯,通過一個超強的分類系統(tǒng),集合擅長不同領(lǐng)域的大模型,一起處理,最大限度解決用戶的實際問題?!?/p>
AGI 的未來,一定不是單一模型一統(tǒng)天下,而是做好分工,融匯貫通。本質(zhì)上,現(xiàn)代公司的組織結(jié)構(gòu),就是在構(gòu)建如同機器一般的協(xié)作結(jié)構(gòu),指望一個 AI 來完成所有工作,無異于指望一個員工就撐起整個公司?!?/p>
這不是營銷號那種無腦亂吹,而是邏輯推理后的判斷?!?/p>
邏輯是兩個:
1.中國有無窮多的應(yīng)用場景和商業(yè)模式的積累,首先,AI 只有落地應(yīng)用才有真正的價值,其次,最開始的 AI 可能誕生于實驗室,但只有真實實踐中,才能創(chuàng)造越來越強的 AI。
2.幾十年辛苦播種,今朝終于開花結(jié)果。國民基礎(chǔ)教育,縱觀歷史幾千年,從未有過現(xiàn)在的高度和深度。而 AI 的根本,依然是人才,經(jīng)過幾十年的基礎(chǔ)教育,中國的人才密度,已經(jīng)超越世界上大多數(shù)國家,完全能和美國掰一掰手腕。
很多事情,都是量變引發(fā)質(zhì)變的結(jié)果?!?/p>
2022 年底,ChatGPT 橫空出世,驚爆世界。同時,這也意味著,AI 技術(shù)的大模型路線,完全替代了過去規(guī)則算法和知識圖譜的 AI 路線?!?/p>
中國嘩然,大洋彼岸的美國,在 AI 軍備競賽上,居然領(lǐng)先這么多。當時,大多數(shù)人對于中國的 AI 發(fā)展持悲觀態(tài)度,算力顯卡、技術(shù)封鎖,中國 AI 技術(shù)的前途,確實陰晴不定?!?/p>
但站在 2025 年早春,這種陰霾已經(jīng)一掃而光,中國 AI 的發(fā)展全球矚目,代表基座大模型能力的 DeepSeek 讓世界側(cè)目,如今,在應(yīng)用層大放光芒的 Manus,同樣來源于中國?!?/p>
Manus 背后的創(chuàng)始人肖弘,是華中科技大學 2015 屆畢業(yè)生,在之前創(chuàng)業(yè)做過「壹伴助手」和「微伴助手」。
這個團隊還有一款更知名的產(chǎn)品,就是去年火爆全網(wǎng)的 AI 助手 Monica。這是一款瀏覽器插件起家的 AI 應(yīng)用,通過非常敏銳的需求洞察,讓用戶在瀏覽器中,使用 GPT 4o、DeepSeek R1、Claude 3.7 等模型,進行一些非常具體的工作?!?/p>
![]()
有人說這是套殼 AI,可 Monica 的理念,就是將 AI 前沿技術(shù),找到應(yīng)用層的落地方式,實現(xiàn) AI 的真正落地。極致的套殼,同樣也是牛?!在這樣的理念下,這支團隊,又搓出了 Manus?!?/p>
我們很欣喜地看到,Manus 的出現(xiàn),是讓普通人也用好 AI 的又一個大進步?!?/p>
我下午看到,有不少人對于 Manus 的指責,指責 Manus 在宣傳和推廣方面的積極,認為 Manus 所謂的超強能力,是在營銷,想要成為下一個 DeepSeek?!?/p>
但事實上,Manus 和 DeepSeek 本身就是兩個不同的產(chǎn)品,一個專注于更好的落地應(yīng)用,一個專注于基礎(chǔ)模型的技術(shù)突破,這都很有價值。我想起在我在幾年前寫過的一句話:
科學普及與科技創(chuàng)新同等重要?!?/p>
這只是一個理念,只是一個起點,保持謙遜,多往前看?!?/p>
![]()
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論