Langbase調(diào)查了3400多位專業(yè)人士(100多個(gè)國家),職業(yè)包括C級(jí)高管(46%)、工程師(26%)、客戶支持(17%)、MKT(8%)。報(bào)告鏈接https://langbase.com/state-of-ai-agents
![]()
具體內(nèi)容如下:
1、誰在采用AI Agent?
LangChain調(diào)查顯示:約有51%的受訪者已經(jīng)在生產(chǎn)環(huán)境中采用了AI Agent;78%的受訪者計(jì)劃在近期將AI Agent引入生產(chǎn)應(yīng)用。
按規(guī)???,員工人數(shù)為100-2000的中型企業(yè)最為積極,采用率達(dá)到63%;按行業(yè)看,90%的非科技公司已經(jīng)部署或計(jì)劃部署AI Agent,這與科技公司(89%)旗鼓相當(dāng)。
![]()
Langbase調(diào)查顯示:目前,AI(非AI Agent)的實(shí)驗(yàn)用途比例遠(yuǎn)遠(yuǎn)大于生產(chǎn)用途,雖然后者在穩(wěn)步增加中。
![]()
2、AI Agent基座大模型哪家強(qiáng)?
Langbase調(diào)查顯示:OpenAI(76%)占據(jù)主導(dǎo)地位;谷歌(59%)正迅速崛起,成為其強(qiáng)勁的競(jìng)爭(zhēng)對(duì)手;Anthropic(47%)緊隨其后。Meta的Llama、Mistral和Cohere影響力不高,但增長(zhǎng)勢(shì)頭不容忽視。
![]()
各家大模型的采用情況如下:
OpenAI在技術(shù)和營銷應(yīng)用處于領(lǐng)先地位,同時(shí)也是翻譯能手;
Google在健康和翻譯領(lǐng)域表現(xiàn)相當(dāng)出色,展示其在語言和醫(yī)學(xué)領(lǐng)域的強(qiáng)大實(shí)力;
Anthropic是處理技術(shù)任務(wù)的高手,但在營銷和翻譯方面的使用率較低;
Mistral在技術(shù)和科學(xué)領(lǐng)域表現(xiàn)不錯(cuò),不過是個(gè)偏科生;
Meta被廣泛應(yīng)用于技術(shù)和科學(xué)領(lǐng)域;
Cohere在多個(gè)領(lǐng)域的齊頭并進(jìn)。
![]()
3、選擇AI Agent基座大模型受哪些因素影響?
Langbase調(diào)查顯示,準(zhǔn)確性(45%)是最重要的因素,其次是安全性(24%)和可定制性(21%),成本(10%)影響相對(duì)較小。(注:與“企業(yè)采用AI Agent有何顧慮”基本一致)
![]()
4、企業(yè)在哪些場(chǎng)景采用AI Agent?
LangChain調(diào)查顯示:研究與總結(jié)(58%)、個(gè)人生產(chǎn)力工具(53.5%)、客戶服務(wù)(45.8%)。
![]()
該結(jié)果顯示——人們希望將耗時(shí)任務(wù)交給AI Agent。
知識(shí)過濾器:AI Agent能夠快速提煉關(guān)鍵信息。在文獻(xiàn)綜述或研究分析中,人們無需自己手動(dòng)篩選海量數(shù)據(jù);
生產(chǎn)力加速器:AI Agent可以協(xié)助安排日程、管理任務(wù),提升個(gè)人效率,讓人們專注于更重要的工作;
客服神助攻:AI Agent幫助企業(yè)更快地處理客戶咨詢、解決問題,大幅提升團(tuán)隊(duì)的響應(yīng)速度。
Langbase調(diào)查顯示:自動(dòng)化、簡(jiǎn)化是企業(yè)采用AI的首要目標(biāo),其在效率和流程簡(jiǎn)化方面受益;定制化解決方案、提升協(xié)作能力則反映了大模型日益增長(zhǎng)的靈活性,以及消費(fèi)者對(duì)系統(tǒng)共享訪問的興趣。
![]()
在具體場(chǎng)景上,Langbase調(diào)查顯示:
AI大模型在軟件開發(fā)(87%)應(yīng)用最廣泛;
其次是文本摘要(59%)、市場(chǎng)營銷(50%)、IT運(yùn)營(48%)、客服(43%);
最后是人力資源(26%)、法律合規(guī)(15%)等領(lǐng)域。
值得注意的是,該結(jié)果與上述LangChain的調(diào)查有些出入。主要原因是——Langbase的提問方式是AI大模型,而非AI Agent。
![]()
5、在生產(chǎn)中采用AI Agent存在哪些顧慮?
LangChain調(diào)查顯示,性能質(zhì)量(41%)是首要關(guān)注點(diǎn),其重要性遠(yuǎn)超成本(18.4%)和安全(18.4%)等因素。
![]()
AI Agent依賴LLM“黑盒”控制工作流程,這會(huì)帶來不可預(yù)測(cè)性,增加出錯(cuò)風(fēng)險(xiǎn)。因此,團(tuán)隊(duì)難以確保其Agent 能否始終提供準(zhǔn)確、符合上下文的響應(yīng)。
對(duì)于小企業(yè)而言,性能質(zhì)量尤其重要——45.8%的小企業(yè)將性能質(zhì)量列為主要關(guān)注點(diǎn),而成本因素僅為 22.4%。
對(duì)于必須遵守法規(guī),要敏感地處理客戶端數(shù)據(jù)的中大型企業(yè)來說,安全問題也很普遍,超過了成本因素。
![]()
除了上述因素,LangChain在書面回復(fù)中發(fā)現(xiàn),團(tuán)隊(duì)還面臨知識(shí)、時(shí)間難題。
知識(shí)不足:許多團(tuán)隊(duì)缺乏構(gòu)建和部署 AI Agent的專業(yè)技能,特別是在特定應(yīng)用場(chǎng)景下的實(shí)現(xiàn)。員工們還要苦練專業(yè)技能,以高效利用AI Agent。
時(shí)間有限:構(gòu)建可靠的AI Agent需要投入大量時(shí)間成本,包括調(diào)試、評(píng)估和模型微調(diào)等環(huán)節(jié)。
Langbase調(diào)查顯示:復(fù)雜的擴(kuò)展和部署過程是阻礙采用的首要問題;其次是數(shù)據(jù)隱私和安全合規(guī)性;缺乏監(jiān)控工具、高昂的基礎(chǔ)設(shè)施成本也阻礙了技術(shù)的落地應(yīng)用。
![]()
6、AI Agent開發(fā)相關(guān)問題有哪些?
Langbase調(diào)查顯示:在生產(chǎn)環(huán)境中部署LLM和AI Agent面臨關(guān)鍵挑戰(zhàn),包括定制化難度高、缺乏用于質(zhì)量保證的評(píng)估方法,可重復(fù)使用的基礎(chǔ)設(shè)施不足。碎片化工具、集成問題以及可擴(kuò)展性限制進(jìn)一步加劇困難,突顯出構(gòu)建簡(jiǎn)化流程和強(qiáng)大支持工具的必要性。
![]()
開發(fā)者將AI Agent的版本控制視為開發(fā)平臺(tái)最重要的功能。強(qiáng)大的SDK、庫生態(tài)系統(tǒng)、本地開發(fā)環(huán)境也受到關(guān)注。
![]()
大多數(shù)受訪者需要多代理RAG能力以提高上下文信息處理;評(píng)估工具對(duì)于確保AI系統(tǒng)按預(yù)期工作同樣很重要;多代理流水線也是在生產(chǎn)中實(shí)現(xiàn)復(fù)雜任務(wù)的關(guān)鍵技術(shù)。
![]()
7、對(duì)AI Agent有哪些展望?
LangChain調(diào)查顯示:企業(yè)在采用AI Agent,既有新的期待,也會(huì)面臨持續(xù)的挑戰(zhàn)。
新的期待:
處理多步驟任務(wù):AI Agent具備更深入的推理和上下文理解能力,能夠應(yīng)對(duì)復(fù)雜任務(wù)。
自動(dòng)化重復(fù)性任務(wù):AI Agent被視為自動(dòng)化日常任務(wù)的關(guān)鍵工具,釋放人力投入更具創(chuàng)造性的工作。
任務(wù)分配與協(xié)作:優(yōu)化任務(wù)分配,確保合適的Agent在正確的時(shí)間處理特定問題,尤其在多Agent系統(tǒng)中。
類人推理能力:不同于LLMs,AI Agent能追溯并優(yōu)化自己的決策,根據(jù)新信息調(diào)整策略,類似人類的思考過程。
![]()
主要挑戰(zhàn):
Agent的黑盒機(jī)制:工程師發(fā)現(xiàn),他們很難向團(tuán)隊(duì)和利益相關(guān)者解釋 AI Agent 的功能和行為。盡管可視化步驟有助于理解到底發(fā)生了什么,但 LLM 的內(nèi)部機(jī)制仍然是個(gè)黑盒,增加了解釋的難度。
重點(diǎn)關(guān)注:
對(duì)開源AI Agent的興奮:許多人對(duì)開源AI Agent 表現(xiàn)出濃厚興趣,認(rèn)為集體智慧能加速創(chuàng)新。
期待更強(qiáng)大的模型:大家期待更高級(jí)的 AI Agent,由更強(qiáng)大的模型驅(qū)動(dòng),以更高的效率和自主性處理復(fù)雜任務(wù)。
![]()
結(jié)語
從企業(yè)的采用意愿來看,2025年或?qū)⒊蔀锳I Agent的爆發(fā)元年。
從爆發(fā)領(lǐng)域來看,軟件開發(fā)、客戶服務(wù)、市場(chǎng)營銷等領(lǐng)域?qū)⒙氏扰艹龇N子選手。目前已知的就包括編程神器Cursor、AI Coding“鼻祖”Replit等等。
值得關(guān)注的是,這兩份報(bào)告均揭示出當(dāng)前AI Agent落地的最大難點(diǎn)——準(zhǔn)確性,甚至連成本因素都名列二、三位。
一個(gè)辦法是等待“至尊”大模型出現(xiàn),但這取決于巨頭們的能力邊界。而在某種程度上,AI Agent的出現(xiàn)本身就是為了解決LLM在具體應(yīng)用場(chǎng)景中的局限性。因此,開發(fā)者需要盡可能地在記憶、規(guī)劃、工具使用等其他技術(shù)棧下功夫。
如果不能迅速實(shí)現(xiàn),我們也可以換個(gè)思路:短期內(nèi)商業(yè)化成功的AI Agent,不一定是看起來“代理化”程度最高的產(chǎn)品;而是能夠平衡性能、可靠性,以及用戶信任的產(chǎn)品。
換句話說,如果做不到完全自主,開發(fā)者需要從一開始考慮如何將人類員工融入其中,做到準(zhǔn)確性萬無一失。
正如吳恩達(dá)的觀點(diǎn),形容詞“Agentic”比名詞“Agent”能更好地幫助我們理解這類智能體的本質(zhì)。如同自動(dòng)駕駛汽車L1-L4,Agent的進(jìn)化也是一個(gè)過程。或許,一個(gè)確定的趨勢(shì)是先擁有AI Copilot,再擁有AI Agent。只不過,Copilot這個(gè)詞的存在感可能會(huì)降低,轉(zhuǎn)而被“少量Agentic能力”代替。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論