重要的是,基于DeepSeek-R1的browser-use 等很多智能體實(shí)操案例已經(jīng)證明,DeepSeek能夠有效降低部署AI Agent的門檻,能夠大幅提升AI Agent性能和效率,增強(qiáng)場景適應(yīng)能力。

在LLM Based AI Agent亟待落地的當(dāng)下,一個高效且性價比可觀的大模型對于智能體的重要性可想而知。可以預(yù)見,接下來DeepSeek-R1等強(qiáng)化學(xué)習(xí)類大模型,將會極大地提升智能體的構(gòu)建與應(yīng)用效率,進(jìn)一步加速AI Agent的落地應(yīng)用。

當(dāng)然,在智能體成為AI應(yīng)用主旋律的當(dāng)下,春節(jié)前后更精彩的仍然是AI Agent行業(yè),產(chǎn)品研發(fā)與生態(tài)擴(kuò)建方面全球技術(shù)廠商都在馬不停蹄。

谷歌于 2024 年 12 月發(fā)布了全新多模態(tài)大模型Gemini 2.0,其性能全面提升,支持圖片、視頻和音頻等多模態(tài)輸入與輸出?;贕emini 2.0架構(gòu),谷歌推出了三個新的AI智能體原型:通用大模型助手Project Astra、瀏覽器助手Project Mariner和編程助手Jules。其中,編程助手Jules能夠直接集成到GitHub的工作流程系統(tǒng)中,分析復(fù)雜代碼庫并實(shí)施修復(fù)。

微軟于2024年10月宣布在Dynamics 365中集成10個自主AI Agent,這些智能體能夠自動執(zhí)行客服、銷售、財務(wù)、倉儲等業(yè)務(wù)流程。這些AI Agent支持 OpenAI的o1模型,具備自主學(xué)習(xí)能力,可以自動執(zhí)行跨平臺的超復(fù)雜業(yè)務(wù)。例如,美國著名電信公司Lumen通過AI Agent每年能節(jié)省5000萬美元成本,相當(dāng)于增加了 187 名全職勞動力。

OpenAI在2025年1月24日發(fā)布了其首款A(yù)I Agent——Operator,該系統(tǒng)能夠自動執(zhí)行各種復(fù)雜操作,包括編寫代碼、預(yù)訂旅行、自動電商購物等。2月2日正式推出面向深度研究領(lǐng)域的智能體產(chǎn)品深度研究(Deep research)功能。該功能可在5-30分鐘完成專業(yè)報告,支持多領(lǐng)域高強(qiáng)度知識工作者,由o3模型提供支持,通過端到端強(qiáng)化學(xué)習(xí)訓(xùn)練,由四模塊協(xié)同工作,已在ChatGPT上線,未來計劃擴(kuò)展數(shù)據(jù)源和結(jié)合Operator執(zhí)行復(fù)雜任務(wù)。

Anthropic于2025 年 1 月發(fā)布了Agent最佳實(shí)踐指南,旨在提升AI Agent在多個應(yīng)用場景下的效率和靈活性。還計劃在2025年推出智能體“AI同事”(virtual collaborator),能夠編寫和測試代碼。其旗艦產(chǎn)品Claude 3.5 Sonnet升級版在OSWorld測試中電腦使用能力得分為AI模型中首位。

在國內(nèi),阿里云通義千問也于1月29日上線了超大規(guī)模的MoE模型Qwen2.5-Max。該模型預(yù)訓(xùn)練數(shù)據(jù)超過20萬億tokens,在多個基準(zhǔn)測試中表現(xiàn)優(yōu)異,整體性能優(yōu)于DeepSeek V3。

通義千問還開源了全新的視覺模型Qwen2.5-VL,推出3B、7B和72B三個尺寸版本。Qwen2.5-VL和2.5MAX不僅在性能上取得了顯著提升,而且在AI Agent尤其是computer use方面展現(xiàn)出了強(qiáng)大的應(yīng)用潛力。例如,Qwen2.5-VL能夠直接作為視覺Agent進(jìn)行操作,推理并動態(tài)使用工具,支持在計算機(jī)和手機(jī)上完成多步驟的復(fù)雜任務(wù),例如自動查詢天氣、預(yù)訂機(jī)票、發(fā)送消息等。

各大科技公司都在用快速迭代的產(chǎn)品與解決方案,對外彰顯其在AI Agent領(lǐng)域發(fā)展的絕對速度。從目前各領(lǐng)域的表現(xiàn)來看,2025年這個AI Agent商業(yè)化應(yīng)用元年,智能體的落地應(yīng)用比大家想象的要快得多,預(yù)示著AI Agent技術(shù)即將迎來爆發(fā)式增長,當(dāng)然競爭也更為激烈。

這種情況下,自然會有很多朋友想要快速認(rèn)知與掌握AI Agent。而了解一個行業(yè)最快的方式,莫過于先從閱讀各種各種行業(yè)研報資料開始。

為了幫助大家更好地了解、學(xué)習(xí)與應(yīng)用AI Agent,在2025年春節(jié)假期歸來開工的第一天,王吉偉頻道精心準(zhǔn)備了10份智能體行業(yè)研報。

這些研報涵蓋了AI Agent的最新技術(shù)進(jìn)展、應(yīng)用場景、行業(yè)趨勢以及面臨的挑戰(zhàn)等多個方面,旨在為大家提供全面、深入的參考。無論是企業(yè)決策者、技術(shù)開發(fā)者還是對AI Agent感興趣的讀者,都可以從這些研報中獲取有價值的信息,把握AI Agent帶來的發(fā)展機(jī)遇。

 

報告1:谷歌《Agents》白皮書

該白皮書探討了生成式人工智能(Generative AI)模型如何通過使用外部工具來擴(kuò)展其功能,從而形成所謂的Agents(智能體)。詳細(xì)介紹了Agents的定義、認(rèn)知架構(gòu)、關(guān)鍵組件、工具使用、以及如何通過這些工具和架構(gòu)來增強(qiáng)模型性能和實(shí)現(xiàn)生產(chǎn)應(yīng)用。

它首先闡明了Agent區(qū)別于單純模型的關(guān)鍵在于其能夠利用工具訪問外部信息,并進(jìn)行自主推理和行動規(guī)劃,而非僅僅依賴訓(xùn)練數(shù)據(jù)進(jìn)行單次預(yù)測。

白皮書詳細(xì)介紹了Agent的三個核心組成部分:模型(Language Model)、工具(Extensions, Functions, Data Stores)和編排層(Orchestration Layer)。編排層利用各種推理框架(如ReAct, Chain-of-Thought, Tree-of-Thoughts)指導(dǎo)Agent的決策過程。工具則賦予Agent與外部世界交互的能力:Extensions連接Agent與API,F(xiàn)unctions允許客戶端控制API調(diào)用,Data Stores則提供對外部數(shù)據(jù)的訪問,支持RAG等應(yīng)用。

最后介紹了在LangChain和Vertex AI平臺上構(gòu)建和部署Agent的方法,并討論了如何通過各種學(xué)習(xí)方法(如上下文學(xué)習(xí)、基于檢索的上下文學(xué)習(xí)和微調(diào))提升模型性能??偠灾?,該白皮書旨在系統(tǒng)性地講解生成式AI Agent的原理、架構(gòu)和應(yīng)用實(shí)踐,為開發(fā)者提供構(gòu)建更強(qiáng)大、更靈活的AI系統(tǒng)的指導(dǎo)。

對于希望了解或構(gòu)建Agents系統(tǒng)的朋友來說,是一份非常有價值的資源,推薦詳細(xì)研讀。

報告2:Anthropic《Building effective agents》

《Building effective agents》深入探討了構(gòu)建大型語言模型(LLM)Agent的實(shí)踐經(jīng)驗(yàn)與洞見。文章開篇對“Agent”一詞進(jìn)行了明確界定,并細(xì)致區(qū)分了工作流(Workflow)與Agent在架構(gòu)上的不同之處。

工作流指的是對LLM和工具的預(yù)定義流程進(jìn)行編排,而Agent則賦予了LLM動態(tài)調(diào)控其流程及工具使用的靈活性。還分析了在何種情境下以及如何有效運(yùn)用Agent系統(tǒng),并著重指出,在應(yīng)用構(gòu)建過程中,應(yīng)優(yōu)先采用最簡潔的方案,并根據(jù)實(shí)際需求逐步引入復(fù)雜功能。

文章深入探討了幾種構(gòu)建Agent的常見模式,包括增強(qiáng)型LLM、提示鏈(Prompt Chaining)、路由(Routing)、并行化(Parallelization)、指揮者-工作者(Orchestrator-Workers)和評估器-優(yōu)化器(Evaluator-Optimizer)等,并強(qiáng)調(diào)了簡潔性、透明度和周全的工具文檔和測試的重要性。

這些模式旨在指導(dǎo)開發(fā)者構(gòu)建高效、可靠且易于維護(hù)的Agent系統(tǒng),而非追求過度復(fù)雜的系統(tǒng)。文章還提供了在客戶支持和編碼領(lǐng)域使用Agent的實(shí)際案例,并附錄中詳細(xì)說明了工具的提示工程技巧,以幫助開發(fā)者創(chuàng)建更有效的Agent-計算機(jī)接口 (ACI)。

此外,文章介紹了多種框架,這些框架雖然簡化了實(shí)現(xiàn)過程,但也可能帶來額外的抽象層,影響調(diào)試。因此,文章建議開發(fā)者直接使用LLM API,并在必要時使用框架,同時確保理解底層代碼。最終目標(biāo)是確保Agent系統(tǒng)的設(shè)計保持簡潔,優(yōu)先考慮透明度,并通過工具文檔和測試精心設(shè)計Agent-計算機(jī)接口(ACI)。

《Building effective agents》報告能夠?yàn)閷I Agent感興趣的讀者提供了全面且實(shí)用的指導(dǎo)。它不僅解釋了AI Agent的核心概念和構(gòu)建方法,還通過實(shí)際案例和建議,幫助讀者更好地理解和應(yīng)用這些技術(shù)。對于希望深入了解和構(gòu)建LLM Agent的讀者來說,這份報告是一份不可多得的參考資料。

報告3:LangChain《State of AI Agents》

報告通過調(diào)查超過1300名專業(yè)人士,揭示了2024年AI Agent的使用現(xiàn)狀,包括它們在不同行業(yè)中的應(yīng)用情況、主要用途、面臨的挑戰(zhàn)以及未來的發(fā)展趨勢。

該報告將AI Agent的定義為使用大型語言模型(LLM)來決定應(yīng)用程序控制流的系統(tǒng)。探討了了不同類型的Agent框架,如ReAct、多Agent編排器和LangGraph等,這些框架在業(yè)界獲得了廣泛的關(guān)注。提到了AI Agent在不同行業(yè)中的應(yīng)用,以及它們在處理研究、總結(jié)、個人生產(chǎn)力任務(wù)、客戶服務(wù)等方面的具體用途。

報告發(fā)現(xiàn),超過一半的受訪者正在生產(chǎn)環(huán)境中使用人工智能Agent,而絕大多數(shù)受訪者計劃在不久的將來部署AI Agent。主要的應(yīng)用案例包括信息研究和總結(jié)以及提高個人生產(chǎn)力,而客戶服務(wù)也是一個重要的領(lǐng)域。報告強(qiáng)調(diào)了追蹤和可觀察性工具以及人工監(jiān)督在控制AI Agent風(fēng)險方面的重要性,并指出性能質(zhì)量是部署AI Agent的最大障礙。

最后,報告分析了Cursor、Perplexity和Replit等成功的案例,并探討了多步驟任務(wù)管理、重復(fù)性任務(wù)自動化以及AI Agent的協(xié)作等新興主題。報告調(diào)查顯示,不同規(guī)模的公司在AI Agent的控制和優(yōu)先事項(xiàng)方面存在差異,大型企業(yè)更注重安全性和合規(guī)性,而小型公司更關(guān)注追蹤和理解結(jié)果。

《LangChain AI Agent 狀態(tài)報告》提供了關(guān)于AI Agent現(xiàn)狀的全面概述,并深入探討了其應(yīng)用場景、挑戰(zhàn)和未來趨勢。對于希望了解AI Agent技術(shù)并在實(shí)際中部署相關(guān)應(yīng)用的讀者來說,具有很高的參考價值。

報告4:Langbase 《2024 State of AI Agents》

Langbase Research《 State of AI Agents》基于3400多位來自100多個國家的開發(fā)者的反饋,總結(jié)了AI智能體領(lǐng)域的最新趨勢。報告描繪了AI技術(shù)在2024年的新高峰,以及開發(fā)者如何利用不同大型語言模型(LLM)提供商構(gòu)建AI Agent,并探討了在工作流程中采用AI Agent所面臨的挑戰(zhàn)和目標(biāo)。

研究旨在了解AI Agent在2024年的發(fā)展情況,包括開發(fā)者如何使用不同的LLM提供商服務(wù),以及在實(shí)際應(yīng)用中遇到的挑戰(zhàn)和目標(biāo)。研究還探討了AI在不同行業(yè)和公司規(guī)模中的應(yīng)用情況,以及開發(fā)者對于AI開發(fā)平臺的偏好。

報告揭示了OpenAI在LLM提供商中占據(jù)主導(dǎo)地位,但Google和Anthropic緊隨其后;不同LLM提供商在不同行業(yè)應(yīng)用中各有優(yōu)勢??蓴U(kuò)展性復(fù)雜性和數(shù)據(jù)隱私是阻礙AI智能體廣泛應(yīng)用的兩大主要因素,而準(zhǔn)確性是開發(fā)者選擇LLM時的首要考慮因素。

報告還指出,自動化和簡化是企業(yè)采用AI技術(shù)的首要目標(biāo),軟件開發(fā)是LLM最主要的應(yīng)用領(lǐng)域。最后,報告強(qiáng)調(diào)了開發(fā)者對可定制的AI開發(fā)平臺和工具的需求,以及對版本控制和SDK生態(tài)系統(tǒng)的重視。

對于希望了解AI Agent技術(shù)的讀者來說,這是一份非常有價值的參考資料,可以幫助大家更好地了解市場動態(tài)和技術(shù)發(fā)展方向。

報告5:Insight Partners 《The state of the AI Agents ecosystem: The tech, use cases, and economics》

這份Insight Partners撰寫的報告探討了AI Agent生態(tài)系統(tǒng)的現(xiàn)狀、應(yīng)用案例和經(jīng)濟(jì)模式?;趯?gòu)建者、企業(yè)和研究人員的訪談,分析了AI Agent在企業(yè)架構(gòu)中的實(shí)際部署情況,討論了不同使用案例的復(fù)雜性、購買特定功能Agent與構(gòu)建自定義Agent工作流之間的權(quán)衡,以及價值衡量和歸屬的多樣性

報告首先定義了AI Agent,并闡述了其架構(gòu)設(shè)計中的關(guān)鍵考量,特別是人機(jī)協(xié)同循環(huán)和任務(wù)規(guī)劃策略。接著,報告深入分析了AI Agent的參考架構(gòu),包括數(shù)據(jù)檢索(RAG、記憶、長上下文)、Agent計算機(jī)接口(函數(shù)/工具調(diào)用、計算機(jī)使用、集成)以及性能評估和安全防護(hù)(Guardrails)。

報告對AI Agent進(jìn)行了類型劃分,包括垂直Agent、水平Agent平臺、多模態(tài)Agent和經(jīng)典SaaS的Agent接口。報告還繪制了AI Agent市場圖譜,指出了基礎(chǔ)設(shè)施和垂直化平臺的機(jī)遇,并探討了構(gòu)建與購買AI Agent的決策考量,以及新興的定價模式(平臺+雇傭Agent、平臺+結(jié)果導(dǎo)向定價、純結(jié)果導(dǎo)向定價)。

最后,報告總結(jié)了企業(yè)和構(gòu)建者在AI Agent部署和發(fā)展中面臨的挑戰(zhàn)和最佳實(shí)踐,強(qiáng)調(diào)了合規(guī)性、數(shù)據(jù)準(zhǔn)備、可靠性、ROI衡量、文化融合等重要方面。

報告認(rèn)為,AI Agent的研究難點(diǎn)在于理解AI Agent的復(fù)雜性,包括它們?nèi)绾为?dú)立推理和行動,以及如何將它們集成到現(xiàn)有的企業(yè)系統(tǒng)中。研究者需要評估不同使用案例的復(fù)雜性,并確定在購買特定功能Agent與構(gòu)建自定義Agent工作流之間的最佳權(quán)衡點(diǎn)。衡量和歸屬價值的多樣性也是一大挑戰(zhàn),因?yàn)椴煌钠髽I(yè)可能有不同的評價標(biāo)準(zhǔn)和業(yè)務(wù)目標(biāo)。

這份報告旨在為企業(yè)和AI Agent構(gòu)建者提供對AI Agent生態(tài)系統(tǒng)全面而深入的理解,并為其發(fā)展戰(zhàn)略提供指導(dǎo)。不僅分析了 AI Agent 的技術(shù)細(xì)節(jié),還深入探討了企業(yè)在部署 AI Agent 時需要考慮的實(shí)際問題,并為構(gòu)建者提供了有價值的建議,推薦仔細(xì)研讀。

報告6:infoQ《中國 Al Agent應(yīng)用研究報告》

InfoQ研究中?發(fā)布的《2024年中國AI Agent應(yīng)用研究報告》,深入分析了AI Agent在中國的市場發(fā)展背景、特征、應(yīng)用案例以及未來趨勢。報告基于技術(shù)專利數(shù)量、技術(shù)發(fā)展時間、技術(shù)輿論指數(shù)等指標(biāo),結(jié)合市場規(guī)模與融資事件等資料,繪制了2024年中國AI Agent應(yīng)用的成熟度模型,并探討了AI Agent在不同領(lǐng)域的應(yīng)用現(xiàn)狀與未來發(fā)展方向。

報告聚焦2024年第二季度中國AI Agent應(yīng)用的研究。報告首先分析了AI Agent市場的背景和特征,以及當(dāng)下中國人工智能的技術(shù)成熟度模型,其中特別強(qiáng)調(diào)了AI Agent作為連接大模型和應(yīng)用層的橋梁作用。

報告深入探討了AI Agent的市場趨勢,包括單/多智能體協(xié)同發(fā)展、通用技術(shù)框架、典型應(yīng)用場景(生活類、企業(yè)專業(yè)類)以及不同廠商的產(chǎn)品策略(大模型創(chuàng)業(yè)廠商、互聯(lián)網(wǎng)科技廠商、RPA廠商、數(shù)字化企業(yè)服務(wù)商)。還展望了AI Agent未來的發(fā)展趨勢,例如大模型能力提升、工具生態(tài)完善、多智能體協(xié)同,以及終端智能體(手機(jī)、電腦等)的興起將帶來的變革。

報告指出,AI Agent作為連接模型層與應(yīng)用層的重要補(bǔ)充,正逐漸深入復(fù)雜任務(wù),并在多個行業(yè)場景中展現(xiàn)出應(yīng)用潛力。報告基于技術(shù)專利數(shù)量、技術(shù)發(fā)展時間、技術(shù)輿論指數(shù)等核心指標(biāo),結(jié)合市場規(guī)模與融資事件等公開資料,以及技術(shù)和市場專家的驗(yàn)證,繪制了中國人工智能成熟度模型,并對AI Agent的市場特征、應(yīng)用場景、產(chǎn)品發(fā)展、盈利模式等進(jìn)行了詳細(xì)探討。

《2024年中國AI Agent應(yīng)用研究報告》是一份極具前瞻性和深度的研究報告,對于關(guān)注人工智能技術(shù)發(fā)展、尤其是AI Agent應(yīng)用的從業(yè)者、企業(yè)決策者、技術(shù)愛好者以及相關(guān)領(lǐng)域的研究人員來說,具有很高的參考價值。

報告7:愛分析《2024愛分析·AI Agent 應(yīng)用實(shí)踐報告》

《2024愛分析·AI Agent 應(yīng)用實(shí)踐報告》由愛分析撰寫,旨在探討AI Agent在企業(yè)中的應(yīng)用現(xiàn)狀、市場洞察以及未來發(fā)展趨勢。

報告首先概述了AI Agent的核心能力——獨(dú)立思考、自主執(zhí)行、持續(xù)迭代,以及其在市場中的興起和企業(yè)落地的主要挑戰(zhàn):“落地難”和“應(yīng)用難”。

核心內(nèi)容聚焦于數(shù)據(jù)分析AI Agent和AI Agent開發(fā)管理平臺這兩個特定市場,分別分析了其落地實(shí)施的關(guān)鍵要點(diǎn)和成功案例,例如城商行利用數(shù)據(jù)分析AI Agent提升數(shù)據(jù)分析效率,飛鶴利用AI Agent開發(fā)管理平臺推進(jìn)數(shù)字化轉(zhuǎn)型。

報告指出,AI Agent作為能夠感知環(huán)境、基于目標(biāo)進(jìn)行決策并執(zhí)行動作的智能化應(yīng)用,隨著大模型能力的增強(qiáng)和相關(guān)技術(shù)的成熟,其能力得到了質(zhì)的飛躍。報告強(qiáng)調(diào)了AI Agent在企業(yè)中的三個核心能力:獨(dú)立思考、自主執(zhí)行、持續(xù)迭代,并分析了企業(yè)在落地AI Agent項(xiàng)目時面臨的挑戰(zhàn)。

報告還特別關(guān)注了數(shù)據(jù)分析AI Agent市場和AI Agent開發(fā)管理平臺市場,提供了市場洞察和案例分析,為企業(yè)提供策略指導(dǎo)和實(shí)踐洞見。

該報告不僅分析了AI Agent的技術(shù)和應(yīng)用,更深入探討了企業(yè)在落地AI Agent時面臨的挑戰(zhàn)和應(yīng)對策略。報告強(qiáng)調(diào)了企業(yè)應(yīng)從自身特性出發(fā),建立AI Agent與新質(zhì)生產(chǎn)力、數(shù)據(jù)要素的內(nèi)在聯(lián)系,實(shí)現(xiàn)價值升華,并建立AI文化。該報告適合企業(yè)決策者、IT負(fù)責(zé)人以及對AI Agent應(yīng)用感興趣的讀者閱讀。

報告8:頭豹研究《2024年中國AI Agent行業(yè)研究》

《2024年中國AI Agent行業(yè)研究:智能體落地千行百業(yè),引領(lǐng)智能化革命的新引擎》報告,由頭豹研究院發(fā)布,深入分析了AI Agent(人工智能體)在中國的發(fā)展現(xiàn)狀、應(yīng)用前景、市場趨勢以及行業(yè)生態(tài)。

報告首先定義了AI Agent,并將其與大模型區(qū)分開來,強(qiáng)調(diào)其自主決策和執(zhí)行能力;然后,分析了AI Agent的關(guān)鍵特征、分類及發(fā)展歷程,并對國內(nèi)外主流項(xiàng)目及產(chǎn)品進(jìn)行了盤點(diǎn);接著,報告探討了AI Agent的市場規(guī)模、驅(qū)動因素及行業(yè)生態(tài)圖譜,指出其在企業(yè)級應(yīng)用(toB)方面擁有更廣闊的前景;最后,報告對AI Agent在不同行業(yè)領(lǐng)域的應(yīng)用情況及發(fā)展趨勢進(jìn)行了深入分析,并對未來發(fā)展方向進(jìn)行了預(yù)測,特別指出金融行業(yè)是AI Agent應(yīng)用最成熟的領(lǐng)域,而政務(wù)領(lǐng)域則由于數(shù)據(jù)獲取的限制,發(fā)展相對滯后??偠灾?,該報告旨在為投資者、企業(yè)和研究人員提供對中國AI Agent行業(yè)全面而深入的了解。

報告指出,AI Agent作為一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動作的智能實(shí)體,與傳統(tǒng)人工智能相比,具備更強(qiáng)的自主性和適應(yīng)性。詳細(xì)介紹了AI Agent的定義、基礎(chǔ)架構(gòu)、特征分類、發(fā)展歷程、市場驅(qū)動因素、行業(yè)應(yīng)用圖譜、商業(yè)模式以及消費(fèi)級與企業(yè)級應(yīng)用的對比。

還預(yù)測了AI Agent在不同行業(yè)中的應(yīng)用發(fā)展情況,并提供了國內(nèi)外AI Agent項(xiàng)目及產(chǎn)品的盤點(diǎn)。整體而言,AI Agent在企業(yè)級應(yīng)用中前景廣闊,尤其在金融、電商零售、教育、醫(yī)療、制造、交通、媒體娛樂、能源、物流和政務(wù)等行業(yè)領(lǐng)域中展現(xiàn)出強(qiáng)大的滲透力和應(yīng)用潛力。

該報告不僅指出了AI Agent在金融等領(lǐng)域的成熟應(yīng)用,也探討了其在其他行業(yè)的潛力,為對AI Agent技術(shù)和市場感興趣的讀者提供了有價值的參考。該報告適合希望了解AI Agent如何落地并引領(lǐng)行業(yè)變革的讀者閱讀。

報告9:Letta 《The AI agents stack 》

《The AI agents stack 》本文探討了AI Agent棧的最新發(fā)展,特別是2024年末的AI Agent生態(tài)系統(tǒng),包括Agents托管/服務(wù)、Agents框架和大型語言模型(LLM)模型及存儲三個關(guān)鍵層次。報告基于作者在開源AI領(lǐng)域超過一年的工作經(jīng)驗(yàn)以及7年以上的AI研究經(jīng)驗(yàn),對現(xiàn)有的Agents技術(shù)棧分類提出質(zhì)疑,并分享了他們自己的“Agents技術(shù)棧”模型。

報告探討了2024年末AI智能體(Agent)的軟件生態(tài)系統(tǒng),并提出了作者自己基于多年經(jīng)驗(yàn)的“智能體堆棧”模型。

該模型將智能體系統(tǒng)分為三層:底層是大型語言模型(LLM)及其服務(wù)和存儲,包括各種API服務(wù)和向量數(shù)據(jù)庫;中間層是智能體框架,負(fù)責(zé)LLM調(diào)用、狀態(tài)管理、內(nèi)存管理以及多智能體通信;頂層是智能體托管和服務(wù),關(guān)注如何將智能體部署為服務(wù),并通過REST APIs訪問。

報告強(qiáng)調(diào),與簡單的LLM聊天機(jī)器人相比,智能體開發(fā)面臨著更大的工程挑戰(zhàn),例如狀態(tài)管理和工具執(zhí)行。作者認(rèn)為,未來的智能體將作為服務(wù)部署,并期待出現(xiàn)類似于OpenAI ChatCompletion API的行業(yè)標(biāo)準(zhǔn)智能體API。

報告還提到了2022年和2023年興起的LLM框架和SDK,如LangChain和LlamaIndex,以及通過API消費(fèi)LLM的標(biāo)準(zhǔn)平臺,如vLLM和Ollama。同時,文章也指出了2024年AI領(lǐng)域?qū)?ldquo;Agents”概念的轉(zhuǎn)變,以及如何從LLM發(fā)展到AI Agent的必要性。

這份報告主要面向軟件開發(fā)者,旨在幫助他們理解 AI Agent 技術(shù)棧的復(fù)雜性,并為他們提供構(gòu)建垂直 Agent 應(yīng)用的指導(dǎo)。報告強(qiáng)調(diào)了 AI Agent 與傳統(tǒng) LLM 聊天機(jī)器人在工程方面的不同,并介紹了 Letta 提供的相關(guān)資源。該報告適合對 AI Agent 技術(shù)棧和實(shí)際應(yīng)用感興趣的開發(fā)者閱讀。

報告10:德勤《Prompting for action How AI agents are reshaping the future of work》

該報告由德勤(Deloitte)人工智能研究所發(fā)布,探討了AI智能體和多智能體系統(tǒng)如何重塑未來工作。重點(diǎn)介紹了生成式AI(GenAI)的擴(kuò)展能力和多智能體 AI系統(tǒng)的協(xié)同作用,以及這些技術(shù)如何影響企業(yè)并推動智能組織轉(zhuǎn)型。

報告圍繞“隨著AI技術(shù)的快速發(fā)展,企業(yè)如何利用AI Agent和多Agent AI系統(tǒng)來重塑業(yè)務(wù)流程,提高效率并實(shí)現(xiàn)自動化”這一問題,展開了詳細(xì)討論。

報告指出,AI智能體與傳統(tǒng)語言模型不同,具備推理、規(guī)劃、記憶和行動能力,能自動化工作流程。多智能體系統(tǒng)通過協(xié)同合作提高效率、學(xué)習(xí)能力和準(zhǔn)確性,處理復(fù)雜任務(wù)。例如,在戰(zhàn)略洞察方面的應(yīng)用展示了其在速度、效率和可擴(kuò)展性方面的優(yōu)勢。還探討了AI智能體對戰(zhàn)略、風(fēng)險、人才和業(yè)務(wù)流程的影響,并建議領(lǐng)導(dǎo)者評估用例、制定戰(zhàn)略路線圖、投資基礎(chǔ)設(shè)施和人才培養(yǎng)以及加強(qiáng)數(shù)據(jù)治理和風(fēng)險管理。

報告提到了當(dāng)前企業(yè)廣泛使用的大型語言模型(LLMs)和GenAI工具,這些工具雖然能夠根據(jù)簡單提示生成輸出,但其交互通常是事務(wù)性的,且作用范圍有限。探討了AI Agent與傳統(tǒng)語言模型的不同之處,以及AI Agent如何通過理解上下文、規(guī)劃工作流程、連接外部工具和數(shù)據(jù)以及執(zhí)行動作來實(shí)現(xiàn)目標(biāo),從而克服了傳統(tǒng)AI應(yīng)用的局限性。

報告認(rèn)為,如何克服傳統(tǒng)AI應(yīng)用在理解復(fù)雜請求、規(guī)劃工作流程和執(zhí)行多步驟任務(wù)方面的局限性,以及如何整合不同AI Agent以實(shí)現(xiàn)更高級別的自動化和優(yōu)化,是需要關(guān)注的重點(diǎn)問題。

總體而言,該報告強(qiáng)調(diào)AI Agent和多智能體系統(tǒng)在推動智能化轉(zhuǎn)型方面的潛力,并指出前瞻性的企業(yè)和政府機(jī)構(gòu)已經(jīng)開始部署這些技術(shù),適合對AI Agent的最新進(jìn)展及其在各行業(yè)的實(shí)際應(yīng)用感興趣的讀者閱讀。

 

本文系作者 王吉偉 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容
  • 2025年AI Agent市場前景廣闊,競爭也愈發(fā)激烈。

    回復(fù) 2025.02.09 · via h5
  • DeepSeek的崛起為AI Agent行業(yè)注入新活力,值得關(guān)注。

    回復(fù) 2025.02.09 · via android
  • 各大公司紛紛布局AI Agent,行業(yè)洗牌在即

    回復(fù) 2025.02.09 · via android
  • 開源AI Agent降低了門檻,未來發(fā)展?jié)摿薮蟆?/p>

    回復(fù) 2025.02.08 · via h5
  • 幫助人們理解AI Agent的技術(shù)與應(yīng)用,善舉呀

    回復(fù) 2025.02.08 · via android

快報

更多

2026-02-06 23:02

現(xiàn)貨白銀日內(nèi)漲幅擴(kuò)大至8%

2026-02-06 22:59

納斯達(dá)克中國金龍指數(shù)漲2%

2026-02-06 22:59

道瓊斯指數(shù)觸及新紀(jì)錄高位,上漲1.4%

2026-02-06 22:52

吉華集團(tuán):控股股東擬變更為桐廬鈞衡,股票自2月9日起復(fù)牌

2026-02-06 22:47

美股三大股指均漲超1%

2026-02-06 22:46

英偉達(dá)漲幅擴(kuò)大至5%

2026-02-06 22:41

現(xiàn)貨白銀向上觸及76美元/盎司

2026-02-06 22:37

市場監(jiān)管總局召開大型食品銷售連鎖企業(yè)行政指導(dǎo)會

2026-02-06 22:35

亞馬遜盤初跌幅一度達(dá)10%

2026-02-06 22:35

納斯達(dá)克金龍中國指數(shù)漲幅擴(kuò)大至1.5%

2026-02-06 22:33

美股開盤:三大指數(shù)集體高開,存儲概念股走強(qiáng)

2026-02-06 22:29

保險許可證將取消,今年6月起保險機(jī)構(gòu)適用金融許可證

2026-02-06 22:23

輝瑞抗感染創(chuàng)新藥獲批兒科適應(yīng)證

2026-02-06 22:22

國家數(shù)據(jù)局開展2025年度全國數(shù)據(jù)資源統(tǒng)計調(diào)查

2026-02-06 22:21

鹿客科技(北京)股份有限公司遞表港交所

2026-02-06 22:15

海關(guān)總署:嚴(yán)厲打擊非法出口管制物項(xiàng)和偷逃、瞞騙等走私違法行為

2026-02-06 22:07

美伊核談判最新進(jìn)展:雙方就“保持對話”達(dá)成共識,具體條款仍有博弈

2026-02-06 22:00

國家數(shù)據(jù)局局長劉烈宏召開系列專家企業(yè)代表座談會,聽取對“十五五”時期數(shù)字中國規(guī)劃和建設(shè)的意見建議

2026-02-06 21:52

供銷大集:擬參與競拍國投農(nóng)產(chǎn)品60%股權(quán)

2026-02-06 21:48

印度國家證券交易所董事會批準(zhǔn)進(jìn)行IPO

5

掃描下載App