圖片系AI生成

日前,AI領域投資人、風投公司Air Street Capital聯(lián)合創(chuàng)始人內森·貝奈奇(Nathan Benaich)與其團隊共同發(fā)布了《人工智能現(xiàn)狀報告 2025》。該系列報告已連續(xù)發(fā)布八年,而本次報告長達300多頁,由業(yè)界和研究領域的頂尖AI從業(yè)者進行評審,涵蓋了技術研究與產業(yè)、政策與安全、用戶市場調研等多個維度。

基于此,內森·貝奈奇對下一年度給出預測,他在報告中寫道:“對前沿AI模型的研究,中國的研究機構會超越美國;開放式AI智能體(Agent)更值得獲得進一步科研發(fā)現(xiàn);AI安全領域,基于AI生成欺詐視頻的網絡攻擊事件將引發(fā)國際間討論;美國某頭部AI研究架構會最終轉向開源生態(tài)以獲得其政府支持。”

筆者根據該報告調研數(shù)據及分析,梳理出三大類關鍵信息。

過去一年,超級智能與中美大模型PK

2024年末至2025年,隨著GPT-o1的發(fā)布,迎來基于深度推理的大模型發(fā)展熱潮,各家大模型廠商快速面世了多個推理模型。

期間,以Meta為代表的科技巨頭定義了“超級人工智能”(Superintelligence)一詞,“通用人工智能”(AGI)成為過去時。

請輸入圖說

報告認為,開源模型與閉源模型之間的差距雖曾一度縮小,但當前最頂尖的模型仍保持閉源,如GPT-5、GPT-o3、Gemini 2.5 Pro、Claude 4.1 Opus、Grok4等。其中,OpenAI憑借其最新的GPT-5在多個基準測試中保持領先,繼續(xù)鞏固在基礎模型領域的優(yōu)勢地位。

盡管中國基礎模型尚未取得突破性進展,但在開源模型領域卻頗具競爭力。相比之下,美國的開源模型表現(xiàn)令人失望,OpenAI的開源模型性能遠遜于GPT-5。

隨著中國DeepSeek、Qwen和Kimi等模型的崛起,市場競爭愈發(fā)激烈。特別是在推理和編程任務方面,中國廠商正逐步縮小與領先者的差距。報告強調,開源為中國廠商提供了快速追趕的契機,越來越多的開發(fā)者選擇基于Qwen進行開發(fā)。中國的大模型不僅在智能水平上有所提升,還呈現(xiàn)出多樣化的特點。相比之下,曾作為開源模型標桿的Meta Llama,其市場份額已從2024年末的約50%大幅下滑至目前的15%。

報告指出,近期推理模型的方法改進完全處于基準模型的誤差范圍內,這或許意味著推理模型的進步并不真實。而且,強化學習(RL)帶來的實際收益也微乎其微,且容易過擬合。

針對此,報告援引一篇論文,深入剖析了研究人員間的爭議焦點:推理模型在應對復雜問題時表現(xiàn)欠佳,究竟是源于實驗設計本身的缺陷,還是僅在特定領域才能展現(xiàn)出超越基準模型的優(yōu)勢?

當前,前沿AI實驗室正積極探索將強化學習、基于可驗證的獎勵機制、可驗證推理與新環(huán)境相結合,賦予模型規(guī)劃、反饋、自我修正以及在更長時間跨度內執(zhí)行任務的能力。

報告還提到,AI研究目前正考慮利用小語言模型(SLMs)構建智能體(Agentic AI)。鑒于大多數(shù)智能體的工作流存在局限性、重復性且高度依賴格式,小語言模型已能滿足實際操作需求,且成本顯著降低。因此,采用小語言模型構建有限的異構智能體架構,僅在必要時調用大模型,成為一種可行的策略。

作為構建AI智能體的軟件平臺,AI智能體框架發(fā)展同樣迅速。盡管LangChain仍廣受歡迎,但如今已只是眾多選擇之一,目前市面上各細分領域已涌現(xiàn)數(shù)十種框架,如研發(fā)領域的AutoGen、camel,軟件工程領域的MetaGPT等。

此外,AI智能體的研究正賦予其記憶能力,實現(xiàn)從拓展上下文窗口到結構化、持久性終身記憶的轉變,并且進一步延伸至動態(tài)整合、遺忘和反思,旨在使智能體在交互、任務乃至整個運行周期中保持連貫性。

報告還提到,AI如今在跨學科領域的應用價值日益凸顯。例如,在生物領域,DeepMind的AI系統(tǒng)“Co-scientist”,基于Gemini 2.0構建,能夠生成、辯論并進化其假設生成與實驗規(guī)劃過程。

AI智能同樣涌現(xiàn)物理世界。如艾倫人工智能研究所Ai2發(fā)布的針對于具身智能系統(tǒng)的模型MolmoAct,谷歌的Gemini Robotics 1.5,與大模型“思維鏈”相呼應,能夠顯著提升物理機器人的可解釋性和可靠性。

產業(yè)進展:更便宜的智能,限制與競爭

當前,AI產業(yè)應用正迅速普及。AI優(yōu)先企業(yè)營收遠超其SaaS同行,并且在各個行業(yè)展現(xiàn)出發(fā)展勢頭。2025年,隨著AI采用率上升,用戶留存率上升,企業(yè)支出增加。特別是在音視頻、虛擬形象、圖像生成領域,AI公司的收入有望實現(xiàn)爆發(fā)式增長。

在企業(yè)內部,AI應用場景以內容生成、代碼生成、研究及分析密集型任務最為常見。

ChatGPT、Claude、Gemini/Google和Perplexity成為使用頻率最高的工具。盡管Meta的AI工具覆蓋面廣,但其使用頻率遠不及Mistral Le Chat或Midjourney。值得注意的是,DeepSeek雖然覆蓋率略低,但使用頻率相對較高。

在開發(fā)者工具方面,Cursor、Claude Code和GitHub Copilot備受青睞;而在非編程工具中,Deep Research、ChatGPT、ElevenLabs、Perplexity和Claude的使用頻率也非常高。

然而,AI編程工具的應用也伴隨著一定風險。例如,AI編程工具可能會主動覆蓋企業(yè)生產代碼,導致開發(fā)成果受損。同時,從事AI編程開發(fā)的初創(chuàng)公司仍面臨嚴峻的單位經濟效益挑戰(zhàn),其盈利狀況受制于上游模型價格和競爭對手。這可能導致初創(chuàng)公司在提高利潤時,除了技術降本外,還可能采取突然提價或限制用戶功能等措施。

瀏覽器正成為AI應用的最新焦點和企業(yè)競爭的新戰(zhàn)場。目前,OpenAI、Google、Anthropico和Perplexity均推出了助手功能,不僅能解答用戶關于網頁內容的問題,還能代表用戶在瀏覽器中進行導航和操作。這一轉變將瀏覽器重新定義為互聯(lián)網的智能操作系統(tǒng)。此外,谷歌公司在其產品中嵌入Gemini能力,讓更多用戶體驗到AI檢索服務。據谷歌公司聲稱,其每月Token消耗數(shù)量在2025年同比增長了50倍,達到千萬億個Token。

事實上,AI的工業(yè)時代已經到來。

但在這其中,電力供應正成為制約AI發(fā)展的新因素。報告稱,若電力供應不足,國家AI計劃將面臨崩潰風險。未來1-3年內,美國幾個主要地區(qū)可能會出現(xiàn)電力短缺。美國能源部(DOE)警告稱,由于電力供應不穩(wěn)定和AI需求增長,到2030年,停電頻率可能會增加100倍。

報告提到了2024年末DeepSeek對整個AI市場的攪動,市場重新認識“杰文斯悖論”,即更便宜的智能,帶來更高的需求,更高的需求又會提高對芯片的消耗。

無論是在公有云、私有云還是本地化部署環(huán)境中,GPU都至關重要。英偉達的市值突破4萬億美元,占據90%的AI研究論文市場份額,定制芯片與新云服務同步崛起。除了英偉達之外,隨著客戶對優(yōu)惠價格、靈活合同條款及AI專用軟件套件的需求增加,上市公司Coreweave、Nebius以及私企Lambda、Crusoe正實現(xiàn)快速增長。同時,報告指出TPU和AMD的GPU普及程度并不高。

報告還首次對1183名AI從業(yè)者進行了調研,結果顯示,95%的專業(yè)人士現(xiàn)在在工作或生活中使用AI,76%的人自掏腰包購買AI工具,且大多數(shù)人表示生產力持續(xù)提高。這充分證明AI的真正普及已成為主流趨勢。

報告指出,目前AI主要擠壓的是入門級崗位市場,其中在軟件和客服領域,這類崗位極易受AI技術影響,其招聘崗位持續(xù)下降,經驗豐富的勞動力暫時保持工作穩(wěn)定性。

報告還指出,研究發(fā)現(xiàn)當前勞動力市場變化早于2022年ChatGPT的問世,AI自動化目前并未削弱經濟領域對認知型勞動力的需求。

AI政策“反復”,安全風險加劇

整體來看,美國推行“美國AI優(yōu)先”的戰(zhàn)略并調整出口政策,中國則加速推進自主研發(fā)與本土芯片制造,以中美為代表的AI競賽愈演愈烈。

2025年,特朗普政府將人工智能安全研究所更名為人工智能標準與創(chuàng)新中心(CAISI),并啟動了5000億美元的“星門計劃”。與此同時,美國政府發(fā)布《人工智能行動計劃》力求保持其在全球AI領域的主導地位。

與中國最密切相關的是AI芯片出口限制的相關政策,報告用“反復”來形容。事實上,美國政府在國家安全目標與供應鏈依賴、供應商游說這見尋求平衡,這使得英偉達和AMD成為政治焦點。報告指出,英偉達在中國市場并未達到穩(wěn)定狀態(tài)。

與此同時,美國監(jiān)管措施在巨額投資浪潮中被邊緣化:國際外交陷入僵局,《人工智能法案》實施遭遇重重阻礙。

AI數(shù)據中心建設陷入了新的瓶頸:鄰避主義(NIMBYism)。在最新事件中,美國公眾對新建大規(guī)模數(shù)據中心的反對聲日益高漲。

而盡管政府《人工智能行動計劃》提及需自主AI領域”基礎科學“,但其核心研發(fā)資金遠低于專家建議的2026年320億美元投資目標。

與此同時,硅谷科技巨頭目前采取了“逆向”并購政策:通過快速引進人才(創(chuàng)始人及團隊高薪)以規(guī)避并購限制,同時保留原業(yè)務精簡的公司轉型拓展小眾市場。其原因在于,特朗普政府以來的并購增長預期尚未到來,同時又受制于前拜登政府推行的反壟斷審查。例如,微軟收購Inflection,谷歌收購Character AI,亞馬遜收購Adept,Meta收購Scale AI(貌似最近的Manus并購案也存在同樣模式)。

目前美國聯(lián)邦貿易委員會(FTC)對這類“逆向”并購行為的擔憂日益加劇。

與此同時,美國就AI安全相關的政策議題也在發(fā)生轉變,加之實驗室間日益激烈的商業(yè)競爭,某些安全規(guī)程已被列為非優(yōu)先事項。

外部安全機構年度預算甚至不及頂尖實驗室單日總支出,曾以安全為核心的機構開始將重點轉向產品化。報告估算,外部AI安全研究投入僅約1.3億美元,而同期全球AI研發(fā)支出接近千億美元,比例極低。

AI實驗室為防范生物安全風險和網絡攻擊部署了空前防護,部分實驗室卻因錯過自我設定的截止日期或悄然放棄測試方案。

報告指出,網絡攻擊能力每五個月翻一番,遠超防御措施的更新速度。犯罪分子利用AI智能體的勒索軟件已滲透至世界500強企業(yè)。

涉及生成式AI的安全事件正呈急劇增長態(tài)勢。其中,大量報告事件涉及AI換臉技術,這與大模型的濫用密切相關。與此同時,AI代理正日益成為網絡安全防御的重大挑戰(zhàn)。(作者 | 楊麗,編輯 | 蓋虹達)

報告來源:https://www.stateof.ai/

本文系作者 TechHorizon 授權鈦媒體發(fā)表,并經鈦媒體編輯,轉載請注明出處、作者和本文鏈接。
本內容來源于鈦媒體鈦度號,文章內容僅供參考、交流、學習,不構成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據《網絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內容

掃描下載App