免费看在线a黄视频|99爽99操日韩毛片儿|91停婷在线无码观看|日韩三级片小视频|一级黄片免费播放|欧美成人视频网站导航|亚洲日韩欧美七区|国产视频在线观看91|人成视频免费在线播放|国产精品成人在线免费观看

AI御三家年終“火拼”

AGI
被討論和使用最多的,還是ChatGPT,Claude和Gemini,我愿稱之為AI御三家。

文 | 吳懟懟

2025年的人工智能(AI)領(lǐng)域可謂風起云涌:大模型你追我趕、商業(yè)版圖急劇擴張。

以前我感覺用ChatGPT+Claude就可以了,現(xiàn)在必須加上Gemini和Grok,要取四個AI之長。跟打王者榮耀升級一樣,要有個本命英雄,但是同一分路還要會點別的英雄,最好還要擅長不同分路。

當然,被討論和使用最多的,還是ChatGPT,Claude和Gemini,我愿稱之為AI御三家。

AI御三家瘋狂加碼

年底壓軸登場的OpenAI GPT-5.2成為年終焦點。

面對Gemini 3在各大榜單上后來居上的壓力,OpenAI提前啟動紅色代碼警告,加速推出了這款新一代大模型。

GPT-5.2被定位為“一款為專業(yè)知識工作打造的最強模型”,在推理、編程和智能體任務(wù)上較前代有顯著提升。

其最大亮點之一是超長上下文記憶能力:支持40萬Token的輸入窗口和12.8萬Token的輸出長度,可一次性 ingest 海量文檔或代碼庫并生成長篇報告。

這意味著GPT-5.2能夠閱讀理解數(shù)百頁資料后給出總結(jié),在長鏈多步驟推理中表現(xiàn)更穩(wěn)健。

OpenAI還將GPT-5.2劃分為Instant、Thinking和Pro三個等級模型,以平衡速度與深度需求——Instant偏重日??焖倩卮穑琓hinking適合復(fù)雜結(jié)構(gòu)化任務(wù)和長時智能Agent執(zhí)行,Pro則追求極致準確率以應(yīng)對棘手問題。

在各項權(quán)威基準測試上,GPT-5.2全面刷新紀錄:比如在SWE-Bench Pro編程測試中達到55.6%的新高分,遠超前代;在通用推理ARC-AGI測試上首次突破90%正確率。

值得一提的是,GPT-5.2雖然對圖像生成暫未有顯著改進(OpenAI透露“圖像生成的增強還在籌備中”),但在多模態(tài)理解上已有進步:它能夠更好地“感知圖像”并結(jié)合視覺輸入完成復(fù)雜任務(wù)。

此外,GPT-5.2成為OpenAI推動“Mega-Agent時代”的引擎,其連貫長程代理能力令人矚目——測試顯示它能自主完成40%更復(fù)雜的長鏈任務(wù),如根據(jù)乘客反饋自動完成改簽航班、預(yù)訂酒店、申請賠償?shù)囊徽资聞?wù),比前代5.1覆蓋更多步驟且更準確。

這一年,經(jīng)歷了年初GPT-5.0/5.1推出時的波折(性能和風格調(diào)整一度飽受爭議,被用戶批評“過于冰冷刻板”,OpenAI火速用5.1版本改善了親和度),OpenAI憑借GPT-5.2在年末重奪技術(shù)王冠,在大模型軍備競賽中卷土重來。

作為OpenAI強勁的對手,Anthropic在2025年持續(xù)發(fā)力,9月發(fā)布了Claude 4.5。Claude 4.5主打自主編程與工具操作能力。

在內(nèi)部測試中,其子型號Claude 4.5-Sonnet曾連續(xù)自主編程30小時構(gòu)建出一個Web應(yīng)用,而此前Claude Opus 4只能堅持7小時。

這一飛躍體現(xiàn)出Claude在長程任務(wù)上的穩(wěn)定性提升,讓AI代理真正能夠長時間無監(jiān)督地工作。

Anthropic表示4.5在金融分析和科學推理上也更勝一籌,在一項操作系統(tǒng)使用能力測試中得分約60%,遠高于前代模型的40%。

換言之,Claude 4.5更善于像人一樣使用電腦完成多步驟任務(wù),這對需要AI自動執(zhí)行業(yè)務(wù)流程的企業(yè)非常關(guān)鍵。Anthropic一貫強調(diào)安全可靠,以降低出錯或產(chǎn)生有害內(nèi)容的風險,定位于企業(yè)及專業(yè)用戶場景。

在架構(gòu)上,Claude 4.5提供了不同性能版本:例如Claude 4.5-Haiku、Sonnet、Opus等,分別平衡速度、成本與精度,其中最強的Opus 4.5版本支持更大的上下文窗口和更高的調(diào)用上限(相應(yīng)成本也最高)。

這反映出大模型普遍朝著精細化配置方向發(fā)展。值得關(guān)注的是,Claude 4.5在發(fā)布當日即宣布與微軟深化合作:微軟將其引入Microsoft 365 Copilot,增加Excel/Word的“智能體模式”和Copilot聊天中的“Office助手”等新特性。

微軟此舉意在讓Office用戶獲得更強的自動辦公助手,同時也表明其生態(tài)策略從獨家捆綁OpenAI轉(zhuǎn)為多模型并舉。

而在OpenAI和Anthropic激戰(zhàn)正酣之際,谷歌DeepMind整合優(yōu)勢,于11月發(fā)布了里程碑式的Gemini 3模型。作為谷歌雄心勃勃的旗艦,Gemini 3 Pro號稱谷歌“有史以來最智能、事實準確率最高”的AI。

與其前代相比,Gemini 3最大的突破是“原生多模態(tài)”:它能同時處理文本、圖像和音頻,多模態(tài)融合能力業(yè)界領(lǐng)先。

例如,用戶可以讓Gemini讀取菜譜照片并直接生成烹飪手冊,或讓它看一系列視頻課程后自動創(chuàng)建交互式學習卡片。

這種將視覺、聽覺與文本理解打通的能力,為AI應(yīng)用打開了新局面。借助多模態(tài)和強大的編程能力,Gemini 3還能輸出富媒體結(jié)果:在Google搜索的AI模式下,它可以把答案呈現(xiàn)為圖片、表格、網(wǎng)頁等動態(tài)格式,而非僅有文字。

更驚艷的是,Gemini 3內(nèi)置增強版的搜索工具調(diào)用機制,能自主將復(fù)雜問題拆解成子查詢?nèi)ニ阉?,并結(jié)合結(jié)果給出整合答案。這一“查詢分解+工具使用”策略提升了答案的廣度和準確性。

Gemini 3在交互風格上也別具特色:谷歌直言其回復(fù)將摒棄討好傾向,不再一味迎合用戶而是提供“聰明、簡潔、直接”的洞見,避免空洞恭維。過去聊天機器人易有的過度諂媚在Gemini上大幅減少,這被視為對ChatGPT習慣說“好話”的一針諷刺。

除了日常問答,Gemini 3 Pro還強化了推理規(guī)劃和Agent能力。谷歌稱其可以“可靠地進行更長遠的計劃”,驅(qū)動實驗性的Gemini智能代理,幫助用戶自動收發(fā)郵件、研究行程甚至預(yù)訂機票。這預(yù)示著搜索引擎正從提供信息進化為直接代辦任務(wù)的全能助理。

性能方面,Gemini 3 Pro一經(jīng)推出即登頂權(quán)威排行榜LMArena,足見其實力。Gemini 3發(fā)布當天,谷歌選擇在其Gemini App上向全民免費開放旗艦?zāi)P蚉ro,并很快在搜索服務(wù)中提供給訂閱用戶使用。

這種大規(guī)模分發(fā)策略與OpenAI先會員后開放的方式形成對比,也顯示了谷歌在消費級AI領(lǐng)域搶占用戶的迫切。

Gemini 3 Pro的橫空出世,標志著谷歌在經(jīng)歷了GPT-4/Bard時期的相對落后后,于2025年強勢反超,一度引發(fā)行業(yè)內(nèi)“Holy Shit!,谷歌贏得AI競賽”的驚嘆。

估值飆升再飆升

2025年,AI賽道的融資規(guī)模再創(chuàng)新高,多家頭部獨角獸估值飆漲,吸金能力驚人。 OpenAI在未進行公開融資的情況下,據(jù)報道正尋求員工股份出售,潛在估值高達5000億美元——這一數(shù)字是歐洲AI獨角獸估值的數(shù)十倍,體現(xiàn)出投資者對其龍頭地位的信心。

而Anthropic在9月宣布完成130億美元的巨額融資,投后估值達1830億美元,較年初翻了近兩倍。

此輪融資由硅谷知名投資機構(gòu)ICONIQ領(lǐng)投,富達、Lightspeed等跟投,亦有中東的卡塔爾主權(quán)基金和華爾街巨頭黑石等參與。

Anthropic一躍成為全球估值第三高的非上市公司,僅次于SpaceX等少數(shù)巨頭。隨著資金涌入,Anthropic公布其業(yè)務(wù)營收增長迅猛:2025年初年化收入約10億美元,到了8月激增至50億美元,表明大型AI模型的商業(yè)付費需求正被快速開發(fā)。

另一家引人注目的創(chuàng)業(yè)公司是法國的Mistral AI。這家2023年才成立的創(chuàng)業(yè)公司,2025年9月獲得了17億歐元(約20億美元)的系列C投資。由荷蘭光刻機巨頭ASML領(lǐng)投1.3億歐元,占股11%,其余包括DST、a16z、創(chuàng)投基金B(yǎng)pifrance、英偉達等紛紛押注。

此次融資使Mistral估值達到117億歐元,成為歐洲AI領(lǐng)域新的價值巔峰。盡管這一估值僅相當于OpenAI傳聞估值的約1/40,但對于歐洲來說是重大突破——Mistral被視為歐盟對抗美中AI巨頭的重要希望,法國更將其視作國家AI戰(zhàn)略的核心。

馬斯克于2023年創(chuàng)建的xAI在今年也有所動作。xAI開發(fā)的對話模型Grok持續(xù)迭代,2025年推出了Grok 4,據(jù)稱在部分基準上號稱“世界最聰明”。

Musk在社交媒體上高調(diào)宣傳Grok整合了實時網(wǎng)絡(luò)檢索和各種工具插件,并賦予其鮮明的“直言不諱”個性,讓其回答帶有一點“Meme風格”,以吸引年輕用戶。

作為OpenAI背后最大的金主和合作伙伴,微軟在2025年的策略出現(xiàn)了微妙變化。一方面,微軟將OpenAI模型深度嵌入其Windows、Office、Bing等核心產(chǎn)品,持續(xù)收割付費用戶和云計算消耗。

今年微軟全面上線了Windows 11的Copilot助手,將操作系統(tǒng)與GPT助手融為一體,用戶可以直接在桌面調(diào)用AI完成設(shè)置、搜索等操作,讓傳統(tǒng)OS煥發(fā)新生。

同時,微軟Azure云借助OpenAI服務(wù)吸引了大量企業(yè)上云進行AI開發(fā),Azure的使用量和收入顯著增長。

但另一方面,微軟不再將寶押在OpenAI一家:10月,微軟宣布與Anthropic達成合作,將后者Claude模型引入Azure并在Office中集成。微軟高管稱此舉是為了給客戶提供“多樣化選擇”,降低對單一供應(yīng)商的依賴。

這或許與2023年末OpenAI高層動蕩(Altman一度被董事會驅(qū)逐后又復(fù)歸)有關(guān),微軟意識到必須預(yù)防風險、扶持第二陣營以維持自己的AI領(lǐng)先地位。

此外,微軟也加碼自研,傳聞其內(nèi)部的生成式模型項目(代號Omega)在研制多模態(tài)基礎(chǔ)模型,以備不時之需。

谷歌在經(jīng)歷了ChatGPT帶來的“AI覺醒”之后,今年實現(xiàn)了AI戰(zhàn)略的大幅轉(zhuǎn)身。Google DeepMind的成立整合了谷歌原有的Brain團隊與DeepMind研究院資源,成為谷歌AI創(chuàng)新的核心引擎。

Gemini 3的成功推出讓谷歌重奪技術(shù)話語權(quán),也增強了內(nèi)部信心。谷歌隨即在產(chǎn)品線上全面開花:搜索業(yè)務(wù)推出“AI對話模式”,地圖應(yīng)用上線路線智能生成和旅行規(guī)劃助手,Gmail/Docs增加AI寫作輔助功能等。

不僅軟件服務(wù),谷歌在Android系統(tǒng)中也增加了端側(cè)AI能力,例如利用手機SoC內(nèi)的TPU微芯片,實現(xiàn)小型語言模型的本地推理,提供離線的智能輸入法、更精準的相冊識別等。

甚至有報道指出,谷歌與蘋果達成協(xié)議,為后者提供定制的Gemini模型用于提升iOS上的智能體驗。

這表明谷歌積極尋求將其AI技術(shù)輸出賦能更多平臺。商業(yè)上,谷歌云也以提供多元模型著稱——除了自家的PaLM/Gemini系列,第三方的Meta Llama2、Anthropic Claude等也能在其Vertex AI平臺上獲取,從而與微軟Azure在企業(yè)市場上抗衡。

谷歌今年對AI創(chuàng)業(yè)公司的投資并購也有增加,據(jù)傳它投資了多家生成式AI初創(chuàng)(例如Inflection)以擴展生態(tài)。谷歌卷土重來,在AI領(lǐng)域從被動應(yīng)戰(zhàn)轉(zhuǎn)為主動出擊,通過技術(shù)突破和生態(tài)聯(lián)盟重塑了自己的領(lǐng)先地位。

Meta繼續(xù)走開放生態(tài)和消費者應(yīng)用兩手抓的路線。一方面,它在開源社區(qū)的地位鞏固。自從2023年開源LLaMA模型大獲成功后,Meta在2025年又相繼推出了改進版的LLaMA 3模型以及一系列開源的多模態(tài)模型,包括圖像生成模型和語音合成模型。

這些模型免費供研究者和開發(fā)者使用,僅要求遵守一些不用于有害用途的許可,大量第三方應(yīng)用建立在Meta模型之上。

另一方面,Meta充分發(fā)揮旗下社交產(chǎn)品的流量,將AI融入數(shù)十億用戶的日常。2025年,Meta在Messenger和Instagram中推出了一系列AI角色聊天功能,例如用戶可以和由名人形象構(gòu)建的AI聊天(這些明星形象的對話風格由模型模擬,并獲得了明星本人的授權(quán))。

用戶還可以讓AI根據(jù)朋友圈內(nèi)容自動生成趣味回應(yīng),或在Instagram上通過文字命令生成個性化的圖片貼紙。Meta的VR/AR事業(yè)部也不甘落后,在Meta Quest頭顯中集成了AI教練和AI健身指導(dǎo),提供沉浸式的互動體驗。

值得注意的是,Meta在AI商業(yè)化上更側(cè)重間接收益——通過提升用戶黏性、廣告定向和內(nèi)容生態(tài)繁榮來賺錢,而非直接出售API。因此,Meta樂于推動AI開源降低成本,同時憑借其社交帝國將AI無縫融入產(chǎn)品,鞏固自身社交媒體霸主地位。

相比喧囂的友商,蘋果在AI領(lǐng)域依舊低調(diào)、緩慢但務(wù)實。2025年的WWDC大會上,蘋果官宣了一項重大底層升級:iOS/macOS引入了本地大型語言模型(Foundation Models)框架,開發(fā)者可調(diào)用系統(tǒng)提供的基礎(chǔ)模型,在App中實現(xiàn)更智能的功能。

蘋果透露,他們針對Apple設(shè)備專門訓(xùn)練了多語言的中等規(guī)模語言模型,并進行了深度優(yōu)化,使其能夠在iPhone/蘋果電腦上離線運行,用于鍵盤聯(lián)想、語音助手Siri應(yīng)答等場景。

這意味著用戶的部分AI請求不必上傳云端,在設(shè)備上即可處理,提升了隱私與響應(yīng)速度。同時,蘋果也將AI應(yīng)用于照片處理(利用生成模型一鍵除物或改變背景)、Apple Music個性歌單(AI分析用戶喜好生成播放列表)等方面,提升用戶體驗。

有傳聞稱蘋果還與谷歌達成某種合作,可能在云端借助定制版Gemini模型來增強iCloud的AI服務(wù)。

但截至年底,蘋果并未發(fā)布類似ChatGPT的通用聊天產(chǎn)品,Siri的智能度也還有提升空間——不過可以預(yù)料,一旦蘋果認為時機成熟,可能會推出深度融合硬件優(yōu)勢的AI助手,引發(fā)新的行業(yè)震動。

蘋果的策略體現(xiàn)了差異化競爭:它不與OpenAI等正面拼參數(shù)規(guī)模,而是發(fā)揮軟硬件一體的長處,讓AI默默融入生態(tài),為用戶提供便利且安全的功能。這種潤物細無聲的推進,契合蘋果品牌調(diào)性,也為行業(yè)提供了另一種范式:以終端和隱私為中心的AI道路。

當然,另一面,AI是否存在泡沫的討論也越來越多。

無論如何,作為用戶,還是希望,2026,AI御三家,以及更多玩家,繼續(xù)打起來吧。

本文系作者 吳懟懟 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學習,不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

掃描下載App