AI時(shí)代的"門戶之見"正在消融。

當(dāng)?shù)貢r(shí)間3月30日,微軟宣布為Microsoft 365 Copilot推出"多模協(xié)作"深度研究功能,允許OpenAI GPT與Anthropic Claude在同一任務(wù)中協(xié)同工作——對(duì)于行業(yè)來說,或許這不是簡(jiǎn)單的API拼接,而是一場(chǎng)關(guān)于AI競(jìng)爭(zhēng)底層邏輯的范式重構(gòu)。

事件核心:Critique與Council雙引擎出擊

3月30日,微軟對(duì)Microsoft 365 Copilot研究助理(Researcher)功能進(jìn)行了一次意義深遠(yuǎn)的更新——微軟推出了兩項(xiàng)互補(bǔ)的多模型協(xié)同功能:

Critique(批判)功能

該功能采用"生成-審核"協(xié)同架構(gòu)。在實(shí)際運(yùn)行中,OpenAI的GPT模型負(fù)責(zé)研究并生成回復(fù)內(nèi)容,同時(shí)Anthropic的Claude模型并行對(duì)輸出結(jié)果的準(zhǔn)確性和質(zhì)量進(jìn)行審核,最終經(jīng)過雙重驗(yàn)證的成果呈現(xiàn)給用戶。Claude的審查重點(diǎn)包括稿件的準(zhǔn)確性、完整性和引證質(zhì)量。

微軟同時(shí)透露,未來該功能將支持雙向協(xié)作——由Claude先生成、GPT后審核,實(shí)現(xiàn)真正意義上的對(duì)稱協(xié)作。

微軟365和Copilot企業(yè)副總裁Nicole Herskowitz表示,這種多模型方法應(yīng)有助于限制AI幻覺并提高生產(chǎn)力。微軟同時(shí)透露,未來該功能將支持雙向運(yùn)行——Claude先寫、GPT后審,實(shí)現(xiàn)真正意義上的對(duì)稱協(xié)作。

Council(理事會(huì))功能

該功能采用并行對(duì)比架構(gòu)。GPT與Claude針對(duì)同一課題獨(dú)立展開研究并生成各自報(bào)告后,由一個(gè)獨(dú)立的"裁判模型"對(duì)兩份產(chǎn)出進(jìn)行評(píng)估,提煉出共識(shí)點(diǎn)和分歧點(diǎn),并總結(jié)每個(gè)模型的獨(dú)特貢獻(xiàn)。這套機(jī)制本質(zhì)上是在搭建一個(gè)"模型間辯論場(chǎng)"。

數(shù)據(jù)支撐:DRACO基準(zhǔn)驗(yàn)證"1+1>2"

概念再好,最終要靠數(shù)據(jù)說話。微軟援引了業(yè)界衡量深度研究質(zhì)量的DRACO基準(zhǔn)測(cè)試結(jié)果,作為此次多模型架構(gòu)的有效性背書。

DRACO基準(zhǔn)測(cè)試顯示,Critique系統(tǒng)在研究結(jié)果的廣度、深度及表達(dá)質(zhì)量等核心維度上,表現(xiàn)均優(yōu)于市場(chǎng)上同類單一架構(gòu)產(chǎn)品。微軟首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)在社交媒體上進(jìn)一步宣稱,與OpenAI、谷歌及Perplexity的同類深度研究產(chǎn)品相比,Critique能提供"頂尖的深度研究質(zhì)量"

截至發(fā)稿,微軟尚未公開DRACO基準(zhǔn)測(cè)試的完整量化數(shù)據(jù)。納德拉在公開聲明中使用的表述是Critique能提供"頂尖的深度研究質(zhì)量",并稱其表現(xiàn)優(yōu)于OpenAI、谷歌和Perplexity的同類產(chǎn)品。

盡管具體的量化提升數(shù)據(jù)仍待進(jìn)一步透明化,但納德拉的公開背書以及微軟在基準(zhǔn)測(cè)試中對(duì)標(biāo)OpenAI自身產(chǎn)品、谷歌和Perplexity的做法,至少傳遞出一個(gè)信號(hào):這是一次經(jīng)過充分測(cè)試的產(chǎn)品化發(fā)布。

從"模型忠誠(chéng)"到"架構(gòu)自由"

Critique的發(fā)布背后,藏著一條清晰的戰(zhàn)略敘事線。這條線的起點(diǎn),是微軟與OpenAI之間微妙的關(guān)系演變。

1. 微軟-OpenAI關(guān)系的結(jié)構(gòu)性松動(dòng)

2025年10月28日,OpenAI宣布完成企業(yè)重組,正式轉(zhuǎn)型為公共利益公司(PBC)。根據(jù)新協(xié)議,微軟持有OpenAI營(yíng)利業(yè)務(wù)板塊約27%的股份,同時(shí)保留了對(duì)其模型和產(chǎn)品的技術(shù)訪問權(quán)至2032年。值得注意的是,此前(2025年初)雙方已調(diào)整合作關(guān)系,OpenAI獲準(zhǔn)訪問競(jìng)爭(zhēng)對(duì)手的計(jì)算資源,打破了此前僅依賴微軟Azure的算力獨(dú)家供應(yīng)格局。

緊接著,2025年11月18日,微軟與英偉達(dá)、Anthropic宣布建立新的戰(zhàn)略合作伙伴關(guān)系。微軟承諾向Anthropic投資最多50億美元,Anthropic則承諾從微軟購(gòu)買價(jià)值300億美元的Azure算力。Claude模型正式登陸微軟Azure平臺(tái)。微軟CEO納德拉當(dāng)時(shí)明確表示,OpenAI仍然是微軟的關(guān)鍵合作伙伴,但與Anthropic的合作建立在"將越來越多地成為彼此的客戶"的基礎(chǔ)之上。

2. 多模型之藥

如果回溯時(shí)間線,會(huì)發(fā)現(xiàn)納德拉推動(dòng)Copilot多模型化的緊迫感并非無中生有。據(jù)報(bào)道,2025年12月,納德拉在內(nèi)部溝通中直言Copilot與Gmail、Outlook等工具的集成"大多不奏效"且"不夠智能",并親自介入督促產(chǎn)品團(tuán)隊(duì)整改。這一內(nèi)部危機(jī)意識(shí),為后續(xù)多模型戰(zhàn)略埋下了伏筆。

2026年3月9日,微軟正式推出基于Anthropic Claude模型的Copilot Cowork智能體,支持多步驟工作流自主執(zhí)行。而此次Critique和Council的推出,則是多模型協(xié)作的進(jìn)一步延伸——Copilot Cowork側(cè)重于Claude獨(dú)立執(zhí)行復(fù)雜工作流,而Critique讓GPT與Claude在同一研究任務(wù)中形成"生成+審核"的互補(bǔ)組合。兩者的定位并非替代關(guān)系,而是微軟多模型生態(tài)中覆蓋不同場(chǎng)景的兩條平行路徑。

GPT擅長(zhǎng)創(chuàng)意生成和廣度覆蓋,Claude以嚴(yán)謹(jǐn)?shù)倪壿嬐蒲莺蛯徤鞯氖聦?shí)核查見長(zhǎng)。將兩者組合為"生成+審核"的協(xié)同架構(gòu),本質(zhì)上是在對(duì)齊學(xué)術(shù)界"同行評(píng)審"的經(jīng)典范式——讓一個(gè)模型產(chǎn)出的成果接受另一個(gè)獨(dú)立模型的審視。

AI競(jìng)爭(zhēng)轉(zhuǎn)向"系統(tǒng)博弈"

Critique的發(fā)布不僅僅是一個(gè)產(chǎn)品功能迭代,它或標(biāo)志著AI產(chǎn)業(yè)競(jìng)爭(zhēng)的底層邏輯正在發(fā)生位移。

第一層位移:從單一模型比拼到多模型編排。

過去兩年的AI競(jìng)爭(zhēng),核心敘事是"誰的模型參數(shù)更大、 benchmarks分更高"。而微軟通過Critique傳遞出的信號(hào)是:未來競(jìng)爭(zhēng)的關(guān)鍵不在于單個(gè)模型的能力天花板,而在于你能否將不同模型的優(yōu)勢(shì)組合成一個(gè)高效協(xié)同系統(tǒng)。模型編排能力正在成為新的核心壁壘。

第二層位移:從供應(yīng)商鎖定到模型超市。

Critique通過Copilot平臺(tái)的模型調(diào)度能力,實(shí)現(xiàn)了跨廠商模型的協(xié)同調(diào)用。對(duì)企業(yè)用戶而言,這意味著不必再為"選擇哪個(gè)模型"而糾結(jié)——系統(tǒng)可以同時(shí)調(diào)動(dòng)不同供應(yīng)商的模型優(yōu)勢(shì)組合完成任務(wù)。這實(shí)際上是在推動(dòng)AI市場(chǎng)從"模型專賣店"向"模型超市"演進(jìn)。

第三層位移:AI幻覺治理進(jìn)入"結(jié)構(gòu)性解法"階段。

此前,應(yīng)對(duì)AI幻覺的手段主要依賴模型自身的RLHF(基于人類反饋的強(qiáng)化學(xué)習(xí))對(duì)齊和提示工程優(yōu)化。而Critique引入的"獨(dú)立模型審核"機(jī)制,是一種架構(gòu)層面的結(jié)構(gòu)性解法——用Claude的審慎來制衡GPT的"過度自信",以跨模型對(duì)立來實(shí)現(xiàn)自我糾錯(cuò)。這比依賴單一模型"既當(dāng)運(yùn)動(dòng)員又當(dāng)裁判員"要可靠得多。

"AI競(jìng)爭(zhēng)已從單純的模型參數(shù)競(jìng)賽轉(zhuǎn)向復(fù)雜的系統(tǒng)集成與邏輯驗(yàn)證新階段。"

隨著深度研究系統(tǒng)的落地,微軟在企業(yè)級(jí)生產(chǎn)力工具市場(chǎng)的護(hù)城河將進(jìn)一步加固。對(duì)于整個(gè)行業(yè)而言,這個(gè)趨勢(shì)意味著:評(píng)判一個(gè)AI產(chǎn)品強(qiáng)弱的標(biāo)尺,正在從"跑分"轉(zhuǎn)向"實(shí)戰(zhàn)"。

目前,Critique與Council功能已率先集成至Microsoft 365 Copilot的研究助理工具包中,進(jìn)入早期測(cè)試階段,首批訪問權(quán)限僅限于加入微軟"Frontier計(jì)劃"的企業(yè)客戶。這一選擇頗具深意——微軟沒有直接向消費(fèi)端鋪開,而是優(yōu)先在高精度需求的B端場(chǎng)景驗(yàn)證。

從應(yīng)用場(chǎng)景來看,這套多模型協(xié)作架構(gòu)的潛在適用范圍相當(dāng)廣泛:

• 學(xué)術(shù)研究領(lǐng)域:通過GPT快速生成文獻(xiàn)綜述初稿,再由Claude按照學(xué)術(shù)標(biāo)準(zhǔn)進(jìn)行準(zhǔn)確性和引證質(zhì)量審查,有效降低研究過程中AI輔助環(huán)節(jié)的幻覺風(fēng)險(xiǎn)。

• 法律文檔處理:在合同審查、法律文書起草等對(duì)準(zhǔn)確性要求極高的場(chǎng)景中,"生成-審查"雙保險(xiǎn)機(jī)制能顯著提升產(chǎn)出的可靠性。

• 戰(zhàn)略分析與投研:Council的并行對(duì)比機(jī)制天然適用于需要多維度交叉驗(yàn)證的復(fù)雜決策場(chǎng)景,幫助投資人和企業(yè)管理者捕捉單一視角可能遺漏的關(guān)鍵信號(hào)。

對(duì)于中國(guó)AI產(chǎn)業(yè)而言,微軟的這一動(dòng)作同樣具有參考價(jià)值。

當(dāng)前國(guó)內(nèi)大模型賽道競(jìng)爭(zhēng)激烈,但多數(shù)玩家仍困在"單模型比參數(shù)"的競(jìng)爭(zhēng)框架中。微軟的實(shí)踐表明,多模型協(xié)作編排可能是一個(gè)被低估的方向——尤其是在國(guó)內(nèi)已有多個(gè)差異化能力模型(如DeepSeek在推理能力上的突出表現(xiàn)、文心一言在中文理解上的積累等)的背景下,如何構(gòu)建一個(gè)高效的多模型調(diào)度與協(xié)作平臺(tái),或許比執(zhí)著于訓(xùn)練一個(gè)"全能冠軍模型"更具商業(yè)可行性。(本文首發(fā)鈦媒體APP,作者 | 硅谷Tech_news,編輯 | 秦聰慧)

作品聲明:內(nèi)容由AI生成
本文系作者 硅谷Tech news 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

17:30

AI潮玩品牌“MOMOTOY”完成數(shù)千萬元融資

17:29

浪潮信息發(fā)布企業(yè)級(jí)OpenClaw方案“企千蝦”

17:26

工信部:有攻擊者利用針對(duì)蘋果公司終端產(chǎn)品的漏洞利用工具實(shí)施網(wǎng)絡(luò)攻擊活動(dòng),可導(dǎo)致信息竊取、系統(tǒng)受控等嚴(yán)重危害

17:24

伊朗警告將摧毀美以在中東所有資產(chǎn)

17:24

*ST精倫:收到上交所擬終止股票上市事先告知書

17:10

馬來西亞吉隆坡綜合指數(shù)收盤跌0.2%,報(bào)1695.50點(diǎn)

17:10

仙鶴股份:實(shí)控人之一王明龍因涉嫌短線交易被立案

17:06

擔(dān)心風(fēng)險(xiǎn)、不滿美對(duì)外干預(yù),超2000名數(shù)學(xué)家抵制赴美參會(huì)

17:05

豫光金鉛:擬定增募資不超過18.39億元,用于先進(jìn)稀貴金屬材料智造項(xiàng)目等

17:02

殯葬領(lǐng)域6項(xiàng)行業(yè)標(biāo)準(zhǔn)出臺(tái)

17:02

四川路橋:下屬企業(yè)中標(biāo)南充至廣安鐵路60.69億元項(xiàng)目并參與設(shè)立合伙企業(yè)

16:54

中證指數(shù)修訂中證華福福建100指數(shù)編制方案

16:54

十部門:人工智能產(chǎn)品和服務(wù)應(yīng)采取充分措施確保隱私數(shù)據(jù)得到有效保護(hù)

16:53

十部門:推廣符合科技倫理的人工智能產(chǎn)品和服務(wù),保護(hù)科技倫理審查技術(shù)知識(shí)產(chǎn)權(quán)

16:51

十部門:開展人工智能科技活動(dòng)應(yīng)將科技倫理要求貫穿全過程

16:49

長(zhǎng)久物流:聘任黃清清為公司財(cái)務(wù)總監(jiān)

16:41

乘聯(lián)分會(huì):2026年1-2月中國(guó)汽車出口155萬輛,同比增長(zhǎng)61%

16:36

乘聯(lián)分會(huì):2026年1-2月汽車行業(yè)利潤(rùn)435億元,同比下降30%

16:35

乘聯(lián)會(huì):3月中國(guó)乘用車新能源市場(chǎng)零售78.4萬輛,環(huán)比增長(zhǎng)69%

16:32

在岸人民幣兌美元收?qǐng)?bào)6.8803,較上一交易日上漲133點(diǎn)

掃描下載App