金融行業(yè)又迎來了一個新的大模型。

7月底舉行的2025世界人工智能大會(WAIC)論壇上,螞蟻數(shù)科正式發(fā)布金融推理大模型Agentar-Fin-R1,提供32B和8B兩個版本,為金融AI應(yīng)用打造可靠可優(yōu)化智能中樞。

該模型基于Qwen3研發(fā),在FinEval1.0、FinanceIQ等權(quán)威金融大模型評測基準(zhǔn)上超越同尺寸開源通用大模型以及金融大模型,顯示其更強的金融專業(yè)性、推理能力以及安全合規(guī)能力。

實際上,隨著大模型從技術(shù)走向應(yīng)用落地,金融行業(yè)的實際業(yè)務(wù)場景中,往往需要高度專業(yè)的金融知識、復(fù)雜的業(yè)務(wù)邏輯推理能力以及嚴(yán)格的金融級安全合規(guī)等要求,然而,現(xiàn)有的基礎(chǔ)大模型“幻覺率”依然很高,在解決實際金融任務(wù)時仍然存在諸多挑戰(zhàn),因此,“百模大戰(zhàn)”下,金融這一專業(yè)領(lǐng)域也需要更懂金融的專業(yè)大模型。

螞蟻數(shù)科CEO趙聞飆表示,通用大模型距離產(chǎn)業(yè)實際應(yīng)用存在“知識鴻溝”。構(gòu)建專業(yè)的金融大模型是推進金融與AI深度融合的必然路徑,未來,金融大模型的應(yīng)用深度將成為金融機構(gòu)競爭力的關(guān)鍵要素。

基礎(chǔ)大模型無法適應(yīng)金融專業(yè)場景

研究機構(gòu)IDC于近日發(fā)布的一份報告顯示,2024年,中國金融行業(yè)生成式 AI平臺及應(yīng)用解決方案市場總規(guī)模約為9.14億元人民幣,約占整體AI平臺及應(yīng)用市場規(guī)模的14%。

由于金融行業(yè)的特殊性,往往對于數(shù)據(jù)安全性、隱私保護以及監(jiān)管合規(guī)等要求高于其他行業(yè)。大多數(shù)金融機構(gòu)會選擇本地化部署方式落地生成式AI平臺及生成式AI應(yīng)用。數(shù)據(jù)顯示,2024年,中國金融行業(yè)生成式 AI 平臺及應(yīng)用解決方案市場規(guī)模中本地化部署方式的規(guī)模約占總規(guī)模的91%。

而且,保險、消金/互金、券商等金融機構(gòu)在合同審核、智能客服、知識助手等場景仍會以MaaS(MaaS)模式接入大模型,以此提供以云服務(wù)模式交付的全流程大模型生命周期工具鏈以及大模型服務(wù)。

WAIC一場論壇上,浙江大學(xué)教授、區(qū)塊鏈與數(shù)據(jù)安全全國重點實驗室主任陳純表示,大模型的專業(yè)化應(yīng)用,首要的是可靠性問題。盡管當(dāng)前技術(shù)SOTA(指行業(yè)頂尖水平)已經(jīng)達到了80%到90%的水平,但其可靠性距離醫(yī)療、工業(yè)、金融等專業(yè)場景的要求仍有顯著差距。

螞蟻數(shù)科CTO王維也表示,金融行業(yè)用好AI技術(shù)還是面臨很多的挑戰(zhàn),包括大模型在金融場景中的“幻覺”、差錯或者回答沒有達到金融企業(yè)要求,“如何把通用能力和場景鴻溝彌合。從水平通用大模型向?qū)I(yè)/專用模型演進,這也是數(shù)科持續(xù)攻堅的方向。”

事實上,螞蟻數(shù)科此次發(fā)布的金融推理大模型Agentar-Fin-R1,就是專門面向金融任務(wù)設(shè)計,通過構(gòu)建全面的金融任務(wù)數(shù)據(jù)體系以及模型訓(xùn)練算法創(chuàng)新,實現(xiàn)模型更強的金融推理能力及可信性。

在數(shù)據(jù)層面,螞蟻數(shù)科構(gòu)建了業(yè)內(nèi)最全面與專業(yè)的金融任務(wù)分類體系,包括6大類、66小類場景,覆蓋銀行、證券、保險、基金、信托等金融全場景,基于千億級金融專業(yè)數(shù)據(jù)語料,通過可信數(shù)據(jù)合成技術(shù)以及結(jié)合專家標(biāo)注的金融長思維鏈(CoT)構(gòu)造機制,顯著提升模型處理復(fù)雜任務(wù)的能力;

訓(xùn)練層面,螞蟻創(chuàng)新的加權(quán)訓(xùn)練算法,最大化提升數(shù)據(jù)利用效率及訓(xùn)練效率,同時通過動態(tài)分配訓(xùn)練資源,提高大模型對復(fù)雜金融任務(wù)學(xué)習(xí)效率與性能,在后續(xù)業(yè)務(wù)應(yīng)用中,可以顯著減少二次微調(diào)的數(shù)據(jù)需求與算力消耗,降低大模型落地企業(yè)的門檻和成本。

此外,Agentar-Fin-R1不斷更新迭代,吸收最新的金融政策、市場動態(tài)等關(guān)鍵信息,并通過配套評測工具進行針對性優(yōu)化,確保知識、能力和合規(guī)性始終緊跟行業(yè)變化,讓模型能力在真實業(yè)務(wù)場景中不斷進化。

評測結(jié)果顯示,在業(yè)內(nèi)主流的大模型金融評估基準(zhǔn)FinEval 1.0、FinancelQ等評測中,Agentar-Fin-R1均取得最高評分,超過DeepSeek、Qwen等開源通用模型以及xuanyuan等金融大模型,并且Agentar-Fin-R1在金融能力顯著增強的同時,通用能力也表現(xiàn)出較高水準(zhǔn)。

為了考察大模型在實際金融場景中部署的能力,螞蟻數(shù)科還聯(lián)合中國工商銀行、寧波銀行、北京前沿金融監(jiān)管科技研究院、上海人工智能行業(yè)協(xié)會等機構(gòu)聯(lián)合推出Finova大模型金融應(yīng)用評測基準(zhǔn),深度考察智能體能力、復(fù)雜推理以及安全合規(guī)能力。

在Finova評測中,Agentar-Fin-R1也取得最高評分,甚至超越DeepSeek-R1、GPT-o1等更大參數(shù)規(guī)模的通用模型。目前Finova已經(jīng)全面開源,推動行業(yè)共同提升大模型在金融領(lǐng)域的應(yīng)用水平。

據(jù)悉,Agentar-Fin-R1包括32B和8B參數(shù)兩個版本。螞蟻數(shù)科還推出基于百靈大模型的MoE(混合專家)架構(gòu)模型,獲得更優(yōu)推理速度。此外,還有非推理版本的14B和72B參數(shù)大模型,以滿足金融機構(gòu)在多樣化場景下的部署需求。

“一個推理能力很強的垂直大模型,才能成為智能體可控、可靠、可優(yōu)化的智能中樞。齒輪決定了機器、履帶要嚴(yán)絲合縫,沒有關(guān)鍵性的齒輪,那其他的齒輪就帶不動。而推理模型產(chǎn)生出來的推理能力、泛化和意圖識別能力,可以讓企業(yè)更加有意愿升級原有的業(yè)務(wù)模式,否則就很難談增量價值的創(chuàng)造了。”王維稱。

“AI+金融”進入深水區(qū),2027年國內(nèi)規(guī)模將超35億元

IDC預(yù)計,到2027年,中國金融行業(yè)生成式 AI 平臺及應(yīng)用解決方案市場規(guī)模將攀升至35.09億元,較2024年實現(xiàn)384%的增幅。

IDC中國金融行業(yè)研究總監(jiān)高飛表示,隨著大模型相關(guān)技術(shù)的快速迭代,生成式AI在金融行業(yè)的實踐正在經(jīng)歷從“局部工具”向“企業(yè)級平臺能力”的升級。其應(yīng)用場景也在由單一的效率提升,逐步拓展至業(yè)務(wù)決策的支持與任務(wù)執(zhí)行。

“一個不能理解行業(yè)的大模型,它難以產(chǎn)生真正的價值。”王維表示,螞蟻數(shù)科希望幫助金融行業(yè)客戶解決大模型在核心業(yè)務(wù)場景落地的問題,讓大模型真正深入實際應(yīng)用場景,創(chuàng)造真實價值。

在王維看來,螞蟻數(shù)科的優(yōu)勢,一方面在于背靠螞蟻集團的底層技術(shù)能力,另一方面來自于長期深耕金融場景所積累的金融know-how能力。

今年以來,螞蟻數(shù)科加速布局企業(yè)級大模型服務(wù),并聚焦金融與新能源兩大行業(yè)場景。

其中,在金融領(lǐng)域,螞蟻數(shù)科此前推出金融智能體平臺Agentar,貫通智算調(diào)度、數(shù)據(jù)與模型平臺、行業(yè)大模型及應(yīng)用落地全流程,助力金融機構(gòu)高效搭建專業(yè)智能體應(yīng)用,加速大模型在金融行業(yè)的落地應(yīng)用。

今年7月,螞蟻數(shù)科還宣布聯(lián)合金融業(yè)伙伴進行創(chuàng)新,推出超過100個金融場景智能體解決方案,覆蓋銀行、證券、保險、通用等四大領(lǐng)域。包括零售業(yè)務(wù)助手、AI原生手機銀行、智能營銷和風(fēng)控等多個已經(jīng)在金融實際場景中深度應(yīng)用的智能體解決方案。

以上海某銀行為例。螞蟻數(shù)科助力該行打造的AI手機銀行,創(chuàng)新“對話即服務(wù)”模式,用戶通過自然對話即可獲取各類金融服務(wù),月活用戶同比增長25%。

螞蟻數(shù)科與大地保險打造的“AI大模型中臺”,則是保險業(yè)內(nèi)首次將大模型、數(shù)據(jù)、算力和框架相結(jié)合,通過大模型技術(shù)與行業(yè)特定垂直場景緊密結(jié)合,大地保險模型應(yīng)用部署過程無須人工介入和適配,效率提升80%,準(zhǔn)確率及智能體應(yīng)用問答效率提升近30%。

目前,螞蟻數(shù)科累計已服務(wù)100%的國有銀行和股份制銀行、超60%的地方性商業(yè)銀行、數(shù)百家金融機構(gòu)。

“AI 雖然離全面替代人工還有很長一段距離,但是利用AI賦能業(yè)務(wù)發(fā)展的趨勢和方向是毋庸置疑的。我們判斷,AI對人類社會的影響會越來越大,商業(yè)銀行與AI的連接,不是一個‘要不要’的問題,而是‘怎么用’的問題。”中國農(nóng)業(yè)銀行股份有限公司副董事長、執(zhí)行董事、行長王志恒近期對外表示。

王維強調(diào),如今已經(jīng)進入企業(yè)級智能體爆發(fā)之年,螞蟻數(shù)科會逐步覆蓋且深化金融場景,幫助客戶解決業(yè)務(wù)場景的難題,讓大模型在金融業(yè)從“可用”到“好用”,加速大模型在金融業(yè)的規(guī)?;瘍r值落地,“這是一場沒有完成時,只有進行時的長跑”。(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|蓋虹達)

本文系作者 林志佳 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

19:49

沙特推出金融新舉措促進經(jīng)濟轉(zhuǎn)型

19:47

德國外長稱美伊代表可能會在巴基斯坦會晤

19:46

世嘉科技:擬1.3億元收購光彩芯辰6.94%股權(quán),標(biāo)的公司來自海外客戶的800G以上光模塊產(chǎn)品出貨量開始增加

19:45

150家券商實現(xiàn)總營收5412億、凈利2194億,投顧業(yè)務(wù)大幅增長

19:39

珠江啤酒:擬使用不超過100億元閑置資金進行現(xiàn)金管理

19:38

中國保險行業(yè)協(xié)會發(fā)布《保險產(chǎn)品適當(dāng)性管理自律規(guī)范》

19:36

九州一軌:擬4.15億元收購晶禧半導(dǎo)體100%股權(quán)并向其增資3500萬元

19:36

九州一軌:擬8000萬元參設(shè)合資公司,布局第四代半導(dǎo)體金剛石材料

19:35

ST百靈:因涉嫌信息披露違法違規(guī),公司被貴州證監(jiān)局罰款1000萬元

19:34

渤海租賃:控股子公司下屬企業(yè)擬出售10架B737-8 MAX飛機資產(chǎn),目錄價格約12億美元

19:34

金風(fēng)科技:2025年凈利潤27.74億元,同比增長49%

19:33

北京君正:擬2億元增資榮芯半導(dǎo)體

19:33

中債估值中心:3月30日起,新增在全國中小企業(yè)股份轉(zhuǎn)讓系統(tǒng)轉(zhuǎn)讓的優(yōu)先股估值

19:21

山東黃金:控股子公司山金國際已重新向香港聯(lián)交所遞交H股發(fā)行上市申請

19:20

香港創(chuàng)新科技及工業(yè)局:100億港元創(chuàng)科產(chǎn)業(yè)引導(dǎo)基金將爭取年內(nèi)投入運作

19:18

外交部亞洲司司長劉勁松會見韓國駐華使館新任公使劉福根

19:15

國常會研究加快建設(shè)分級診療體系有關(guān)政策措施

19:14

李強主持召開國務(wù)院常務(wù)會議,聽取當(dāng)前我國服務(wù)業(yè)發(fā)展情況匯報

19:12

三菱電機、羅姆和東芝據(jù)悉醞釀?wù)瞎β拾雽?dǎo)體業(yè)務(wù)

19:11

中國鋁業(yè):2025年凈利潤127億元,同比增長2.25%

掃描下載App