首頁

螞蟻數(shù)科發(fā)布金融推理大模型助力金融機構加速落地智能體應用

2025-07-29 23:37 來源：證券日報

本報訊（記者李冰）7月28日，在世界人工智能大會論壇上，螞蟻數(shù)科正式發(fā)布金融推理大模型Agentar-Fin-R1，為金融AI應用打造“可靠、可控、可優(yōu)化”的智能中樞。Agentar-Fin-R1基于Qwen3研發(fā)，在FinEval1.0、FinanceIQ等權威金融大模型評測基準上超越DeepSeek-R1等同尺寸開源通用大模型以及金融大模型，顯示其更強的金融專業(yè)性、推理能力以及安全合規(guī)能力。

“通用大模型距離產(chǎn)業(yè)實際應用存在‘知識鴻溝’。構建專業(yè)的金融大模型是推進金融與AI深度融合的必然路徑，未來，金融大模型的應用深度將成為金融機構競爭力的關鍵要素。”螞蟻數(shù)科CEO趙聞飆在演講中表示。

據(jù)悉，螞蟻數(shù)科通過構建全面的金融任務數(shù)據(jù)體系以及模型訓練算法創(chuàng)新，實現(xiàn)模型更強的金融推理能力及可信性。評測結果顯示：相較于通用開源模型及其他金融模型，Agentar-Fin-R1在FinEval1.0、FinanceIQ兩大主流金融基準測試中均取得最高評分。并且模型在金融能力顯著增強的同時，通用能力也表現(xiàn)出較高水準。

在數(shù)據(jù)層面，螞蟻數(shù)科構建了業(yè)內最全面與專業(yè)的金融任務分類體系，包括6大類、66小類場景，覆蓋銀行、證券、保險、基金、信托等金融全場景。基于千億級金融專業(yè)數(shù)據(jù)語料，通過可信數(shù)據(jù)合成技術以及結合專家標注的金融長思維鏈（CoT）構造機制，顯著提升模型處理復雜任務的能力，讓大模型“天生懂金融，出廠即專家”。

在訓練層面，創(chuàng)新的加權訓練算法，提高大模型對復雜金融任務學習效率與性能。在后續(xù)業(yè)務應用中，可顯著減少二次微調的數(shù)據(jù)需求與算力消耗，有效降低大模型在企業(yè)落地的門檻與成本。此外，Agentar-Fin-R1還能不斷更新迭代，吸收最新的金融政策、市場動態(tài)等關鍵信息，并通過配套評測工具進行針對性優(yōu)化，讓模型能力在真實業(yè)務場景中不斷進化。

為了考察大模型在實際金融場景中部署的能力，螞蟻數(shù)科還聯(lián)合工商銀行、寧波銀行、北京前沿金融監(jiān)管科技研究院、上海人工智能行業(yè)協(xié)會等機構聯(lián)合推出Finova大模型金融應用評測基準，深度考察智能體能力、復雜推理以及安全合規(guī)能力。在Finova評測中，Agentar-Fin-R1也取得最高評分，甚至超越更大參數(shù)規(guī)模的通用模型。目前Finova已經(jīng)全面開源，推動行業(yè)共同提升大模型在金融領域的應用水平。

相關資訊

甬城證券期貨機構共探財富管理轉型聚力提升投資者服務質效2025-07-29 17:25

-證券日報網(wǎng)

熱點新聞

AI浪潮下“HALO”資產(chǎn)迎來長期發(fā)展機遇

公募基金發(fā)行持續(xù)升溫權益類產(chǎn)品“唱主角”

從典型案例看資本市場立體化追責體系日臻成熟

從文化流量到消費增量 “博物館經(jīng)濟圈”釋放新價值

24小時排行一周排行

深度策劃

新一輪以舊換新落地激發(fā)消費新動能

首先，一些地方在出臺與消費品以舊換新相關的……[詳情]

市場快訊

23:33	從文化流量到消費增量 “博物館經(jīng)...
23:33	公募基金發(fā)行持續(xù)升溫權益類產(chǎn)品...
23:32	從典型案例看資本市場立體化追責體...
23:32	年內185名當事人被記入“失信黑名...
23:32	3月份中國物流業(yè)景氣指數(shù)為50.2% ...
23:32	業(yè)內預計3月份CPI同比進一步回升 P...
23:32	3月份新增信貸、社融或環(huán)比多增
23:32	各國央行黃金買賣行為緣何分化？
23:32	券商去年服務實體經(jīng)濟直接融資超8...
23:32	新版人身險產(chǎn)品負面清單落地進一...
23:32	一季度超八成百億元級私募機構斬獲...
23:32	中油資本擬全資收購英大期貨申請獲...

螞蟻數(shù)科發(fā)布金融推理大模型 助力金融機構加速落地智能體應用

螞蟻數(shù)科發(fā)布金融推理大模型助力金融機構加速落地智能體應用