金融行业又迎来了一个新的大模型。
该模型基于Qwen3研发,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越同尺寸开源通用大模型以及金融大模型,显示其更强的金融专业性、推理能力以及安全合规能力。
实际上,随着大模型从技术走向应用落地,金融行业的实际业务场景中,往往需要高度专业的金融知识、复杂的业务逻辑推理能力以及严格的金融级安全合规等要求,然而,现有的基础大模型“幻觉率”依然很高,在解决实际金融任务时仍然存在诸多挑战,因此,“百模大战”下,金融这一专业领域也需要更懂金融的专业大模型。
蚂蚁数科CEO赵闻飙表示,通用大模型距离产业实际应用存在“知识鸿沟”。构建专业的金融大模型是推进金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。
基础大模型无法适应金融专业场景
研究机构IDC于近日发布的一份报告显示,
由于金融行业的特殊性,往往对于数据安全性、隐私保护以及监管合规等要求高于其他行业。大多数金融机构会选择本地化部署方式落地生成式AI平台及生成式AI应用。
而且,保险、消金/互金、券商等金融机构在合同审核、智能客服、知识助手等场景仍会以MaaS模式接入大模型,以此提供以云服务模式交付的全流程大模型生命周期工具链以及大模型服务。
WAIC一场论坛上,浙江大学教授、区块链与数据安全全国重点实验室主任陈纯表示
蚂蚁数科CTO王维也表示,金融行业用好AI技术还是面临很多的挑战,包括大模型在金融场景中的“幻觉”、差错或者回答没有达到金融企业要求,“如何把通用能力和场景鸿沟弥合。从水平通用大模型向专业/专用模型演进,这也是数科持续攻坚的方向。”
,蚂蚁数科此次发布的金融推理大模型Agentar-Fin-R1,就是专门面向金融任务设计,通过构建全面的金融任务数据体系以及模型训练算法创新,实现模型更强的金融推理能力及可信性。
在数据层面,蚂蚁数科构建了业内最全面与专业的金融任务分类体系,包括6大类、66小类场景,覆盖银行、证券、保险、基金、信托等金融全场景,基于千亿级金融专业数据语料,通过可信数据合成技术以及结合专家标注的金融长思维链构造机制,显著提升模型处理复杂任务的能力;
训练层面,蚂蚁创新的加权训练算法,最大化提升数据利用效率及训练效率,同时通过动态分配训练资源,提高大模型对复杂金融任务学习效率与性能,在后续业务应用中,可以显著减少二次微调的数据需求与算力消耗,降低大模型落地企业的门槛和成本。
此外,Agentar-Fin-R1不断更新迭代,吸收最新的金融政策、市场动态等关键信息,并通过配套评测工具进行针对性优化,确保知识、能力和合规性始终紧跟行业变化,让模型能力在真实业务场景中不断进化。
评测结果显示,在业内主流的大模型金融评估基准FinEval 1.0、FinancelQ等评测中,Agentar-Fin-R1均取得最高评分,超过DeepSeek、Qwen等开源通用模型以及xuanyuan等金融大模型,并且Agentar-Fin-R1在金融能力显著增强的同时,通用能力也表现出较高水准。
为了考察大模型在实际金融场景中部署的能力,蚂蚁数科还联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构联合推出Finova大模型金融应用评测基准,深度考察智能体能力、复杂推理以及安全合规能力。
在Finova评测中,Agentar-Fin-R1也取得最高评分,甚至超越DeepSeek-R1、GPT-o1等更大参数规模的通用模型。目前Finova已经全面开源,推动行业共同提升大模型在金融领域的应用水平。
据悉,Agentar-Fin-R1包括32B和8B参数两个版本。蚂蚁数科还推出基于百灵大模型的MoE架构模型,获得更优推理速度。此外,还有非推理版本的14B和72B参数大模型,以满足金融机构在多样化场景下的部署需求。
“一个推理能力很强的垂直大模型,才能成为智能体可控、可靠、可优化的智能中枢。齿轮决定了机器、履带要严丝合缝,没有关键性的齿轮,那其他的齿轮就带不动。而推理模型产生出来的推理能力、泛化和意图识别能力,可以让企业更加有意愿升级原有的业务模式,否则就很难谈增量价值的创造了。”王维称。
“AI+金融”进入深水区,2027年国内规模将超35亿元
IDC预计,
IDC中国金融行业研究总监高飞表示,随着大模型相关技术的快速迭代,生成式AI在金融行业的实践正在经历从“局部工具”向“企业级平台能力”的升级。其应用场景也在由单一的效率提升,逐步拓展至业务决策的支持与任务执行。
“一个不能理解行业的大模型,它难以产生真正的价值。”王维表示,蚂蚁数科希望帮助金融行业客户解决大模型在核心业务场景落地的问题,让大模型真正深入实际应用场景,创造真实价值。
在王维看来,蚂蚁数科的优势,一方面在于背靠蚂蚁集团的底层技术能力,另一方面来自于长期深耕金融场景所积累的金融know-how能力。
今年以来,蚂蚁数科加速布局企业级大模型服务,并聚焦金融与新能源两大行业场景。
其中,在金融领域,蚂蚁数科此前推出金融智能体平台Agentar,贯通智算调度、数据与模型平台、行业大模型及应用落地全流程,助力金融机构高效搭建专业智能体应用,加速大模型在金融行业的落地应用。
今年7月,蚂蚁数科还宣布联合金融业伙伴进行创新,推出超过100个金融场景智能体解决方案,覆盖银行、证券、保险、通用等四大领域。包括零售业务助手、AI原生手机银行、智能营销和风控等多个已经在金融实际场景中深度应用的智能体解决方案。
以上海某银行为例。蚂蚁数科助力该行打造的AI手机银行,创新“对话即服务”模式,用户通过自然对话即可获取各类金融服务,月活用户同比增长25%。
蚂蚁数科与大地保险打造的“AI大模型中台”,则是保险业内首次将大模型、数据、算力和框架相结合,通过大模型技术与行业特定垂直场景紧密结合,大地保险模型应用部署过程无须人工介入和适配,效率提升80%,准确率及智能体应用问答效率提升近30%。
目前,蚂蚁数科累计已服务100%的国有银行和股份制银行、超60%的地方性商业银行、数百家金融机构。
中国农业银行股份有限公司副董事长、执行董事、行长王志恒近期对外表示。
王维强调,如今已经进入企业级智能体爆发之年,蚂蚁数科会逐步覆盖且深化金融场景,帮助客户解决业务场景的难题,让大模型在金融业从“可用”到“好用”,加速大模型在金融业的规模化价值落地,“这是一场没有完成时,只有进行时的长跑”。
消息,Sanpshot 页面显示,Aave 正在对将年度回购预算从 5000 万美元下调至 3000 万美元的 ARFC 提案...
2 加密货币新闻:Pepeto发布跨链工具安全更Pepeto宣布对其跨链基础设施进行重大安全更新,强化其人工智能驱动的合约验证层,并扩展其...
3 以色列拦截导弹库存被曝“严重不足”美国官员透露,以色列本周告知美国,随着与伊朗的冲突持续激烈,其弹道导弹拦截弹已告急...
4 摩根大通测试投资者信贷周期胃口消息,据彭博社发推称:摩根大通首席执行官杰米戴蒙数周乃至数月来持续警告信贷周期终将...
5 Grayscale 的首席分析师刚刚表示 XRP 定价错灰度研究主管 Zach Pandl 表示,一旦监管政策明朗化,XRP 有望迎来意义重大的重新定价,他指出...
6 巨鲸10倍杠杆做多25.18万LINK消息,据链上分析平台Lookonchain发推称:一小时内,有用户新建钱包并开启 10 倍杠杆做多 25....
7 渣打银行称,企业正考虑以人民币借贷。渣打银行对300家企业客户的调查显示,全球企业越来越多地将人民币用于营收、供应链和采购...
8 以太坊基金会场外出售5000枚ETH消息,据吴说区块链发推称:以太坊基金会以均价 2042.96 美元场外出售 5000 枚 ETH 给 BitMNR,所...
9 黎巴嫩和以色列将在未来几天举行直接会消息,3 月 14 日,预计黎巴嫩和以色列将在未来几天举行直接会谈,由美国特使 Jared Kushner 领...
10 巨鲸0x3ed4沉寂两月后回归,向Hyperliquid存消息,据链上分析平台Lookonchain发推称:巨鲸 0x3ed4 在近两个月沉寂后重返市场,向 Hyperliquid...
成都来彰科技 蜀ICP备2025134723号-1
资讯来源互联网,如有版权问题请联系管理员删除。