环球网
在7月28日举行的世界人工智能大会论坛上,蚂蚁数科正式发布金融推理大模型Agentar-Fin-R1,旨在为金融领域人工智能应用构建“可靠、可控、可优化”的智能核心引擎。
该模型基于国产基础大模型Qwen3研发,在FinEval1.0、FinanceIQ等权威金融评测基准上的表现,已超越包括DeepSeek-R1在内的同规模开源通用模型及其他金融专业模型,展现了其在金融专业性、复杂推理能力及安全合规性上的显著优势。
当前,金融行业数智化转型持续加速,大模型应用日益深化。然而,高度专业的金融知识、复杂的业务逻辑推理要求以及严苛的金融级安全合规标准,对现有通用大模型在实际业务场景中的应用构成了严峻挑战。
“通用大模型与产业实际应用需求间存在明显的‘知识鸿沟’。构建专业化的金融大模型,是推动金融与人工智能深度融合的必由之路。未来,金融大模型的应用深度将成为衡量金融机构核心竞争力的关键指标。”蚂蚁数科首席执行官赵闻飙在论坛主旨演讲中强调。
据悉,蚂蚁数科通过构建覆盖金融全场景的专业任务数据体系与创新模型训练算法,显著提升了Agentar-Fin-R1的金融推理能力与可信度。权威评测显示:该模型在FinEval1.0和FinanceIQ两大主流金融基准测试中均拔得头筹。尤为难得的是,其金融能力实现跃升的同时,通用能力亦保持在较高水准。
目前,蚂蚁数科建立了全面、专业的金融任务分类体系,涵盖银行、证券、保险、基金、信托等全场景,细分为6大类、66小类。基于千亿级金融专业语料,结合可信数据合成技术及融合专家知识的金融长思维链(CoT)标注机制,大幅提升模型处理复杂金融任务的能力,力求实现“天生懂金融,出厂即专家”。采用独创的加权训练算法,动态优化模型学习过程,显著提升其对复杂金融任务的学习效率与性能表现。该技术可有效减少后续业务微调所需的数据量和算力消耗,显著降低大模型在企业端部署的成本与门槛。
值得关注的是,Agentar-Fin-R1具备持续迭代能力,能够吸收最新金融政策、市场动态等关键信息,并通过配套工具进行针对性优化,确保模型能力在真实业务场景中持续进化。
Agentar-Fin-R1提供32B和8B两种参数版本。此外,蚂蚁数科还推出了基于百灵大模型的MOE架构模型以获得更优推理速度,以及非推理版本的14B和72B参数大模型,全面满足金融机构多样化部署需求。
作为蚂蚁集团旗下独立科技子公司,蚂蚁数科致力于以AI及Web3技术驱动产业数智化升级。今年以来,该公司加速布局企业级大模型服务,聚焦金融与新能源两大核心场景。在金融领域,其推出的金融智能体平台Agentar已成为首批通过中国信通院评测并获最高5级评级的平台产品,并联合合作伙伴推出超百个智能体解决方案,加速大模型在金融业的规模化落地。
以上海某银行为例,在蚂蚁数科技术支持下打造的AI手机银行,创新“对话即服务”模式,用户通过自然对话即可便捷获取金融服务,显著提升了老年客户满意度,带动月活跃用户同比增长达25%。目前,蚂蚁数科已服务国内全部国有大型银行和股份制银行、超过60%的地方性商业银行以及数百家各类金融机构,为金融业智能化转型提供坚实科技支撑。