当前位置: 首页 » 资讯 » 科技头条 » 正文

奇富科技发布信贷场景专属视频评测任务FCMBench-Video-V1.0:从“看懂证件”到“看穿过程”

IP属地 中国·北京 编辑:柳晴雪 TechWeb 时间:2026-05-09 00:50:55

5月8日消息,继今年早些时候发布全球首个面向信贷场景的多模态评测基准FCMBench-V1.0与V1.1后,奇富科技近日再推重磅成果,正式发布信贷场景专属的视频评测任务FCMBench-Video-V1.0,旨在通过视频任务推动信贷AI评测从“看懂一张图”进阶到“理解一段过程”。这为信贷场景中的视频理解能力提供了一把可量化的新标尺,标志着AI评测从“静态识别”向“动态研判”迈出了关键一步。

一张精心PS的证件照可能骗过静态审核系统,但一段手持拍摄的连续视频却会“泄密”:人物动作的连贯性、光照变化的连续性、对焦漂移的过程,乃至纸张翻页时的物理褶皱,这些天然携带的真实性信息极难被完美伪造。

FCMBench-Video正是锚定这一特性,将多模态大模型的评测,从二维图像推向了三维时空。

如果说FCMBench解决的是“模型能否读懂静态证照”的问题,那么FCMBench-Video关注的则是更具挑战性的能力边界。视频带来的不仅是更多画面,而是时间维度的引入,以及信息在时间轴上的组织方式。模型不仅需要识别内容,还需要理解这些内容在何时出现、是否重复出现、是否与前后信息一致,以及在复杂干扰下是否仍能保持稳定判断。这些能力直接关系到反欺诈链条中的关键环节,也是传统评测体系难以覆盖的盲区。

举个例子。一段视频里同一个证件反复出现,模型得学会“去重”,不能数一次就算一次;连续出现好几份文件,模型得会“对账”,比一比它们之间有没有矛盾;如果出了风险,模型还得能说出“我是根据第几秒的画面下的判断”。这些不再是简单的识别,而是考验记忆、推理和判断的综合题。

更值得关注的是,FCMBench-Video还创新性加入“防忽悠”测试,专门检验模型的反欺诈能力。测试中,研究人员会在视频末尾故意添加“已核实通过”等误导性提示,观察模型会不会因此忽略前面发现的风险。结果显示,不同模型的反欺诈能力差距悬殊,且暂无通用方法能规避此类误导,这一发现直接点明视频AI模型的安全性需专项测试、持续优化,为行业技术迭代指明了关键方向。在数据构建层面,FCMBench-Video延续了来源于业务、服务于业务的原则,同时进一步平衡了真实性与合规性之间的关系。通过模拟真实拍摄过程,结合多种现实环境下的画质变化,并在此基础上构建不同复杂度的视频样本,使评测既具备真实世界的挑战性,又避免涉及敏感信息。这种方法不仅保证了评测结果的参考价值,也为行业提供了一种可复制的数据构建路径。

从整体评测结果来看,当前主流视频多模态模型之间仍存在较大能力差距,即使是表现最优的模型,在部分关键任务上也未达到可以直接应用于生产环境的水平。这意味着,视频理解能力在信贷场景中的落地仍处于早期阶段,更印证了FCMBench-Video具备极强的能力区分度,能精准衡量模型的真实水平与提升空间,为企业技术选型、科研机构研究提供权威参考。

作为FCMBench评测基准的重要组成部分,FCMBench-Video延续开放共享理念,配套数据集与工具已同步开源开放,旨在汇聚更多科研工作者及行业机构参与信贷AI能力建设,为信贷AI技术落地实际应用搭建坚实桥梁。

需要说明的是,当前版本的FCMBench-Video所覆盖的文档视频分析,仅为信贷场景视频分析任务的细分维度之一。本次任务设计,提炼自奇富科技当前迭代打磨中的视频尽调AI产品。AI视频尽调不仅要求模型具备准确的文档内容理解能力,更需要对企业经营现场开展全方位综合研判,涵盖厂房环境、生产设备、原料库存、工艺流程、人员作业状态等关键维度,进而推演企业真实经营现状、偿债履约水平及潜在经营风险。这类真实业务诉求,对视频尽调AI模型的产业化落地提出了更高标准与全新挑战。

FCMBench-Video所构建的评测方法论,能够助力复杂视频尽调场景筑牢核心技术底座,推动多模态信贷AI评测从“看懂一张图”升级为“理解一座工厂”,逐步完善覆盖信贷全业务流程的评测能力体系,实现评测基准源于业务场景、赋能业务落地。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。