奇富科技发布信贷场景专属视频评测任务FCMBench-Video-V1.0：从“看懂证件”到“看穿过程”

IP属地中国·北京 编辑：柳晴雪 TechWeb 时间：2026-05-09 00:50:55

5月8日消息，继今年早些时候发布全球首个面向信贷场景的多模态评测基准FCMBench-V1.0与V1.1后，奇富科技近日再推重磅成果，正式发布信贷场景专属的视频评测任务FCMBench-Video-V1.0，旨在通过视频任务推动信贷AI评测从“看懂一张图”进阶到“理解一段过程”。这为信贷场景中的视频理解能力提供了一把可量化的新标尺，标志着AI评测从“静态识别”向“动态研判”迈出了关键一步。
一张精心PS的证件照可能骗过静态审核系统，但一段手持拍摄的连续视频却会“泄密”：人物动作的连贯性、光照变化的连续性、对焦漂移的过程，乃至纸张翻页时的物理褶皱，这些天然携带的真实性信息极难被完美伪造。
FCMBench-Video正是锚定这一特性，将多模态大模型的评测，从二维图像推向了三维时空。
如果说FCMBench解决的是“模型能否读懂静态证照”的问题，那么FCMBench-Video关注的则是更具挑战性的能力边界。视频带来的不仅是更多画面，而是时间维度的引入，以及信息在时间轴上的组织方式。模型不仅需要识别内容，还需要理解这些内容在何时出现、是否重复出现、是否与前后信息一致，以及在复杂干扰下是否仍能保持稳定判断。这些能力直接关系到反欺诈链条中的关键环节，也是传统评测体系难以覆盖的盲区。
举个例子。一段视频里同一个证件反复出现，模型得学会“去重”，不能数一次就算一次；连续出现好几份文件，模型得会“对账”，比一比它们之间有没有矛盾；如果出了风险，模型还得能说出“我是根据第几秒的画面下的判断”。这些不再是简单的识别，而是考验记忆、推理和判断的综合题。
更值得关注的是，FCMBench-Video还创新性加入“防忽悠”测试，专门检验模型的反欺诈能力。测试中，研究人员会在视频末尾故意添加“已核实通过”等误导性提示，观察模型会不会因此忽略前面发现的风险。结果显示，不同模型的反欺诈能力差距悬殊，且暂无通用方法能规避此类误导，这一发现直接点明视频AI模型的安全性需专项测试、持续优化，为行业技术迭代指明了关键方向。在数据构建层面，FCMBench-Video延续了来源于业务、服务于业务的原则，同时进一步平衡了真实性与合规性之间的关系。通过模拟真实拍摄过程，结合多种现实环境下的画质变化，并在此基础上构建不同复杂度的视频样本，使评测既具备真实世界的挑战性，又避免涉及敏感信息。这种方法不仅保证了评测结果的参考价值，也为行业提供了一种可复制的数据构建路径。
从整体评测结果来看，当前主流视频多模态模型之间仍存在较大能力差距，即使是表现最优的模型，在部分关键任务上也未达到可以直接应用于生产环境的水平。这意味着，视频理解能力在信贷场景中的落地仍处于早期阶段，更印证了FCMBench-Video具备极强的能力区分度，能精准衡量模型的真实水平与提升空间，为企业技术选型、科研机构研究提供权威参考。
作为FCMBench评测基准的重要组成部分，FCMBench-Video延续开放共享理念，配套数据集与工具已同步开源开放，旨在汇聚更多科研工作者及行业机构参与信贷AI能力建设，为信贷AI技术落地实际应用搭建坚实桥梁。
需要说明的是，当前版本的FCMBench-Video所覆盖的文档视频分析，仅为信贷场景视频分析任务的细分维度之一。本次任务设计，提炼自奇富科技当前迭代打磨中的视频尽调AI产品。AI视频尽调不仅要求模型具备准确的文档内容理解能力，更需要对企业经营现场开展全方位综合研判，涵盖厂房环境、生产设备、原料库存、工艺流程、人员作业状态等关键维度，进而推演企业真实经营现状、偿债履约水平及潜在经营风险。这类真实业务诉求，对视频尽调AI模型的产业化落地提出了更高标准与全新挑战。
FCMBench-Video所构建的评测方法论，能够助力复杂视频尽调场景筑牢核心技术底座，推动多模态信贷AI评测从“看懂一张图”升级为“理解一座工厂”，逐步完善覆盖信贷全业务流程的评测能力体系，实现评测基准源于业务场景、赋能业务落地。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

携程：2026财年第一财季营收162亿元，同比增长17%

俞浩社交账户已被公司接管，网上发疯是做极限测试，全民自媒体已终止

携程暴跌14%

硅芯片真神归位 IBM首发0.7nm工艺：密度5倍于7nm

零跑首款旗舰MPV D99正式上市 24.98万元起售

尊界S800 Grand Design典藏大观上市：L3+架构、售价138.8万元

全站最新

携程：2026财年第一财季营收162亿元，同比增长17%

俞浩社交账户已被公司接管，网上发疯是做极限测试，全民自媒体已终止

携程暴跌14%

硅芯片真神归位 IBM首发0.7nm工艺：密度5倍于7nm

热门推荐

携程预期Q2业绩增速大幅放缓，高管回应市场竞争

“龙大转债”倒计时不足一月，ST龙大坦言“钱不够还”

携程：2026财年第一财季营收162亿元，同比增长17%

俞浩社交账户已被公司接管，网上发疯是做极限测试，全民自媒体已终止

携程暴跌14%

硅芯片真神归位 IBM首发0.7nm工艺：密度5倍于7nm

零跑首款旗舰MPV D99正式上市 24.98万元起售

尊界S800 Grand Design典藏大观上市：L3+架构、售价138.8万元

零跑朱江明：当初差点跟罗永浩一样去做手机评估后放弃了

全尺寸MPV尊界V800/V680亮相：搭载全主动悬架，预售价80万-120万/65万-90万元

苹果罕见承认成本失控：Mac、Pad全球涨价，iPhone暂未受影响

速速下单！苹果Mac系列电商渠道还没涨价：最后的原价上车机会

江汽董事长项兴初：积极对标华为、站在巨人的肩膀上，产品研发效率提升近四成

百度千帆Coding Plan停止续费：已购用户可正常使用至服务到期

哈弗旗舰方盒子SUV长城H10亮相：归元平台打造，提供5座和6座布局

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

奇富科技发布信贷场景专属视频评测任务FCMBench-Video-V1.0：从“看懂证件”到“看穿过程”