当前位置: 首页 » 资讯 » 科技头条 » 正文

超越OpenAI、Claude 中国造深度研究系统在国际测评中位列全球第二

IP属地 中国·北京 封面新闻 时间:2025-11-12 18:24:37


封面新闻记者 欧阳宏宇

11月12日,国际权威评测DeepResearch Bench最新公布了最新测试结果:一项由中国科技企业研发的深度研究系统“Dingtalk-DeepResearch” 以48.49位列全球第二,仅次于获得49.71分的gemini-2.5-pro-DeepResearch,同时,OpenAI、Claude分列全球第三四位。这也标志着中国企业级AI技术迈入国际第一梯队。

据介绍,深度研究系统“Dingtalk-DeepResearch”的技术逻辑是一种面向真实企业场景的多智能体深度研究框架,将深度研究生成、异构表格解析与推理、多模态报告生成有效整合在同一系统中。

其技术创新性在于应对企业场景的动态变化,该框架区别于传统静态架构,通过熵引导、记忆感知的在线学习机制使智能体能够持续演进,就像员工可通过反复实践提升技能,而无需人工干预。该机制保障系统能自动从历史交互中归纳经验,逐步适应不同企业的业务流程与用户操作风格。

为确保生成内容的准确性与可靠性,Dingtalk-DeepResearch内置了DingAutoEvaluator评估系统。该系统会对生成的每一份报告进行多维度“质量检验”,涵盖数据准确性、逻辑连贯性、工具使用规范等。一旦发现问题,系统会自动将相关案例反馈至训练流程以优化模型,形成一套从生成、评估到优化的持续改进闭环。

目前,Dingtalk-DeepResearch已成功应用于制造业、供应链等复杂场景,能够在复杂异构表格、多阶段推理与多模态生成任务中保持行业领先的准确性和稳健性,帮助企业高效处理多模态数据,实现智能升级。

“Dingtalk-DeepResearch通过结合自适应优化和多模态推理,形成一个可灵活部署的企业级AI框架,旨在处理复杂且不断演进的真实业务任务。”该系统所属研发团队钉钉CTO朱鸿表示,该技术正加速在AI搜索、AI表格、自动化工作流、Agent平台等产品中落地,让前沿AI技术更贴近实际生产需求,为企业提供真正创造价值的AI。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新