超越OpenAI、Claude 中国造深度研究系统在国际测评中位列全球第二

IP属地中国·北京 封面新闻 时间：2025-11-12 18:24:37

封面新闻记者欧阳宏宇
11月12日，国际权威评测DeepResearch Bench最新公布了最新测试结果：一项由中国科技企业研发的深度研究系统“Dingtalk-DeepResearch” 以48.49位列全球第二，仅次于获得49.71分的gemini-2.5-pro-DeepResearch，同时，OpenAI、Claude分列全球第三四位。这也标志着中国企业级AI技术迈入国际第一梯队。
据介绍，深度研究系统“Dingtalk-DeepResearch”的技术逻辑是一种面向真实企业场景的多智能体深度研究框架，将深度研究生成、异构表格解析与推理、多模态报告生成有效整合在同一系统中。
其技术创新性在于应对企业场景的动态变化，该框架区别于传统静态架构，通过熵引导、记忆感知的在线学习机制使智能体能够持续演进，就像员工可通过反复实践提升技能，而无需人工干预。该机制保障系统能自动从历史交互中归纳经验，逐步适应不同企业的业务流程与用户操作风格。
为确保生成内容的准确性与可靠性，Dingtalk-DeepResearch内置了DingAutoEvaluator评估系统。该系统会对生成的每一份报告进行多维度“质量检验”，涵盖数据准确性、逻辑连贯性、工具使用规范等。一旦发现问题，系统会自动将相关案例反馈至训练流程以优化模型，形成一套从生成、评估到优化的持续改进闭环。
目前，Dingtalk-DeepResearch已成功应用于制造业、供应链等复杂场景，能够在复杂异构表格、多阶段推理与多模态生成任务中保持行业领先的准确性和稳健性，帮助企业高效处理多模态数据，实现智能升级。
“Dingtalk-DeepResearch通过结合自适应优化和多模态推理，形成一个可灵活部署的企业级AI框架，旨在处理复杂且不断演进的真实业务任务。”该系统所属研发团队钉钉CTO朱鸿表示，该技术正加速在AI搜索、AI表格、自动化工作流、Agent平台等产品中落地，让前沿AI技术更贴近实际生产需求，为企业提供真正创造价值的AI。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

爱奇艺王凯航：情绪经济不是选择题，而是时代命题

2026贝壳财经年会金融大会亮点揭秘！将于7月9日在京举行

OpenAI招聘投资银行专家，年薪最高20.5万美元外加股权

iPhone X一机难求再度重演！苹果折叠屏供货严重不足

Perplexity自研AI编程工具曝光，公司程序员已投入使用

小红书挖两年坑，把自己埋进去了

全站最新

爱奇艺王凯航：情绪经济不是选择题，而是时代命题

2026贝壳财经年会金融大会亮点揭秘！将于7月9日在京举行

OpenAI招聘投资银行专家，年薪最高20.5万美元外加股权

iPhone X一机难求再度重演！苹果折叠屏供货严重不足

热门推荐

谷歌Pixel Watch 5智能手表规格初现，41mm与45mm双尺寸，8月20日发货

阿里达摩院两项AI成果亮相联合国峰会具身平台与材料智能体双获优秀案例奖

爱奇艺王凯航：情绪经济不是选择题，而是时代命题

2026贝壳财经年会金融大会亮点揭秘！将于7月9日在京举行

打造人社人工智能重大场景，有6方面部署

内存一年暴涨300%！5000元以内的笔记本电脑近乎消失

OpenAI招聘投资银行专家，年薪最高20.5万美元外加股权

iPhone X一机难求再度重演！苹果折叠屏供货严重不足

Perplexity自研AI编程工具曝光，公司程序员已投入使用

小红书挖两年坑，把自己埋进去了

苹果透露与博通合作：金额超300亿美元，在美制造超150亿颗芯片

余承东曝光享界G9实车图：原厂一体式升顶帐篷，国内首款自带露营帐篷SUV

对话小红书IPO举报风波当事人：获赔80余万后，我为何仍然实名举报？

52岁字节员工宣布退休，网友：HR连夜学习SOP

1.6亿货款诉讼引爆“赊货链”危机，国晟科技控股股东高位质押陷困局