大模型专题：2025年大模型智能体开发平台技术能力测试研究报告

IP属地中国·北京 编辑：任飞扬 时间：2025-08-15 00:11:10

今天分享的是：大模型专题：2025年大模型智能体开发平台技术能力测试研究报告
报告共计：21页
《大模型专题：2025年大模型智能体开发平台技术能力测试研究报告》对阿里云百炼、腾讯云智能体开发平台、扣子、百度智能云千帆四个典型平台的技术能力进行了测试，围绕RAG能力、工作流能力、Agent能力三个核心维度展开。RAG能力测试涵盖文本问答、结构化数据问答、图文问答，各平台在文本处理上表现优异，单文档及多文档问答准确率较高，但拒答与澄清处理存在差异，腾讯云对知识库外问题实现100%拒答；结构化数据问答中，百度智能云千帆在复杂查询场景表现稳定，多表关联查询准确率较高；图文问答中，阿里云百炼、腾讯云及扣子图片识别能力较强，但配图输出率分化。工作流能力以订单修改为核心场景，测试参数提取、异常回退等，各平台端到端准确率在61.5%-69.2%，腾讯云意图识别准确率达93.3%，参数提取是主要差异点，整体具备基础可用性但需优化。Agent能力测试工具调用，各平台单工具调用完成率较高（83%-92%），多工具协同及提示词调用有提升空间，腾讯云表现较均衡，存在流程断点、技术稳健性不足等问题。总体而言，平台基础能力趋同但路径分化，未来需在场景深度适配、技术链厚度构建、生态广度拓展上持续发力，以实现从实验性应用向生产级交付跨越。
以下为报告节选内容

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

苹果涨价引发亚洲科技股抛售，市场担忧存储芯片涨价拖累AI需求

让外卖骑手转型汽车营销、质量管理，吉利发起“跨时代实战专业能力培养计划”

中国信通院联合华为云等22家单位，筹备成立AIIA词元服务工作组

特朗普T1手机开放销售，结算页需额外支付41.75美元的“设备税”

消息称三星集团29日将公布1000万亿韩元巨额投资计划

小米YU7获CNCAP安全性测试五星认证：雷军称安全高于一切

全站最新

苹果涨价引发亚洲科技股抛售，市场担忧存储芯片涨价拖累AI需求

让外卖骑手转型汽车营销、质量管理，吉利发起“跨时代实战专业能力培养计划”

中国信通院联合华为云等22家单位，筹备成立AIIA词元服务工作组

特朗普T1手机开放销售，结算页需额外支付41.75美元的“设备税”

热门推荐

苹果涨价引发亚洲科技股抛售，市场担忧存储芯片涨价拖累AI需求

新加的同事为啥能看到你以前的“同事不可见”朋友圈？微信官方给出答案

Notion宣布将于9月22日关闭AI邮箱服务Notion Mail

亚马逊加码印度：拟投 130 亿美元布局AI与云基础设施

让外卖骑手转型汽车营销、质量管理，吉利发起“跨时代实战专业能力培养计划”

中国信通院联合华为云等22家单位，筹备成立AIIA词元服务工作组

特朗普T1手机开放销售，结算页需额外支付41.75美元的“设备税”

消息称三星集团29日将公布1000万亿韩元巨额投资计划

小米YU7获CNCAP安全性测试五星认证：雷军称安全高于一切

DeepSeek成立以来规模最大扩招，意味着什么？

头部新势力车企回应：暂不涨价

TD Cowen称马斯克SpaceX可能斥3200亿美元收购美国第三大运营商T-Mobile

近400家美国报纸联合起诉OpenAI和微软白嫖内容，AI热潮恐成地方新闻“丧钟”

国产大模型Kimi表态：最高优先是研发要跟美国御三家AI掰掰手腕

消息称小鹏机器人大调整：新设九部门，何小鹏兼任产品部负责人