当前位置: 首页 » 资讯 » 科技头条 » 正文

腾讯AI慢了吗?中国AI行业存在过度刷榜行为 汤道生与姚顺雨对谈大模型下半场

IP属地 中国·北京 编辑:柳晴雪 新黄河 时间:2026-06-05 16:31:49

6月5日,备受关注的腾讯集团高级执行副总裁汤道生与首席AI科学家姚顺雨展开对话。两人围绕外界关注的“腾讯AI慢了吗”、大模型下半场、Agent产品、模型与产品Co-Design等话题进行了讨论。

新黄河大鱼财经记者注意到,这场对话中,汤道生主动提到一个外界常见质疑:“很多人都会提到腾讯慢,说在AI上面我们没有及时抓住一些机会,你觉得我们真的慢了吗?到底下半场是什么?”

姚顺雨回应称,讨论这一问题前,首先要判断AI究竟是短期游戏还是长期游戏。他表示,硅谷近年有一种情绪,认为AI很快会取代大量工作,企业要尽快抓住短期窗口。但在他看来,AI并不是一个短跑项目,而是长期游戏,“AI其实刚开始,下半场才刚刚开始”。

姚顺雨进一步表示,他并不认为ChatGPT和Claude Code会是唯一的超级应用。如果未来只有少数几个超级应用占据全部入口,那将是“非常灰暗的世界”。他判断,AI产业未来仍会不断出现新的机会,类似上世纪70年代个人电脑刚出现时,真正的大规模应用和产业形态还远未完成。

对于“腾讯是否慢了”,姚顺雨没有直接否认。他表示,过去腾讯在模型和产品上做了很多探索,也走过一些弯路,“如果没有做过一个事情,第一次做肯定有曲折”。但他认为,更重要的是组织能否诚实面对反馈,能否看到问题后快速改变,并保持足够耐心。

汤道生也在现场回应称,外界经常会挑腾讯某一个点来批评,他欢迎外部对腾讯提出更高要求。他表示,腾讯是一个业务形态复杂的公司,产品分布在多个赛道,很多团队同时推进不同项目,“在这样一个复杂的组织里面,有一些地方可能做得快了,有的地方做得慢了,有一些地方可能会做失败”。

但汤道生强调,AI是一场长跑,腾讯的优势在于丰富的场景和多年来积累的产品体系。他提到,AI需要Context,即上下文,模型需要真实场景中的用户、数据、业务流程和生态信息来发挥价值。腾讯过去在微信、企业微信、元宝等产品上的积累,可以为模型提供不同场景下的上下文,从而支撑AI能力落地。

“我们正在长跑中,也请各位多给我们提醒,给我们建议,也多用我们的产品来给我们正向的反馈。”汤道生说。

姚顺雨今年加入腾讯,担任腾讯首席AI科学家,负责混元大语言模型及AI Infra。他曾提出ReAct框架,并在OpenAI参与Operator、Deep Research等前沿Agent产品。谈到为何选择腾讯时,姚顺雨表示,AI进入“下半场”后,最重要的问题不只是方法论,而是寻找真正有价值的问题。

他解释称,过去AI模型通常对应单一任务,例如围棋、翻译等;但预训练和后训练的发展,使大模型逐渐成为一种通用方法论。模型像一个“万能锤子”,可以解决各种问题,真正困难的反而是找到值得解决的问题,以及把模型放进合适场景中。

在姚顺雨看来,腾讯吸引他的一个重要原因,正是这里有大量真实产品和业务问题。“好的产品能够回答一个问题:预训练和后训练之后到底要把它应用在什么地方产生价值。”他说。

他还表示,未来企业和个人的竞争壁垒,会越来越体现在是否掌握足够关键的上下文信息。“很多时候,你的竞争壁垒就在于有没有最原始的输入,知不知道这个人到底在干什么,知不知道企业各种各样的信息。”在这一点上,他认为腾讯具有较强优势。

围绕模型和产品如何结合,汤道生提出,腾讯内部经常讨论Co-Design,即模型与产品共同设计。当前,腾讯在元宝、AI搜索、智能客服、智能营销,以及CodeBuddy、WorkBuddy等产品中,都在尝试让模型和产品更紧密配合。

姚顺雨表示,Co-Design的前提是模型本身足够扎实。预训练提供基础能力,后训练则需要基于真实应用建立评测体系。他认为,中国AI行业存在过度“刷榜”的倾向,但榜单容易被过拟合,不能完全代表真实产品体验。相比之下,基于真实世界数据和产品反馈建立Eval,更能发现模型在真实用户场景中的问题。

他举例称,benchmark中的题目往往描述完整、指令明确,而真实用户的问题可能只有一两句话,甚至非常模糊,还会不断追问。真实Prompt分布能帮助模型团队理解用户如何使用产品,也能推动训练方式调整。

汤道生对此补充称,早期做元宝时,团队就遇到过多轮遵循问题。用户在产品中不断迭代Prompt的方式,与榜单测试差异很大。AI产品面对的是开放式需求,产品方不知道用户会问什么,因此产品不仅要提供功能,还要给模型提供工具、上下文和评测标准。

谈到AI时代产品研发的变化,汤道生表示,过去产品更多是通过功能满足用户需求,像是把菜单和功能提前准备好,用户只能在其中选择。但AI产品更像一种开放式服务,用户可能通过自然语言或语音提出需求,模型需要理解意图、推理、调用工具并完成任务。

他认为,AI时代产品研发流程也在变化。今年以来,很多代码由AI生成,工程师更多时间会用于设计、架构和修正。测试也需要更前置,团队要更早考虑Eval、环境、开放式答案质量和alignment,即模型输出如何与用户需要的风格对齐。

对于混元3的进展,姚顺雨表示,当前做大模型并没有太多“秘密”,关键是把基础设施、数据和评测体系做好。腾讯重建了预训练和强化学习相关基础设施,同时在数据和Eval上做了较大调整,包括定义更真实的问题、丰富数据体系、提高数据质量等。

在Agent方向,姚顺雨认为,Agent和Coding Agent已成为模型厂商必须投入的基础能力。他强调,Coding Agent并不只是代码能力问题,还需要聊天、搜索、指令遵循、推理等复合能力。大模型的关键价值,在于不同能力之间可以泛化。

汤道生则从产品侧表示,不同场景下Agent形态不同。比如Coding场景需要代码上下文,办公协作场景则需要理解用户习惯、历史偏好和任务背景。随着模型能力增强,Agent本身可以变得更简化,产品侧则要提供更多工具、技能和记忆能力,让模型更高效完成任务。

对话最后,汤道生透露,腾讯将发布一套效率智能体工具集,帮助企业更安全、更高效地部署智能体应用。其背后包括三项能力:一是场景联接能力,通过微信、企业微信、元宝等高频触点,把大模型嵌入真实业务流;二是工程驾驭能力,通过Harness体系、AI Infra和Agent Runtime等支撑Agent稳定运行;三是模型驱动力,依托混元大模型和模型产品Co-Design,兼顾实用性、性价比和ROI。

记者:张盼港 编辑:孙菲菲 校对:杨荷放

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新