腾讯AI慢了吗？中国AI行业存在过度刷榜行为汤道生与姚顺雨对谈大模型下半场

IP属地中国·北京 编辑：柳晴雪新黄河 时间：2026-06-05 16:31:49

6月5日，备受关注的腾讯集团高级执行副总裁汤道生与首席AI科学家姚顺雨展开对话。两人围绕外界关注的“腾讯AI慢了吗”、大模型下半场、Agent产品、模型与产品Co-Design等话题进行了讨论。
新黄河大鱼财经记者注意到，这场对话中，汤道生主动提到一个外界常见质疑：“很多人都会提到腾讯慢，说在AI上面我们没有及时抓住一些机会，你觉得我们真的慢了吗？到底下半场是什么？”
姚顺雨回应称，讨论这一问题前，首先要判断AI究竟是短期游戏还是长期游戏。他表示，硅谷近年有一种情绪，认为AI很快会取代大量工作，企业要尽快抓住短期窗口。但在他看来，AI并不是一个短跑项目，而是长期游戏，“AI其实刚开始，下半场才刚刚开始”。
姚顺雨进一步表示，他并不认为ChatGPT和Claude Code会是唯一的超级应用。如果未来只有少数几个超级应用占据全部入口，那将是“非常灰暗的世界”。他判断，AI产业未来仍会不断出现新的机会，类似上世纪70年代个人电脑刚出现时，真正的大规模应用和产业形态还远未完成。
对于“腾讯是否慢了”，姚顺雨没有直接否认。他表示，过去腾讯在模型和产品上做了很多探索，也走过一些弯路，“如果没有做过一个事情，第一次做肯定有曲折”。但他认为，更重要的是组织能否诚实面对反馈，能否看到问题后快速改变，并保持足够耐心。
汤道生也在现场回应称，外界经常会挑腾讯某一个点来批评，他欢迎外部对腾讯提出更高要求。他表示，腾讯是一个业务形态复杂的公司，产品分布在多个赛道，很多团队同时推进不同项目，“在这样一个复杂的组织里面，有一些地方可能做得快了，有的地方做得慢了，有一些地方可能会做失败”。
但汤道生强调，AI是一场长跑，腾讯的优势在于丰富的场景和多年来积累的产品体系。他提到，AI需要Context，即上下文，模型需要真实场景中的用户、数据、业务流程和生态信息来发挥价值。腾讯过去在微信、企业微信、元宝等产品上的积累，可以为模型提供不同场景下的上下文，从而支撑AI能力落地。
“我们正在长跑中，也请各位多给我们提醒，给我们建议，也多用我们的产品来给我们正向的反馈。”汤道生说。
姚顺雨今年加入腾讯，担任腾讯首席AI科学家，负责混元大语言模型及AI Infra。他曾提出ReAct框架，并在OpenAI参与Operator、Deep Research等前沿Agent产品。谈到为何选择腾讯时，姚顺雨表示，AI进入“下半场”后，最重要的问题不只是方法论，而是寻找真正有价值的问题。
他解释称，过去AI模型通常对应单一任务，例如围棋、翻译等；但预训练和后训练的发展，使大模型逐渐成为一种通用方法论。模型像一个“万能锤子”，可以解决各种问题，真正困难的反而是找到值得解决的问题，以及把模型放进合适场景中。
在姚顺雨看来，腾讯吸引他的一个重要原因，正是这里有大量真实产品和业务问题。“好的产品能够回答一个问题：预训练和后训练之后到底要把它应用在什么地方产生价值。”他说。
他还表示，未来企业和个人的竞争壁垒，会越来越体现在是否掌握足够关键的上下文信息。“很多时候，你的竞争壁垒就在于有没有最原始的输入，知不知道这个人到底在干什么，知不知道企业各种各样的信息。”在这一点上，他认为腾讯具有较强优势。
围绕模型和产品如何结合，汤道生提出，腾讯内部经常讨论Co-Design，即模型与产品共同设计。当前，腾讯在元宝、AI搜索、智能客服、智能营销，以及CodeBuddy、WorkBuddy等产品中，都在尝试让模型和产品更紧密配合。
姚顺雨表示，Co-Design的前提是模型本身足够扎实。预训练提供基础能力，后训练则需要基于真实应用建立评测体系。他认为，中国AI行业存在过度“刷榜”的倾向，但榜单容易被过拟合，不能完全代表真实产品体验。相比之下，基于真实世界数据和产品反馈建立Eval，更能发现模型在真实用户场景中的问题。
他举例称，benchmark中的题目往往描述完整、指令明确，而真实用户的问题可能只有一两句话，甚至非常模糊，还会不断追问。真实Prompt分布能帮助模型团队理解用户如何使用产品，也能推动训练方式调整。
汤道生对此补充称，早期做元宝时，团队就遇到过多轮遵循问题。用户在产品中不断迭代Prompt的方式，与榜单测试差异很大。AI产品面对的是开放式需求，产品方不知道用户会问什么，因此产品不仅要提供功能，还要给模型提供工具、上下文和评测标准。
谈到AI时代产品研发的变化，汤道生表示，过去产品更多是通过功能满足用户需求，像是把菜单和功能提前准备好，用户只能在其中选择。但AI产品更像一种开放式服务，用户可能通过自然语言或语音提出需求，模型需要理解意图、推理、调用工具并完成任务。
他认为，AI时代产品研发流程也在变化。今年以来，很多代码由AI生成，工程师更多时间会用于设计、架构和修正。测试也需要更前置，团队要更早考虑Eval、环境、开放式答案质量和alignment，即模型输出如何与用户需要的风格对齐。
对于混元3的进展，姚顺雨表示，当前做大模型并没有太多“秘密”，关键是把基础设施、数据和评测体系做好。腾讯重建了预训练和强化学习相关基础设施，同时在数据和Eval上做了较大调整，包括定义更真实的问题、丰富数据体系、提高数据质量等。
在Agent方向，姚顺雨认为，Agent和Coding Agent已成为模型厂商必须投入的基础能力。他强调，Coding Agent并不只是代码能力问题，还需要聊天、搜索、指令遵循、推理等复合能力。大模型的关键价值，在于不同能力之间可以泛化。
汤道生则从产品侧表示，不同场景下Agent形态不同。比如Coding场景需要代码上下文，办公协作场景则需要理解用户习惯、历史偏好和任务背景。随着模型能力增强，Agent本身可以变得更简化，产品侧则要提供更多工具、技能和记忆能力，让模型更高效完成任务。
对话最后，汤道生透露，腾讯将发布一套效率智能体工具集，帮助企业更安全、更高效地部署智能体应用。其背后包括三项能力：一是场景联接能力，通过微信、企业微信、元宝等高频触点，把大模型嵌入真实业务流；二是工程驾驭能力，通过Harness体系、AI Infra和Agent Runtime等支撑Agent稳定运行；三是模型驱动力，依托混元大模型和模型产品Co-Design，兼顾实用性、性价比和ROI。
记者:张盼港编辑:孙菲菲校对:杨荷放

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

66款AI硬件通过L3认证：华米OV耀全员入围，但没人突破L4天花板

AI产业链的卡位战，海信为何成了重要玩家？

长鑫科技IPO网上投资者放弃认购658.62万股，弃购率0.17%

满仓AI的投资者，几天回撤50%，重新理解长期主义

荣耀官宣：与阿莱ARRI达成全球影像战略合作

美国FAA推进监管改革，推动电动空中出租车与超音速飞机商业化落地

全站最新

66款AI硬件通过L3认证：华米OV耀全员入围，但没人突破L4天花板

AI产业链的卡位战，海信为何成了重要玩家？

长鑫科技IPO网上投资者放弃认购658.62万股，弃购率0.17%

满仓AI的投资者，几天回撤50%，重新理解长期主义

热门推荐

口子窖陷渠道重构阵痛，徽酒老三腹背受敌

起底酒店低价早餐券灰产：用差评换“霸王餐”，有商家卖出3万张获利数十万\n

66款AI硬件通过L3认证：华米OV耀全员入围，但没人突破L4天花板

AI产业链的卡位战，海信为何成了重要玩家？

长鑫科技IPO网上投资者放弃认购658.62万股，弃购率0.17%

满仓AI的投资者，几天回撤50%，重新理解长期主义

荣耀官宣：与阿莱ARRI达成全球影像战略合作

美国FAA推进监管改革，推动电动空中出租车与超音速飞机商业化落地

iPhone 18 Pro系列9月见：10项升级全面解析

特斯拉现金流或现两年多来首次净流出，AI投入考验市场信心

1024卡、NPO光互连！壁仞科技的万亿大模型算力新解法

腾讯发布科学发现智能体Hyra-1.0：递归自我改进，多项任务刷新纪录

二季度保险预定利率研究值环比上行1BP至1.94%，年内将不再有“炒停售”红利期

宁德时代与Solarpro签署2GWh合作协议

超节点、超集群算力“拼系统”时代最关心Token性价比

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

腾讯AI慢了吗？中国AI行业存在过度刷榜行为汤道生与姚顺雨对谈大模型下半场

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

腾讯AI慢了吗？中国AI行业存在过度刷榜行为 汤道生与姚顺雨对谈大模型下半场

同类资讯

腾讯AI慢了吗？中国AI行业存在过度刷榜行为汤道生与姚顺雨对谈大模型下半场