腾讯AI慢了吗？姚顺雨公开回应（附对谈实录）

IP属地中国·北京 编辑：冯璃月立知Tech 时间：2026-06-05 16:32:18

6月5日，2026年腾讯云AI产业应用大会如期召开，腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生与腾讯首席AI科学家姚顺雨进行了对话和交流。
值得注意的是，这算是姚顺雨加入腾讯后的第二次公开亮相，但是首次真身公开亮相，上次是在AGI-Next前沿峰会上接受视频连线。
此次二人对谈的主题是“腾讯AI下半场”。
姚顺雨表示，国内AI产业有个不好的倾向，就是喜欢刷榜，但实用性价值大于刷榜价值，实事求是基于产品和应用去构造AI更重要。
关于腾讯是否慢了？AI下半场到底是怎么样的？在姚顺雨眼中，当然，过去模型、产品做了很多探索，走了很多弯路，我觉得这很正常，没做过一件事，第一次做肯定会有曲折。但可能更重要的是：能不能诚实地面对自己，能不能 be real，能不能看到 feedback 然后去改变，能不能保持耐心。我觉得这些事情，在下半场会更加重要。
AI是长期游戏，AI下半场才刚开始，不认为ChatGPT和Claude是唯一的机会，总会有新的机会诞生。
此外，AI还是多元化游戏。AI发展以来，多模态、具身智能等新模式和产品，一直在发生。过去的大模型探索，大家走了很多弯路，这是正常的。重要的是，能不能诚实面对自己，能不能及时纠正，保持耐心。
以下为二位对话的主要内容：
话题1：为什么会选择来到腾讯？
[汤道生]：你加入腾讯之前，记得当时我还问过你一些问题，为什么会选择来到腾讯？而且你认为 AI 的下半场最重要的是什么？
[姚顺雨]：对，我觉得我想先首先解释一下什么叫做下半场。因为我最近感觉这个词有点被滥用了，这个概念其实是我去年的一个博客里面提出来的，什么意思呢？
我觉得在可能去年之前，AI已经发展了几十年，但是更加重要的是怎么去解决问题，去寻找好的方法。最近很明显的，说方法论变得非常成熟，寻找问题变得更加困难。
我举个例子，比如说过去，比如说我们做下围棋，对吧？我们会发明像AlphaGo（阿尔法狗）这样的方法，但这个方法可能只用来适合下围棋，或者下各种棋类，你会为了翻译做一个这个特别的模型，但是它可能只能用来做翻译，不能做其他事情。
但是有了预训练和后训练之后，我们发现像有了一个万能的锤子，它可以去砸任何钉子。它是一个通用的方法论，可以去解决各种各样的问题。
那么反而更困难的是怎么去寻找好的问题去解决。所以其实我觉得加入腾讯很重要的一点就是，这里有很多好的问题，有很多产品。
然后，我觉得这一点会在接下来变得越来越重要。其实一方面好的产品能够解决第一个问题，就是说我们做了这样的好的，我们做了预训练和后训练之后，我们到底要把它应用在什么样的地方产生价下去。
第二，环境是非常重要的。如果没有好的环境，那agent 就没有办法去做各种各样的事情。
但是我觉得可能最重要的是context，就是无论是企业还是个人，像我上一次在这个AGI Next 说的一样，我觉得越来越重要的事情是context。因为模型越来越擅长把一个非常复杂的输入变成一个输出，很多时候你的竞争壁垒就在于“你有没有那个最原始的输入”？
其实最重要的原因是是文化。我还记得我第一次跟你聊天的时候，包括和很多其他总办的老板聊天的时候，我第一印象就是大家都非常的诚实。
就是哪里做得好，哪里做得不好，都非常直白，就是不会去掩盖。然后就说，我知道我这里做好，我知道我这里不知道，我知道这里应该怎么做，我知不知道哪里应该怎么做。我觉得这种坦诚是是我的第一印象。
然后，我觉得腾讯总体是一个基于Trust 而不是基于Metric 去运转的公司，这一点对于做AI是非常重要的，包括我们这个文化其实有非常 low ego（小自我）非常 solid的一面。我觉得这些文化，都是可能对于长期来做一个AI组织是非常重要的，包括我们对长期主义的这种坚持。
话题2：AI下半场最重要的是什么？
[姚顺雨]：AI下半场最重要的是什么？
我个人的目标，就是我们应该在中国建立一个长期的基于 AGI 的这样的一个组织。
今天的 AI 其实主要有三个部分：
首先是 foundation的部分，怎么样去把预训练和后训练这种最基础的东西做得非常solid。
第二是产品，我们怎么去把这样的技术真的为人和社会产生价值；
第三就是Frontier，我们怎么去探索新的研究的范式，新的机会。
我觉得，最重要的就是，要构建一个非常均衡的三角形一样的组织。对于做foundation来说，最重要的是第一需要充足的资源。
第二就是需要正确做事的方式，这其实跟我刚刚说的文化的一点也是吻合的。那对于产品来说，我觉得就是有好的产品的 sense。有这种做产品的基因是至关重要的。
那第三，我觉得就是说在中国我们今天可能所做的探索还不够多，所以我也希望就是能把这种 Frontier exploration 的精神能更多的注入到我们组织中。
话题3：谈论Co-deisgn
[汤道生]：我们平时开会提比较多的一个词是co-design，怎么把产品跟模型，能够比较紧密结合起来？尤其今天有这么多丰富的产品；另外最近非常火的类龙虾的，像 Codebody、Workbody，对于模型的能力依赖很深，怎么去思考co-design这个方式？
[姚顺雨]：我觉得有三点。
首先，co-design 前提就说模型本身要做得很solid，有很多foundational work要做好。其实首先我觉得预训练是相对就是产品 agnostic的事情。然后他做的非常solid，可以提供一个非常强的foundation，而且预训练最大的特点是一个可泛化的学习的过程，进步是可以，带给各种各样下游的任务，以这个持续价值的提升。
国内AI产业有个不好的倾向，就是喜欢“刷榜”，但实用性价值大于刷榜价值，实事求是基于产品和应用去构造AI更重要。
我们做大量的工作，就说跟各样产品进行了深度的co-design。我觉得 co-desig很关键的一点就是要产生相互信任。
第三点，我想说的就是说我觉得LLM时代和过去的AI最本质的区别就是泛化性。就是在LLM之前，比如你做一个翻译的产品，你只要把翻译的数据做特别好就行。你做一个围棋的程序，你只要把围棋的数据准备特别好就行。
但今天，即使你想只做一个 coding agent，你发现其实需要的也不仅是coding agent数据，需要非常好的聊天能力、搜索能力、指令遵循能力以及推理能力。
所以这些产品它能够提供不同的数据，但这些数据之间又可以相互泛化，形成一个像网络一样的体系，这一点的价值会越来越重要。
姚顺雨：首先这些 benchmark 还是有它的价值的，不是说完全没价值，只是现在这些榜非常容易 saturate（饱和），而基于真实世界的数据有几个帮助：
第一，你能发现模型的很多底线问题。我们想发一个 pre-preview 模型，最重要的目的之一就是希望获得真实世界的反馈，去修复各种榜单里没法发现的底线问题——这一点会在正式版上有非常大的改进。
首先就是你能发现模型很多底线问题。实际上我觉得我们想要，就是发一个 preview 模型，最重要的目的之一就是希望能获得真实世界的反馈，来修复各种各样的，就是榜单中没法发现的这些底线问题，那我觉得这一点会在正式版上面有一个非常大的改进。
那第二点就是说，你对真实的 prompt distribution（提示词分布）有一个更深的了解。
那我举个例子，比如说benchmark上面的这些题目可能都是非常精确的，有非常长的这种 concrete description，它可能一般来说是个单轮的这样的一个问题。但是我们知道在现实场景中可能大家问的问题都是比较模糊的，可能就一两句话。但它会不停的追问，那那这些 setup 上的差异就可以启发我们怎么去更好的去做这样的训练。
我们甚至可以从这些产品上获得灵感，去推进现在还没有的榜单、没有的领域。比如我们最近做了很多 coding 能力的工作，元宝给我们的启发就很有帮助。所以我觉得产品和模型的互相成就，是越来越重要的一个 AI 话题。
话题4：做产品的第一性原理
姚顺雨：我记得第一次跟你聊的时候，你讲了很多过去的经历，从 QQ 空间、QQ 秀的时代，一直到我小学时候最喜欢的那个产品……
汤道生：你说的是”老灯”对吧？
姚顺雨：对，再到 QQ、到音乐、到语音，再到现在的元宝、IMA。跟你聊天很有意思，因为你做过各种各样的产品，To C的也有、To B的也有，远古时代的也有、AI 时代的也有。
我比较好奇的是，你觉得你做产品的第一性原理是什么？哪些经验或价值是不变的，哪些东西变了？
汤道生：我觉得做产品最终还是奔着”用户到底有什么需求、我怎么去解决他的痛点、怎么给用户或客户创造价值”。这一点在不同的时代、不同的行业都成立，产品能给用户带来价值，他才会买单、才会使用。
所以从 PC 互联网时代做空间，到移动时代做各种内容产品，再到云互联网做云，我们都要花很多时间去听客户的声音、帮他们解决问题，底层逻辑其实没有那么大的变化。
但 PC、移动互联网时代做产品，跟今天 AI 时代做产品，还是有蛮多不一样的地方。
首先从范式上看，在AI 之前，我们做产品很多时候是通过”功能”来满足需求：作为服务提供方，你想清楚要提供什么能力，让用户通过界面、菜单去选，能力是预置好的，用户只能在里面点。
但 AI 时代那种开放式的服务形态就带来很不一样的要求——交互方式可能是自然语言、是语音，作为产品方你也不知道用户会问什么，所以要充分利用模型能力去理解用户需求，再通过大模型的逻辑推理、调用工具的能力，由产品给模型提供各种可用的工具，去应对这种开放式需求。这跟我们过去做产品很不一样。
还包括你刚提到的 specification（规格）。过去对产品细节功能有很清晰的描述，怎么设计、研发、测试，那套瀑布式流程也比较清晰。但做 AI 产品，我发现最大的变化是整个流程可能都要重新设计。
尤其是今年，大部分代码都由AI生成，工程师会花更多时间做设计、做架构，把写代码的工作交给AI，再定期去指导、修正。
测试也要”左移”、更前置地去想清楚针对各种 case 的 eval（评估），要有环境，要对开放式答案有要求，甚至包括 alignment（对齐），怎么对齐到用户所需要的那种风格。我感觉今天AI时代做产品，要求的能力其实更全面了。
话题5：Hy-3做了什么改变？
[汤道生]：大家都在说Hy-3，Preview 是Hy-3，是你在腾讯的首秀。具体Hy-3做了什么改变？你能给大家介绍一下吗？
[姚顺雨]：其实我觉得没有什么秘密，就是今天做大模型。从过程来说是一个比较trivial的事情，就是说我们应该把 infrastructure 做好，应该把数据做好，算法的部分其实反而是比较简单的。
我觉得主要几个点：
第一，我们把这个infrastructure 进行重建，无论是预训练还是强化学习。
第二，我们把数据和以往做了很多大的改变。如何去定义更真实的问题？如何去丰富这个 data 的 taxonomy（数据分类），如何去提高数据的质量？这是个永无止境的追求。
第三，我觉得很重要的很多决策，其实包括怎么去招人，怎么去设计这个模型的节奏，怎么去每天有很多这个 decision ，要考虑很多 tradeoff，我觉得可能没有一个很清晰的公式，可能我觉得是一个很 taste driven 的事情。
话题6：从ReAct到今天：几年前的预测兑现了吗?
[汤道生]：你是 ReAct 的提出者，博士研究也围绕语言智能体（Agent）展开。你几年前的一些观点，到今天兑现了吗？哪些兑现了？
[姚顺雨]：之前我还挺感慨的，因为我重新读了自己的博士论文，感觉又回到了一个这个很远古的时代。
我博士论文的题目叫《Language Agent: from next token prediction to digital automation》（语言智能体：从下一词预测到数字自动化）。
7年前，就是 GPT 2 那个时候，他当时只能做 next token prediction，而且它产生的可能一段话还不太连续，或者还有很多毛刺。
当时我的想象力可能比较狂野，我觉得GPT 是个非常优美的东西，就是吐出下一个 Token，是非常极简且非常通用的事情，有一天潜力活在于把这个世界上所有的事情全部自动化。
当时我当时想的可能还不够大，我想的是 Digital Automation。但现在看起来也有可能是Digital and Physical Automation。
我博士期间主要做两部分。第一部分就是如何建立一个 agent 的方法论，如何把next token prediction 的机器变成 agent，变成自动化的机器。那其实就像你说的，最重要的一天工作可能是 React。
我记得，22年7月某一天晚上，我第一次把语言模型的API 和我当时自己手写了一个Wikipedia API的 API连在一起。
然后它第一次可以基于这个网页回答问题，并且多轮交互的时候，当时感觉就像微弱的电灯丝突然亮了的感觉一样。据我所知，这可能第一次人类把 LLM 和就是真正的互联网连在一起，并且去做这种多人交互，感觉可能在 5 年或者 10 年会改变这个世界，但是可能比我想象中还要更快。
那另一部分其实我做的工作，就是怎么去定义Digital Automation的任务，比如说Web Shop是第一个基于互联网的，就Web agent的task，然后包括Infer Code和Switch是最早的就是Coding agent这样的任务，现在看起来就是agent的技术，最重要的两个部分可能确实是Web的agent和coding的agent。
我看，我那个博士论文的结尾，就是我在24年的时候写我的futurework，第一个是train models for agent，第二个是safe and robust deployment；第三个是scientific discovery，第四个是怎么我要去help human，我很感慨。我很幸运，我确实现在在做我当时列的future direction。
话题7：Tokens焦虑，性价比的本质
[汤道生]：智能体今天大家都说需要消耗很多的Tokens的调用。这对于混元做下一代模型的研发，你觉得什么是你的侧重有哪些地方是比较重要的？
[姚顺雨]：我觉得毫无疑问今天Agent的，或者说coding agent有点像预训练一样，是一个不得不做的事情，它是一个最基础的能力。我个人觉得coding这是非常本质。
Agent 毫无疑问是每一家模型所发力的重点。我们做的方法可能会有几个区别。
第一，即使可能今天coding也是最重要的事情，但是我们还是会强调体系的全面化。
我始终认为，真的要把coding做好，需要远远不止coding这个数据，也需要各种各样不同的东西，因为大模型最重要的点是泛化性。
第二，很显然产品的作用越来越重要，如何用，利用好就线上的回流，我觉得是一个每一个模型厂商都在应对和思考的问题。
第三，我觉得其实还是需要更多想象力。无论是技术的演进，还是产品的演进，甚至下一个范式的演进，我们还需要做一些探索性的，甚至不确定性的工作。
[汤道生]：从产品侧，大家越来越多有token焦虑的声音，token的成本持续爆发式增长，也听到很多的客户，甚至用户身边的同事们，紧盯着这个积分的消耗或者 token 的消耗。怎么可以让我们的模型在解决某个问题或者完成某一个任务， token的效率最高？
[姚顺雨]：我觉得，现在大家讨论性价比可能更多讨论的是模型架构。但其实它是个很复杂的体系，可能最重要的事情是你的 performance。
很多人其实跟我说，他最后发现用OPS这样的模型比用比更差的模型，最后发现其实更省钱。因为你更快地就把这个事情做对了，然后你也省了人的精力。
尤其今年，我觉得可能很多简单任务的 robustness 会变得更加重要。如何一次把很多，相对简单的任务做对，这可能是性价比更关键的部分，而不仅仅是模型架构。
那第二部分我觉得就是成本，其实本身就性价比，我觉得第一其实是性能，如果这个性能不好，性价比就无从谈起。成本的话，我觉得中国其实是领先于世界的，就是说我们做大量的工作去优化我们的成本。
但其实我觉得成本可能最重要的事情是，怎么用一个更小的模型把这个更高的这个价值任务给做好。但我个人看法，如果我们能做一个相对较小的模型，但是它又能够比肩大模型的性能。而且能够在大部分的任务上做到很强的 robustness。
话题8：腾讯慢了吗？下半场到底是什么？
[汤道生]：我想问一个大家讨论比较多的问题：很多自媒体都会提到，腾讯在 AI 上没有及时抓住一些机会。你觉得我们真的慢了吗？下半场到底是什么？能多说一下吗？
[姚顺雨]：感觉这应该是我问你的问题。我觉得今天我有两个重要的判断。
第一个判断：AI是一个短期游戏，还是长期游戏？在硅谷蔓延着很多情绪，所有人都要失业了、AI 要取代所有人的工作，所以赶快赚两年钱然后退休。这是一种判断。
但我们的判断很显然是：这会是一个长期游戏，而且其实才刚刚开始，下半场才刚开始。我不认为 GPT 和 Claude 会是唯一的 super app，那会是一个非常灰暗的世界。我觉得一定会有源源不断的新机会诞生，今天可能就像 70 年代 PC 刚出现的时候，还有很多好事情要做。
第二个判断：它会是一个更单一、还是更多元的游戏？过去几年大家能看到的是 pre-training、post-training、RL、agent、coding agent，好像有一条非常清晰的主线，坦白说所有人都在做一样的事，这也是件很灰暗的事。未来到底会更单一还是更多元？
我个人觉得会更多元。coding agent 的生产力毫无疑问会越来越重要，而且它才刚刚开始，这个世界还有 trillions of dollars 的市场没被填满；但多模态、具身智能，还有很多很多新事情正在或刚刚发生。所以从这个角度看，如果我们认为下半场才刚开始，那可能确实不算晚。
当然，过去模型、产品做了很多探索，走了很多弯路，我觉得这很正常，没做过一件事，第一次做肯定会有曲折。但可能更重要的是：能不能诚实地面对自己，能不能 be real，能不能看到 feedback 然后去改变，能不能保持耐心。我觉得这些事情，在下半场会更加重要。
[姚顺雨]：你怎么看？
[汤道生]：大家对腾讯经常喜欢挑某一个点来批评，我们也欢迎大家提更高的要求。腾讯有非常多的业态、很多产品在很多赛道，同时很多团队在推进不同项目。在这样一个复杂的组织里，有些地方可能做得快，有些地方做得慢，有些地方可能在探索中失败。
所以这些提醒都非常好，确实有些地方我们可以做得更好。但就像你说的，这是一场长跑、一场马拉松。
腾讯有非常丰富的场景。就像你一开始提到的，选择腾讯是因为 AI 需要 context，模型需要很多上下文，而腾讯多年来在不同赛道、不同产品上的积累，都可以针对每一个场景为模型提供有用的信息、提供 context、发挥价值。
在这场长跑里，我相信模型会不断迭代，用户需求也在不断变化，还会有新的产品形态出现。比如今年初那一波（视频生成？）热潮我们反应也比较快；同时也有 Workbody 这样的智能体产品——其实是几年前就开始做的产品，沿着原来 coding 的积累慢慢看到很强的需求，我们也能比较快地去应对。
今天也听到很多客户对我们不同产品怎么组合起来有很高的期待。所以我们正在长跑中，也请各位多给我们提醒和建议，多用我们的产品，给我们正向的、constructive 的反馈。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

66款AI硬件通过L3认证：华米OV耀全员入围，但没人突破L4天花板

AI产业链的卡位战，海信为何成了重要玩家？

长鑫科技IPO网上投资者放弃认购658.62万股，弃购率0.17%

满仓AI的投资者，几天回撤50%，重新理解长期主义

荣耀官宣：与阿莱ARRI达成全球影像战略合作

美国FAA推进监管改革，推动电动空中出租车与超音速飞机商业化落地

全站最新

66款AI硬件通过L3认证：华米OV耀全员入围，但没人突破L4天花板

AI产业链的卡位战，海信为何成了重要玩家？

长鑫科技IPO网上投资者放弃认购658.62万股，弃购率0.17%

满仓AI的投资者，几天回撤50%，重新理解长期主义

热门推荐

口子窖陷渠道重构阵痛，徽酒老三腹背受敌

起底酒店低价早餐券灰产：用差评换“霸王餐”，有商家卖出3万张获利数十万\n

66款AI硬件通过L3认证：华米OV耀全员入围，但没人突破L4天花板

AI产业链的卡位战，海信为何成了重要玩家？

长鑫科技IPO网上投资者放弃认购658.62万股，弃购率0.17%

满仓AI的投资者，几天回撤50%，重新理解长期主义

荣耀官宣：与阿莱ARRI达成全球影像战略合作

美国FAA推进监管改革，推动电动空中出租车与超音速飞机商业化落地

iPhone 18 Pro系列9月见：10项升级全面解析

特斯拉现金流或现两年多来首次净流出，AI投入考验市场信心

1024卡、NPO光互连！壁仞科技的万亿大模型算力新解法

腾讯发布科学发现智能体Hyra-1.0：递归自我改进，多项任务刷新纪录

二季度保险预定利率研究值环比上行1BP至1.94%，年内将不再有“炒停售”红利期

宁德时代与Solarpro签署2GWh合作协议

超节点、超集群算力“拼系统”时代最关心Token性价比