“很多人都会提到腾讯慢,说在AI上面我们没有及时抓住一些机会,你觉得我们真的慢了吗?”
6月5日的2026腾讯云AI产业应用大会上,腾讯集团高级执行副总裁汤道生,把这个问题抛给了坐在对面的腾讯首席AI科学家姚顺雨。这是姚顺雨加入腾讯后的首次公开对谈。面对这个尖锐提问,他接过话,先开了句玩笑:“感觉应该是我问你的问题。”汤道生也笑了。
姚顺雨没有用“是”或“否”来回答,而是讲了两个判断。这两个判断,既是说给汤道生听的,也是说给所有关心国内AI的人听的。
第一个判断:AI到底是一场短期游戏还是长期游戏?姚顺雨说,在硅谷蔓延着一种情绪,好像AI马上要取代所有人的工作,“我们要赶快赚两年钱退休”。但他的看法完全不同:“很显然我们的判断AI是一个长期游戏,其实我觉得AI刚开始,下半场才刚刚开始。”
姚顺雨说了一句让人印象深刻的话:“我不认为ChatGPT和Claude Code会是唯一的超级应用(Super App),我觉得那是一个非常灰暗的世界,我觉得肯定会有源源不断新的机会诞生。”他把当下的AI比作上世纪70年代个人电脑刚刚诞生时,“还有很多很多事情需要做”。
第二个判断:AI的未来会更单一还是更多元?姚顺雨说,过去几年,所有人都在做一样的事、都在模仿,“这也是非常灰暗的事情”,他个人认为,AI“会变得更多元”,多模态、具身智能才刚刚发生。
对于外界提出“腾讯慢了”的质疑,汤道生坦率地说,大家总喜欢挑某一个点来批评腾讯,“当然我觉得我们也很欢迎大家给我们提更高的要求”。
既然是一场长跑,起跑线上的快慢就没那么要紧了。在汤道生看来,腾讯是一个多业态的公司,产品分布在很多赛道,在这么复杂的组织里,“有一些地方可能我们做得快了,有的地方做得慢了,有一些地方可能会做失败,在探索,确实有一些地方我们是可以做得更好”。但随即汤道生话锋一转,“就像你说的,这是一个长跑,是一个马拉松”,腾讯过去在不同产品、不同赛道上的积累,都是可以给模型提供丰富场景来发挥价值的,“所以我们正在长跑中”。
如果快慢不是唯一的标准,那用什么来衡量AI做得好不好?两人的讨论,也回答了这个问题。
在聊到模型和产品如何协同时,姚顺雨提到,后训练最重要的一点是设立好正确的评测,“中国大家有个不好的倾向是大家喜欢刷榜”,但更重要的应该是基于真实应用构造评测。
“基准测试(benchmark)不是完全没有价值,只是说这些榜非常容易过拟合(overfitting)。”在姚顺雨看来,混元发预览版,最主要的目的就是“获得真实世界反馈,能修复各种各样基准测试中没有发现的问题”。他举例说,基准测试里的题目往往非常精确,有很长的具体描述,但现实中大家问的问题都比较模糊,可能就一两句话,还会不停追问,这些真实场景能启发模型做得更好。
汤道生接过话证实,早期做元宝时就碰到过这类问题,用户在使用产品时真正需要的能力,“跟基准测试(benchmark)还有蛮大的差异”。
“过去模型、产品做了很多探索,走很多弯路,我觉得这是正常的,你如果没有做过一个事情,第一次做肯定有曲折。但是我觉得可能更重要的事情是能不能诚实面对自己,能不能坦诚,能不能够去看到反馈然后去改变,能不能够保持耐心。这个事情是下半场最重要的事情。”姚顺雨总结道。





京公网安备 11011402013531号