OpenAI o3横扫夺冠！AI象棋大赛揭露通用模型真实棋力

IP属地中国·北京 编辑：沈瑾瑜 Chinaz 时间：2025-08-14 10:31:40

在一场备受瞩目的人工智能国际象棋锦标赛中，OpenAI的o3模型展现出压倒性优势，以全胜战绩夺得冠军。这场比赛有一个特殊规则:参赛的AI模型必须在没有接受任何专门象棋训练的前提下参赛，只能在赛前从互联网获取基础的国际象棋知识。
决赛阶段，o3面对来自xAI的Grok4，最终以4-0的悬殊比分轻松获胜。更令人印象深刻的是，o3在整个锦标赛期间保持了完美记录，三场比赛均以4-0的比分获胜，甚至在半决赛中横扫了同为OpenAI开发的o4mini模型。
Grok4在进入决赛的道路上同样表现不俗，连续击败了Google的两个强劲对手——Gemini2.5Flash和Gemini2.5Pro。当时，埃隆·马斯克还颇为自信地表示，xAI团队"基本没在象棋上花功夫"，暗示Grok4的天然实力。
然而，决赛的结果让许多观察者大跌眼镜。国际象棋对弈网站Chess.com的总编辑Pedro Pinhata在赛后报道中写道:"直到半决赛，似乎没有什么能够阻止Grok4赢得比赛。但这种幻觉在比赛的最后一天破灭了。"
担任解说嘉宾的国际象棋大师中村光在直播中直言不讳地指出:"Grok在比赛中犯了很多错误，但OpenAI没有。"这个简洁的评价道出了胜负的关键。
更有趣的是世界排名第一的国际象棋大师芒努斯·卡尔森的点评。他表示，决赛中两个AI模型的棋力水平大约相当于刚学会规则的普通棋手，ELO等级分约为800分。作为对比，卡尔森本人的ELO达到2839分，排名第二的中村光也有2807分，两者之间的差距可谓天壤之别。
卡尔森进一步分析了这些通用AI模型在象棋方面的局限性。他发现，这些模型的表现极不稳定，棋艺时好时坏。它们在计算吃棋子方面表现尚可，但在真正将死对手这一核心目标上却显得力不从心。"它们懂得物质优势，却不懂如何取胜，"卡尔森形象地比喻道，"这就好比擅长收集食材，却不会做饭一样。"
这场比赛的结果与专门设计的象棋AI形成了鲜明对比。回顾历史，1997年击败国际象棋大师加里·卡斯帕罗夫的超级电脑"深蓝"，以及2016年战胜韩国围棋九段李世石的AlphaGo，都是专门为棋类游戏量身打造的程序，拥有深度的领域知识和专业训练。
事实上，通用AI模型在专业棋类领域的局限性早有先例。今年早些时候，在国际象棋大师Levy Rozman组织的另一场锦标赛中，Grok和ChatGPT都败给了专为国际象棋设计的人工智能系统Stockfish，进一步证实了通用模型与专业系统之间的实力差距。
这场AI象棋锦标赛不仅展示了当前通用人工智能模型的能力边界，也为我们理解AI在特定领域的表现提供了有价值的参考。尽管这些模型在语言理解和生成方面表现出色，但在需要深度战略思维和专业知识的领域，它们仍有很长的路要走。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

机器人终于不瞎抓了！港大阿里联手开源FineVLA：用哪只手、抓哪里，一句话全搞定

豆包大模型2.1跨越“质变点”，AI生产力大爆发

法定代表人设在秘书长身上，会长怎么办？中国互联网上网服务行业协会内斗，六条战线全部拉开

长宁小小UP主“出道”，互联网原住民这样讲红色故事

大众汽车裁员10万人，博主曝美光高管吐槽苹果涨价，英雄联盟官宣怀旧服，WPS回应C盘占用问题，这就是今天的其他大新闻！

6月26日捷途双车齐发！硬核越野+豪华座舱，亲民价圆普通人越野梦

全站最新

机器人终于不瞎抓了！港大阿里联手开源FineVLA：用哪只手、抓哪里，一句话全搞定

豆包大模型2.1跨越“质变点”，AI生产力大爆发

法定代表人设在秘书长身上，会长怎么办？中国互联网上网服务行业协会内斗，六条战线全部拉开

长宁小小UP主“出道”，互联网原住民这样讲红色故事

热门推荐

安全预警系统，看不见的滴滴「基建」

机器人终于不瞎抓了！港大阿里联手开源FineVLA：用哪只手、抓哪里，一句话全搞定

豆包大模型2.1跨越“质变点”，AI生产力大爆发

机器人产业热潮涌动：百万年薪揽才背后，泡沫隐现待验证

世界杯赋能品牌跃升，蒙牛以创新驱动多线破局走出消费市场独立行情

富力地产等被执行5.7亿

法定代表人设在秘书长身上，会长怎么办？中国互联网上网服务行业协会内斗，六条战线全部拉开

长宁小小UP主“出道”，互联网原住民这样讲红色故事

大众汽车裁员10万人，博主曝美光高管吐槽苹果涨价，英雄联盟官宣怀旧服，WPS回应C盘占用问题，这就是今天的其他大新闻！

腾讯等入股智衍慧生科技公司

豆包输入法iOS版1.4.7更新：输入体验全方位优化打字更高效流畅

6月26日捷途双车齐发！硬核越野+豪华座舱，亲民价圆普通人越野梦

这些岗位，互联网企业需求大

信孙正义，还不如信马斯克

存储芯片大涨苹果美光打口水战