GPT-5.2发布即降智？背后华人被挖出，清北校友核心贡献

IP属地中国·北京 新智元 时间：2025-12-12 14:17:43

新智元报道
编辑：Aeneas
号称满分屠榜的GPT-5.2，一发布就降智了？许多网友现身表示，似乎确实比开始弱了很多。但提前实测的网友表示，它的确很强，甚至当得起GPT-6之称！
昨夜，OpenAI放出了GPT-5.2炸弹。
根据官方公布的基准测试，它几乎完全碾压Gemini 3 Pro。
GPT-5.2最擅长帮人们完成有经济价值的任务，比如做电子表格、做PPT、写代码和审查代码、分析长文档等等。
而且号称在GDPval等基准测试中，有70.9%的时间能追赶甚至吊打专业人士。
可以说，这是OpenAI进入红色预警，甚至不惜改变AGI目标，都要完成的一个产品，而且还身负着狙击Gemini 3的重任。

所以，GPT-5.2实测起来，体感究竟如何？
GPT-5.2实测：一上线就降智？
出乎意料都是，一个GPT-5.2实测翻车的帖子，在X上火了。
如果向它提问：「garlic」中有多少个R？它会回答：0个。

相比之下，其他模型的表现就要稳定得多。

归根结底，这是LLM的一个底层问题：因为tokenization而无法统计字母数量。
不过，只要强制选到Thinking版本，GPT-5.2就能答对这个问题了。

在reddit上，也有很多网友表示：在GPT-5.2刚发布的时候，似乎功能还很强。
结果几个小时后，它紧接着就降智了。

有人表示，自己早上八点半开始用的时候还好好的，喝完一杯咖啡后，GPT-5.2忽然就不行了。

似乎每次新模型一发布，几小时后就会被削弱，OpenAI这是什么操作？

大佬现身说法：还是挺强的
不过这点小插曲，还是没有影响坊间的正面评论。
昨晚GPT-5.2一发布，网友们就被震撼了。
比如有人说，ARC-AGI 2的这次飞跃属实疯狂，OpenAI究竟是怎么做到的？

本来大家还以为OpenAI已经落后谷歌了，看来并没有！

看起来，OpenAI内部还捂着不少厉害的东西没发布。

而且，领略过GPT-5.2超强满血版的用户，对它是一致好评。

沃顿商学院教授Ethan Mollick表示，自己有幸提前使用了GPT-5.2，它的性能还是令人印象很深刻的。

比如下面这个任务：创建一个视觉上有趣的着色器，可以在twigl-dot-app中运行，使其看起来像一座无限的新哥特式塔楼城市，部分淹没在波涛汹涌的海洋中。
对于这个视频，很多网友大加赞叹：GPT-5.2不仅遵循了指令，还在代码中选择了非常合理的审美和结构。

然后，教授又让GPT-5.2绘制一张人类历年考试成绩的图表。

这个任务十分复杂，因为需要在过程中查找和交叉引用大量资料，然后一次性就生成有用的结果。
可以看到，GPT-5.2的表现十分惊艳。

这个Twigl代码的实例，显出了GPT-5.2的强大编码能力。

推理、数学、编程的重大飞跃
Magicpathai的CEO表示，自己已经测试GPT-5.2有一段时间了。
他对于这个模型的评价是——「复杂推理、数学、编程和模拟方面的一次重大飞跃」。

在下面这个实例中，它在单个文件中就构建了一个完整的3D图形引擎，还支持交互式控制，分辨率达到4K。
在这个视频中，他还用GPT-5.2进行了高难度推理。
有人质疑道：这个图形引擎会不会是GPT-5.2调库完成的？CEO表示，所有代码和图形完全是从0开始写的。

也就是说，GPT-5.2的进步不是渐进式的，而是编码助手功能的彻底范式转变。

网友们惊呼：这种进步的速度，实在是令人头晕目眩。

这位CEO对于GPT-5.2的评价是：它是OpenAI推出的最佳智能体模型，可以连续运行大量工具而不会出现问题，并且比其前代产品速度更快。
为了测试它的功能，他构建了一个智能体，可以同时使用GPT-5.2、5.1和5。
结果显示，GPT-5.2调用工具时无需任何前导码，而且即使在长时间会话中，也不会迷失方向。

还有人让GPT-5.2用ASCII写出了自己的内心世界，答案很震撼。

总之，在大多数人的反馈中，GPT-5.2能稳定地处理实际工作，条理清晰，工作流程顺畅。

相比于会出现小中断的旧模型，GPT-5.2对于任务的理解更强，完成得也更顺利。

ARC Prize表示，GPT-5.2 Pro（X-High）的最新SOTA得分为90.5%，这就意味着，AI在一年内效率已经提高了约390倍。

背后神秘华人，浮出水面
同以往一样，这次GPT-5.2的幕后功臣，依然有不少华人。
比如，最早预告GPT-5.2的OpenAI华人研究员、北大校友Yu Bai。

他本科在北大学习数学，在斯坦福获得统计学博士学位。

负责后训练的Yun Dai，本科来自清华大学，在加州大学尔湾分校获得了计算机科学硕士学位。

另一位OpenAI华人研究员Zuxin Liu，从事推理模型后训练工作。
他本科毕业于北航，在CMU攻读硕士和博士学位。

Aston Zhang来自在伊利诺伊大学厄巴纳-香槟分校攻读博士学位，现在是OpenAI的研究员。

他感谢了团队，尤其强调了GPT-5.2 Thinking的处理多步骤任务能力。

总之，昨晚的AI大战，OpenAI给出了强烈一击。
接下来，谷歌又会拿出什么来应对呢？
参考资料：
https://x.com/skirano/status/1999182295685644366
https://x.com/emollick/status/1999185085719887978
秒追ASI
⭐点赞、转发、在看一键三连⭐
点亮星标，锁定新智元极速推送！

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

携程：2026财年第一财季营收162亿元，同比增长17%

俞浩社交账户已被公司接管，网上发疯是做极限测试，全民自媒体已终止

携程暴跌14%

硅芯片真神归位 IBM首发0.7nm工艺：密度5倍于7nm

零跑首款旗舰MPV D99正式上市 24.98万元起售

尊界S800 Grand Design典藏大观上市：L3+架构、售价138.8万元

全站最新

携程：2026财年第一财季营收162亿元，同比增长17%

俞浩社交账户已被公司接管，网上发疯是做极限测试，全民自媒体已终止

携程暴跌14%

硅芯片真神归位 IBM首发0.7nm工艺：密度5倍于7nm

热门推荐

携程预期Q2业绩增速大幅放缓，高管回应市场竞争

“龙大转债”倒计时不足一月，ST龙大坦言“钱不够还”

携程：2026财年第一财季营收162亿元，同比增长17%

俞浩社交账户已被公司接管，网上发疯是做极限测试，全民自媒体已终止

携程暴跌14%

硅芯片真神归位 IBM首发0.7nm工艺：密度5倍于7nm

零跑首款旗舰MPV D99正式上市 24.98万元起售

尊界S800 Grand Design典藏大观上市：L3+架构、售价138.8万元

零跑朱江明：当初差点跟罗永浩一样去做手机评估后放弃了

全尺寸MPV尊界V800/V680亮相：搭载全主动悬架，预售价80万-120万/65万-90万元

苹果罕见承认成本失控：Mac、Pad全球涨价，iPhone暂未受影响

速速下单！苹果Mac系列电商渠道还没涨价：最后的原价上车机会

江汽董事长项兴初：积极对标华为、站在巨人的肩膀上，产品研发效率提升近四成

百度千帆Coding Plan停止续费：已购用户可正常使用至服务到期

哈弗旗舰方盒子SUV长城H10亮相：归元平台打造，提供5座和6座布局

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

GPT-5.2发布即降智？背后华人被挖出，清北校友核心贡献