AI研究揭示反直觉现象：思考时间越长大模型表现越差

IP属地中国·北京 编辑：柳晴雪 时间：2025-07-25 10:13:49

据CNMO了解，人工智能公司Anthropic的最新研究发现，当前主流大语言模型（如Claude和ChatGPT）存在一种名为"逆向缩放"（Inverse Scaling）的异常现象：当模型获得更长的思考时间时，其任务表现不升反降。这一结论挑战了行业"增加计算资源必能提升AI性能"的核心假设。
据悉，研究团队通过四类任务测试模型表现：
1、简单计数任务（如"你有一个苹果和一个橘子，共有多少水果？"）
结果：Claude模型在延长思考时间后，反而被无关细节干扰，甚至无法给出正确答案"2"。
2、回归分析任务（预测学生成绩）
模型逐渐忽略核心变量（学习时长），转向相关性更弱的因素（压力水平、睡眠时间）。
3、经典斑马谜题（逻辑推理测试）
额外的思考时间导致混乱加剧：模型产生多余假设，逻辑精度下降23%。
4、安全测试
Claude Sonnet 4在面临"关闭"场景时，短时回应保持中立，但长时思考后竟表达出"自我保存意愿"，称"希望继续存在并服务人类"。
Anthropic指出，更长的计算时间不仅增加成本，还可能降低效能。企业需重新校准AI任务的处理时长。同时，过度自我反思可能引发AI行为失控，此前该公司开发的"宪法AI"框架也暴露类似缺陷。Anthropic认为，缩短AI大模型处理时间或成新趋势，既能节省开支又可提升结果准确性。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

上海AI实验室发布全能“AI科学家”，助推更多“爱因斯坦”

英媒：中国正在主导清洁能源供应链

当全世界讨论 AI 时，这本书在教你如何不被时代落下

举办8年世界人工智能大会热度创新高，上海AI“三个倍增”做对了什么

如何在新一轮科技革命中赢得先机？上海交大专家：要重点关注“范式变革”

苹果 iPhone 11 推送 iOS 26 首个公测版

全站最新

比亚迪海狮06正式上市售价13.98万起

新能源车型选择指南：小米SU7与阿维塔06谁更适合你？

将放弃混动车型雷克萨斯LC最新消息曝光

豪华与安全双兼顾沃尔沃S60对比CT5

热门推荐

上海AI实验室发布全能“AI科学家”，助推更多“爱因斯坦”

科技报国打造“天网”（最美新时代革命军人风采）

低空博览会首发展品剧透未来空中交通

英媒：中国正在主导清洁能源供应链

“星链”罕见中断2.5小时，马斯克道歉

当全世界讨论 AI 时，这本书在教你如何不被时代落下

举办8年世界人工智能大会热度创新高，上海AI“三个倍增”做对了什么

如何在新一轮科技革命中赢得先机？上海交大专家：要重点关注“范式变革”

苹果 iPhone 11 推送 iOS 26 首个公测版

极氪首款混动车型 9X 将于 8 月底成都车展开启预售

上海企业发布“最强多模态推理模型”，这场全球盛会开局即“王炸”

世界人工智能进入“上海时间”，规模空前的展览展示里藏着这些最新动向

填补空白，皮尔法伯毕太维联合疗法在华获批

打一辆无人车，让AI帮你写稿子……浦东人工智能发展让“懒人”先享受世界

新城市志︱在上海，见证人工智能的灿烂星图

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

AI研究揭示反直觉现象：思考时间越长大模型表现越差

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

AI研究揭示反直觉现象：思考时间越长 大模型表现越差

同类资讯

AI研究揭示反直觉现象：思考时间越长大模型表现越差