当前位置: 首页 » 资讯 » 科技头条 » 正文

​Cursor 实测:在长程自动化编程任务中,GPT-5.2 表现优于 Claude Opus 4.5

IP属地 中国·北京 编辑:顾青青 Chinaz 时间:2026-01-15 16:28:20

知名 AI 编程辅助工具Cursor近日分享了一项内部测试发现:在处理超长程、自主性的编程任务时,OpenAI 最新的GPT-5.2模型表现出比 Anthropic 的Claude Opus4.5更高的可靠性。为了验证模型能力,Cursor 团队尝试从零开始构建一个功能完备的Web 浏览器,涵盖了 HTML 解析、CSS 布局及自定义 JavaScript 虚拟机等复杂底层架构。

实测结果显示,GPT-5.2在这种需要数百万行代码、耗时数周的“长跑式”任务中,能够更精准地遵循复杂指令,并保持极高的专注度,有效避免了长程任务中常见的“目标漂移”问题。相比之下,Claude Opus4.5虽然在许多场景表现出色,但在处理此类极大规模工程时,往往更倾向于中途停止或寻找捷径,提前交出控制权。

目前,Cursor已在其平台上同步上线了GPT-5.2模型,旨在探索 AI 代理是否能独立完成通常需要人类团队花费数月才能完成的大型项目。除了浏览器实验,该模型还成功完成了包括 Windows7模拟器及超百万行代码的复杂迁移任务,展现了生成式 AI 在自主工程领域的巨大潜力。

划重点:

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。