![]()
作者 | 董道力
邮箱 | dongdaoli@pingwest.com
AI Coding 的第一阶段,最容易被相信的故事是"原生模型 + 原生应用"的闭环优势。
Claude Code 背靠 Anthropic,能最早用上最强的 Claude,模型能力、上下文窗口、工具调用都可以被端到端优化。训练数据、推理参数、工具协议,每一层都可以为 coding 场景专门调校,不需要迁就任何第三方API。
相比之下,Cursor 更像是接入模型的"套壳"产品,哪怕体验做得再好,也很容易被认为只是暂时领先。一旦原生团队把模型优势释放出来,或者为了抢占市场提高第三方 API 价格,应用层的产品就会关门大吉。
但现在看,这个判断正在失效。
![]()
Artificial Analysis 近期更新的榜单里,Cursor CLI 与 Claude Code 使用同样的 Claude Opus 4.7(medium),综合得分分别是 61 和 60。这个数字大小本身不重要,重要的是它说明了一件事:所谓"原生"带来的加成,正在慢慢被应用层的工程积累所替代。
同款模型,接近的结果,Cursor 用套壳的方式,做出了不输原生的体验。
Cursor 反击的窗口,就在这里。
1
把模型变成可替换的零件
Cursor 应对"套壳"质疑的方式,不是去证明自己的模型更强,而是让模型变得不那么重要。
在模型外围建立一套足够高效的系统。上下文管理、代码库理解、IDE 与 CLI 的协同等等,这些东西不依附于任何单一模型,却决定了 agent 任务能不能真正跑通。
4 月发布的 Cursor 3,将 Agents Window 被提到核心位置,开发者可以在同一界面里同时调度多个 Agent,分别运行在本地、worktree、云端、远程 SSH 和不同 repo 中。
后续更新沿着这个方向逐层补齐。Cursor SDK 把 Agent runtime 开放给开发者,让企业可以将 Agent 接入内部工具。Cloud Agents 增加了多 repo 支持和审计日志,解决企业用户在安全合规上的顾虑。
与此同时,Cursor 还在把任务入口从 IDE 中移出去。未来的任务不一定从编辑器开始,它可能来自一个想法、一条消息。
Cursor 要做的,是让这些入口自动收拢进 Agent 系统,最终以 diff、测试结果和 PR 的形式回到开发者面前。
从 AI 编程工具,到以 Agent 为核心运转的工程系统,这是 Cursor 这轮更新真正的野心。
这套系统建立起来之后,模型本身变得可以被替换。
Claude 强,接入 Claude,GPT 强,接入 GPT,开源模型好用,就纳入同一套工作流。
而且,随着顶级模型的能力上限正在趋同,接入 Claude Opus 4.7 和接入 GPT 5.5,在很多真实开发任务里的体感差距越来越小。
当"谁家的模型更强"不再是决定性变量,用户的选择逻辑就变了,他们不再被迫绑定某一家模型,而是更看重谁能把不同模型的能力调度得更好。
过去被轻视为"套壳"的那一层,正在成为用户选择的核心。
![]()
1
不体面,但有效
解决了"被替代"的问题,Cursor 还有另一个更基础的困境:不赚钱。
它的商业模式天然带着一个尴尬螺旋:工具越好用,用户调用越多,背后的模型 API 成本就越高。
而 Coding agent 本身又是高 tokens、高工具调用、高重试率的场景。
Cursor 和许多依赖第三方模型的 AI coding 创业公司一样,直到最近仍处于负毛利状态。The Information 随后披露,截至 2026 年 1 月的季度,Cursor 毛利率约为 -23%,此后才勉强转正。
![]()
转折点来自 Cursor 自己训练的 Composer 系列模型。
Cursor 的思路不是从零构建一个优秀的基础模型,而是更务实地用自有模型接管大量常规 coding agent 任务,减少对上游 API 的依赖。
那些不需要最前沿推理能力的任务,常规的代码补全、格式化、简单重构等由 Composer 接管,把昂贵的 API 调用留给真正需要它的场景。
效果很快显现,Cursor 的大型企业账户已实现正毛利,个人开发者账户虽仍在亏损,但整体结构已经有所改观。
最新的 Composer 2.5,是这个逻辑的延续。Cursor 承认它基于 Kimi K2.5 底座,针对长周期编程任务专项训练,合成数据量是上一代的 25 倍。
![]()
选开源底座而非自研,选专项微调而非全能训练,每一步都在压低成本。
这套机制,最终形成了一个可接受的成本结构。
最复杂的需求交给 Claude、GPT 这类前沿模型,最频繁、最标准化的中间地带,交给自己的 Composer。
结合 Cursor 自身的系统,需求越具体,专用模型就越有训练空间,对上游的依赖就越低。
1
重新被评价的资格
某种意义上,Cursor 正在做的事,是用一种不太体面的方式,完成一件很有尊严的事。
它没有执着于证明"我的模型比你强",也没有试图在基础研究上和 Anthropic、OpenAI 正面竞争。它接受自己的位置,然后在这个位置上,把应用层能做的事做到极致。
AI 基础模型正在从"赢家通吃"走向"多极并立"。当没有哪一家模型能在所有场景下碾压其他对手,应用层的工程能力就成了真正决定用户去留的变量。
谁能把有限的模型能力用得更充分、更稳定、更便宜,谁就赢得了真实的竞争。
这场竞争还没有结束。Claude Code 不会坐以待毙,模型能力的天花板仍在上升,原生团队在工具调用和上下文优化上的投入也在加速。
Cursor 的窗口能开多久,取决于两件事:应用层的工程积累能否持续领先,以及它能否在成本结构彻底健康之前,等到市场格局真正稳定下来。
但至少现在,它重新赢回了市场的信任。
在 AI 这个行业里,能活到被重新评价,本身就已经是一种胜利。
![]()
点个“爱心”,再走 吧





京公网安备 11011402013531号