后OpenClaw时代！国产Agent模型凭「高配低价」叫板Opus 4.6

IP属地中国·北京 机器之心Pro 时间：2026-05-26 18:26:55

编辑｜+0、杜伟
今年最出圈的 AI 应用是什么？OpenClaw 一定是绕不开的答案。
回过头看二三月份，「养虾」一度成为流行的社交货币。但它的意义远不止是一款爆款应用：OpenClaw 真正将智能体概念从开发者圈层推向了大众视野，让普通用户第一次直观感受到 Agent 到底能做什么。
当更多人开始理解 Agent 的价值之后，行业的焦点也自然进入到了下一阶段：谁家的 Agent 做得更好、上手起来更容易以及更能负担得起。这些才是决定 Agent 生态走向的关键变量。
谁能在这一节点完成转型，就能在「后 OpenClaw 时代」抢占先机。事实上，国内已经有玩家率先落子。
就在今日，昆仑万维旗下的天工 AI（Skywork）全新发布了 SkyClaw-v1.0 智能体模型，成为其长期深耕云端助理的又一里程碑，也开始了从助手形态向智能体基座模型的架构升级。
作为一款专为 OpenClaw、Claude Code、Hermes、Nanobot 等主流智能体框架深度优化的基座模型，SkyClaw-v1.0 模型在底层能力上实现了质的提升，工具调用精度更准、多轮任务执行更稳、长链路推理更优，能够更好地适配真实场景中复杂、动态的智能体工作流。
与此同时，Skywork 还同步上线了 SkyClaw-v1.0-lite。这一轻量化版本瞄准了高频调用和成本敏感场景，在保持核心智能体能力的同时，大幅优化了推理速度与资源开销，为开发者提供了一个更灵活的部署选择。
两款模型在 X 上抢先亮相以来，热度持续走高。

Nanobot 官方发文，「很高兴能与 Skywork 携手推出 SkyClaw-v1.0！期待看到各位开发者用它创造出无限可能。」

不少海外活跃 AI 博主对它评价颇高，「SkyClaw-v1.0 的训练任务来源于用户的实际操作场景，而不是通用的实验室数据。它在基准测试上超越了 DeepSeek V4 Flash 等模型，稳定性经过了多次验证。这才是打造真正能在实际场景中好用模型的方式。」

「基准测试之争结束了。SkyClaw-v1.0 登场，干净利落地赢下了所有。」

目前，SkyClaw-v1.0 两款模型限时免费开放体验，并已在 5 月 22 日接入到了 Skywork 平台。

天工地址：tiangong.cnSkyClaw-v1.0 项目地址：https://skyworkai.github.io/skyclaw/apifree.ai API 地址：https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api
打出这三张牌
很难不选择它
从产品层面来看，SkyClaw-v1.0 确实拿出了有说服力的东西，具体可以拆成三个维度来看：Agent 能力、使用门槛和性价比。
首先，Agent 能力要强
根据 Skywork 的官方结果，在主流智能体基准以及内部开发的 Claw 任务评估中，包括 PinchBench、Claw-Eval Pass^3 和 Skywork-Claw-Bench（基于 OpenClaw 构建的内部智能体评估套件），SkyClaw-v1.0 和 SkyClaw-v1.0-lite 的表现均优于 Minimax 2.7、DeepSeek V4 Flash 和 Qwen 3.6 35B A3B/27B 模型
另外，在 OpenClaw 相关任务上，SkyClaw-v1.0 的性能逼近更大规模的开闭源模型，包括 DeepSeek V4 Pro、Claude Opus 4.6 和 Qwen 3.6 Plus。

跑分亮眼之外，SkyClaw-v1.0 在实际应用场景中表现惊艳。
在交互式网页与游戏生成方面，它能够输出功能齐全的网页应用，从物理模拟到完整的游戏。结果不仅渲染正确、动画流畅，用户交互处理得也恰到好处。

宾果消消乐
在深度研究与数据可视化方面，SkyClaw-v1.0 展现出了超越单纯代码生成的综合能力：它能够自主研究现实世界课题，从多个来源收集并交叉验证数据，最终将分析结果整合为交互式、达到出版级质量的仪表盘和报告。
可以说，SkyClaw-v1.0 不只是在评测榜单上跑出了好成绩，也在真实场景中证明了自己作为生产力工具的实际价值。
其次，门槛要低
对于用户来说，上手 SkyClaw-v1.0 几乎没有额外的学习成本，按需选择使用渠道。在 Skywork 平台，一键选择模型即可使用。另外，通过 AI 模型聚合服务平台 apifree.ai 注册账号并创建 APIKey，就能免费调用。
生态适配也很完善。Nanobot 已经率先完成对 SkyClaw-v1.0 的适配，后续还将上线 OpenRouter。随着更多平台的接入，开发者将能够在自己熟悉的工具链中直接调用模型，无需重新搭建一套工作流。

在 nanobot 中，只需填入 API 密钥即可使用 SkyClaw-v1.0。
最后，性价比要高
SkyClaw-v1.0 的定价显著低于当前主流 Agent 模型。与 Minimax 2.7 和 Qwen 3.6 系列模型相比，定价仅为它们的一半甚至更低。

SkyClaw-v1.0 打出的这几张牌，直指当前 Agent 模型市场的核心矛盾：性能强的用不起，用得起的不够强，好用的生态封闭。它同时从能力、成本和易用性三个层面给出了一个相对均衡的解，这恰恰是当前市场最稀缺的选项。
一手实测
拿捏住了「快与准」
接下来，我们通过 Claude Code 来调用此次的 SkyClaw-v1.0，上手进行了一些测试。接入过程非常丝滑，配置好 API Key 就能直接跑。
先来做一个小游戏：贪吃蛇。

SkyClaw-v1.0 仅用时 33s 就完成了单文件网页版的基础开发，不仅包含了完整的游戏逻辑、计分系统，并且运行流畅。

再追加进阶需求：「在游戏中增加随机奖励，吃到蛇身边长三格」

依然非常快速，系统在普通食物的基础上增加了一个有 25% 概率掉落的金色星星奖励。
接下来，让 SkyClaw-v1.0 把这个游戏打包成 Windows 桌面可独立运行的 EXE 应用，并附带要求：「色系改成多巴胺色」。这一阶段的测试能够很好地反映 Agent 在面对涉及环境依赖的复杂工程以及排错时的真实能力。
在 UI 需求上，自主定义了包含 12 种高饱和色彩的 CSS 变量，落实了「多巴胺色系」的设计。
在打包环节，采用了 Electron 方案，完成了工程脚手架搭建及依赖安装。
在异常处理方面，遇到报错不陷入死循环，能读懂报错日志，并尝试改变配置（从一个打包器换到另一个）来绕过环境限制。
接下来换一个真实办公场景，这时需求不是单一格式的，这就考验到了模型能不能同时输出文档、PPT 和视频，以及执行任务过程中的全局规划与跨格式协调能力。
这一次，我们直接在 Skywork 中调用 SkyClaw-v1.0，给它一个有难度的复合任务。
让它「制作分别介绍地球四大洋的海底生态视频（每个 10 秒），视频生成后将其作为中间素材，构建一份全球海洋科普专题 PPT。要求将这 4 段视频嵌入到对应的 PPT 页面中，并在视频旁配上基于视频内容自动生成的专业解说词。」
在整个执行链路中，模型需要先生成四段风格统一的视频素材，再把视频作为输入反哺到 PPT 制作中，最后根据视频内容自动撰写解说词。前后环环相扣，任何一步执行不到位可能都会导致最终结果不可用。

从结果来看，包括视频生成质量、PPT 排版完成度以及解说词与视频画面的匹配程度，SkyClaw-v1.0 都表现得面面俱到。
放上一段生成的「太平洋海底珊瑚生态」视频，大家感受一下效果：

完整 PPT 效果如下：

两个案例测下来，我们发现，从理解需求、调用工具、遇错自修以及完整跑通多步骤任务等能力来看，SkyClaw-v1.0 以远低于行业的价格，交付出了接近顶流的 Agent 体验。
技术拆解
三步练出一个顶级 Agent
SkyClaw-v1.0 之所以能在评测与实战中交出亮眼成绩，离不开一套系统化的训练流程。整个过程涵盖环境构建、中期训练与监督微调、强化学习三个阶段，层层递进，构成了一条完整的能力链路。
首先是搭建高质量的训练环境
团队构建了一个高复杂度的模拟 OpenClaw 环境，其中内置了丰富的高质量工具和技能，以供模型探索调用。
不仅如此，团队还深入分析了真实用户在类 OpenClaw 环境下的实际任务行为，并结合线上高频技能的使用数据和反馈，梳理出工具之间的关系图谱。基于这张图谱，合成大量贴近真实用户需求的复杂任务，确保模型从训练阶段就接触到足够真实与复杂的场景。
有了环境基础，接下来是大规模的中期训练与监督微调
依托上面经过充分验证的训练环境，团队合成了海量高质量训练数据。而为了把控数据质量，团队建立了严格的过滤和评估机制，在考核最终答案正确性的同时，还会回溯评估模型完成任务的完整轨迹，确保解题过程本身也是合理高效的。
另外，团队进行了大量数据配比实验，找到智能体任务训练数据的最优组合。
最后，团队通过强化学习进一步打磨模型的泛化能力
由于自建的 OpenClaw 环境天然支持端到端的探索与反馈，模型能够在其中进行充分的强化学习训练。这一阶段的核心目标，除了确保模型在特定任务上表现出色，其在不同智能体框架和陌生任务场景下也要保持稳定的泛化能力。
整体来看，SkyClaw-v1.0 采用的这套技术路径，没有依赖单点突破，而是围绕「真实智能体场景下的可用性」这一目标，实现了数据、训练与优化的贯通。
环境构建解决「用什么数据来练」，中期训练和 SFT 解决「如何练出基础能力」，强化学习解决「如何进一步提升性能上限和泛化性」。
如同此前所有 AI 热点一样，OpenClaw 经历了正常的波动起伏。虽然热度会消退，但趋势不会。Agent 作为当前 AI 发展最重要的方向之一，其地位在短时间内不会改变。
上周的谷歌 I/O 大会是很好的例证，智能体成为贯穿全场的主角，Gemini Spark 的亮相更是直接对标 OpenClaw。这释放出了一个清晰的信号：巨头们正在加速 Agent 技术的消费级落地。
在这样的行业背景下，「一个真正好用且用得起的 Agent」势必将成为市场的香饽饽。但现实是，顶级 Agent 能力几乎被海外御三家（Anthropic、OpenAI 和谷歌）的少数闭源模型垄断，高昂的调用成本导致大量中小开发者和企业望而却步。
换句话说，Agent 的瓶颈不在技术天花板，在于落地门槛。SkyClaw-v1.0 的发布，切中了这一痛点。
它以接近 Claude Opus 4.6 等闭源顶流的 Agent 性能，定价却只有主流模型的一半。结果就是，一个此前因预算有限只能用轻量模型「凑合跑」的开发者，现在可以用同样的成本调用到接近顶级水平的 Agent 能力。
回过头看，此次新发布是昆仑万维在 AI 领域长期布局的又一阶段性成果。自 2022 年确立「All in AGI 与 AIGC」战略以来，昆仑万维基于自主研发的全球领先大模型基座，已构建起短剧和 A I 短剧平台、AI 音乐、AI 游戏、AI SuperAgent、AI 社交五大核心产品矩阵。
其中在 Agent 领域，昆仑万维在今年一、二月先后发布了 Skywork Super Agents Video v1.0、天工 Skywork 桌面版及 SkyClaw 云端智能体。桌面版实现全本地化运行，无需上传数据即可处理多格式内容；SkyClaw 集成 70 余项技能，支持跨设备多端监控。
SkyClaw-v1.0 能够做到高性能与低成本兼顾，与昆仑万维在模型、应用和生态层面的长期积累密不可分。
当 Agent 赛道从狂欢期进入冷静期，最后能留在牌桌上的，一定是把基本功做得最扎实的那一个。SkyClaw-v1.0 交出的这份答卷，正是昆仑万维对这一判断最有力的回应。
文中视频链接：https://mp.weixin.qq.com/s/SSfxXcx8Sr0XQH04rcASrg

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

谷歌DeepMind哈萨比斯：人类有个宝贵的窗口期来确保AGI是安全的

常州市与高德达成合作构建首个城市级全空间无人体系应用先行示范

欧版Apple Watch等智能手表豁免可拆卸电池

26名员工起诉Meta：休病假或育儿假也会导致自己被裁

豆包、千问下线智能体国内首部AI拟人化互动服务新规今起施行

10000小时人类数据，练出全球首个全身移动操作隐式世界动作模型

全站最新

谷歌DeepMind哈萨比斯：人类有个宝贵的窗口期来确保AGI是安全的

常州市与高德达成合作构建首个城市级全空间无人体系应用先行示范

欧版Apple Watch等智能手表豁免可拆卸电池

26名员工起诉Meta：休病假或育儿假也会导致自己被裁

热门推荐

集均2000万成爆剧生死线，长剧观众抛弃古偶了？

芒果综艺能救活一座24亿的大庸古城吗？

相比股票分红，Momenta的车企金主们更想要爆款

理光、富士抱团涨价吃老本，影石们要来整顿微单市场了

排队4小时“顶流”首店，背后是半个奶茶江湖的恩怨情仇

隐忍14年，一个“老二”把三星拉下了王座

上半年上市猪企累计出栏超8500万头，头部“踩刹车”，周期何时反转？

通达系五巨头退出蜂网，“表面兄弟”也没得做了？

迎来重要利好，市值超1200亿，百利天恒能够继续神奇之路吗？

卖一辆亏3万，又一个汽车品牌黯然退守

出口半年增43.2%，欧洲高温让中国空调全产业链都赚翻了

长鑫、SK海力士、三星与美光四大存储巨头的硬核对比

印度\"杀猪盘\"阳谋下，vivo交出控股权

海外品牌接连败退，这门餐饮生意却被中国玩家盘活了？

闫俊杰的「零薪酬」赌局：押上一切冲向AGI