![]()
编辑|+0、杜伟
今年最出圈的 AI 应用是什么?OpenClaw 一定是绕不开的答案。
回过头看二三月份,「养虾」一度成为流行的社交货币。但它的意义远不止是一款爆款应用:OpenClaw 真正将智能体概念从开发者圈层推向了大众视野,让普通用户第一次直观感受到 Agent 到底能做什么。
当更多人开始理解 Agent 的价值之后,行业的焦点也自然进入到了下一阶段:谁家的 Agent 做得更好、上手起来更容易以及更能负担得起。这些才是决定 Agent 生态走向的关键变量。
谁能在这一节点完成转型,就能在「后 OpenClaw 时代」抢占先机。事实上,国内已经有玩家率先落子。
就在今日,昆仑万维旗下的天工 AI(Skywork)全新发布了 SkyClaw-v1.0 智能体模型,成为其长期深耕云端助理的又一里程碑,也开始了从助手形态向智能体基座模型的架构升级。
作为一款专为 OpenClaw、Claude Code、Hermes、Nanobot 等主流智能体框架深度优化的基座模型,SkyClaw-v1.0 模型在底层能力上实现了质的提升,工具调用精度更准、多轮任务执行更稳、长链路推理更优,能够更好地适配真实场景中复杂、动态的智能体工作流。
与此同时,Skywork 还同步上线了 SkyClaw-v1.0-lite。这一轻量化版本瞄准了高频调用和成本敏感场景,在保持核心智能体能力的同时,大幅优化了推理速度与资源开销,为开发者提供了一个更灵活的部署选择。
两款模型在 X 上抢先亮相以来,热度持续走高。
![]()
Nanobot 官方发文,「很高兴能与 Skywork 携手推出 SkyClaw-v1.0!期待看到各位开发者用它创造出无限可能。」
![]()
不少海外活跃 AI 博主对它评价颇高,「SkyClaw-v1.0 的训练任务来源于用户的实际操作场景,而不是通用的实验室数据。它在基准测试上超越了 DeepSeek V4 Flash 等模型,稳定性经过了多次验证。这才是打造真正能在实际场景中好用模型的方式。」
![]()
「基准测试之争结束了。SkyClaw-v1.0 登场,干净利落地赢下了所有。」
![]()
目前,SkyClaw-v1.0 两款模型限时免费开放体验,并已在 5 月 22 日接入到了 Skywork 平台。
![]()
天工地址:tiangong.cnSkyClaw-v1.0 项目地址:https://skyworkai.github.io/skyclaw/apifree.ai API 地址:https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api
打出这三张牌
很难不选择它
从产品层面来看,SkyClaw-v1.0 确实拿出了有说服力的东西,具体可以拆成三个维度来看:Agent 能力、使用门槛和性价比。
首先,Agent 能力要强
根据 Skywork 的官方结果,在主流智能体基准以及内部开发的 Claw 任务评估中,包括 PinchBench、Claw-Eval Pass^3 和 Skywork-Claw-Bench(基于 OpenClaw 构建的内部智能体评估套件),SkyClaw-v1.0 和 SkyClaw-v1.0-lite 的表现均优于 Minimax 2.7、DeepSeek V4 Flash 和 Qwen 3.6 35B A3B/27B 模型
另外,在 OpenClaw 相关任务上,SkyClaw-v1.0 的性能逼近更大规模的开闭源模型,包括 DeepSeek V4 Pro、Claude Opus 4.6 和 Qwen 3.6 Plus。
![]()
跑分亮眼之外,SkyClaw-v1.0 在实际应用场景中表现惊艳。
在交互式网页与游戏生成方面,它能够输出功能齐全的网页应用,从物理模拟到完整的游戏。结果不仅渲染正确、动画流畅,用户交互处理得也恰到好处。
![]()
宾果消消乐
在深度研究与数据可视化方面,SkyClaw-v1.0 展现出了超越单纯代码生成的综合能力:它能够自主研究现实世界课题,从多个来源收集并交叉验证数据,最终将分析结果整合为交互式、达到出版级质量的仪表盘和报告。
可以说,SkyClaw-v1.0 不只是在评测榜单上跑出了好成绩,也在真实场景中证明了自己作为生产力工具的实际价值。
其次,门槛要低
对于用户来说,上手 SkyClaw-v1.0 几乎没有额外的学习成本,按需选择使用渠道。在 Skywork 平台,一键选择模型即可使用。另外,通过 AI 模型聚合服务平台 apifree.ai 注册账号并创建 APIKey,就能免费调用。
生态适配也很完善。Nanobot 已经率先完成对 SkyClaw-v1.0 的适配,后续还将上线 OpenRouter。随着更多平台的接入,开发者将能够在自己熟悉的工具链中直接调用模型,无需重新搭建一套工作流。
![]()
在 nanobot 中,只需填入 API 密钥即可使用 SkyClaw-v1.0。
最后,性价比要高
SkyClaw-v1.0 的定价显著低于当前主流 Agent 模型。与 Minimax 2.7 和 Qwen 3.6 系列模型相比,定价仅为它们的一半甚至更低。
![]()
SkyClaw-v1.0 打出的这几张牌,直指当前 Agent 模型市场的核心矛盾:性能强的用不起,用得起的不够强,好用的生态封闭。它同时从能力、成本和易用性三个层面给出了一个相对均衡的解,这恰恰是当前市场最稀缺的选项。
一手实测
拿捏住了「快与准」
接下来,我们通过 Claude Code 来调用此次的 SkyClaw-v1.0,上手进行了一些测试。接入过程非常丝滑,配置好 API Key 就能直接跑。
先来做一个小游戏:贪吃蛇。
![]()
SkyClaw-v1.0 仅用时 33s 就完成了单文件网页版的基础开发,不仅包含了完整的游戏逻辑、计分系统,并且运行流畅。
![]()
再追加进阶需求:「在游戏中增加随机奖励,吃到蛇身边长三格」
![]()
依然非常快速,系统在普通食物的基础上增加了一个有 25% 概率掉落的金色星星奖励。
接下来,让 SkyClaw-v1.0 把这个游戏打包成 Windows 桌面可独立运行的 EXE 应用,并附带要求:「色系改成多巴胺色」。这一阶段的测试能够很好地反映 Agent 在面对涉及环境依赖的复杂工程以及排错时的真实能力。
在 UI 需求上,自主定义了包含 12 种高饱和色彩的 CSS 变量,落实了「多巴胺色系」的设计。
在打包环节,采用了 Electron 方案,完成了工程脚手架搭建及依赖安装。
在异常处理方面,遇到报错不陷入死循环,能读懂报错日志,并尝试改变配置(从一个打包器换到另一个)来绕过环境限制。
接下来换一个真实办公场景,这时需求不是单一格式的,这就考验到了模型能不能同时输出文档、PPT 和视频,以及执行任务过程中的全局规划与跨格式协调能力。
这一次,我们直接在 Skywork 中调用 SkyClaw-v1.0,给它一个有难度的复合任务。
让它「制作分别介绍地球四大洋的海底生态视频(每个 10 秒),视频生成后将其作为中间素材,构建一份全球海洋科普专题 PPT。要求将这 4 段视频嵌入到对应的 PPT 页面中,并在视频旁配上基于视频内容自动生成的专业解说词。」
在整个执行链路中,模型需要先生成四段风格统一的视频素材,再把视频作为输入反哺到 PPT 制作中,最后根据视频内容自动撰写解说词。前后环环相扣,任何一步执行不到位可能都会导致最终结果不可用。
![]()
从结果来看,包括视频生成质量、PPT 排版完成度以及解说词与视频画面的匹配程度,SkyClaw-v1.0 都表现得面面俱到。
放上一段生成的「太平洋海底珊瑚生态」视频,大家感受一下效果:
![]()
完整 PPT 效果如下:
![]()
两个案例测下来,我们发现,从理解需求、调用工具、遇错自修以及完整跑通多步骤任务等能力来看,SkyClaw-v1.0 以远低于行业的价格,交付出了接近顶流的 Agent 体验。
技术拆解
三步练出一个顶级 Agent
SkyClaw-v1.0 之所以能在评测与实战中交出亮眼成绩,离不开一套系统化的训练流程。整个过程涵盖环境构建、中期训练与监督微调、强化学习三个阶段,层层递进,构成了一条完整的能力链路。
首先是搭建高质量的训练环境
团队构建了一个高复杂度的模拟 OpenClaw 环境,其中内置了丰富的高质量工具和技能,以供模型探索调用。
不仅如此,团队还深入分析了真实用户在类 OpenClaw 环境下的实际任务行为,并结合线上高频技能的使用数据和反馈,梳理出工具之间的关系图谱。基于这张图谱,合成大量贴近真实用户需求的复杂任务,确保模型从训练阶段就接触到足够真实与复杂的场景。
有了环境基础,接下来是大规模的中期训练与监督微调
依托上面经过充分验证的训练环境,团队合成了海量高质量训练数据。而为了把控数据质量,团队建立了严格的过滤和评估机制,在考核最终答案正确性的同时,还会回溯评估模型完成任务的完整轨迹,确保解题过程本身也是合理高效的。
另外,团队进行了大量数据配比实验,找到智能体任务训练数据的最优组合。
最后,团队通过强化学习进一步打磨模型的泛化能力
由于自建的 OpenClaw 环境天然支持端到端的探索与反馈,模型能够在其中进行充分的强化学习训练。这一阶段的核心目标,除了确保模型在特定任务上表现出色,其在不同智能体框架和陌生任务场景下也要保持稳定的泛化能力。
整体来看,SkyClaw-v1.0 采用的这套技术路径,没有依赖单点突破,而是围绕「真实智能体场景下的可用性」这一目标,实现了数据、训练与优化的贯通。
环境构建解决「用什么数据来练」,中期训练和 SFT 解决「如何练出基础能力」,强化学习解决「如何进一步提升性能上限和泛化性」。
如同此前所有 AI 热点一样,OpenClaw 经历了正常的波动起伏。虽然热度会消退,但趋势不会。Agent 作为当前 AI 发展最重要的方向之一,其地位在短时间内不会改变。
上周的谷歌 I/O 大会是很好的例证,智能体成为贯穿全场的主角,Gemini Spark 的亮相更是直接对标 OpenClaw。这释放出了一个清晰的信号:巨头们正在加速 Agent 技术的消费级落地。
在这样的行业背景下,「一个真正好用且用得起的 Agent」势必将成为市场的香饽饽。但现实是,顶级 Agent 能力几乎被海外御三家(Anthropic、OpenAI 和谷歌)的少数闭源模型垄断,高昂的调用成本导致大量中小开发者和企业望而却步。
换句话说,Agent 的瓶颈不在技术天花板,在于落地门槛。SkyClaw-v1.0 的发布,切中了这一痛点。
它以接近 Claude Opus 4.6 等闭源顶流的 Agent 性能,定价却只有主流模型的一半。结果就是,一个此前因预算有限只能用轻量模型「凑合跑」的开发者,现在可以用同样的成本调用到接近顶级水平的 Agent 能力。
回过头看,此次新发布是昆仑万维在 AI 领域长期布局的又一阶段性成果。自 2022 年确立「All in AGI 与 AIGC」战略以来,昆仑万维基于自主研发的全球领先大模型基座,已构建起短剧和 A I 短剧平台、AI 音乐、AI 游戏、AI SuperAgent、AI 社交五大核心产品矩阵。
其中在 Agent 领域,昆仑万维在今年一、二月先后发布了 Skywork Super Agents Video v1.0、天工 Skywork 桌面版及 SkyClaw 云端智能体。桌面版实现全本地化运行,无需上传数据即可处理多格式内容;SkyClaw 集成 70 余项技能,支持跨设备多端监控。
SkyClaw-v1.0 能够做到高性能与低成本兼顾,与昆仑万维在模型、应用和生态层面的长期积累密不可分。
当 Agent 赛道从狂欢期进入冷静期,最后能留在牌桌上的,一定是把基本功做得最扎实的那一个。SkyClaw-v1.0 交出的这份答卷,正是昆仑万维对这一判断最有力的回应。
文中视频链接:https://mp.weixin.qq.com/s/SSfxXcx8Sr0XQH04rcASrg





京公网安备 11011402013531号