![]()
作者 | 黄小艺
邮箱 | huangxiaoyi@pingwest.com
就在今天上午,我参加了一头“骡子”的产品体验会——MuleRun,中文名是骡子快跑,这也是首个做到了自进化的个人AI产品。
结合最近的爆火的OpenClaw,这次发布让我开始思考“AI员工哲学”。
自从龙虾火了之后,各行各业的人都想养一个龙虾,做内容的、跑业务的、做研究的,甚至完全不关注AI的朋友,都在说:“我也想养,但从哪里开始?”
当你真的去问这些人:“你打算用它来干什么?”——大多数人答不上来。他们只是觉得大家都在养,我也得养一个。至于养来干什么,养上了再说。
真正养上之后呢,崩溃时刻才是来了。
有人照教程部署了本地Agent,跑了两天突然挂掉,报错看不懂,研究一晚没结果,最后直接删掉;有人找到了一个很具体的需求——自动抓取行业信息推送到飞书群——结果动不动烧掉大量token,执行到一半就中断,手动盯着跑,省下的时间不如消耗的精力多;还有人任务跑到一半,AI开始绕圈子,反复刷同一个页面,强制停掉,什么都没留下。
这些故事指向同一件事:让AI真正帮你做事、实现全流程自动化,在技术上是可行的,但大多数人还没找到方法,让它稳定地融入日常工作。
毕竟,龙虾这类开源的自由度高的开发者工具,能力越强,安装越复杂、出错风险越高、需要的技术背景越深,远超普通用户的射程范围。
但是,从个人电脑到智能手机,从搜索引擎到移动支付,每一种生产力工具真正大规模普及的节点,从来不是“用户学会了驾驭复杂系统”的那一刻,而是“把产品门槛降到普通人直接上手”的那一刻。
产品必须去适应用户,不是反过来。
3月16日发布的 MuleRun(骡子快跑),就是一次试图把 AI 拉回普通人桌面的尝试。
这是一款主打“自进化”的个人 AI,去掉了复杂的部署和调试,核心逻辑就是让各行各业的人,能以极低的门槛雇佣自己的数字员工。
之所以叫骡子,是因为马跑得快,但成本高,普通农户养不起;驴便宜,但扛不了重活。而作为马和驴的后代,骡子解决的是一个很具体的问题:用更低的成本,把更重的活稳定干完。耐力好,脾气稳,不挑路,不需要你太多关注,活就做完了。
正如发布会上,MuleRun创始人陈宇森提到的,“我们想做的是个人 AI。安全、稳定性、上手门槛低。它一直记着你,根据和你的交互而进化,主动提醒你但不打扰,一直在线。”
这个听起来很美的愿景能不能真的落地?我们实际测了测。
1
先搞清楚MuleRun是什么
坦白说,这一年主打AI自主操作的产品太多了,各家都在说“你只需要描述需求,AI来执行”。但用下来,大多数是同一个结果:你给任务,它踉踉跄跄地跑完,给出一份大差不差的报告和网页。
骡子快跑第一眼看起来也是这条路——打开网页,一个对话框,你说话,它干活。
它和OpenClaw的区别在于,它配置了云端的虚拟机,并非是本地优先的逻辑,由此缺失了一部分本地的用户Context,无法直接管理终端文件,但也因此具有更高的独立性和安全性,操作也更便捷;
相似之处在于,它同样有Heartbeat功能,能够完成长期的监控、执行任务,并且能够从交互和任务执行中不断优化自己,适应用户的使用习惯。
我们先搞清楚它的两种工作形态。
第一种叫Super Agent,是骡子快跑最直接的入口。你在页面的对话框里用自然语言描述需求,骡子会调用它背后封装好的工具和能力来完成任务——生图、做PPT、建网站、批量处理文件,说清楚你要什么,它来想怎么做。
这类任务的特点是“做完交付”:你要一个结果,它给你一个结果。
在这个过程中,你不需要选择模型,不需要限定任务类型,唯一需要选择的是,是否连接、使用、操作你的GitHub代码库。
![]()
第二种是Computer模式。它是一台专属于你的云端虚拟机,7×24小时持续运行,就算你关掉电脑、睡觉、出门,它还在工作。
![]()
在Computer场景下,它内置了“Heartbeat”的主动触达机制,会在你开机一段时间后,主动汇报过去24小时的工作进展。
你可以给它布置定时任务,让它每天早上抓行业信息整理给你;可以让它持续监控某个数据,有变动就通知你;还可以配置它通过 Telegram、WhatsApp 或 Discord 主动联系你汇报进展。这类任务的特点是“需要一直跑着”:人可以不在,它替你盯着。
1
我把几件很具体的事交给了它
分清了它的两种能力形态,接下来就是“拉出来干活”了,我们主要实测了三个场景。
测试一:批量处理一批图
有一类图片处理需求,单张做很容易,但在一段时间内保持高度的“品牌一致性”进行批量处理却极其困难。
比如,为一个电商店铺生成一系列符合品牌调性的配图,或者处理固定场景的系列文章插图。
以往,要么借助Photoshop进行批处理,这需要一定的专业门槛;要么在修图软件里套用固定的模板,缺乏灵活性;如果去求助常规的AI Chatbot,那基本是在“抽卡”——每次生成的画风、细节可能都不同。
我想试试在MuleRun的Super Agent里,用自然语言把这种需要严格统一风格的批量需求描述出来,避免“抽卡式”的不确定性。
我先上传了一张图,描述了我想要的风格:涂色书风格,粗黑轮廓,无阴影,适合儿童,黑白线稿。
骡子读取图片后,自行扫描了可用的模型配置,选了一个适合风格迁移的模型,跑完了第一张转换。
![]()
结果还不错——圆脸、大眼、发型、耳环都保留了,整体确实是干净的线稿风格。
第二步,我说了一句:“将这个过程沉淀下来,我要以后批量处理。”
于是,它创建了一个名为 coloring-book 的可复用技能,写了批量转换脚本,附上了参数说明文档,把一次性的操作封装成了下次可以直接调用的能力。
![]()
我尝试了下效果,“帮我搜索十张好看的风景照,然后全部转化成线稿。”
骡子开始自己拆解、依次执行——搜索并筛选了十张涵盖山脉、湖泊、海滩、花田的风景图,批量下载,调用刚才封装好的脚本,统一转换,最后把十张线稿一并呈现出来,还附上了每张图的主题说明。
![]()
测试二:让它帮我盯着一件我没时间盯的事
AI 短剧是最近增长最快的内容品类之一,各平台的数据每天都在变——哪些作品在涨,什么题材在跑,爆款背后有没有规律可循。这类事情,凭人工去跟踪既费时又低效,但它确实有价值。
我把这件事交给MuleRun的Computer,设置了一个持续监控任务:7×24 小时监控 AI 短剧大盘,多平台、多维度,每 30 分钟出一次可视化 HTML 报告。
骡子开始探查哪些数据源真实可访问,B 站、今日头条、微博逐一测试,确认拿得到API的真实数据之后,才开始动手构建系统,最后给出的HTML报告看起来很专业,包含了大盘 KPI、题材热力榜、爆款排行、风格维度、AI 预测信号等模块,数据全部来自 B 站公开 API 和头条热榜,不是对历史报告的简单搜索。
过程中出现了一个插曲:第一次,MuleRun给到的网页打不开,我提出“再给我一个百分百能打开的网页”,它开始自己探索,找到了cloudflared,打了一条公网隧道,直接给我一个 HTTPS 地址,任何设备浏览器打开即用。历史报告也有单独的存档路径。
这个测试和第一个的核心差别在于“时间维度”,从结果来看,骡子执行的很好,但如果需要更专业细致的数据,还需要在Prompt阶段给出DataEye这样的数据源。
测试三:在广场上发现游戏,然后自己也试了一下
在MuleRun的Use Case广场逛了一圈之后,发现有相当多的用户在拿MuleRun做游戏。
于是,我们也来尝试做了做。我只给了一句话:“做一个治愈系闯关游戏,画面唯美,配乐柔和。”没有提任何技术参数,没有提美术风格,没有上传任何素材。
MuleRun开始自己工作,给这个游戏起了个名字叫“星野漫步”——小狐狸在星空下的梦境森林里穿行,收集萤火虫。深紫星空加极光渐变的背景,樱花花瓣随风飘落,萤火虫有动态光晕,骡子用 Web Audio API 生成了五声音阶的柔和琴音循环,跳跃和通关各有专属音效。做完之后,它直接给了我一个链接,点开就能玩,发给朋友,手机上也能打。
一直以来,游戏开发在创意类工作里门槛算是最高的之一:美术素材、玩法逻辑、关卡设计、交互代码,每一块都是独立的专业方向。MuleRun的能力里同时搭载了这些模块——不只是能写游戏代码,还内置了生图、视频等 API,可以批量生成美术素材,最后一键部署成可玩的在线网页。
对普通人来说,一句话能出一个能玩的demo,这个门槛已经低到可以忽略不计了。
![]()
对专业游戏开发者来说,价值在别处:批量生产美术资产、快速搭出功能原型、把不同模块分工生成,代码也可以直接下载部署到本地,融进团队自己的开发流程里。
1
骡子说自己“越用越懂你”,这件事是怎么做到的?
在测试Super Agent和Computer的过程中,我发现在任务完成之后,MuleRun会主动复盘,将任务经验沉淀下来,下次可以重复操作,或者汇报下一次的任务监控进度,具有一定的主动性。
正如,陈宇森在发布会上提到,和市面上那些“用完即走、没有记忆”的工具不同,MuleRun的核心机制在于“自进化”。
让“AI会记住你”这句话,几乎每家产品都在说,但骡子在这件事上的设计逻辑,比大多数产品想得更深一些。它的自进化机制,主要在两个层面在运转。
在个体层面,它试图成为一个真正懂你的员工——深入学习并记住你的工作习惯、决策逻辑、知识积累甚至审美偏好,越用越默契。
具体来看,骡子会在你每一次使用中,积累特定场景的AI能力组合、行业认知、工作框架,并整理成结构化的知识存进来,记录在专属的云端环境里,随时调用、实时翻阅,在下次遇到类似场景时,提前做出判断。
此外,骡子还提供了几种预设场景模式,覆盖投资、设计、营销、开发、研究等方向。切换模式之后,系统会自动加载对应的工具包和能力。
而在群体层面,它构建了一个开放的Agent网络生态,别人踩过的坑、验证过的高效工作流,会被系统自动匹配给你。
这意味着,你不仅拥有了一个专属助理,还无差别共享了全网最聪明的“打工人”大脑。
具体来看,每一个用户在使用过程中沉淀出来的Agent任务,都可以一键发布到模板广场。骡子会根据使用频次、任务完成质量等维度,对这些Agent进行加权排序——被更多人验证有效的Agent,会更容易被个人AI采纳。
我去广场逛了一圈。现有的Knowledge Network数量已经很多了,覆盖的场景也很广:风格化写作、股价监控、在LinkedIn上筛选潜在客户、短剧内容生成、视频脚本创作……翻都翻不完。于是,我也把我已经成功的线稿转化任务公开了出去。
![]()
对骡子快跑而言,用得越久、用得人越多,整个 Agent 网络的质量也越高,从而能够形成一个会自我增强的生态,而不是一个静止的工具库。
1
龙虾与骡子,两种“员工哲学”的分野
在Agent火爆的背景下,目前用户面临的问题,已经不是“要不要用AI员工”,而是“什么样的AI员工更好用”了。
把AI Agent工具按照“使用门槛”和“控制粒度”两个维度做一个分类。那么龙虾代表的是高控制粒度、高使用门槛的路线——它给你最大的自由度,但代价是你要懂它、管它、救它。
换句话说,龙虾是一个能力极强但需要精细管理的顶级外包——你得写清楚需求文档、配置环境、处理各种报错,还要自己承担数据外泄的风险。
它的设计逻辑预设了一种特定的雇主画像:有技术背景、能承担风险、愿意花时间调教。
而另一种,则是门槛低、自动化程度高的AI员工,由它来自主承担“越用越懂你”的责任,而不是作为老板的你来适应员工。而这,也是大多数人的需求。
正如陈宇森提到的,“ 把 AI 的定义权,还给每一个人。骡子不是给大公司用的,就是给你用的。”
在MuleRun里,用户既不需要每次从零交代背景,也不需要本地安装、环境配置,只需要打开浏览器,一个对话框,就能让它干活。更重要的是,遇到问题,内置一键修复和快捷重启;如果还解决不了,会员提交邮件反馈,有专人响应。
工具遇到问题,骡子自己解决;骡子遇到问题,MuleRun公司来兜底。
这两种AI员工,不是说哪个更好,而是它们适合两种不同的“雇主人群”,代表着Agent行业里两条同时成立的路:一条路通向极致的能力上限,一条路通向真正的大众可及。
前者会让技术玩家越来越兴奋,而后者会让更多普通人第一次真正用上AI员工。
![]()
点个“爱心”,再走 吧





京公网安备 11011402013531号