![]()
我敢打赌,AI视频生成这个行业,要因为这一个免费开源的项目而变天了。
没错,我说的就是从6月下半旬开始在Github上爆火的OpenMontage。
这是一个专门用来给AI视频生成准备的Harness工具,你把你的提示词给它,它就能自动帮你完善成专业的AI视频生成提示词,并且还配有剪辑、配音等等一系列后期工作。
并且它跟OpenClaw一样,会自动帮你挑视频模型,在满足你需求的前提下,它会想方设法地去降低整个工作流的成本。
具体有多神呢?下面这段视频就是完全用OpenMontage生成的,标题为“来自明天的信号 (SIGNAL FROM TOMORROW)”。
根据OpenMontage官方的介绍,这是一部完全通过OpenMontage制作的电影级科幻预告片,包括了概念、剧本、场景规划、Veo生成的动态片段、配乐以及Remotion合成。
除了这种概念艺术片之外,OpenMontage还能应用在实际产品宣传上。
比如下面这个视频,通过AI,生成了4张关于一个叫做VOID的脑机接口。OpenMontage会自动为它配上相关的产品介绍,还会把产品的数字概念加以动态演示。
01
到底是个什么东西?
现在市面上所有的AI视频工具,不管是Sora、Runway、Kling还是Pika,本质上都是片段生成器。你给它一句话,它给你吐出来一段几秒钟的素材。
但是这些工具给你的是“素材”,不是“成片”。
OpenMontage给你的,是一整个视频制作团队的完整视频制作流程。
你跟它说“给我做一个60秒的科普视频,讲清楚黑洞是怎么形成的”,然后它就开始行动了。
• OpenMontage会先上网搜资料,找最新的研究,找观众最关心的问题,确保输出的内容不能是瞎编的
• 然后写脚本,分镜头,算成本,完成这步以后它会问你,如果成本OK分镜OK,那就继续往下执行
• OpenMontage开始生成画面、找素材、配音、找音乐
• 根据生成的画面自动剪辑、加字幕、做转场、混音、调色
• 最后自己先检查一遍,有没有黑帧,声音对不对,字幕准不准,没问题了才把成片给你
整个过程就跟Claude Code一模一样,你是甲方,OpenMontage是乙方全套团队。
OpenMontage的核心是一套状态机驱动的确定性制片系统,每一步干什么、干到什么标准才能往下走,都写死在程序里。
最底层是模型无关适配层。它把14家视频生成API、10个图像模型、4个TTS引擎、本地开源模型(WAN2.1、Hunyuan、CogVideo)、甚至免费公共素材库,全部封装成了统一的接口。
对上层流水线来说,用哪个模型生成的视频其实无所谓,系统会自动根据镜头类型选最合适的模型、算成本。
中间层是52个专业工具。
比如事实核查的网络搜索工具、镜头分析工具(自动抽帧识别景别、转场、节奏点、语音停顿)、基于Remotion和FFmpeg的程序化剪辑引擎等等。
上层是技能工作流。它会规定整个生产过程里,研究阶段要搜多少个来源、脚本要符合什么结构、分镜每个镜头必须包含哪些字段、什么情况要打回重写、什么镜头用什么级别的模型等等。
整个流程跑在一个导演循环(Director Loop)里。
从你输入需求开始,系统自动推进研究→脚本→分镜→资产规划→生成→剪辑→质检,每一步都有明确的验收标准。
说白了,其他AI视频工具是给你一个很厉害的摄像师,你自己还得当导演、当编剧、当剪辑、当制片;而OpenMontage是直接给你拉来了一整个成熟的剧组,你只需要说你想拍什么就行。
而且它跟OpenClaw一样,可以随意更换模型。你有Kling的key就用Kling,有Runway就用Runway。
你可能要问了,那我虽然有token,但我没素材可咋办啊?
没关系,OpenMontage会用免费的图片生成加动画来填充画面,甚至它还能从Archive.org、NASA、Wiki这些免费的地方,去找真实的历史素材、纪录片素材给你剪出来真正的“视频”。
他们官方演示里做了一个60秒的皮克斯风格动画短片,有角色有剧情有配音有字幕,总共才花了1.33美元。还有一个产品广告片,只用了一个OpenAI的key,花了0.69美元。
甚至还可以完全不用花一分钱的,用免费素材加本地配音做出来的纪录片风格视频。
还有一个被所有人忽略的点:它是“参考驱动”的,不是“prompt驱动”的。
这句话的意思是,你不用给OpenMontage说什么“电影感、4K、黄金时刻、景深、85mm镜头”这种话。
你直接把你喜欢的一个短视频或者抖音链接甩给它,说“给我做个跟这个节奏差不多的,但是内容讲量子计算”。
它会自动去分析那个参考视频的节奏、钩子、结构、镜头语言,然后给你出几个方案,告诉你哪些地方保留,哪些地方改了,要花多少钱,做出来大概是什么样。
你不用当prompt工程师,你当甲方就行。
02
因何而爆火?
OpenMontage的创建者是calesthio,全称为Calesthio AI Labs。calesthio在上传OpenMontage之前,已经开发了许多个开源项目,比如个人情报Agent Crucix(10.3k stars),以及分析工具BreakoutAnalysis、期权交易工具OptionsCanvas、Claude Code 上下文记忆工具SessionAnchor等等 。
其实OpenMontage这个项目早在3月份的时候就在Github上创建了,但直到6月底才开始爆火。
原因在于,早期的OpenMontage只是个框架,提出了这种以Agent形式去生成视频的流程,不过并不能真正帮你执行。
直到6月,calesthio提交了23个commit,还合并了15个社区PR,这才让OpenMontage变成今天的样子。
6月22日到6月26日这几天,OpenMontage几乎每天都要斩获3000多颗星星,其火爆的趋势不亚于3月份的OpenClaw。
OpenMontage能爆火还有一个原因,就是它的README写得非常通俗易懂。
一般的项目,它的README往往都是各种安装依赖、使用说明,OpenMontage不一样,它直接把生成的视频和提示词放进了README开头,是好是坏你一眼便知。
![]()
接着它连续放了多个样片案例,并且每个案例都写清楚生产方式和成本。
另外,calesthio还发现中国的AI视频生成市场很大,于是在6月24日,特地用中文重新写了一篇README。其目的不言而喻。
![]()
在OpenMontage出现之前,AI视频生成是一件非常麻烦的事情。
首先你得先选平台。用Sora?得有ChatGPT会员,还不一定排得上队,生成10秒视频等半小时,效果还不稳定。用Runway?一分钟视频大几十块钱,生成完了还得自己下载下来。
好不容易生成了几段素材,噩梦才刚刚开始。你得把这几段几秒钟的视频下载下来,打开剪映或者PR,自己拼到一起。然后得自己写文案、自己配音,还得自己找BGM。
虽然此前Seedance 2.0、可灵还有Sora 2都有类似的自动增加配音、自动根据素材生成视频,然而由于各种合规问题和素材质量问题,到头来很多事情还得自己在剪辑时加入。
同一段提示词同一批素材,如果你想换个模型试试,那对不起,所有流程重来一遍。
说白了,之前的AI视频,本质上还是“大公司建游乐场卖门票”。你想进来玩,可以,得按我的规矩来,得买我的票,玩什么项目我说了算,而且有些地方还不让你带零食进来。
OpenMontage不一样,它是免费开源的,一切素材解释权在你。
它把话语权从大公司手里夺回来了。
03
视频生成行业真要变天了?
很多人可能会问了,不就是一个开源工具吗,至于说的这么邪乎?
可以肯定的一点是,OpenMontage会彻底改变,整个行业的竞争维度,就像我们从Chatbot时代跨越到Agent时代一样。
之前所有人都在卷模型,卷画质,卷时长,卷物理规律对不对。
现在突然有人告诉你,这些都是基础能力,是入场券而已。我是用户,我要的是片子,我要的不是素材,所以你卷那些没用,我要看你们卷的是成片、是分镜。
就像手机行业,前几年大家都在卷处理器,卷摄像头像素,现在处理器够用了,大家开始卷系统,卷影像算法,卷充电速度,卷谁能把用户体验做好。
视频生成这个行业,马上就要进入这个阶段了。
以后再出来一个新模型,说我能生成10秒视频,画质8K,根本没人会惊讶。大家只会在意它能不能接OpenMontage?多少钱一秒?跟其他模型比有什么优势?
还有一个潜在的影响,专业视频制作这个行业,也要开始洗牌了。
很多人说AI替代不了剪辑师,替代不了导演。没错,顶级的导演和剪辑师永远不会被替代,但是90%的中低端视频制作,真的要没了。
当年美图秀秀出来的时候,也有人说替代不了影楼,。当年剪映出来的时候,也有人说替代不了专业剪辑师。
历史永远是这样。新技术出来的时候,一开始大家都觉得玩具一样,然后突然有一天你发现,它已经把你能干的活都干了。
不过也说句实在的。
在体验的过程中,我发现OpenMontage还是有很多bug的,而且很多功能也不完善,做出来的视频也不是每次都能达到专业水准。
但是,开源的力量从来不是一开始就完美,而是它一旦跑起来,就会有全世界的人一起给它添砖加瓦,发展速度会超出所有人的想象。





京公网安备 11011402013531号