一句话,生成一个3D宇宙——这个科幻场景,今天实现了。
“AI教母”李飞飞创办的World Labs,刚刚发布了其首款商业化世界模型产品Marble。
它彻底改变了3D世界的创作方式:用户只需上传照片、视频或输入文本,就能快速生成可编辑、可下载的虚拟环境,并已全面兼容Vision Pro和Quest 3。
这不仅是游戏开发者和电影特效师的福音,更预示着AI正从理解语言,迈向理解物理世界的全新纪元。
··
Marble的“魔法”究竟有多强?一键生成3D宇宙
Marble的正式亮相,瞬间让World Labs在世界模型领域的竞争中抢占了领先地位。
这款在两个月前首度以限量测试版形式亮相的产品,展现出与同行截然不同的技术路径。当Decart、Odyssey等初创公司还在“小打小闹”地推出免费演示版,谷歌的Genie也只在有限研究预览阶段“犹抱琵琶半遮面”时,Marble已经实现了商业化落地。
它的核心技术突破在于能够创建“持久化”、可下载的3D环境,这与那些在用户探索时实时动态生成的虚拟世界有着本质区别。World Labs联合创始人贾斯汀·约翰逊(Justin Johnson)指出,这种技术路径能有效减少场景形变和画面不一致的现象,同时支持用户将生成的世界以高斯溅射、网格或视频等多种工业级格式导出。
据World Labs官方介绍,Marble通过生成规模更大、风格更多元、3D几何结构更清晰的世界,实现了对前代模型的跨越式升级。
输入灵活,细节逼真到“毛孔”
Marble在输入方式上展现出卓越的灵活性。无论是场景描述、图像素材、真实环境视频片段,还是粗略的3D布局,都能作为生成素材的“引子”。它不仅支持从单条文本提示或单张图像生成世界,更能通过接收多角度图像或短视频作为输入,构建高度逼真的数字孪生环境。
World Labs去年展示的早期模型虽然已实现了从单张图像生成交互式3D场景的突破,但仍存在画面略显卡通、移动范围受限和偶发渲染错误等局限。而在正式版Marble的测试体验中,仅凭图像提示就能生成从游戏场景到真实客厅复刻的多种虚拟环境,其细节还原度简直令人惊叹!
约翰逊透露,尽管测试版在场景边缘处理上曾有改进空间,但据说正式版已对此进行了优化。更有趣的是,测试期间使用单一提示生成的世界,在视觉效果和意图匹配度上反而展现出独特优势,这让人对正式版的表现充满期待。
·AI原生编辑,混合3D创作“零门槛”
作为同类产品中的首创,Marble集成了AI原生编辑工具和名为Chisel的混合3D编辑器。用户可以先勾勒出粗略的空间布局(如墙体、立方体或平面),再通过文本提示定义视觉风格,最后由AI智能填充细节。这种将结构与样式分离的工作流程,就像用HTML定义网站架构,再用CSS控制视觉呈现一样,思路清晰又高效。 与传统基于文本的编辑方式不同,Chisel支持用户直接操控3D物体,例如直接抓取代表沙发的3D方块并将其移动到任意位置,从而实现了无需代码的直观可视化编辑。
·无限扩展,融合创新
World Labs新引入的“世界扩展”功能显著提升了编辑的自由度。约翰逊解释道:“生成世界后,用户可以进行一次扩展操作。当遇到场景开始模糊的区域时,可以指令模型在该区域进行扩展或增添细节。”
针对超大规模空间的创作需求,Marble的“组合模式”(composer mode)支持多个世界的无缝融合。约翰逊在现场演示中,将风格迥异的“奶酪房间配葡萄椅”与“太空未来会议室”两个世界进行了完美拼接。该系统能够基于现有规则和风格自动生成延展的3D空间,确保世界扩展的风格统一性,让你的虚拟宇宙想多大就有多大!
·高斯溅射:实现影院级渲染效果
在生成式AI领域,高斯溅射(Gaussian Splatting)被视为渲染3D对象和空间的高品质标准。Marble通过生成数百万甚至数十亿个微小的“溅射点”,这些分布在3D空间不同位置的半透明粒子,以其中心为最大值,按照钟形曲线平滑递减至边缘为零的分布方式,精准模拟了物体的亮度、不透明度、颜色和密度等光学特性。
当数量庞大的溅射点相互重叠连接时,就能够以令人惊叹的精度近似模拟3D场景中的光滑表面、丰富色彩和复杂光照效果。这种渲染技术不仅创造了平滑一致的视觉体验,更是图形专业人士熟悉的工业级标准格式,分分钟让你的作品达到电影大片水准!
·多元风格,自由创作,想象力就是极限
模型支持生成包括卡通、科幻、未来主义、奇幻、动漫、写实,以及复古低多边形在内的多种艺术风格。特别值得一提的是,其复古风格能够精准还原老式计算机渲染特有的“低画质”视觉效果,为怀旧游戏和复古艺术创作提供了强大工具。想创建什么风格的世界,Marble 都能满足你!
颠覆千行百业?Marble的“野心”有多大?
约翰逊阐明了产品的核心定位:“Marble未来的主题是‘创意控制’。我们既要保留快速生成的便捷性,更要赋予用户深度掌控创作细节的能力。我们不希望机器完全接管创作过程,剥夺用户的创造力。”
他明确表示,Marble的首批应用场景将聚焦于游戏开发、电影视觉特效和虚拟现实三大领域。
·游戏开发:赋能而非替代
开发者可以使用Marble生成背景环境,再将获得的3D资产导入Unity或虚幻引擎等主流游戏开发平台,继续添加交互逻辑与程序代码。“它并非要取代现有的游戏开发流程,而是作为现有流程的补充,提供可直接嵌入工作流的素材资源,”他特别强调。Marble 能够输出完整的3D 世界数据,其他创作者可以基于这些基础进行二次开发或效果增强,例如将生成的三角网格直接应用于游戏场景构建。
尽管近期有游戏开发者大会的调查显示,业内对生成式AI的负面评价有所上升,主要担忧集中在知识产权、能耗问题和生成内容质量等方面,但Marble坚持“工具赋能”而非“完全替代”的定位,或许能为这些担忧提供新的解决思路。
·影视特效:精准控制的突破
在电影视觉特效领域,Marble能够有效规避传统AI视频生成器常见的画面不稳定与镜头控制难题。艺术家可以借助其生成的3D资产进行精确的场景布置,实现帧级别的精度的镜头控制。比如,特效团队可以获取高斯溅射数据,直接用于特效镜头的合成制作,大大提升效率和质量。
·虚拟现实:即时生成
虽然World Labs目前并未将虚拟现实作为重点发展方向,但约翰逊坦言该行业正面临“内容饥渴”的现状,并对Marble 的发布表现出浓厚兴趣。目前,Marble 已全面兼容Vision Pro和Quest 3等主流VR设备,所有生成的世界都可以立即通过VR头显进行沉浸式体验。
·机器人训练:构建仿真环境
此外,在机器人技术领域,Marble也展现出独特潜力。约翰逊称,机器人技术领域一直缺乏大规模训练数据库,而Marble这类世界生成器能够便捷地构建仿真训练环境,为开发自动驾驶车辆和机器人等AI系统提供大量逼真的训练数据。
·更广阔的应用前景:科研、医疗、教育
李飞飞进一步展望了该技术的长远影响。她指出,这类技术未来将在实验模拟、药物研发和沉浸式学习等科学与医学领域展现价值。
同时,她深信“空间智能将彻底改变我们创建和交互虚实环境的方式”,为叙事艺术和整个创意产业带来革命性变革。可以想象,未来我们阅读小说时,也许可以直接生成一个3D 场景来体验故事!
订阅模式与生态展望:谁将成为先行者?
Marble提供四档订阅方案,从免费版到每月95美元的旗舰版不等,让不同需求的用户都能找到适合自己的选择。
免费版: 支持4次文本/图像/全景生成
标准版: 20美元/月,提供12次生成次数,支持多图像/视频输入及高级编辑。
专业版: 35美元/月,提供25次生成次数,含场景扩展及商业授权
旗舰版: 95美元/月,提供75次生成次数和完整功能集,全功能解锁
为追求其空间智能的愿景,World Labs已筹集2.3亿美元资金,投资方可谓“众星云集”,包括Radical Ventures、Andreessen Horowitz和英伟达等顶级风投,以及杰弗里·辛顿(Geoffrey Hinton)、埃里克·施密特(Eric Schmidt)、马克·贝尼奥夫(Marc Benioff)和里德·霍夫曼(Reid Hoffman)等科技界领袖。
目前全球范围内已有多个团队致力于世界模型研发,包括谷歌的Genie、英伟达的Cosmos以及AI初创公司Decart。值得关注的是,Meta首席AI科学家杨立昆(Yann LeCun)据传也在为其世界模型初创项目进行早期融资,预示着这场“空间智能”的竞赛将异常激烈。
Marble的发布,不仅是World Labs的里程碑,更是AI迈向真正理解和与物理世界交互的重要一步。正如李飞飞所言:“空间智能将改变我们创建和与现实及虚拟世界互动的方式——彻底改变叙事、创意、机器人技术、科学发现及其他领域,这将是AI的下一片前沿!”(小小)





京公网安备 11011402013531号