12月17日,腾讯混元团队正式发布混元世界模型1.5(WorldPlay)。该模型支持通过文本描述或单张图片生成可实时交互的3D场景,用户可通过键盘、鼠标或手柄在生成的世界中自由探索。

据悉,此次发布版本强调空间记忆能力,当用户在场景中移动并返回先前区域时,模型能保持三维结构的前后一致性。模型支持以24帧/秒的速率生成720P视频流,并可将交互场景导出为3D点云复用。

腾讯宣布,此次同步开源了涵盖数据、训练与流式推理部署的实时世界模型全链路框架。技术报告公开了包括重构记忆机制、长上下文蒸馏及基于3D奖励的强化学习后训练等模块的细节。该模型主要面向AI游戏关卡生成、影视场景预览、虚拟现实及具身智能研究等场景。目前用户可通过官网申请体验。






京公网安备 11011402013531号