不只能画图！谷歌推出Gemini Omni：只需动动嘴 AI自动帮你改大片

IP属地中国·北京 编辑：吴俊快科技 时间：2026-05-20 18:11:39

快科技5月20日消息，在Google I/O 2026上，谷歌正式发布Gemini Omni模型。该模型支持文本、图像、音频、视频作为输入，实现跨模态生成与编辑。
其中在音频方面，目前该模型初期仅支持语音输入，但Google表示未来将很快扩展更多类型的音频输入能力。
首发产品Gemini Omni Flash已在Gemini应用上线，后续将向企业客户开放API。
该模型核心卖点在于深度视频编辑能力。用户通过自然语言指令即可对生成内容持续迭代，包括添加或删除对象、切换摄像机角度、修改环境与风格。
得益于模型对物理规律的理解以及对历史、科学、文化知识的整合，生成的视频在角色、场景及视觉逻辑上高度连贯，甚至能推测后续情节。用户亦可创建个人数字分身，并将其植入视频中。
谷歌在安全领域同步布局，所有通过Omni生成的视频均会自动嵌入SynthID数字水印，支持通过Google搜索及Chrome验证。
Gemini Omni Flash 现已面向拥有 Google AI Plus/Pro/Ultra 订阅的用户在 Gemini 应用和 Google Flow 中推出。此外，它还免费向希望混剪 YouTube Shorts 的用户以及 YouTube Create 应用用户推出。
Google DeepMind负责人哈萨比斯表示，该模型正推动AI从单纯的任务执行向通用人工智能（AGI）迈进。

标签：模型视频用户能力编辑谷歌音频画图深度视觉卖点角度 摄像机 逻辑环境科学客户任务文化大片企业 人工智能 历史场景图像核心指令高度连贯领域角色文本对

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

砍掉DRAM缓存换上QLC闪存：三星990 Value SSD杀入入门级市场

互联网企业集中释放超20万岗位！

VS Code 的冷面孔与微软的暖钱包：别被硅谷的噪音骗了

企业微信与云通信协同打造私域管理新模式

2026京东方投资者日三大创新业务以"光筑新基"开启价值新篇

Anthropic也要造芯片了，还挖了OpenAI的芯片工程师

全站最新

砍掉DRAM缓存换上QLC闪存：三星990 Value SSD杀入入门级市场

互联网企业集中释放超20万岗位！

VS Code 的冷面孔与微软的暖钱包：别被硅谷的噪音骗了

法拉利LUCE纯电跑车北京首秀，自研电池与创新部件成焦点

热门推荐

砍掉DRAM缓存换上QLC闪存：三星990 Value SSD杀入入门级市场

互联网企业集中释放超20万岗位！

VS Code 的冷面孔与微软的暖钱包：别被硅谷的噪音骗了

周志铭任水井坊法定代表人

2026年vivo手机怎么选？六款热门机型深度解析，帮你找到梦中情机

汇联科技自研物联网主板：为自助售货设备智能化升级注入强劲动力

规范引导情感陪伴人形机器人健康发展，两协会联合倡议

宁德时代与北京绿交所等签署战略合作协议

企业微信与云通信协同打造私域管理新模式

2026京东方投资者日三大创新业务以"光筑新基"开启价值新篇

Anthropic也要造芯片了，还挖了OpenAI的芯片工程师

消息称某厂子系将推7英寸巨屏性能机，预计为小米REDMI

规范引导情感陪伴人形机器人健康发展，两协会联合倡议

索尼为何铁心放弃PS平台实体游戏？前总裁道出真相

15年首次调整车船税，新能源车的“免税滤镜”正在慢慢消失