谷歌发布旗舰多模态大模型Gemini Omni 可实现“任意输入、任意输出”能力

IP属地中国·北京 编辑：顾雨柔 TechWeb 时间：2026-05-20 10:15:50

5月20日消息，今日凌晨，在谷歌2026 I/O开发者大会上，官方正式发布全新旗舰级多模态大模型Gemini Omni。
据了解，Gemini Omni主打“任意输入、任意输出”的核心能力，打破传统AI模态割裂局限，实现文本、图像、音频、视频等全模态信息的互通理解与自由生成。
据官方介绍，Gemini Omni依托谷歌成熟的世界模型Genie、图像模型Nano Banana、视频生成模型Veo三大核心技术底座，构建起完整的全模态AI框架。
该模型支持多样化混合输入，用户可将手绘草图、文字描述、图片素材、音频视频等任意形式内容组合输入模型，系统可自主解析信息逻辑、模拟真实物理规则，最终生成高精度、符合现实逻辑的视频、图像、文本等多元化输出内容。
本次发布最大的实用化亮点在于对话式实时编辑能力。不同于传统AI生成工具一次性输出、修改繁琐的痛点，Gemini Omni支持生成过程中的交互式迭代优化。用户完成初始内容生成后，可通过自然语言对话精准调整画面细节，例如替换视频场景、修改物体材质、调整动态特效，且修改过程不会破坏画面原有整体逻辑与物理效果。
发布会现场演示中，工作人员仅凭手绘简易图形+文字指令，便生成了带有物理碰撞效果的完整特效视频，直观展现了模型的强大创作能力。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

股价下跌96%，奈雪把自己的高端标签「作没了」

世界杯来了，电视却卖不动了

首款神经动力学芯片问世有助于脑机接口等技术发展

零跑全新B01/B10座舱公布：前排双零重力座椅等

比亚迪熊甜波：方程豹钛7 EV闪充版四驱车型本周已全面开启交付

iPhone 18 Pro遭史诗级泄密！苹果一心去风险印度反倒成最大风险

全站最新

股价下跌96%，奈雪把自己的高端标签「作没了」

世界杯来了，电视却卖不动了

首款神经动力学芯片问世有助于脑机接口等技术发展

零跑全新B01/B10座舱公布：前排双零重力座椅等

热门推荐

必胜客中国商业版图盘点

中国商业航天盈利之问：从蓝箭中科宇航招股书看2029年能否破局

安耐佳电子：手机平板支架优选厂家，硬实力与软服务铸就品质之选

今年前5个月我国机器人出口近200亿元

股价下跌96%，奈雪把自己的高端标签「作没了」

世界杯来了，电视却卖不动了

AI周报 |豆包、千问下线智能体功能；阿里内部全面禁用Claude Code

首款神经动力学芯片问世有助于脑机接口等技术发展

零跑全新B01/B10座舱公布：前排双零重力座椅等

比亚迪熊甜波：方程豹钛7 EV闪充版四驱车型本周已全面开启交付

iPhone 18 Pro遭史诗级泄密！苹果一心去风险印度反倒成最大风险

宇树陈立：关节电机上游只有铜线等原材料供应商，完全自主可控

历史首次！联想美国在售笔记本用上长江存储SSD

中国联通组织机构重大调整：设立六大部门和五大事业群

特斯拉Robotaxi服务进军美国迈阿密，车内无安全员

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

谷歌发布旗舰多模态大模型Gemini Omni 可实现“任意输入、任意输出”能力