当前位置: 首页 » 资讯 » 科技头条 » 正文

谷歌连续炸场!新一代AI图像生成模型发布,还能识别真假AI图片

IP属地 中国·北京 澎湃新闻 时间:2025-11-21 16:19:57


科技巨头谷歌密集发布AI(人工智能)模型。

当地时间11月20日,谷歌旗下图像生成模型Nano Banana在推出三个月后迎来重磅更新,基于谷歌最新大模型Gemini 3 Pro搭建的Nano Banana Pro正式亮相。同时,谷歌为用户提供了更简单的数字水印验证方式,提高AI内容的透明度。

据介绍,Nano Banana Pro能够“以空前的控制力、改进的文字呈现和增强的世界知识,将用户的构想变成工作室级的设计”,不仅在细节表现力、图像分辨率和文本渲染准确性方面均有升级,还能以不同风格、字体和语言生成文本。

首先,Nano Banana Pro的文字渲染能力获得大幅提升。结合多模态理解能力,模型可以直接把图片中的文字翻译成其他语言,并保持原有的设计风格不变。


Nano Banana Pro的文字渲染能力获得大幅提升。谷歌

此外,还改进了局部编辑功能,并加入互联网搜索能力。用户可以选择、优化和调整图像的任何部分,调整相机角度、改变焦点和色彩分级,甚至改变场景光照。Nano Banana Pro能够生成分辨率高达2K和4K的图像,并支持调整宽高比。

在一致性方面,Nano Banana Pro也实现了大幅提升,现在支持输入最多14张图片,在复杂场景的生成结果中也能保持一致性。该模型还能够在生成结果中保持最多5位人物的一致性和相似度。


根据提示词,Nano Banana Pro能够在复杂构图中保持多输入的一致性。谷歌

同时,谷歌宣布,用户将可以直接用Gemini鉴定一张图片是否由谷歌AI生成。谷歌表示,所有由谷歌工具生成的媒介都嵌入了SynthID数字水印,用户从现在起可以将图片上传到Gemini应用,轻松查询图片是否由Google AI生成,这项验证方式将很快扩展到音频和视频。

目前,Nano Banana Pro已经在Gemini应用中开放使用,免费用户拥有限定的使用次数,超出后会回到Nano Banana模型,Google AI Plus、Pro和Ultra订阅用户则享有更高的配额。该模型也从即日起在设计软件Adobe Photoshop和Firefly中提供。

一经发布,Nano Banana Pro和Gemini 3一样获得了热烈反响。两天前,谷歌正式发布新一代多模态AI模型Gemini 3,包括Gemini 3 Pro和增强型推理模式Gemini 3 Deep Think两个版本。该模型基于谷歌TPU(张量处理单元)进行训练,不仅横扫各大基准测试榜单,还展现了Gemini系列在多模态领域的一贯优势。

在AI竞赛中,谷歌一直在努力追赶OpenAI。分析指出,随着Gemini 3的发布,两家公司之间的竞争愈演愈烈。一周前,OpenAI发布了让ChatGPT“更智能、对话感更强、更易于定制”的GPT-5.1。11月19日,OpenAI又毫无预告地发布了GPT-5.1 Pro和代码模型GPT-5.1-Codex-Max。

在发布Gemini 3时,谷歌CEO桑达尔·皮查伊(Sundar Pichai)表示,目前每月有20亿用户使用AI概览(谷歌搜索的AI Overviews功能),Gemini app的月用户量已突破6.5亿。

11月20日,受到大盘普跌的影响,谷歌(Nasdaq:GOOGL)跌1.03%收于每股289.98美元,总市值3.49万亿美元。今年以来,谷歌股价已涨超50%。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。