当前位置: 首页 » 资讯 » 科技头条 » 正文

谷歌Nano Banana 2首批样本流出:不仅会画画,还懂物理

IP属地 中国·北京 编辑:赵静 IT之家 时间:2025-11-11 12:07:09

IT之家 11 月 11 日消息,科技媒体 testingcatalog 昨日(11 月 10 日)发布博文,报道称谷歌新一代 AI 图像模型 Nano Banana 2 的早期预览样本意外泄露,展示了其强大的图像生成与编辑能力。

Nano Banana 2 的预览版本在 Media.ai 平台短暂上线后被迅速撤下,但其生成的图像样本已在社交媒体上广泛传播,其在提升低质量图片清晰度(图像修复)和执行复杂的色彩编辑指令方面,展现出强大的技术实力。

根据泄露的资料,Nano Banana 2 主要带来 2 项改进,其一是能够解决与物理逻辑相关的视觉任务。例如,在一张泄露的图片中,模型通过“图生图”(img2img)技术,准确绘制出了小球运动的物理轨迹,这是当前其他模型难以完成的复杂任务。

其二,该模型在文本渲染方面表现极为出色,能够根据自然语言提示,在白板等介质上绘制出字体一致且排列精确的复杂文字,有效解决了以往模型在图像内生成清晰文本的难题。

该媒体还指出,Nano Banana 2 在视觉保真度和指令遵循能力上的飞跃,表明其模型内部集成了更深层次的世界知识。这一进步使其不再局限于简单的图像生成,而是能够理解并执行更复杂的、包含逻辑关系的指令。IT之家附上相关图片如下:

这些高级能力为设计、媒体内容制作和自动化工作流等领域开辟了新的可能性。例如,企业未来或许可以通过 API 接口,程序化地调用该模型,快速生成符合要求的营销海报或社交媒体视觉素材,从而大幅提升内容生产效率。

标签: 图像 模型 指令 文本 样本 视觉 社交媒体 ai 自然语言

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。