当前位置: 首页 » 资讯 » 科技头条 » 正文

3毛钱生成刷屏3D手办图片,API调用成AI应用厂商落地“快车道”

IP属地 中国·北京 编辑:杨凌霄 第一财经资讯 时间:2025-09-05 20:17:32


9月5日,爱诗科技旗下AI视频生成平台拍我AI开启为期六天的限时免费活动,国内用户在活动期间可免费体验PixVerse(拍我AI)Agent创作助手。此次拍我AI成为国内首批嵌入NanoBanana(内部代号,正式名称为谷歌Gemini 2.5 Flash Image)的AI视频生成的平台,也是大量创作者用户选择体验PixVerse Agent的重要原因。

NanoBanana是由谷歌DeepMind实验室推出的图像生成与编辑模型,核心亮点包括角色一致性、多图融合能力和自然语言交互。中档价格叠加高质量图片生成能力的高性价比,是NanoBanana重要优势。据官方披露,目前用户可通过Gemini APP、API等方式访问,API定价为每百万输出token30美元,生成单张图片约消耗1290个输出token,折算成本约0.039美元(约0.277元人民币)。

对比行业同类产品,Nano Banana约为行业中档价格水平,较GPT-Image-1中档价格略低,较 Midjourney便宜约50%,高于Stability AI与快手可灵AI 的“超低价”档位。但由于Nano Banana生成质量较高,因此呈现更高性价比优势。

被业内视为“AI 模型高考放榜”的LM Arena榜单显示,Nano Banana在图像编辑榜以1362 Elo分第一。华福证券分析师认为,Nano Banana主打四方面能力:跨图一致性、多图融合、对话式/指令式精细编辑,以及“借助Gemini世界知识”带来的更强常识/语义理解。


虽然NanoBanana具备保持角色一致性、理解物理规则、支持多张图无缝合成新场景等优点,但仍存在诸多不足。一位体验者对第一财经记者表示,生成过程中,效果不够理想的情况也有很多,包括失败率偏高、细节轻微失真或存在马赛克感、对图像质量有极高要求的用户会认为生成质量不够“细腻”等。

Nano Banana虽然在社交平台引发大量“3D打印手办”图片分享,但Nano Banana目前并不能直接生成可供3D打印的.stl、.obj等格式的三维模型文件,而是高度逼真的二维图片,本质上是谷歌模型图像生成和风格迁移能力的集中体现,而非真正意义上的“Text-to-3D”(文本到三维)。

据第一财经记者了解,此次拍我AI主要以Agent的产品形态、API形式接入NanoBanana,六天活动时间内提供免费服务,之后的付费模式暂未披露,双方暂未形成联合研发、联合品牌或资源互换,属于“模型供应商-应用方”关系。

除了拍我AI,Adobe、Figma、Lovart、Genspark等产品均已接入Nano Banana。得益于谷歌开放B端接口,下游应用厂商将直接受益。企业客户可通过Google AI Studio、Gemini API和Vertex AI等渠道,快速集成谷歌模型的图像生成和编辑功能,用于广告、产品展示或教育等场景。

今年以来,券商机构普遍将“应用厂商直接调用大模型API”视为AI赛道确定性商业主线。调用量大增、成本下降、场景颗粒化,逐渐构成“API 经济”闭环,且已在电商、金融、客服等场景实现可量化案例。浙商证券分析师认为,在大模型平权的情况下,通过产品矩阵构建业务闭环的厂商,以及深耕于垂直场景的企业服务商将更具备竞争优势。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。