当前位置: 首页 » 资讯 » 科技头条 » 正文

阿里Qwen-Image更新,千问APP首发接入

IP属地 中国·北京 环球网资讯 时间:2025-12-02 14:14:51

环球网

12月2日,阿里巴巴发布了图片生成及编辑模型Qwen-Image的重磅更新。新模型在图像编辑中维持了更高的一致性,并在多视角转换、多图像融合、多模态推理等方面取得突破进展,可广泛用于概念创意、工业设计、日常修图等诸多场景。目前,新版本Qwen-Image已首发接入千问APP,用户可无限次免费使用。

Qwen-Image-Edit基于20B的Qwen-Image模型进一步训练,相较于上个版本,新的Qwen-Image-Edit模型还进行了多项关键性能增强:在图片编辑中,新模型大幅减轻了主体偏移问题,生图不模糊、更稳定;同时提升了主体一致性,使得多张图片中的人物可顺畅融合为一张合照。Qwen-Image-Edit新模型在工业设计场景着重进行了优化,轻松实现变颜色、变视角、局部修改、材质替换等常用功能;新模型的推理能力也有大幅提升,特别是在几何推理方面,可直接在几何图上生成新的辅助线等效果。

此前,Qwen-Image基础版在用于通用图像生成的GenEval、DPG和OneIG-Bench,以及用于图像编辑的GEdit、ImgEdit和GSO等多个基准测试中均取得了最先进的性能,展现出其在图像生成与图像编辑方面的强大能力。此外,在用于文本渲染的LongText-Bench、ChineseWord和TextCraft上的结果表明,Qwen-Image在文本渲染方面表现尤为出色。



Qwen-Image系列模型自开源发布后,即刻成为全球AI社区最火热的开源视觉基础模型,当前总下载量已突破300万次。在全球最大的AI开源社区HuggingFace的“图生图”榜单前15中,有13个都是Qwen-Image的原生或衍生模型,网友们纷纷基于Qwen-Image魔改出各种新版本,比如镜头控制lora效果,可实现图片的多角度重新编辑,目前仍高居HuggingFace的演示空间(Space)榜单第一。如今,开源社区的优秀创意也已吸纳到新改版的Qwen-Image-Edit模型中,基模上就可实现打光、换视角等特色效果。

目前,Qwen-Image-Edit最新模型已经在千问App全面上线,普通用户也可免费使用这一新模型。用户只需在千问APP对话界面输入指令,即可自动调用Qwen-Image系列模型的强大能力,实现生图、修图、多图融合等操作。例如,输入“生成图1和图2的人物合照”,模型能高效、精准地生成符合语义的图像,效果直观且富有创意。

此外,结合千问App上接入的万相Wan2.5视频生成能力,用户还可实现生图、生视频的无缝串联:先生成人物图像,再一键实现“一张照片就跳舞”或“对口型唱歌”等功能,瞬间将静态画面转化为动态视频,真正实现从图像生成到创意表达的全新创作方法。(勃潺)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新