编辑:桃子 犀牛
刚刚,豆包图像创作模型Seedream 4.0同时登顶「文生图」和「图像编辑」两项榜单!相比Nano Banana,Seedream 4.0在文生图的清晰度和美感上优势较为明显;在图像编辑上则难分伯仲,仅小幅领先。
谷歌Nano Banana一夜爆火之后,各种邪修玩法儿,至今让全网意犹未尽。
等距视角、多图合成、老照片修复、3D手办.......创意脑洞大开,全网玩疯。
谁曾想,短短半个月后,大洋彼岸就杀出来了一个最强逆袭者!
就在刚刚,字节跳动发布的豆包图像创作模型Seedream 4.0,一举拿下了Artificial Analysis「文生图」和「图像编辑」两大榜单的第一。
一键创作+编辑,原生4K分辨率,一次最多上传10张参考图。
如今,全网的画风是这样子的——
左右滑动查看
有网友随手扔了一张糊到爹妈都不认的图,Seedream 4.0直出一张超清版的,简直是废片秒变神作。
生图不仅是它的强项,Seedream 4.0还具备了超强的知识和推理能力。
就比如,一边生图,一边解方程;生成的冰激凌配方图,逻辑清晰;一键比较建筑特点,美观且要点明了......
左右滑动查看
这是因为,Seedream 4.0首次将「生成图像」和「图像编辑」(SeedEdit 3.0),全部整合到单体模型中。
相较于上一代,4.0版本生成文字清晰又准确,尤其是在中文文字渲染上,效果碾压GPT-4o、Gemini 2.5 Flash。
比如,我们想把下面这听饮料上面的字换成「新智元」。
Seedream 4.0给出的结果,不仅光影正确,而且字体也很有设计感。
相比之下,谷歌Nano Banana生成的,除了「新」字之外,可以说是是驴唇不对马嘴。
更多对比如下:
左右滑动查看
可以说,Seedram 4.0的横空出世,一夜之间掩盖了谷歌「香蕉」所有光芒。
现在,打开「火山方舟体验中心」,就可以免费体验4K高清多模态生图了!
点击即可直达,传送门:https://www.volcengine.com/experience/ark?launch=seedream
一手实测,更适合中国宝宝
多图融合,是最常见的一种玩法儿。
不论是「双人同框」,还是每日穿搭、模仿火柴人动作草图等等,Seedream 4.0可以全部拿捏。
甚至,一次上传10张参考图,它都能以正确的逻辑融合成一张图。
十图无缝合成,生成专属OOTD
就比如,今日份OOTD穿搭,Seedream 4.0就能直接帮你承包了。
让图1女孩穿上图2的穿搭
上传一张个人照片,再淘一张穿搭图,上身效果如何,几秒就能get了。
令人惊艳的是,照片生成的太自然了,人物一致性非常高,肉眼根本辨别不出是AI生成的。
再换一套简约风格的,果然人美穿啥都好看。
接下来加大难度,一次上传八张图片:一张主角,五张配饰,外加一只杜宾和一辆吉普汽车。
为了让图像呈现得更加美观,提示要求男子站在汽车一旁,狗紧挨着男主。
图1的男子穿上第2、3、4、5、6张图的穿搭,站在第八张图汽车前,第七张图小狗站在男人身旁
不得不说,Seedream 4.0理解力一绝,还能准确地给男主穿上衣服,戴上配饰。
随便一个pose模板,Seedream 4.0便可以让任何人做出相同的动作。
一位古装女子和一位画上的皇帝,做图3的摆拍,那会是怎样的效果?
将图1、图2合进一张图里,参考图3姿势
快看,这张合照堪称「天作之合」,真是挑不出一点毛病,比拍照还真。
再比如,自己想要一张和霉霉合照,Seedream 4.0就可以帮你实现愿望。
图1和图2女生合拍,两人表现自然一些,背景是上海东方明珠夜景
上传两张图后,一句话,即可无缝合成。
可以看到,照片中人物的衣服、头发颜色等细节非常一致,而且动作自然,没有出现人物失真的情况。
现场手绘一个「火柴人」,就让犬夜叉和杀生丸来一个打斗摆拍。
让图1和图2两个人,模仿图3的姿势
没想到,就这么随笔一画,让Seedream 4.0就让动漫人活灵活现了。
还有3D物理世界小人,Seedream 4.0也可让其动作1:1复刻。
图1女生做图2的动作
连续生图,淘汰制片人?
想连续做动画或视频,缺少灵感?
Seedream 4.0还具备了强大的「连续生图」的能力,只要输入剧情描述,AI即可自动生成多个关键画面帧。
最后,再借助AI视频工具,合成动态视频。
从故事脚本到视觉呈现,一个人即可轻松搞定Vlog、创意短片,从此制作效率翻倍。
举个栗子,你可以让名画中的人,在同一时空下相遇。
图1的梵高和图二的蒙娜丽莎,在图3的一家酒吧里偶遇,然后两人在图4露天小餐馆畅谈,需要环境的局部特写,比如酒馆的光影,酒杯特写等。
梵高和蒙娜丽莎在一家酒吧偶遇后,两人又去户外小餐馆畅聊。
动漫连载,下一个宫崎骏是你
我们再来做一个动漫连环画,上传一张有人物角色的照片。
然后,若是想要指定的画面,把所有故事分镜的脚本扔给Seedream 4.0。
保持封面参考图的绘画风格和封面的主体,下面每句话帮忙生成一句故事分镜(一共5个分镜):
1. 夏日清晨,小女孩背着绣小熊的布包,牵着卷毛小狗从家门口出发,门廊竹席上还放着没喝完的绿豆汤。
2. 两人走到公园长椅旁,小狗突然追着粉蝴蝶跑远,小女孩举着刚摘的狗尾草。
3. 路过野菊花丛,小女孩蹲下来摘小黄花,小狗叨起一朵送到她手边,花瓣上还有露珠。
4. 听到远处卖冰粉的叫卖声,小女孩牵着小狗跑过去,买了碗红糖冰粉,用小勺子喂小狗尝了口。
5. 突然下起小雨,小女孩拉着小狗躲进公园的木亭子,小狗缩在她脚边,用脑袋挨着她。
不一会儿工夫,五个分镜全部出来了。画面效果非常惊艳,而且人物画面全部保持一致。
左右滑动查看
电影分镜,堪比好莱坞大片
一直以来,人们都难以相信,一款AI工具如何能砸掉制片人的饭碗?
当你真正体验之后,就会惊叹这就是现实!
接下来,上传一张女主和一张男主的照片,任何人就可以直接拍出一部短剧。
prompt:参考图片形象,生成三种影视分镜:第一幕女主去买帽子;第二幕转角遇到了图2的帅气男子;第三幕男主向女主表达爱慕,两人微笑。复古风格。
第一幕:女主去买帽子。
值得一提的是,在第一幕画面生成中,Seedream 4.0还整了一个高难度——镜面。
可以看到,女主表情和镜子中一致,包括帽子、耳钉、珍珠项链、衣服等等,和原图保持高度一致。
第二幕,女主出门转角,偶遇到了男主。
这一幕中,Seedream 4.0放大了视角,营造了一种「魔法版」的偶遇,逼真还原了男女主。
第三幕,男主向女主表达爱慕。
注意看,这里的镜头又被拉近,男女主之间的甜蜜溢出了屏幕,一根羽毛成为了他们之间爱情的见证。
是不是感觉情节太过精彩,还没有看够。不如,接下来的故事,就由你们来续写~
创意玩法,脑洞大开
除了多图融合、连续生图,Seedream 4.0还有各种本领。
比如,让它取出汉堡的所有馅料,只保留顶部和底部的面包片。而且,两个面包片之间空隙间隔,要与原来的一致。
Remove all the ingredients from the burger and keep only the top and bottom buns. Leave a gap between them, keeping the same spacing as if the fillings were still inside.
一个只有面包,没有夹层的汉堡就闪现了。
它还可以生成一个可爱小狗的桌面手办。
根据草图,生成对应主体的立体搪胶手办,摆放在深色电脑桌上
除了图片的生成和编辑外,Seedream 4.0还拥有智能——它真的理解图片上的内容。
比如让它推断生成,一张上海东方明珠照片12个小时后的样子。
12个小时后,城市展示的景色
模型不仅正确推断出12小时后是夜景,而且建筑物的细节、角度等也都非常完美的还原。
补全后的4k图像真的是相当清晰。
再比如,给它一个时间,然后问1分钟之后会显示什么。
Seedream 4.0也能正确推断出相应的时间,而且其他参数也都没有随意改动。
草图建模也不在话下。
设计师有福了。
根据草图,设计出完整建筑,并上色
可以看到,模型不仅完美还原出建筑的设计细节以及外部材料的质感,为了方便展示顶部的设计,它甚至还改变了视角。
简直太贴心了。
还可以反过来玩,将建筑转换成模型,而且是不同的角度。
这都需要模型进行很多推理。
把建筑做成不同视角的全景模型,白色的背景,微缩模型,需要四张,不同角度,分别是鸟瞰图、顶视图、侧视图、仰视图
最近还流行的一种玩法是制作教程。
比如让Seedream 4.0生成一张牛肉汉堡制作步骤教程图,绘制在手账本上。
可以看到最后的教程步骤清晰,实用性很高。
彩铅手账风格,出一个牛肉汉堡制作步骤教程图,步骤说明要中文,女生手写可爱字体,绘制在一个手账本上
更进一步的应用是制作信息图表。
这个应用不仅好玩儿,还更有教育意义——一下子把枯燥的文字知识变成图表,让学习的效率指数型上升。
举个栗子:牛顿第二定律。
提示词:“牛顿第二定律”信息图表,包括科普文字、示意图和基础物理公式,分列进行排版
太香了。上学时要是有这东西,我的成绩绝对还能上升两个层次。
一键接入API
当然,作为一家云平台,火山引擎也支持API接入,面向开发者解锁更多玩法。
在火山引擎拿到自己的API KEY后,只需点击上图中的API接入,就可以看到调用的示例代码。
在红框内换成自己的API KEY后,直接复制代码放到终端即可。
大家看一下Seedream 4.0文生图的质量。
生成3张女孩和奶牛玩偶在游乐园开心地坐过山车的图片,涵盖早晨、中午、晚上
除了文生图外,API还支持图生图、多图融合、组图输出等多种玩法,大家可以自己去体验。