期待 AI 创作儿童绘本的点子由来已久,但一直难觅成功的案例——那种孩子喜欢并接受,父母信任又安心的。
去年,Google I/O 期间推出了一个比较小众的实验性项目(Infinite Wonderland)。
Google 跟几位艺术家合作,将图片生成模型(当时是 Imagen 2)训练成各自独特的风格。成果以一本《爱丽丝漫游奇境记》在线绘本呈现。
当你随机点击书中的一段文字,这段文字则会作为提示词实时生成一张配图。为了看起来不像“预制菜”,开发者在生成过程中加入了随机种子(Seed),这样即便反复点击同一段文本,生成的也是为同一段内容搭配的不同图片。
![]()
Infinite Wonderland
这个项目在创意性和艺术性上都很有特色,但当时,他们只做了爱丽丝那一个故事。
也算是没让人等待太久。最近,我发现 Gemini 上新了一个 AI 故事书的新模块“Storybook”,(https://gemini.google/overview/storybook/)
比 Infinite Wonderland 厉害的是,Storybook 不仅能“绘”,还能“讲”,它根据你输入的灵感,讲出来一个完整的故事。加上还有朗读功能,语速适中,发音标准。
这不但能解救睡前被缠住讲故事的父母,甚至还能当作完美的英语启蒙教学。
轮到 AI 讲睡前故事了
我请教了几位有孩子的家长朋友,并总结了他们挑选儿童绘本的大致逻辑:图像和文本质量要过关;分“年龄段”;故事有逻辑,线索丰富最好。我们一起看看 Storybook 能不能满足这些需求?
Prompt:For two-year-old; caterpillar’s adventure story; picture book。看到 AI 给我的绘本之后,我倍感羞愧。相比之下,人类会敷衍多了。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
右滑查看完整绘本
它讲述了一个毛毛虫不断长大、啃食,进入蛹期形成茧,再破茧成蝶的故事。
首先,AI 生成的插画质量不错,清晰度高,色彩丰富,甚至将毛毛虫长大的面部神情展现了出来。总的来说,是一个情节简单、欢快的科普小故事。
接着我让它生成“一本适合五岁小孩的侦探故事,背景发生在图书馆,插图《玩具总动员》风格。”
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
右滑查看完整绘本
角色有穿风衣的熊侦探、戴眼镜很显睿智的猫头鹰教授、骑士、偷了故事书的公主玩偶。但是公主在几张图上都不一样,说明角色一致性还有待提高。
先不说插图风格,玩具在晚上活过来还挺“玩总”的。
然而我不太理解一个情节,就是保护童话书的骑士为熊侦探提供线索(后来我反应过来,既然熊能当侦探,为什么骑士不能去图书馆值夜班保安,果然大人的想象力还是太局限。)
你可以直接在 Gemini 的对话框里输入希望对绘本进行的调整。比如我当时要求调整一下“骑士”角色,换一个找寻失窃图书的线索。
然后 Gemini 将骑士换成了一个在懒人沙发上睡觉的熊,说得几乎同样的台词。只能说,Gemini 理解了我的需求,但没有执行得很好。
![]()
![]()
右滑查看完整绘本
父母希望小孩在成长过程中逐渐理解“友情”、“勇气”等“抽象概念”,但是有时候苦于找不到一个合适的机会。如果这些从一本小孩经常阅读的绘本中演绎出来,会是一个很好的教育方式。
比如你跟 Gemini 说,“我7岁的孩子不愿意在奶奶家过夜,创作一个故事让他们打开心结。”
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
右滑查看完整绘本
Storybook 很有想象力的一点是,还支持上传文件。比如孩子刚画了一张画,满心期待地给你看,你除了夸夸,还可以让 AI 基于这张画生成一个故事(母慈子孝这不就来了)。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
首图来自小红书网友,右滑查看基于这张图片生成的完整绘本
或者孩子总是缠着你,让你解释啥是黑洞、人工智能能做什么、你做啥工作的?为什么总是那么忙……你都不必再用一句,“你还小,现在还理解不了,长大了自会知道”敷衍了事。
如果小孩已经认得了全部的单词,你可以要求 AI 重新遣词造句,逐步提升阅读难度。建议后面加上“点读”功能就更好了。
目前该功能支持中文、英文、意大利语等在内的45种语言。建议你用来生成架空的故事,比如有一次我尝试让它做一本“荆轲刺秦王”绘本,不出意外的,AI 又胡说八道了。
但会讲故事的 AI
也无法代替父母的陪伴
随着我和 Gemini 聊得越来越投入,它告诉我,Storybook 这个功能始于一位开发者(还是个奶爸)使用 Gemini API 参加 Google AI Developer Challenge 的一个项目。
背后大概的技术链条是,利用 Gemini 创作一个10页的故事——Gemini 再为每一页故事创建图片提示,发送给 Imagen——再由模型微调技术保证画面风格迁移和人物角色的一致性,类似基于 Stable Diffusion 做的 LoRA 和 Dreambooth,你可以将它理解成生图模型上打的一个“补丁”。
就在最近,Google 推出了Gemini 2.5 Flash Image。目前不清楚 Storybook 是不是更新到这个最新的图片生成模型,但可以看出角色一致性、完全基于提示的图像生成和编辑一直是图像模型追求的能力提升,也是图像模型产生实用价值的关键。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
Prompt:Using a Claymation art style, create a storybook about friendly bees and how useful they really are to the earth, to help my kids lose their fear of them.右滑查看完整故事书
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
第一次调整,用自然语言跟 Gemimi 对话,让它将黏土风格换成水彩,右滑查看完整故事书
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
第二次调整,让 Gemini 将男孩换成一个名叫 Alice 的女孩,并将水彩风格换成漫画风,右滑查看完成故事书
应该是为了保证一致性效果最佳,Storybook 目前至多生成十页绘本,限制了它没法展现复杂逻辑或宏大主题的故事,总是看得我意犹未尽的。
不好的反馈声有两种,一是,担心小孩过早接收到 AI 的“陈词滥调”、担心生成的内容没有经过人工检验,不适合阅读;
二是,这样 AI 将进一步淹没出版、作家、插画师等行业的努力——目前有第三方做了一个在线绘本库,上面已经上传了三百多个经挑选过的用 Storybook 生成的绘本,并根据年龄段、情绪基调、语言、类型、故事背景做了区分(https://geministorybook.gallery/)。
![]()
网站截图
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
从网站截图的一本,右滑查看完整故事书
不过我想说,甄别不出上述问题的家长,或许此前也不会花多少心思挑选绘本。
技术中立太老生常谈了。Storybook 可以作为低龄儿童的辅助阅读材料,如果你用承担认字和阅读分级教育作用的正规出版图书作为标尺,那么 AI 绘本显然不够如此严谨。
能让小孩时常回味一些和家庭、朋友之间的美好瞬间,父母为孩子讲解就在当下他所感兴趣,或困扰着他的话题,也许是比起传统绘本,AI 绘本更有价值的地方。
作者:TY
编辑:沈知涵





京公网安备 11011402013531号