6秒造一个「视频博主」，Pika让一切图片开口说话

IP属地中国·北京 编辑：唐云泽机器之心Pro 时间：2025-08-13 14:17:33

机器之心报道
编辑：+0
制作一个视频需要几步？可以简单概括为：拍摄 + 配音 + 剪辑。
还记得 veo3 发布时引起的轰动吗？「音画同步」功能的革命性直接把其他视频生成模型按在地上摩擦，拍摄 + 配音 + 粗剪一键搞定。
那如果我就是想用自己迷人的声音呢？或者我自带精妙绝伦的配音？有没有其他解决方案？
有的朋友，有的！
8 月 11 日，Pika 推出了一个名为「音频驱动表演模型」（Audio-Driven Performance Model）的新模型。

Pika 允许用户上传音频文件（如语音、音乐、说唱或任何声音片段），并结合静态图像（如自拍或任意图片）生成高度同步的视频。视频中的角色会自动匹配音频，实现精确的口型同步（lip sync）、自然的表情变化和流畅的身体动作。

更通俗一点说就是，让任何一张静态图片，跟着你给的音频动起来，而且是活灵活现的那种。
你随便扔给它一张自拍，再配上一段马保国的「年轻人不讲武德」，你照片里那张帅气的脸，马上就能口型神同步，连眉毛挑动的时机都分毫不差，主打一个「本人亲授」。
这事儿要是放以前，你起码得是个顶级特效师，捣鼓个十天半个月才能弄出来。现在，Pika 告诉你，平均只要 6 秒
你没看错，就是 6 秒。你上个厕所的功夫，那边视频都生成好了，而且还是 720p 高清，长度不限，想让蒙娜丽莎给你唱一整首《忐忑》都行。
不过目前功能仅限 iOS 端，且需要邀请码，期待功能尽快开放。

话不多说，我们来看看网友测评。
首先来看看我们前面提到的自拍 + 音频，效果可以说是相当惊艳了。

址：https://x.com/WilliamLamkin/status/1954940047624372508
不论是说唱部分还是歌曲部分，唇同步准确性非常高，避免了以往 AI 视频中常见的「假唱」问题。
你如果仔细观察会发现说唱部分中间有一段停顿，人物的表情神态也很自然，活人感十足。不过也不是完美无缺，男歌手的手看起来就怪怪的。
Pika 官方也分享了几个用户制作的精彩视频。

地址：https://x.com/pika_labs/status/1955007656302924192
对于不同语言，Pika 生成的效果看起来也非常不错。

还可以生成一段不是吉米的吉米秀，AI 演员的表现力非常不错。

用来拍电影怎么样？让亚洲面孔的大叔一口印式英语，吐槽露营的糟糕体验。

还可以直接来一场 live 秀！

我们可以预见，它将很快成为社交媒体上的新宠，诞生无数有趣的 Meme 和创意短片。
但它的潜力远不止于此：独立游戏开发者可以用它快速生成 NPC 对话动画，教育工作者可以制作更生动的讲解视频，甚至在不远的将来，我们每个人都能拥有一个专属的、能言善辩的 AI 数字分身。
当然，技术总是一把双刃剑。当任何图片都能被赋予任何声音时，如何辨别信息的真伪也成了我们必须面对的新课题。
但无论如何，一个全民参与、创意迸发的视频新时代，似乎已经敲响了大门。下一个引爆全网的病毒视频，或许就将出自你我之手。
视频链接：https://mp.weixin.qq.com/s/EBQUtfKuPaXNLpAZcsM3NQ

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

引入智能语音、大模型，广商联合讯飞打通产教融合

小红书IPO被举报：VIE架构的“终极一战”与时代终结

灵境智源肖益：机器人“脑”标准现在最紧缺

月之暗面联合创始人张宇韬：从Prompt到Harness，Agent工程的演进之路

自研架构及全国产工艺国产GPU厂商沐曦：GPU订单排满一卡难求

疑似小米SkyNomad新车工程版本内饰曝光

全站最新

引入智能语音、大模型，广商联合讯飞打通产教融合

小红书IPO被举报：VIE架构的“终极一战”与时代终结

灵境智源肖益：机器人“脑”标准现在最紧缺

月之暗面联合创始人张宇韬：从Prompt到Harness，Agent工程的演进之路

热门推荐

发小搭档餐饮创业：以“收店—改造”模式，打造高利润日料品牌

从LV到711：跨界商标战频发，品牌视觉资产保护边界何在？

引入智能语音、大模型，广商联合讯飞打通产教融合

小红书IPO被举报：VIE架构的“终极一战”与时代终结

灵境智源肖益：机器人“脑”标准现在最紧缺

OpenAI百万年薪揽投行精英：教AI“入行”，角逐华尔街千亿市场

REDMI Note17系列7月14日发布升配不升档抗摔续航双升级

月之暗面联合创始人张宇韬：从Prompt到Harness，Agent工程的演进之路

自研架构及全国产工艺国产GPU厂商沐曦：GPU订单排满一卡难求

疑似小米SkyNomad新车工程版本内饰曝光

复杂信息可视化，字节发布多模态图像创作模型Seedream 5.0 Pro

党建引领科创源，松江召开卫星互联网产业集群专题学习会

LinkedIn等机构团队如何让智能体告别"一刀切"式奖励机制

2026中国互联网大会在京开幕

人类首次沦为网络少数派：Cloudflare数据显示57.4%互联网流量来自机器