当前位置: 首页 » 资讯 » 科技头条 » 正文

生数科技发布Vidu S1实时交互模型,支持实时视频通话

IP属地 中国·北京 编辑:陈丽 IT之家 时间:2026-07-03 22:06:50

IT之家 7 月 3 日消息,生数科技今日发布面向实时交互场景的新一代模型 ——Vidu S1 实时交互模型。

官方表示,Vidu S1 模型支持实时视频通话和语音控制视频走向,用户不仅能通过语音控制数字人的行为,还能实现无限时长连续互动。

Vidu S1 支持 540P(960x540)高清分辨率、25FPS帧率(最高支持 42FPS),可基于真人、动漫、萌宠等任意初始形象及个性化音色,快速创建专属交互角色。

据介绍,Vidu S1 采用自回归扩散模型(AR + Diffusion) 路线,不再一次性生成完整视频,而是基于已经生成的历史画面,结合当前语音指令和对话上下文,持续预测并生成后续内容。

当用户发出新的语音指令时,模型可以实时理解并调整角色的表情、动作及后续视频走向,使视频从预先确定的固定内容,转变为一个持续生成、实时响应、动态演化的交互过程。

Vidu S1 已开启内测,IT之家附相关链接如下:

线上体验地址:https://www.vidu.cn/vidu-stream

API 体验地址:https://platform.vidu.cn/live/landing

标签: 视频 通话 科技 模型 生数 角色 语音指令 音色 语音 专属 高清 真人 过程 地址 用户 分辨率 动漫 动态 体验 画面 动作 形象 个性化 据介绍 表情 面向 内容 预先确定 历史 场景 消息

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。