微软解锁AI配音新技能：最长90秒多角色叙述，语音更像真人

IP属地中国·北京 编辑：郑浩 IT之家 时间：2025-08-30 16:10:29

IT之家 8 月 30 日消息，科技媒体 Windows Latest 昨日（8 月 29 日）发布博文，报道称微软在 Copilot Labs 推出全新 AI 语音生成工具 Copilot Audio Expressions，可通过 Emotive 和 Story 两种模式生成更具情感的英文语音。
IT之家注：Copilot Audio Expressions 是一款 AI 语音生成工具，功能是让输出的音频更接近真人，并可根据需求加入创意润色。用户无需注册即可直接体验，并可下载 MP3 格式音频，方便在任何设备播放。
该工具目前提供 Emotive（情感表达）和 Story（故事创作）两种模式。
该媒体在测试 Emotive 模式后，选用“Oak”音色和“narration”叙述风格，将模拟火车站的脚本输入系统。
生成的音频不仅朗读了文字，还自动增添细节、调整措辞，让表达更生动。单段音频最长 59 秒，支持十余种声音与风格组合。
在 Story 模式下，系统自动选择音色和风格，用户仅需提供主题提示。
例如输入“讲一个猫在暗处潜行觅食的故事”，AI 就生成了一个长达 90 秒的多角色叙述：旁白用美式口音，猫的对白则为英式口音，并巧妙穿插互动，形成自然流畅的对话效果。
测试结果表明，Story 模式在情节构建、角色区分及声音融合度方面表现出色，输出的成品不像单调的机器朗读，更像是一次配音合作，让该工具不仅适用于简单朗诵，也可胜任有多角色的创意作品制作。
该工具目前仅支持英文，中文及其他语言用户暂无法直接生成母语音频，微软尚未透露后续是否会增加多语言支持。

标签：语音音频用户角色模式系统口音声音真人无法工具 融合度 配音区分风格 表现出色 结果表明 媒体英文细节措辞方面单调 火车站 语言音色中文情感科技效果成品消

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

2.8万亿、全球最大、马斯克第二次点赞：Kimi K3凭什么刷屏海内外

腾讯联合越疆，“物理AI”走进制造工厂｜直击WAIC

“优必选们”急需打补丁

WAIC观察｜越疆携手腾讯，让Physical AI走进真实工厂

阿里云王坚：对AI理解科学的想象，还局限在人类写出来的知识里

智元精灵G2 Max人形机器人发布，将应用于京东物流智狼仓

全站最新

吉利发布“雷霆16合1智能电驱” 打破技术壁垒树新能源自研新标杆

2.8万亿、全球最大、马斯克第二次点赞：Kimi K3凭什么刷屏海内外

腾讯联合越疆，“物理AI”走进制造工厂｜直击WAIC

“优必选们”急需打补丁

热门推荐

红米新机来袭：7英寸大屏搭配8K级大电池，新功能加持现已火热开售

首批L3级AI终端测试结果出炉联想42款产品领跑行业占比超六成

2.8万亿、全球最大、马斯克第二次点赞：Kimi K3凭什么刷屏海内外

腾讯联合越疆，“物理AI”走进制造工厂｜直击WAIC

“优必选们”急需打补丁

报道：苹果与美国司法部就反垄断案进行早期和解谈判

WAIC观察｜越疆携手腾讯，让Physical AI走进真实工厂

GameStop CEO：索尼停产实体游戏盘对我们无关紧要

国产大模型Kimi K3自主设计AI芯片：45nm工艺 100Mhz频率

社评：面对人工智能时代之问，世界期待中国方案

阿里云王坚：对AI理解科学的想象，还局限在人类写出来的知识里

智元精灵G2 Max人形机器人发布，将应用于京东物流智狼仓

企业级Agent落地生产困境何解？评估先行成破局关键密码

高德问店上线：AI赋能商户，一站式解决选址经营难题获用户好评

AI产品开箱即用腾讯智能体集中亮相WAIC