微软推出其首款自研AI模型：MAI-Voice-1 秒级生成音频

IP属地中国·北京 编辑：陈阳 IT之家 时间：2025-08-29 08:04:51

微软推出其首款自研AI模型：MAI-Voice-1 秒级生成音频，MAI-1-preview剑指Copilot文本场景
IT之家 8 月 29 日消息，周四，微软人工智能部门正式推出其首批两款自研 AI 模型 ——MAI-Voice-1 语音模型与 MAI-1-preview 通用模型。据微软介绍，全新的 MAI-Voice-1 语音模型仅需单块 GPU，就能在 1 秒内生成时长 1 分钟的音频；而 MAI-1-preview 模型则“让用户提前窥见 Copilot 未来功能的发展方向”。
目前，微软已将 MAI-Voice-1 应用于多项功能中：例如在“Copilot Daily”功能里，AI 主持人会通过该模型播报当日热点新闻；同时，它还能生成播客风格的对话内容，帮助用户理解各类话题。
普通用户可在 Copilot Labs 平台亲自体验 MAI-Voice-1：不仅能输入希望 AI 表达的内容，还可自定义语音音色与说话风格。除这款语音模型外，微软此次同步推出的 MAI-1-preview 模型，训练过程动用了约 1.5 万块英伟达 H100 GPU。该模型专为特定需求用户设计，具备遵循指令的能力，可“为日常咨询提供实用回应”。
微软 AI 负责人穆斯塔法・苏莱曼去年在《Decoder》播客某期节目中表示，公司内部研发的 AI 模型并未将企业级应用场景作为核心方向，他解释道：“我的思路是，我们必须打造一款对消费者而言体验极佳的产品，并针对自身应用场景进行深度优化。在广告业务、消费者行为数据等领域，我们拥有海量高预测性、高实用性的数据，因此我的工作重点是构建真正适配‘消费者伙伴’定位的模型。”
据悉，微软 AI 计划将 MAI-1-preview 模型应用于 Copilot 助手的特定文本使用场景（目前 Copilot 主要依赖 OpenAI 的大型语言模型）。同时，该模型已开始在 AI 基准测试平台 LMArena 上进行公开测试。
IT之家注意到，微软 AI 团队在博客文章中写道：“我们对未来发展有着宏大规划。接下来，我们不仅会持续推进技术突破，更相信通过整合一系列针对不同用户需求与应用场景的专业模型，将释放出巨大价值。”

标签：模型场景 消费者 语音首款用户音频数据风格体验领域方向平台 负责人 文章部门能力节目 苏莱曼 团队 人工智能 指令公司 穆斯塔法 博客文本 广告业务 核心定位对话伙

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

企业级Agent落地生产困境何解？评估先行成破局关键密码

高德问店上线：AI赋能商户，一站式解决选址经营难题获用户好评

AI产品开箱即用腾讯智能体集中亮相WAIC

阿里云王坚：对AI理解科学的想象，还局限在人类写出来的知识里

字节两员离职大将，单挑老东家？

阿维塔07L开启预售：全系标配华为ADS 5与896线激光雷达，24.99万元起

全站最新

企业级Agent落地生产困境何解？评估先行成破局关键密码

高德问店上线：AI赋能商户，一站式解决选址经营难题获用户好评

AI产品开箱即用腾讯智能体集中亮相WAIC

阿里云王坚：对AI理解科学的想象，还局限在人类写出来的知识里

热门推荐

企业级Agent落地生产困境何解？评估先行成破局关键密码

高德问店上线：AI赋能商户，一站式解决选址经营难题获用户好评

AI产品开箱即用腾讯智能体集中亮相WAIC

阿里云王坚：对AI理解科学的想象，还局限在人类写出来的知识里

英矽智能创始人：中国让人工智能惠及全球更多国家

字节两员离职大将，单挑老东家？

阿维塔07L开启预售：全系标配华为ADS 5与896线激光雷达，24.99万元起

对话|大晓机器人董事长王晓刚：商业化落地路径采取先To B后To C

大盘回撤银行股逆势抗跌，分红创新高后行情延续性几何？

紫银转债迎最后交易日，未转股比例高达99.99%，青农转债接棒大考

飞天茅台i茅台零售价涨至1639元/瓶，1L规格同步上调

安克充电宝首批获新国标认证，26年全线新品同步跟进

磐石·科学基础大模型2.0发布——通专“双轮驱动”，探索科研新范式

中国工程院院士、阿里云创始人王坚：AI的下一场革命，关键在“科学数据”

金融城小燃哥｜AI 支付要来了，你准备好了吗？