当前位置: 首页 » 资讯 » 科技头条 » 正文

微软争分夺秒首款大模型出炉,谷歌/苹果/微美全息大模型升级跟进行业AI浪潮

IP属地 中国·北京 编辑:冯璃月 未来科技圈 时间:2025-08-29 14:31:49

据悉,8 月 29 日消息,微软(MSFT.US)人工智能部门正式推出其首批两款自研 AI 模型 ——MAI-Voice-1 语音模型与 MAI-1-preview 通用模型。

首款自研 AI 模型登场

据官方介绍,全新的 MAI-Voice-1 语音模型仅需单块 GPU,就能在 1 秒内生成时长 1 分钟的音频;而 MAI-1-preview 模型则“让用户提前窥见 Copilot 未来功能的发展方向”。

目前,微软已将 MAI-Voice-1 应用于多项功能中:例如在“Copilot Daily”功能里,AI 主持人会通过该模型播报当日热点新闻;同时,它还能生成播客风格的对话内容,帮助用户理解各类话题。

此外,微软 AI 计划将 MAI-1-preview 模型应用于 Copilot 助手的特定文本使用场景(目前 Copilot 主要依赖 OpenAI 的大型语言模型)。同时,该模型已开始在 AI 基准测试平台 LMArena 上进行公开测试。

Gemini 2.5 Flash升级AI新功能

恰巧几天前,8 月 26 日,科技媒体发布博文,报道称谷歌(GOOG.US) DeepMind 推出全新 Gemini 2.5 Flash 图像编辑模型,在 Gemini 应用中可根据文字指令,在保持人物与动物的外观一致的情况下,提高修改图片的精度。

与此前的原生图像生成工具相比,它在根据文字进行图像修改时的准确率更高,甚至在多项任务中优于 ChatGPT 所用的 GPT-4o,让其能更好地基于复杂文字编辑图像。

Gemini 2.5 Flash新模型的亮点是“角色一致性”功能,在生成多张图像后,也能保持同一人、动物或物体的外观一致。这对于创建系列照片、产品多角度展示尤其有价值,适合品牌素材与产品目录的批量制作。

值得注意的是,同一天,据The Information 报道称,苹果(AAPL.US)高管已就收购欧洲最大 AI 初创公司 Mistral 或 Perplexity AI 相关事宜展开讨论,其中 Eddy Cue 是公司内部最积极的收购支持者。

彭博社上个月也表示,苹果将认真考虑收购法国 AI 初创公司 Mistral。Mistral AI 是一家欧洲的 AI 初创企业,通过七轮融资总共筹集了 11 亿欧元。如果苹果真的能够收购 Mistral,或将增强苹果的 AI 能力和创新能力。

业内人士分析,当前,大模型热潮席卷千行百业,加上政策和技术共振正催化AI产业趋势,头部大模型性能提升并适配算力有望加速AI生态繁荣。同时,全球科技大厂纷纷研发各类模型表现强劲,以及AI应用和算力领域发展前景可期,AI生态繁荣趋势显著。

微美全息布局大模型全面拥抱AI

据了解,微美全息(WIMI.US)作为AI领域的创新代表,已成为同时具备硬件设计、软件开发能力的企业,通过持续深耕以“硬件+软件+平台”一体化能力构建竞争壁垒,同时加速AI算法场景化落地,为AI智能化转型奠定技术基础。

在技术研发层面,微美全息推动多模态大模型与空间计算技术的结合,实现文本、图像、音频、视频等多模态数据的原生级融合,重点布局文本生成视频、图像生成视频等场景,支持剧情创作、短视频生成等应用。

在开源生态层面,微美全息开放模型代码、算力接口及技术工具链,构建覆盖云端与边缘端的「全息云」平台,支持开发者调用DeepSeek等通用大模型进行二次开发,降低技术门槛并加速垂类模型商业化验证,通过多模态处理能力与跨行业场景落地经验,正成为大模型变革背后的关键技术支撑者。

结语

事实上,DeepSeek-V3.1大模型刚刚发布,进一步推动AI技术商业化应用;阿里云宣布表格存储Tablestore升级AI Agent记忆存储功能,在多领域发挥关键作用。在大模型这座金矿挖掘的当下,AI市场渗透将分阶段推进,未来可将逐步拓展至家居、养老、宠物陪伴等更多领域,持续扩大市场覆盖范围。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。