当前位置: 首页 » 资讯 » 科技头条 » 正文

5天6款AI大模型,一场“蓄谋已久”的AI竞备赛

IP属地 中国·北京 编辑:江紫萱 数据猿 时间:2025-08-23 16:07:30

“5天6款AI大模型,昆仑万维是在下一盘大棋。

昆仑万维用一周的时间占满了科技头条。

从8月11日起,周一到周五昆仑万维每天发布一款模型,覆盖视频生成、世界模型、统一多模态模型、智能体及音乐创作几大方向。全面展示昆仑万维Skywork在多模态AI领域的突破性成果。

这是国内厂商罕见的科技“日更”,在同一周内把视频、世界模型、多模态、Agent、音乐五大热门赛道全部“拉满”,在这高频、密集产品发布背后,昆仑万维到底在布什么局?

外界看到的是昆仑万维高调技术“秀肌肉”。但这场看似突如其来的密集发布,实际上早就埋下伏笔,也是昆仑万维在AI领域布局的“蓄谋已久”。也可以说是昆仑万维的长期AI投入,进入收获期。

5天发布6款模型

六大模型的发布都有哪些?

以下用一幅图来总结昆仑万维“技术发布周”五天(2025年8月11日—15日)的六大模型:

具体来看,昆仑万维的五大AI技术领域包括了视频生成(SkyReels-A3)、世界模型(Matrix-Game 2.0、Matrix 3D)、统一多模态模型(Skywork UniPic 2.0)、智能体(Agent)及AI音乐创作(Mureka V7.5)。

8月11日,率先登场的SkyReels-A3,这是一款音频驱动的人像视频生成模型。

如今,随着对真实世界复杂性模拟需求的增加,AI需要在内容创作中扮演更主动的角色,从基本的主体动起来逐渐过渡到自然的环境互动和执行精准复杂指令。然而当场景复杂度提升到存在人-物体交互,且音频时间更长时,现有方法面临显著的瓶颈,核心挑战在于,比如不同场景下精准的嘴部对齐,包括不同物种,不同参考图风格等,同时,保持甚至优化画面质量。同时,是否能支持更长的音频,特别是对于主播带货,广告等场景等

相较同类产品,此次发布的SkyReels-A3,是基于DiT(Diffusion Transformer)视频扩散模型为基础。在技术上采用3D-VAE+DiT扩散架构,保证长视频画面不崩,能够实现任意时长的全模态音频驱动数字人创作。用户只需上传一张照片并配上语音,图中人物即可精准匹配口型、表情和动作开口说话或表演。据介绍,它在唇形同步、面部稳定性和动作自然度方面表现突出,并支持更丰富的镜头变化和最长60秒视频生成,将深度赋能电影制作、虚拟直播、游戏开发、教育内容创作等多场景。

SkyReels-A3实现音频驱动人物对话视频生成技术框架

SkyReels-A3的定量评估

在定量评估中,SkyReels-A3在不同的音频驱动场景,与先进的开源模型omniavatar和闭源模型omnihuman等方法进行了对比。结果显示,SkyReels-A3在大多数指标上超越了这些方法,尤其是在唇形同步(sync-c和sync-d)方面标出卓越的性能。同时,我们引入了step蒸馏,采用了更少的步数 (40步减少为4步),效果几乎没有损失。

据悉,此款产品于2025年2月发布V1版,4月发布V2,8月发布A3;时长变化:最初视频不超过10s,逐步升级至约30s,直至如今的1min以上。

在第二日,昆仑万维推出的自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本——Matrix-Game 2.0,是一款交互式视频生成模型。这款模型在低延迟、高帧率的长序列交互性能上实现突破,可在多场景中以25FPS的速度,生成连续视频内容,且生成时长可扩展至分钟级,大幅提升了连贯性与实用性,这也是国内国内首家对标Google genie3的模型。

Matrix世界模型系列中的另一个重要组成模型——Matrix-3D,用于3D世界的生成与探索——一个融合全景视频生成与三维重建的统一框架,单图秒变360°可漫游空间。Matrix-3D以文本、图像为输入,生成的3D场景支持360度自由环视,且在几何结构与色彩上保持一致性。它能根据用户输入的不同轨迹,精准生成对应的3D场景。在生成结果的视觉质量和相机可控性层面,Matrix-3D均优于现有方法。此产品的技术亮点是全景+3D重建统一框架,支持任意视角,并且模型已全面开源,方便二次开发。

可交互视频生成大模型Matrix-Game-Turbo和3D场景生成大模型Matrix-3D打破了内容生成与交互之间的壁垒,打造出具备多模态感知、动态交互和长期记忆能力的虚拟世界模拟系统,为游戏引擎、元宇宙、具身智能、自动驾驶等多个领域提供强有力的技术基座。

8月13日发布了Skywork UniPic 2.0。这是一款面向统一多模态建模的高效训练与推理框架,在生成和编辑模块上进行了轻量化优化,并通过与多模态理解模型的联合训练,构建了理解、生图、编辑一体化的核心能力,目标是实现"高效、高质、统一"的多模态生成模型。目前,Skywork UniPic 2.0及其系列模型已全面开源,涵盖模型权重、推理代码及强化策略,方便开发者与研究者快速上手,构建多模态应用。在多个权威评测任务中,UniPic 2.0刷新了性能记录,也显著降低了模型的推理与部署门槛,为消费级多模态智能系统奠定了技术基础。

8月14日,昆仑万维正式发布Skywork Deep Research Agent v2,该模型是天工超级智能体(Skywork Super Agents)的核心引擎。公司表示,Skywork Deep Research Agent自5月22日上线后,大幅重塑了大模型在AI Office领域的角色,通过skywork.ai为用户产出了大量信息密度极高的优质文档、PPT、表格以及其他交付物。新版本的Skywork Deep Research Agent v2将带来更多的体验提升。

作为技术发布周收官之作,8月15日昆仑万维正式推出音乐模型Mureka V7.5,可AI生成音乐。相比传统的音乐创作流程,Mureka可以大幅节约时间和节省成本,据介绍,不论是音乐性还是文本控制准确性均领先同类音乐模型。

Mureka V7.5表现

据悉Mureka自上线以来,在海内外获得了非常好的市场反响。早在今年3月,公司正式发布全新AI音乐生成模型Mureka V6与Mureka O1,Mureka O1和Mureka V6公测后用户反映非常好。全球访问量达333万,环比增长86.5%,目前已经有超过100个国家和地区的用户在使用,增速位列全球AI音乐品类第一。

此次发布的Mureka V7.5模型,在中文歌曲上的演绎再上新台阶,不仅实现了中文歌曲音色、演奏技法的大幅提升,还完成了中文歌曲咬字与情感表现提升。其核心突破在于构建了深度融合文化语境与语言特性的音乐音频理解模块。该模型通过系统性训练,已形成对中文音乐多样性的全面认知,从传统民歌、戏曲到经典华语流行金曲及当代民谣,均能精准捕捉艺术神韵。

至此,昆仑万维用五天时间完成“视频-世界模型-多模态编辑-研究Agent-音乐”全栈布局。

“秀肌肉”背后,实则是“蓄谋已久”

5天连发6款大模型,外界看到的是高调技术“秀肌肉”。但这场看似突如其来的密集发布,实际很早就埋下伏笔,也是昆仑万维在AI领域布局的“蓄谋已久”,也可以说,是昆仑万维的长期AI投入,进入收获期。

昆仑万维是一家怎样的公司?

拉长时间线来看,昆仑万维是一家游戏起家的公司,成立于2008年,2015年登陆深交所,被誉为最早一批“游戏出海”的中国厂商。后转型成了一家平台型互联网企业,再到现在,它正加速转型为一家AI企业。可以说,十几年的时间,完成了主业三连跳,成长为一家领先的AI科技公司。

大模型浪潮袭来时,昆仑万维极为果断,开始坚决投入。正如此前媒体采访中,公司相关负责人谈到的,最好的战略一定是面向未来十年去做产品。2023年,自公司提出“All in AGI 与 AIGC”以来,公司就开始持续投入大量资源开发各类AI应用,蓬勃的技术涌现正推动多场景商业化落地。此后,公司也朝着越来越高的“含AI量”一路狂奔。

2023年,昆仑万维通过增资方式控股AI算力芯片企业——北京艾捷科芯科技有限公司,前瞻性地完成了“算力基础设施—大模型算法—AI应用”全产业链布局。据此前媒体采访,相关负责人提到,昆仑万维不仅仅在做大语言模型和AI应用,公司在整个产业链都有布局。

2024年11月,昆仑万维正式推出了其最新产品——“天工大模型4.0”4o版(Skywork 4o)及实时语音对话助手Skyo,引起了业界的广泛关注。过去一年,天工大模型从2.0升级到4.0,并在海外市场持续高歌猛进。

值得一提的是,SkyReels、Mureka、Linky等产品矩阵已在终端市场获得积极反馈,同期海外业务增速迅猛,标志着其从“技术探索期”迈入“商业收获期”,此次技术周的举办,也意味着公司AI商业化的加速落地。

据了解,就在8月技术周前一周,在Hugging Face最新发布的中国AI社区7月重点成果中,昆仑万维与阿里、腾讯等互联网“大厂”企业共同入选“中国AI开源16强”,该榜单被视为官方对开源贡献的年度盖章。

技术周落幕,AI的“发令枪”才刚响起

技术周的镁光灯已经熄灭, 但AI的“发令枪”仿佛才刚刚响起。

如今,大模型技术进行密集迭代期,AI开始“卷应用”的窗口期到来。

当前形势下,在“AI出海”这一领域中,昆仑万维已然取得了领先位置,这归功于其具有前瞻性的布局。

梳理昆仑万维的的历程,给予我们两点关键启示:

其一,中国AI企业出海有着广阔的前景。以昆仑万维为例,中国的AI大模型企业开始在出海方面获取规模化收益。不过,这一成果背后的方法是否具备可复制性呢?可能要因公司而宜,毕竟不是每一个国内的企业都能有资本和能力像昆仑万维这样走“大航海模式”。

其二,AI从研发到落地的商业闭环得到证实。SkyReels、Skywork Super Agents、Mureka、Linky等在国内外市场收获的积极反响,表明昆仑万维的研发成果有着较高的商业变现能力。这意味着昆仑万维已从“技术探索期”渐渐步入“商业收获期”,并在研发与商业化之间构建起正向循环。此次昆仑万维技术周的模型发布,无疑是“开花结果”的又一“助推器”。

众所周知,步入2025年,AI竞争已从“比拼参数”阶段进入“比拼场景、比拼收入”的后半场。大模型厂商的同质化状况开始出现,市场正以订单、DAU和现金流为评判标准。曾经引人注目的“秀肌肉”阶段,以炫技性的参数比拼和技术展示为特征,正逐渐退去。取而代之的是更加务实且激烈的“比拼落地”战场。

于是,各行业的探索者们开始着眼于一个更核心的问题:怎样将AI的力量切实融入产业肌理,解决实际问题、创造可见价值?这也成为昆仑万维必须深入思索的课题,此次技术发布周正是其给出的一份有力答卷。

昆仑万维在此前,把每一个垂类完成了商业闭环。

可以说,刚刚落幕的“AI技术周”以及密集的模型上新,昆仑万维再次向整个行业传达了清晰信号:将全心投入技术创新,保持竞争优势,加速AI应用落地和商业化变现。

技术周虽已结束,但发令枪才刚刚打响,昆仑万维的下一站,值得期待。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。