当前位置: 首页 » 资讯 » 科技头条 » 正文

摩尔线程发布“花港”GPU新架构,万卡AI训练与推理能力,剑指英伟达

IP属地 中国·北京 编辑:郑佳 凤凰网科技 时间:2025-12-21 16:08:35

12月21日,摩尔线程于12月20日在北京首届MUSA开发者大会(MDC2025)上公布了新一代全功能GPU架构“花港”,并展示了其万卡规模AI训练集群及多项技术进展。

此次发布的核心内容涵盖架构升级、集群能力与推理性能等方面。新架构“花港”支持从FP4到FP64的全精度计算,算力密度提升50%,能效实现10倍提升。基于该架构,公司计划推出专注于AI训练与推理的“华山”芯片,以及面向图形渲染的“庐山”芯片。

在训练集群方面,摩尔线程推出“夸娥”万卡智算集群,称其具备全精度通用计算能力,训练算力利用率在稠密模型上达到60%,在混合专家模型上达40%,训练线性扩展效率为95%。在推理侧,公司与硅基流动合作,在DeepSeek R1 671B模型上实现单卡Prefill吞吐量超过4000 tokens/s,Decode吞吐量超过1000 tokens/s。

软件生态方面,MUSA 5.0版本对编程模型、计算库和编译器进行了优化,核心计算库muDNN的GEMM与FlashAttention效率超过98%,通信效率达97%。公司还计划逐步开源部分核心组件,包括计算加速库与系统管理框架。

在图形领域,新架构集成硬件光线追踪加速引擎,并支持自研的AI生成式渲染技术。摩尔线程还展示了在具身智能、AI for Science等前沿领域的布局,推出仿真训练平台MTLambda以及基于“长江”SoC的AI算力本MTT AIBOOK。

此外,公司公布了面向下一代超大规模智算中心的MTTC256超节点架构设计,着眼于高密度硬件与能效优化。

此次大会,摩尔线程系统展示了从芯片架构、集群基础设施到端侧设备的全栈技术布局,目标是为国内AI计算生态的发展提供硬件与软件支持。 因此行业人士普遍认为,摩尔线程正全面对标英伟达,提前发布架构,以便提升软件生态信心。

标签: 架构 线程 摩尔 集群 模型 花港 芯片 硬件 算力 图形 大会 方面 计划 软件 面向 技术 开源 生态 公司 科技 线性 凤凰网 效率 高密度 精度 计算能力 利用率 部分 布局 核心 领域 单卡

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。