在2025年 AWS re:Invent 大会上,亚马逊云科技(AWS)正式发布了最新一代的人工智能训练芯片 ——Trainium3。这款芯片在多个方面都实现了显著的进步,给 AI 模型训练带来了全新的可能性。
根据 AWS 的介绍,Trainium3芯片采用先进的3纳米制程,其性能相比于第二代产品提升了4倍,内存容量同样增加了4倍,能效则提高了40%。这一系列的改进使得 Trainium3能够更好地满足高负载推理和 AI 训练的需求。
此次发布的 Trainium3UltraServer 系统能够支持大规模集群的构建,最多可以连接100万颗 Trainium3芯片,这个数字是前一代系统的10倍。每台 UltraServer 最多可以容纳144颗芯片,极大地提升了数据处理能力。亚马逊表示,该系统将帮助客户在使用 AI 云服务时显著降低推理成本,进一步促进了 AI 技术的应用。
此外,AWS 还透露了 Trainium4的开发计划,表示这一新一代芯片将支持与英伟达的 GPU 协同工作。通过支持英伟达的 NVLink Fusion 高速互连技术,Trainium4不仅能够扩展整体性能,还能利用亚马逊自研的低成本服务器架构。这一举措将可能降低将现有英伟达优化的 AI 应用迁移至亚马逊云平台的门槛。
划重点:





京公网安备 11011402013531号