6月16日,浪潮计算机AI产品线负责人刘伟在上海金融展上接受澎湃新闻记者采访时透露,受益于算力基础设施建设的推进,浪潮搭载国内GPU和CPU的服务器规模今年将大幅提升。
“今年的AI服务器规模相对去年来说将有很大提升,实际上今年我们有机会做到更大。”刘伟表示,浪潮计算机国内的工厂扩建,包括液冷产线扩建,都在如火如荼地去推进,接下来全国还会进行大规模算力基础设施建设。
随着AI大模型、智能体在金融领域落地,信贷审批、保险理赔、政策合规审核等场景对算力消耗激增。这类业务需交叉调用征信、资产、监管政策等海量数据,单次业务会产生海量算力Token,倒逼金融机构升级算力架构。
浪潮提出,“算力Token化”变革,将GPU算力资源抽象为可计量、可调度、可计费的“Token”,像水电一样按需分配、跨池调度。
算力token化不是对现有模式的优化,而是对算力供给模式的重构。传统模式下,金融机构要想满足这个需求要“买多少台服务器”,算力token化模式下,金融机构关注的不是服务器,而是处理任务的能力。至于底层用的是哪台服务器、哪块GPU,不需要关心。算力token化模式下,通过浪潮的智算多云纳管平台可以统一调度异构云的算力资源,实现“一次接入,全域可用”。
浪潮金融行业部方案架构师马宏宾对澎湃新闻记者表示,今年5月份,国家进行了一轮国测,有七家国内GPU厂商共有九款人工智能训练推理芯片入围,这些厂商都是浪潮的核心合作伙伴。
“金融的生命线是安全可靠,浪潮计算机的生命线也是安全可靠,我们也是围绕安全可靠的产品来做的,从CPU、GPU到相关的关键IC类芯片,甚至到关键的固件,我们全部是按照最高的安全标准来执行的。”马宏宾表示。
刘伟也表示,拆解智能体处理的流程和步骤,GPU的计算在整个过程里边占到了28%,CPU占到72%。大模型训练完之后应用Agent智能体要去运行的时候,大家发现不需要那么多的GPU的算力,这是核心的点。
智能体时代,对CPU也提出了许多新的要求。在产品的性能和规格参数上,第一,要求更强的单核性能,核数多少可以根据场景去调整。第二,更高的主频。CPU除了做传统调度以外,还做数据的预处理、数据的分发,以及结果的一些尾部处理和显示,大量的数据在CPU上运行。这种需求的转变导致目前高频的CPU产品缺货。
据介绍,对于未来CPU和GPU在服务器里面的比例,专注于训练的服务器还是GPU占比更多,主流还是2:8,而针对智能体场景应用层面落地上,CPU和GPU服务器目前两者比例是1:1或者1:2。今年最火的龙虾一体机CPU和GPU的比例是1:2。一些小的机器人场景或者小的实时摄像头处理场景比例都是1:1了。
刘伟表示,之前人们总说AI是泡沫,因为AI只停留在数据中心里面,但现在AI走到了端侧、走到应用侧,AI在各行各业都在快速落地。
浪潮计算机是浪潮集团的核心硬件产业,致力开发设计基于ARM、C86等技术路线的电脑和服务器整机产品,服务于政府、金融、通信、能有交通等关键行业。





京公网安备 11011402013531号