2025年10月15日,笔者走进位于山东省济南市的浪潮人工智能模型工厂。这座工厂并不算大,因为浪潮云在建设该工厂时始终秉持“集约”的原则。它只有九个车间,但却有着技术层面的“别有洞天”。有的车间里并列摆着几台大屏,上面滚动显示着不同客户订单的最新进展;也有的车间里摆放着载有海量数据的大屏,数据处理全程无需真人参与,只需一位真人工程师在旁边监督工作;还有的车间里摆有机器人和机械臂,一旁的工程师正在对着它们做测试。在浪潮云内部,九个车间被称为“九大单元”,它们分别是数据车间、模型车间、评测中心、集成车间、客户服务中心、产品工程中心、安全中心、设备管理中心及调度服务中心。目前,该工厂已积累75道工序及180套工具,实现了数据、算力、算法全面布局。
之所以建设这所工厂,浪潮云的思考是:如果人工智能模型的生产像工业制造品一样变得高效和可控,人工智能便有可能转向数据质量、工艺流程整合与生态构建。对此,浪潮集团执行总裁、总工程师,浪潮云董事长肖雪表示,这便是浪潮人工智能模型工厂“集约”的目的所在,而这种集约体现在多个方面。
首先是算力集约。由于算力成本和算力获得都有一定难度,因此要进行算力集约,把企业单独购买的算力用服务的方式解决。其次是算法集约。当前开源算法越来越多,基础模型的能力越来越强。这时就会面临这样一个问题:以前的产业结构是做一个项目、签一个大单。它的特性特别简单,因为之所以能被称为项目,首先要有明确需求比如有明确的成本要求和时间要求,只有这样才能进行交付。但是,人工智能到底会在多久之内训练出怎样的成果?这不仅是不确定的,而且人工智能的训练成果还需要在数据驱动中进行长周期的持续迭代,因此要进行算法集约。再次是人力集约,即不再采用人力散开的方式,而是将人力集中起来。最后是安全集约。人工智能的训练安全是一个重要问题,因此要为其建立相应的安全底线和安全体系,最好的办法是在数据和应用上进行集中管理。据了解,浪潮云所使用的方式包含技术手段和政策手段两部分(即模型备案+数据沙箱),能够很好地解决一些安全问题。
与此同时,肖雪表示,集约并不是浪潮云的首创,而是一种发展的必然。以前的研发类似于手工作坊,依赖编程人员的开发能力,而且出货速度较慢。当改为现代工厂的模式,通过工艺、工序、工具和流程把它锁定,就能把整体生产能力提升到较高水平。一旦实现了集约和高效,就会出现更高质量、更低成本、更高效率的模型的制造。肖雪表示:“我们从过去平均一个模型的需要90天制造时间,到现在已经压缩到20天左右,整个平均效率提升了75%左右。”
对于一家工厂来说,有了订单之后就会积累数据。而一个基础设施必须具备解决相关数据问题的能力,才能被称为基础设施,如果只能解决单项问题那就不是基础设施。对于浪潮人工智能模型工厂来说,如何在数据上建立不同的基于分布式数据的存储方式和安全方式?如何在运行中实现沙箱建立和持续的安全保障?都需要通过使用一定的治理方式来解决。正因此,浪潮人工智能模型工厂希望通过打造人工智能基础设施来解决各行各业的关切,推动人工智能在各行各业的快速应用。事实上,这座工厂本身也是一个标准的生态体系和产业集群。目前,浪潮云的出海联盟合作伙伴已有400多家,这让其已实现了人工智能的全产业整合。面对各行各业,浪潮人工智能模型工厂在每一个产业链节点上都有能力进行整合。目前,在该工厂的九个车间里,已能包含人工智能产业的全部生态位。
肖雪表示:“依托这些客户积累,我们一方面可以选择能力最优者,另一方面可以根据用户需求选择能力最优者,通过让能力最优者来使用工具或使用能力最优者的工具,进而通过相关的基础能力来服务于产业。”
他进一步指出,所有产业都要学会使用好工具。但是,如何使用好工具不是一个经验问题,而是一个专业问题。浪潮人工智能模型工厂希望把这一专业问题进行工具化和产业化,通过产业集群的构建,来结合相关能力和应用进而服务于产业。肖雪表示,在浪潮云的合作伙伴里,既有大家非常熟悉的互联网大厂,也包含几乎所有的芯片厂商。这些企业在浪潮人工智能模型工厂都拥有自己的资源池,而浪潮云可以为他们做不同资源池的基于国产算力的延展。以浪潮云做的数据标识为例,相关产业的合作伙伴也都参与到了其中。“你是化工行业的,我们会有具备化工标识能力的企业上去;你是钢铁行业的,我们会有具备钢铁标识能力的企业上去,这实际上更多是一个生态位和集群的体现。”肖雪说。
未来,浪潮将在已建成的通用算力中心以及人工智能模型工厂基础上,到2025年底建成人工智能智能体工厂和训练场,推动人工智能科技创新与产业创新深度融合,为社会提供更全面、高效的算力服务,将集约“进行到底”。