对话嘉宾
吴雄昂 新加坡CoreLab Tech公司董事长(CoreLab Tech)
Aniket Saha 美国Tenstorrent公司副总裁(Tenstorrent)
梅迪 广州希姆半导体科技有限公司首席执行官(希姆计算)
第五代精简指令集(RISC-V)自2010年问世以来,在全球学术界和产业界共同努力推动下,逐步迎来爆发式增长,目前已与x86、ARM成为全球最重要的三种计算指令集。作为赋能产业创新的强大引擎,RISC-V为中国科技创新开辟了新的赛道。2024年中国贡献了RISC-V芯片一半以上的出货量,业界预测未来几年中国将在全球RISC-V市场占据主导地位,不过当前RISC-V在产业发展过程中也面临诸多困难和挑战。
第五届RISC-V中国峰会期间,全球RISC-V领域三家专业厂商Tenstorrent、Corelab Tech与希姆计算三方合作打造 “CPU +生态平台+ NPU” 一体化平台,被认为是填补行业空白的关键举措。三方合作对突破 RISC-V AI发展瓶颈能够带来哪些价值?如何更好推动 RISC-V AI开源生态建设?RISC-V AI技术的发展如何更好地展开国际协同?
AI时代需要架构革新 开放架构为创新提供土壤
吴雄昂:我们选择用 RISC-V打造创新平台,原因主要有几方面。一是之前在ARM公司的多年从业经历让我深刻认识到,行业核心趋势是越开放越利于创新、越能加快创新速度。二是AI 作为当下最大的技术革命,必然需要新的架构,以适应不同场景下数据、计算需求和负载的变化。而ARM的优先目标是快速增加收入和巩固其垄断性优势地位,难以满足新兴应用需求,开放的架构才能为创新提供土壤。
回顾过往,我们曾在ARM公司助力众多开拓者从小企业成长为行业巨头,在此次AI浪潮下,我们期望借助更开放的RISC-V平台赋能创新者。同时,在当前AI发展过程中,算力问题亟待解决,开源的RISC-V架构正是突破算力困境的最佳路径。我们希望通过更开放的架构,能让新的创新者和开拓者有更好的机会取得成功。
Aniket Saha:我在CPU的IP领域已经工作了很长时间,RISC-V为最终用户提供了比任何传统架构更多的控制权,用户可以根据需求进行定制、添加扩展和配置。比如我们的Tensix内核有五个嵌入式RISC-V处理器,如果用其他传统架构来实现这一点,就必须先要获得架构许可证,自己构建内核,并花费大量资金。而RISC-V让我们获得了创新的自由和能力。
人工智能模型每年都在快速变化,企业需要完全控制从算法到设备的整个人工智能堆栈,市场上有各种定制化需求,而传统架构无法支持,因为它们支持通用架构。RISC-V使我们能够了解和分析工作负载,并设计最适合的处理器。
梅迪:希姆计算选择RISC-V,最核心一点就是在灵活性、扩展性、可编程性的平衡方面,RISC-V是最好的架构。AI技术发展到今天,“摩尔定律”逐步失效,伴随着大模型的收敛和当前大芯片制程工艺的限制,芯片的设计目标在于压榨每一分算力,尤其对于推理任务更是如此,从这个维度上来看,使用相同的工艺面积,显存带宽,尽可能的减少开销损耗,提升效率,必须要在软硬件协同直至系统层面进行极致优化。
在这个领域里,RISC-V提供给我们的除了灵活性之外,还能够助力我们实现从CPU到NPU再到DPU整个体系的优化。当我们在追求极致优化时,我们把系统所有的组成构件,包括不同芯片和整个计算体系结构进行优化,从而给到市场一个最好的解决方案。比如希姆计算的NPU卡通过与Tenstorrent的CPU 深度适配,结合 Corelab Tech的系统级优化,将协同效率提升至90%以上,从而达到一个系统级别的计算效率提升。
开源生态的繁荣需要 “共建共享”
吴雄昂:开源生态需要 “硬件锚点”,我们将发布平台的硬件设计规范,允许下游厂商基于规范进行二次开发,既保证兼容性,又保留灵活性。同时,我们还将联合建立 “RISC-V AI 测试认证中心”,开源测试工具与基准数据集,避免 “重复造轮子”。
制作AI计算芯片需要多个计算环节,二是需要优化定制化的计算平台。RISC-V因为是一个新生事物,只有大家共同努力才能解决这个问题。目前RISC-V在中低端应用较多,然而在高性能计算方面真正能够做好的仍比较少。我们通过三方合作,打造出一个通用型平台,在这个平台上可以对接各种各样的计算卡,通过这种方式最终实现一体化。
Aniket Saha:开源不是 “免费共享”,而是 “标准化协同”,我们计划将 CPU 与 NPU 的协同接口、并行计算协议开源,供社区参考优化,同时联合高校与研究机构发起 “RISC-V AI 算力竞赛”,吸引开发者基于平台开发模型。与闭源架构相比,RISC-V 的开源特性让 AI 加速算法可直接基于指令集优化,而三方合作将输出 “开源加速库”(如适配大模型推理的算子库),降低开发者迁移成本。
我们正在试图消除进入RISC-V的障碍,我们已经向开源社区捐赠了大量的验证抵押品,另外,我们还计划开源已经经过验证了的内核。RISC-V要想在未来取得成功,业界需要高质量的开源内核。
梅迪:这是一个非常好的问题,在开源生态 “共建共享” 方面,希姆计算主要做了三件事,一是主导和倡导技术标准制定与开源项目推进,特别是在 RISC-V Matrix 扩展标准化工作中发挥主导作用,提案制定高效矩阵运算指令集,并通过 GitHub 发布开源项目,为全球开发者提供可参考和参与的技术框架。二是打造全栈开源解决方案:推出基于RISC-V架构的“芯片 + AI”全栈闭环方案,涵盖芯片、算力服务、模型适配及智能体应用等方面。方便开发者基于其方案进行二次开发和应用落地,推动开源生态的技术实践与成果共享。
而第三件事就是参与国际开源社区协作,我们在RISC-V国际基金会相关工作中积极贡献,推动RISC-V开源生态的全球化共建。而这次的合作,希姆计算将会开源NPU与RISC-V CPU的适配驱动代码,并贡献大模型部署案例,让开发者快速上手。我们还将推动 “RISC-V AI 生态联盟”,联合云厂商、算法公司共建模型适配社区,实现 “一家优化、全生态复用”,加速开源模型在 RISC-V平台的落地。
RISC-V技术发展需要国际协同
吴雄昂:在全球化背景下,RISC-V其实也是一座国际合作的桥梁,RISC-V技术的发展需要国际协同。为推动RISC-V技术的全球化应用,首先需要有一个统一标准,通过统一标准来共享资源;然后要吸引不同国家的参与,也需要人才共享。另外,要根据各个国家各个地区的不同需求进行不同的技术开发。
在这方面,我们的全球化路径是 “本地化产品 + 全球化标准”,在亚太、欧美推出区域定制版平台(如适配当地电力标准、数据合规要求),但核心技术标准保持统一。我们的定位是做 “RISC-V AI 产品的全球桥梁”,帮助不同区域的技术创新转化为标准化产品,实现 “技术 - 产品 - 市场” 的全球化流动。
展望未来,我认为RISC-V目前已经进入往上走的阶段,预计明年这个时间段会有许多新的基于RISC-V的高性能计算芯片出现,今后5年RISC-V将走到高速发展的拐点。
梅迪:在推进国际协同发展方面,我们的定位是成为“RISC-V AI 加速的全球推动者”,向国际社区贡献NPU与RISC-V协同的技术专利,推动形成全球统一的加速接口标准。全球化关键是 “生态互联”,我们将与云服务商和上下游厂家合作,使NPU卡可以更便捷地接入国际云平台和各种边缘计算系统,让全球用户可通过 “算力即服务”体验 RISC-V AI 能力。
通过我们这种三方合作,很快可以让大家看到与以前不同的地方,因为RISC-V提供了新的发展路径,大家的想象空间未来会非常大。(采写:半月谈记者 高少华)