全世界都在从人工智能、全球贸易和经济、技术创新,甚至地缘政治等角度谈论英伟达。很少有公司能够对这家美国芯片制造商构成真正的挑战,其中之一就是中国公司Moore Threads。
那么,我们今天为什么要谈论这家中国公司呢?因为这家总部位于北京的GPU制造商——通常被称为"中国的英伟达"——已启动IPO,计划筹集超过10亿美元。听起来倒也不算太令人惊讶,对吧?但它却引起了惊人的反响。该IPO的认购次数超过4100次,认购总额约为4.5万亿美元,这个数字比英伟达目前的市值还要大。没错,就是那个在人工智能领域占据主导地位的英伟达。当然,这个数字并不意味着Moore Threads价值万亿,但这恰恰说明了人们对人工智能有多么着迷。
如果说我们对Moore Threads有什么可以肯定的一点,那就是它的IPO反响绝非偶然。各国都在竞相确保自身对人工智能所需GPU的供应。随着美国对英伟达最先进芯片的出口限制日益收紧,中国突然发现自己被迫建立自主芯片产业,而Moore Threads的IPO正是这种紧迫性的体现。
Moore Threads成立于2020年新冠疫情期间,同时也正值中国意识到需要在国内研发最新关键技术之际。这家公司的创始人并非初次涉足此领域——臧建宗,这位59岁的创业者曾在英伟达工作14年,担任其中国区负责人。所以当他创立Moore Threads时,他不仅了解GPU,也深知中国在这场竞赛中落后了多少。
如果你一直关注全球人工智能竞赛,那么你现在应该已经知道一件事:全世界都在争抢GPU。这些芯片已经从游戏玩家的显卡变成了训练从ChatGPT到Gemini再到DeepSeek等所有大型AI模型的引擎。GPU,即图形处理单元的缩写,是一种最初设计用于辅助创建图像和视频的电子电路。然而,它能够快速执行大量计算,因此被广泛应用于人工智能和科学计算领域。
臧建宗召集了一支由资深GPU工程师组成的团队,其中包括曾就职于英伟达的首席技术官。他们的目标是完全自主研发一款全功能通用GPU,而且他们的进展非常迅速——Moore Threads在不到300天的时间内设计并生产了其首款GPU芯片。到2021年底,该团队已经拥有了第一代GPU的可用原型。
早期,臧建宗大多待在幕后。公司最初以他妻子的名义注册,但到2023年,他完全掌控了公司。他目前拥有该公司约36%的股份,并担任董事长兼总经理。这次重组显然是为了让公司为即将到来的IPO做好准备。
"Moore Threads"这个名字很有意思。它旨在体现公司的愿景,既是对摩尔定律的致敬,也是对多线程计算的致敬。摩尔定律最初是戈登·E·摩尔在1965年提出的观察结果,指出微芯片上的晶体管数量大约每2年翻一番,而成本却在下降。这并非科学的基本定律,而是一种观察结果,但它在科技领域已成为近六十年来的一项关键原则。许多专家现在认为摩尔定律虽然增速放缓,但并未完全过时——如今芯片技术的进步来自于更智能的设计,而不是简单的晶体管数量翻倍。
创始人臧建宗认为,如今的大型语言模型仅仅是个开始。未来的人工智能、沉浸式图形、科学工作负载等都需要巨大的计算能力,而GPU需要更多的线程来处理所有这些任务——人工智能加速、3D渲染、视频编码、模拟和科学计算。他组建了一支由前英伟达和前AMD工程师组成的团队,从腾讯等大公司筹集了早期资金,并着手打造中国所缺乏的全功能通用GPU。
顺便一提,AMD是英伟达最强劲的长期GPU竞争对手,但它仍然落后于英伟达。英伟达占据了约90%的市场份额,而AMD则拥有约7%到8%的市场份额。
"全功能GPU"这个概念非常重要。中国此前就出现过人工智能芯片初创公司,寒武纪、壁仞等公司都很出色,但它们只专注于AI加速。AI加速是指使用专用硬件来运行AI计算,使其比通用处理器运行得更快、更高效。而Moore Threads的目标是打造一个完整的GPU平台。
要理解Moore Threads,就必须理解它诞生的紧张局势。近十年来,中国科技巨头几乎完全使用英伟达GPU来训练人工智能模型,英伟达在中国人工智能加速器市场占据了超过90%的份额。而且这不仅仅是硬件上的优势。
英伟达在全球拥有惊人的统治地位,但这不仅仅是因为它生产的GPU。即使一家公司能够以相同的规模生产出相同类型和质量的GPU,也不意味着他们就能轻易挑战英伟达。英伟达的武器库中还有另一件鲜为人知的武器——CUDA。
CUDA,全称"统一计算设备架构",使开发人员能够编写在英伟达GPU上流畅运行的程序。近二十年来,研究人员、人工智能公司、大学和初创企业都围绕CUDA构建了他们的整个工作流程。这意味着全球人工智能生态系统与英伟达紧密相连。即使另一家公司生产出优秀的GPU,放弃CUDA也极其困难,因为你必须重写或重新优化大量的软件。这造成了锁定效应,也是英伟达持续主导人工智能领域的一个重要原因。
Moore Threads并非不明白这一点。所以,它不仅仅在制造GPU,还在构建自己的软件生态系统——MUSA。MUSA(全称Moore Threads Unified System Architecture)的设计理念是让CUDA开发人员能够以他们熟悉的方式工作。如果中国开发者只需进行少量更改(理想情况下无需更改)即可在Moore Threads芯片上运行AI模型和图形应用程序,那么新的GPU将变得易于使用,而如果没有这种兼容性,单凭硬件本身是没有意义的。
简单来说,英伟达既有GPU(相当于身体),也有CUDA(相当于大脑)。CUDA已经成为人工智能的语言,竞争不仅仅在于谁能制造出更好的芯片,关键在于谁能构建一个完整的生态系统,让开发者日复一日地依赖它。
短短四年内,Moore Threads就推出了四代GPU,包括游戏显卡、数据中心显卡和软件堆栈,这些产品都是为与CUDA兼容而设计的。
那么,为什么中国会感受到这种紧迫感?原因在于地缘政治。从2022年开始,美国限制了英伟达顶级芯片向中国的出口,并在2023年进一步收紧了限制措施。中国公司将无法再购买A100或H100芯片。这不仅给中国带来了不便,更是对其AI发展构成了威胁——全球一半的人工智能研究人员在中国生活和工作,但他们突然间却难以获得现代人工智能的关键硬件。
Moore Threads几乎立即被纳入中国国家议程。该公司获得了政府补贴,吸引了国家相关投资,并在短短88天内顺利通过了IPO审批,不到该国通常所需时间的一半。
当IPO认购窗口开放时,散户投资者将其视为买彩票。超过400万人参与了股票竞标。在IPO之前,Moore Threads共有近90位股东。值得注意的是,尽管该公司已被列入美国政府的实体清单——该贸易黑名单限制美国技术出口到特定外国公司——但这并未阻挡投资者的热情。
从业务数据来看,Moore Threads已经推出了四代GPU架构。该公司2024年营收达4.385亿元人民币,连续3年年增长率超过200%。但由于研发支出高昂和库存不断增加,该公司仍然无利可图。
当然,目前全球正掀起一股IPO热潮。另一点值得注意的是,随着投资者追逐生成模型和自动化方面的突破,全球人工智能融资额已飙升。但此次资金涌入的速度和规模引发了人们的担忧,即人工智能领域可能正在形成过热的泡沫。
现在到处都在说Moore Threads将成为"中国的英伟达",但它的实际地位究竟如何?坦白说,它的性能仍然远远落后于英伟达。其GPU性能大致相当于几代前的英伟达芯片;将多个GPU连接成集群的技术比英伟达的速度慢;早期一些产品曾因性能不稳定而受到批评。不过需要说明的是,对于一家年轻的GPU公司来说,这一切都是正常的,英伟达的早期发展也并非一帆风顺。
但重点在于:在技术水平上与英伟达持平并不是近期目标,而且也不可能马上实现。快速普及才是目标——中国宁愿接受足够好的国产技术,也不愿依赖自己根本无法获得的顶尖技术。
值得注意的是,Moore Threads并不是这场竞赛中唯一的参与者。华为拥有自己的昇腾芯片,壁仞正在研发功能强大的AI加速器,寒武纪作为上市公司,其股价也随着国内芯片市场热情高涨而飙升。但Moore Threads之所以引人注目,原因只有一个:它正努力成为一家完整的GPU公司,而不仅仅是一家AI芯片制造商。这种雄心壮志加上创始人的英伟达背景,解释了为什么"中国英伟达"这个称号一直沿用至今,即使目前技术差距仍然非常大。
在全球市场中,短期内发生这种情况的可能性极低。CUDA的应用范围极其广泛,英伟达还拥有数十年的专利、强大的工程技术实力、制造合作伙伴关系以及业界的信任。一两代芯片是赶不上这种积累的。
但在中国国内,情况却截然不同。英伟达的访问权限受限,国内采购受到政策支持,中国AI公司正在寻找他们实际能够购买的硬件。所以,更准确的问题不是"Moore Threads是否会取代英伟达",而是"Moore Threads是否会成为中国默认的GPU供应商"——这个问题更容易回答。
Moore Threads有钱,它拥有国家的政治支持和制度保障,拥有一支经验丰富的GPU团队,拥有一个不断发展的软件生态系统,而且它的市场需求正在爆炸式增长。中国正在以创纪录的速度建设人工智能数据中心,而基础设施总得有人提供。
IPO并非其故事的高潮,它的故事才刚刚开始。当然,IPO很引人注目,也让全世界都在讨论Moore Threads。但接下来的五年才是最艰难的——扩大生产规模、精通软件栈、培训开发人员并赢得企业买家的信任,这绝对是一项艰巨的任务。Moore Threads是迄今为止打造类似英伟达的产品的最雄心勃勃的尝试,这就是为什么它的IPO震动了市场,为什么数百万投资者将资金投入到IPO中,为什么全世界都应该停下来关注它。
摩尔线程的IPO震动市场绝非偶然,但要理解它为何被称为"中国的英伟达",需要看到更深层的逻辑。英伟达的真正护城河不只是芯片,而是以CUDA为核心的全栈生态——无论训练大模型、渲染特效还是科学计算,开发者都离不开它。华为昇腾虽在AI训练领域拳头最硬,但本质上是专用加速卡,不覆盖图形渲染和通用计算。
国内真正从第一天就定下AI计算、图形渲染、科学计算、视频编解码"四条腿走路"目标的,只有摩尔线程。其创始人在英伟达任职十四年,完整经历了CUDA从发布到锁定开发者生态的全过程,深谙如何将硬件产品做成生态平台。
摩尔线程自研的MUSA架构正是其"中国版CUDA",成熟度虽远不及CUDA十几年的积累,但方向对不对和现在够不够好是两码事。美方芯片封锁的真正毒性,不在于卡住某几款高端芯片,而在于试图将中国永久锁在英伟达生态之外。
打破这个锁定,靠的不是单点替代,而是生态重建。摩尔线程若能把全功能GPU生态撑起来,覆盖的就是从云端到终端的整个通用计算底座——从民用AI到科学研究,所有需要通用GPU算力的领域都不用再看别人脸色。
这才是"中国版英伟达"这个称号真正的分量所在。至于最终能否走通,时间会给答案,但至少在这张牌桌上,它是唯一把筹码推向这个方向的玩家。





京公网安备 11011402013531号