当前位置: 首页 » 资讯 » 财经头条 » 正文

英伟达的LPU王炸,在给A股哪些公司送钱?

IP属地 中国·北京 英才商业 时间:2026-02-27 12:45:37



这两天的英伟达再次成为全球资本市场焦点。

市场关注点不仅是英伟达的财报,更希望从其指引和管理层评论中,寻找关于全球云厂商和企业AI资本支出热潮能否持续的明确信号,以判断在AI基础设施支出的持续性。好在英伟达盘后发布业绩报告不错,公司四季度营收681亿美元,同比增长73%,超出市场预期的656.84亿美元,盘后股价涨超3%。

同时,市场预期英伟达下一代Feynman芯片将融合Groq的LPU低时延架构,并首次引入背面供电方案以提升能效。这是英伟达在2025年底豪掷200亿美元与Groq达成的技术许可协议,吸纳其核心团队并将LPU(Language Processing Unit)架构纳入自家生态,计划在GTC 2026发布首款原生LPU产品。

这一架构变革直接驱动PCB产业链进行全面升级,核心基材向M9+Q布的跃迁已成定局,并对高阶HDI、钻孔及电镀等工艺环节形成强劲且持久的需求支撑,提前锁定了上游材料与设备环节的景气周期。

今天的A股市场算力PCB、高端材料相关标的应声大涨,胜宏科技(300476.SZ)、沪电股份(002463.SZ)、菲利华(300395.SZ)、生益科技(600183.SH)等上市公司股价强势上扬,成为资金追捧的焦点。

这场看似是芯片架构的升级,实则是英伟达对AI推理端的一次颠覆性重构,而A股市场的机会并非在芯片本体,而是隐藏在服务器机柜架构升级背后的PCB与材料赛道。(A股将受益的相关个股在第二部分)

01算力推理的范式革命:LPU凭什么颠覆GPU?

在AI算力的竞争中,训练端的GPU一直是绝对核心,但随着Agentic AI、实时交互、高频金融交易等场景的爆发,推理端对“低时延、高流畅度”的需求成为新的核心痛点。英伟达LPU的出现,正是瞄准了GPU在时延敏感型推理场景中的短板,通过结构性的架构取舍,将AI推理从“吞吐优先”推向“时延优先”,完成了一次算力推理的范式革命。

LPU的本质是为“大语言模型推理而生的专用ASIC”,其核心竞争力源于大容量片上SRAM+确定性流水线+编译器驱动架构的三重组合,这也是其与CPU、GPU、NPU形成本质差异的关键。





上图2:左侧是“GPU多核+cache+memory controller+5级流水线”,右侧是“LPU/TSP slices+指令pipeline+East/West Hemisphere”详细结构

与依赖片外HBM的GPU不同,LPU将230 MB的SRAM直接集成在Die上,实现了80TB/s的超高带宽,访问时延从GPU HBM的数十纳秒降至纳秒级,且完全摒弃了传统cache层级,通过多颗LPU的SRAM互联形成分布式存储,彻底摆脱了外部内存的延迟束缚。

在执行逻辑上,LPU采用编译期预排程的确定性流水线,将LLM模型的运算过程锁定在固定处理路径,运行期无cachemiss、动态调度等不确定性,让Batch=1场景下的时延近乎无抖动,首token时延可压至百毫秒以内

Groq的实测数据印证了LPU的性能:运行Llama2-70B模型时,LPU的生成速度达300tokens/s,是H100集群的10倍;能效上,LPU从片上SRAM取数的单位能耗仅0.3pJ/bit,是HBM的1/20,每百万tokens能耗约0.9kWh,远低于H100的3.4kWh,综合能效是GPU的10倍。

如果用一张表看清CPU、GPU、NPU、LPU的核心差异,就能发现LPU的颠覆性并非来自“算力更强”,而是“精准适配”



当然,LPU并非完美的“算力万能解”,其架构取舍也带来了明显局限:单颗230 MB的SRAM存在明显的容量瓶颈,让其甚至无法容纳小型AI模型,运行Llama-370B需数百颗LPU串联,占用多个机柜,而GPU仅需2-4块即可实现;高度专用的架构让其无法适配训练、图形渲染等通用任务,对动态模型结构的适应性也较差;同时,大量芯片的堆叠推高了初始硬件投资和机房维护成本。

由此可见,英伟达的布局并非用LPU替代GPU,而是形成CPX/Rubin GPU负责Prefill(训练/大批量推理)、LPU负责Decode(实时推理)的PD分离模式,两者的核心是生态互补,而非替代,共同构建全场景的AI算力体系。

LPU的优势场景因此十分明确:聚焦于对首token时间和交互流畅度要求极高的时延敏感型推理,包括实时对话/多轮Agentic AI、实时语音助手/同声传译、游戏内NPC对话、高频金融交易/风控、军事/工业实时决策等小batch推理链路。这些场景正是未来AI商业化落地的核心领域,也让LPU成为英伟达算力生态的重要拼图。

02A股的叙事逻辑:从芯片架构到材料革命的价值传导

与市场最初的预期不同,英伟达LPU对A股的投资机会并非在“芯片制造”环节——LPU的核心技术掌握在英伟达与Groq手中,国内企业暂未参与芯片本体研发。真正的机会,在于LPU带来的服务器/机柜架构升级,以及由此引发的对高层数、高频高速PCB和高端材料的需求爆发,这也是Rubin架构带来的价值量提升逻辑的延续与放大。

LPU的架构特性决定了其系统层面的实现必须依赖“大规模芯片堆叠+高速互联”而这将再次直接推高对硬件基础的要求。英伟达计划推出的LPX/LPU机柜,从早期规划的64颗LPU升级为256颗,这些芯片将分布在多块52层、采用M9 Q glass基材的高多层PTH PCB上,按测算每颗LPU对应PCB价值量约200美元,单机柜PCB价值量的提升幅度远超传统AI服务器。更重要的是,LPU机柜呈现出显著的“板代线”效应,原本由线缆/交换芯片承载的功能,被转移到大尺寸、高层数、高速PCB上,直接抬升了PCB/覆铜板(CCL)的单机价值量。

而与Rubin/Feynman架构的协同,进一步放大了这种需求。英伟达Rubin平台已经推动了“无缆化+正交背板+CPO架构”的升级,采用M9+Q布、高端树脂+HVLP铜箔的高层数PCB取代传统铜缆;Rubin Ultra预计将PCB层数提升至78-144层,引入PTFE+Q glass M9混合中板;下一代Feynman芯片则计划采用3D堆叠LPU+背面供电,需要嵌埋无源器件的高复杂度PCB,对高阶HDI、多层板的需求进一步提升。可见核心逻辑十分清晰:要将上百甚至数百颗LPU串成“可编程装配线”,必须依靠大尺寸、高层数、高频高速PCB/中板,以及Q布、M9级树脂、HVLP铜箔等高端材料,才能保证信号完整性、供电稳定性与散热效率。

由此,LPU的价值传导路径在A股市场形成了清晰的两层核心受益体系,算力PCB制造高端材料成为绝对主线,相关企业凭借技术卡位与供应链绑定,成为这场架构革命的直接受益者。

第一层核心受益:算力PCB龙头,承接架构升级的量价齐升

算力PCB是LPU机柜架构升级的直接承载者,也是A股最确定的受益环节。Rubin架构已验证了AI服务器向30-70层高层数PCB升级的趋势,而LPU/LPX/Feynman架构则进一步提升了单机板数、层数与技术要求,为PCB企业带来“放量+提价”的戴维斯双击。更重要的是,在谷歌TPU、英伟达Rubin等前期产业链中,A股PCB龙头已深度参与,技术与供应链的绑定让其成为LPU时代的核心供应商。

胜宏科技作为全球首批量产6阶24层HDI板的企业,具备70层高精密板量产能力,直接服务英伟达GB200GPU基板与AI服务器主板,泰国/越南的扩产计划进一步绑定海外AI客户,被多方研报视为英伟达GPU/LPU板级核心供应商之一,充分受益于LPU机柜带来的高层数HDI板需求爆发;

沪电股份在高频高速板领域具备绝对优势,112Gbps高速板已规模化量产,支持224GbpsSerDes传输,为英伟达GB300/AI服务器提供高层PCB,且进入TPU产业链基板环节,是LPU机柜52层以上大板的核心供应者;

深南电路(002916.SZ)作为综合算力PCB龙头,同时布局AI服务器、交换机、高频高速板与IC载板,参与正交背板、CoWoP等新技术路线,2024年营收179.1亿元、净利润18.8亿元,ROE升至13.6%,AIPCB的放量已验证其盈利能力,LPU导入将进一步增加其中板/背板及嵌埋板需求;

广合科技(301086.SZ)作为二线算力PCB的代表,2024年营收37.3亿元、净利润6.76亿元,ROE提升至25.9%,凭借高规格多层板切入AI服务器领域,LPU带来的中板需求将进一步优化其订单结构。

此外,景旺电子(603228.SH)、鹏鼎控股(002938.SZ)、东山精密(002384.SZ)、兴森科技(002436.SZ)等企业,在多层板、HDI领域具备技术积累,且已在TPU/GPU服务器领域供货,LPU架构落地后,其算力业务占比将顺势抬升。从业绩基础来看,2024年胜宏科技、沪电股份、深南电路等PCB龙头均实现营收和利润的高速增长,AI服务器与高端PCB的高景气度已得到验证,这也为LPU带来的进一步升级奠定了良好的业绩基础。

第二层核心受益:高端材料赛道,卡位稀缺性的价值重构

如果说PCB是LPU机柜的“骨架”,那么高端材料就是其“血肉”。LPU/Rubin/Feynman架构对高频高速、低损耗、高稳定性的要求,让M9级覆铜板、HVLP高端铜箔、Q布/Low-CTE玻布、高端树脂成为核心需求,而这些材料领域的技术壁垒高、产能稀缺,A股具备技术卡位的企业将迎来价值重构。

电子布/Q布领域,菲利华是绝对的寡头,具备“石英砂-纤维-织布”一体化能力,其石英布Dk≈2.2、Df≈0.0005,已进入英伟达和台积电供应链,2026年石英布规划产能1400万米/年,市占率超46%,订单锁定1000万米,单价220-260元/米,2024年营收17.4亿元、净利润3.26亿元,是LPU架构中石英布的核心供应商;中材科技、中国巨石、宏和科技则在二代Low-Dk布、Q布领域具备龙头优势,产品指标通过英伟达认证,2026年高端布产能大幅扩张,成为英伟达/台光/生益等企业的核心供应商。

HVLP高端铜箔是高频高速PCB的关键材料,LPU机柜对信号完整性的要求让其需求激增,2026-2028年HVLP-4供需缺口预计分别达24%、40%、36%,供需失衡下价格上行趋势明确。

德福科技(301511.SZ)通过海外收购掌握HVLP-4技术,Ra≤0.5μm,已通过台光电子、生益科技认证,2026年HVLP全系产能规划1.5万吨/年,其中HVLP-4占60%,价格每上调2美元/kg,业绩增量约1.27亿元;

铜冠铜箔(301217.SZ)具备HVLP3-HVLP5全代系产能,HVLP-4通过生益科技、沪电股份认证,2026年产能1.2万吨/年,占全球高端HVLP产能的15%,利润弹性显著。尽管两家企业2024年因产能扩张处于利润承压阶段,但营收的正增长印证了行业需求的高景气,未来价格上行与产能释放将推动其盈利修复。

M9级树脂/覆铜板领域,东材科技(601208.SH)是国内M9级树脂核心供应商,2025年M9产能约5000吨,随着LPU渗透率提升需求激增,2026年以来产品已多轮涨价,被市场视作AI高端材料“十年一遇”的机会;

生益科技作为全球重要CCL厂商,在M8.5/M9级覆铜板上具备领先优势,是英伟达Rubin及高阶PCB的关键材料供应商,2024年营收203.9亿元、归母净利润17.4亿元,ROE升至12.2%,高端CCL的盈利修复已得到验证;华正新材、延江股份则在M9树脂及高端CCL领域布局,已进入英伟达/国内算力厂商新平台的放量验证阶段,成为资金关注的标的。

此外,LPU的导入带来的功耗密度提升,还将拉动液冷、CPO光互联等环节的需求,英维克(002837.SZ)等液冷企业、天孚通信(300394.SZ)等光器件企业将间接受益,但相比PCB与材料,其直接关联度较低,属于产业链的延伸机会。

结语:一场算力革命背后的产业逻辑重构

全球资本市场对英伟达LPU的预期,本质是AI推理端的一次技术升级,更是算力产业逻辑的一次重构,从“追求峰值算力”到“精准适配场景”,从“芯片单一竞争”到“系统架构协同”。

而对于A股市场而言,这场革命的核心并非追逐芯片概念的炒作,而是把握架构升级背后的硬科技卡位机会,那些具备高端PCB量产能力、掌握稀缺高端材料技术、深度绑定英伟达等头部算力企业的公司,才是真正的长期受益者。

当然,机会背后也存在着不确定性:LPU的商业放量节奏受TCO和应用场景制约,难以像GPU一样快速普及;Rubin Ultra、Feynman的技术路线仍需GTC 2026验证,产业内对PCB升级的幅度仍有分歧;部分材料企业当前估值已透支预期,业绩修复进度仍需跟踪。不可否认的是,AI推理端的低时延需求已是确定趋势,LPU作为这一趋势的核心载体,其带来的机柜架构升级与材料革命,将成为A股算力赛道下一阶段的核心主线。

在这场算力新变局中,卡位高端PCB与材料的核心环节,是握住AI推理时代的“金钥匙”。而A股市场的竞争,终究是技术迭代与供应链的竞争,这也是算力硬件板块最本质的投资逻辑。

免责声明:本文不构成投资建议,内容均来自于公开平台及券商研报,数据可能有滞后性,不保证内容的真实有效;文中内容不作为任何投资决策的参考,所涉及个股不作任何推荐,市场有风险,投资需谨慎。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。