
9个月。
从一张白纸到芯片出片,OpenAI只花了9个月。这个行业正常走路,要两到三年。
这颗让全行业侧目的东西叫Jalapeño——墨西哥辣椒里辣度最温柔的一个品种。名字起得谦虚,事情做得一点都不客气。
6月24日,博通CEO陈福阳亲手把工程样片递到了Sam Altman手上。OpenAI,正式拿到了芯片俱乐部的入场券。
真正让业内坐不住的,不是这颗芯片跑分多高——实际上详细的技术报告还没公开。而是另外两件事:它是怎么来的,以及谁因此睡不着觉。
不练模型,只跑推理
别把Jalapeño当成通用GPU的替代品。它不负责训练模型。
它只有一件差事:当用户给ChatGPT发消息、让Codex改bug、请AI助手跑长任务的时候,在服务器那头用最低的功耗把推理算完。
听起来不如训练芯片热闹,但OpenAI的财务部门可是心里门儿清。训练砸一笔大钱也就结束了,推理却是每天汹涌几十亿次请求,电费、服务器折旧,没完没了。So,谁能把推理成本打下来,谁就能真正赚钱。
OpenAI给它的定位叫Intelligence Processor——智能处理器,而非行业惯用的AI加速器这个词——就是想说明这不是一个啥都能干的通用芯片,是专门为大模型推理从头设计的。
架构上三件事贯穿了全部设计:砍掉冗余的数据搬运、让计算与内存及网络的资源配比重新平衡、把实际有效利用率顶到离理论天花板最近的地方。
通俗讲就是——通用GPU跑AI时很多算力耗在了数据搬来搬去上,Jalapeño从架构层面解决了这个问题。
AI画了张电路图,给自己造了副身躯
一颗高端定制ASIC,从架构设计到送厂流片,18个月算快的。谷歌TPU两年一代,亚马逊Trainium也差不多。9个月是破纪录的速度。
关键因素有两个。
第一,AI参与了芯片设计。
芯片设计最耗时的环节不是构思方案,是验证——设计、仿真、debug、改、再仿真,反复成千上万轮,吃掉一半以上的开发时间。而AI恰恰擅长这种活:读历史设计数据、辅助写RTL代码、在验证阶段帮忙排查问题、参与布局优化。OpenAI在公告里明确说了,自家模型在加速设计流程上的表现超出预期。
这就形成了一个闭环:AI帮忙画芯片,芯片造出来跑AI,更强AI下次画更好的芯片。
第二,带队的人。
OpenAI硬件团队由Richard Ho领导。他在谷歌待了将近九年,是Cloud TPU的核心工程负责人,带着多代TPU从概念走到了量产。之后去了光子计算公司Lightmatter做高级副总裁,再早还联合创办了EDA公司0-In Design Automation。芯片设计、AI加速、光互联,三个领域全干过。

分工很明确:OpenAI管架构和内核,博通负责硅片实现和Tomahawk网络交换芯片,天弘科技Celestica做板卡和系统集成,台积电3nm制程制造。
英伟达看着客户名单,客户在另起炉灶
Jalapeño的意义比一颗芯片本身重得多。
拉一条时间线:2016年,谷歌率先发布TPU,当时英伟达GPU在AI训练圈几乎无人能敌。2018年,亚马逊端出推理芯片Inferentia,四年后又加了训练芯片Trainium。2023年,身为OpenAI第一大投资方和算力供应商的微软,自己下场亮了Maia。今年4月,路透社挖出Anthropic也在琢磨自研。
到6月24日,OpenAI把Jalapeño摆上桌面,圈子又扩了一个。
你把这串名字连起来读——谷歌、亚马逊、微软、Meta、OpenAI、Anthropic。每一个都曾是英伟达最舍得掏钱的座上宾,每一个都在暗处建起了自己的芯片工事。
Greg Brockman在发布声明中说得直截了当:世界正在迈向算力驱动的经济。
如果算力变成了和石油一样的基础资源,谁会把阀门全交给同一家供应商?
20美元月费买到的,可能翻倍
这件事的最大受益者不是投资人,不是技术极客,是每一个掏20美元开ChatGPT Plus的人。
推理成本砍下去,第一个直觉体感是速度快了。高峰期卡顿、排队转圈、聊久了越来越慢——这些毛病的根子全在推理算力不够分。同样规模的服务器集群,换上效率翻倍的芯片,吞吐用户的能力就翻倍。
再往下推一层,免费版的边界会被拓宽。现在深度研究、高级数据分析、完整版语音对话都锁在Plus里,不是因为功能本身成本高,而是给免费用户放开之后的算力账单吃不消。成本降下来,这道算术题的答案就变了。
而最隐蔽的变化不在价格标签上。20美元可能还是20美元,但你买到的东西完全不一样了——去年花这个钱只拿到一个GPT-4o,明年同样的钱可能到手的是一个能自主跑完整工作流的agent。月费不变,能力翻倍,这本质上就是推理成本降价带来的隐性赠送。
但Jalapeño瞄准的远不止现在的ChatGPT。
Richard Ho的思路是,芯片要按模型未来6到9个月的发展方向提前造。等agent产品真上了量,每次交互的算力消耗和今天一问一答完全不在一个量级。基础设施不提前准备,最致命的地方就会卡脖子。
从硅片到按钮,OpenAI想全捏在自己手里
OpenAI在公告里的表述很直白。
大意是:我们不仅在开发最前沿的模型,不仅在模型上面搭产品,我们还在设计模型底下的每一层——芯片架构、内核、内存系统、网络、调度、部署体系。
从硅片到用户指尖点下去的按钮,每一段链路都想自己控盘。
这套思路苹果走过,谷歌也走过。但OpenAI比它们多了一层——让AI参与建基础设施,再用更强的基础设施跑更强的AI。如果这个飞轮真的转顺了,它会自己踩油门。
首批部署定在2026年底,与微软等伙伴在吉瓦级数据中心落地。芯片和配套服务器不外卖,纯自用。博通CEO陈福阳在接受采访时甚至说,2027年1.3吉瓦的部署预测都偏保守了,需求远远跑在前面。
Jalapeño只是第一代。下一代叫什么还没人知道。
但设计它的,大概率不会再只是人了。





京公网安备 11011402013531号