OpenAI只用了9个月造出一颗芯片，行业平均要3年，英伟达真的开始慌了

IP属地中国·北京 编辑：周伟智元宇宙 时间：2026-06-25 14:20:09

9个月。
从一张白纸到芯片出片，OpenAI只花了9个月。这个行业正常走路，要两到三年。
这颗让全行业侧目的东西叫Jalapeño——墨西哥辣椒里辣度最温柔的一个品种。名字起得谦虚，事情做得一点都不客气。
6月24日，博通CEO陈福阳亲手把工程样片递到了Sam Altman手上。OpenAI，正式拿到了芯片俱乐部的入场券。
真正让业内坐不住的，不是这颗芯片跑分多高——实际上详细的技术报告还没公开。而是另外两件事：它是怎么来的，以及谁因此睡不着觉。
不练模型，只跑推理
别把Jalapeño当成通用GPU的替代品。它不负责训练模型。
它只有一件差事：当用户给ChatGPT发消息、让Codex改bug、请AI助手跑长任务的时候，在服务器那头用最低的功耗把推理算完。
听起来不如训练芯片热闹，但OpenAI的财务部门可是心里门儿清。训练砸一笔大钱也就结束了，推理却是每天汹涌几十亿次请求，电费、服务器折旧，没完没了。So，谁能把推理成本打下来，谁就能真正赚钱。
OpenAI给它的定位叫Intelligence Processor——智能处理器，而非行业惯用的AI加速器这个词——就是想说明这不是一个啥都能干的通用芯片，是专门为大模型推理从头设计的。
架构上三件事贯穿了全部设计：砍掉冗余的数据搬运、让计算与内存及网络的资源配比重新平衡、把实际有效利用率顶到离理论天花板最近的地方。
通俗讲就是——通用GPU跑AI时很多算力耗在了数据搬来搬去上，Jalapeño从架构层面解决了这个问题。
AI画了张电路图，给自己造了副身躯
一颗高端定制ASIC，从架构设计到送厂流片，18个月算快的。谷歌TPU两年一代，亚马逊Trainium也差不多。9个月是破纪录的速度。
关键因素有两个。
第一，AI参与了芯片设计。
芯片设计最耗时的环节不是构思方案，是验证——设计、仿真、debug、改、再仿真，反复成千上万轮，吃掉一半以上的开发时间。而AI恰恰擅长这种活：读历史设计数据、辅助写RTL代码、在验证阶段帮忙排查问题、参与布局优化。OpenAI在公告里明确说了，自家模型在加速设计流程上的表现超出预期。
这就形成了一个闭环：AI帮忙画芯片，芯片造出来跑AI，更强AI下次画更好的芯片。
第二，带队的人。
OpenAI硬件团队由Richard Ho领导。他在谷歌待了将近九年，是Cloud TPU的核心工程负责人，带着多代TPU从概念走到了量产。之后去了光子计算公司Lightmatter做高级副总裁，再早还联合创办了EDA公司0-In Design Automation。芯片设计、AI加速、光互联，三个领域全干过。
分工很明确：OpenAI管架构和内核，博通负责硅片实现和Tomahawk网络交换芯片，天弘科技Celestica做板卡和系统集成，台积电3nm制程制造。
英伟达看着客户名单，客户在另起炉灶
Jalapeño的意义比一颗芯片本身重得多。
拉一条时间线：2016年，谷歌率先发布TPU，当时英伟达GPU在AI训练圈几乎无人能敌。2018年，亚马逊端出推理芯片Inferentia，四年后又加了训练芯片Trainium。2023年，身为OpenAI第一大投资方和算力供应商的微软，自己下场亮了Maia。今年4月，路透社挖出Anthropic也在琢磨自研。
到6月24日，OpenAI把Jalapeño摆上桌面，圈子又扩了一个。
你把这串名字连起来读——谷歌、亚马逊、微软、Meta、OpenAI、Anthropic。每一个都曾是英伟达最舍得掏钱的座上宾，每一个都在暗处建起了自己的芯片工事。
Greg Brockman在发布声明中说得直截了当：世界正在迈向算力驱动的经济。
如果算力变成了和石油一样的基础资源，谁会把阀门全交给同一家供应商？
20美元月费买到的，可能翻倍
这件事的最大受益者不是投资人，不是技术极客，是每一个掏20美元开ChatGPT Plus的人。
推理成本砍下去，第一个直觉体感是速度快了。高峰期卡顿、排队转圈、聊久了越来越慢——这些毛病的根子全在推理算力不够分。同样规模的服务器集群，换上效率翻倍的芯片，吞吐用户的能力就翻倍。
再往下推一层，免费版的边界会被拓宽。现在深度研究、高级数据分析、完整版语音对话都锁在Plus里，不是因为功能本身成本高，而是给免费用户放开之后的算力账单吃不消。成本降下来，这道算术题的答案就变了。
而最隐蔽的变化不在价格标签上。20美元可能还是20美元，但你买到的东西完全不一样了——去年花这个钱只拿到一个GPT-4o，明年同样的钱可能到手的是一个能自主跑完整工作流的agent。月费不变，能力翻倍，这本质上就是推理成本降价带来的隐性赠送。
但Jalapeño瞄准的远不止现在的ChatGPT。
Richard Ho的思路是，芯片要按模型未来6到9个月的发展方向提前造。等agent产品真上了量，每次交互的算力消耗和今天一问一答完全不在一个量级。基础设施不提前准备，最致命的地方就会卡脖子。
从硅片到按钮，OpenAI想全捏在自己手里
OpenAI在公告里的表述很直白。
大意是：我们不仅在开发最前沿的模型，不仅在模型上面搭产品，我们还在设计模型底下的每一层——芯片架构、内核、内存系统、网络、调度、部署体系。
从硅片到用户指尖点下去的按钮，每一段链路都想自己控盘。
这套思路苹果走过，谷歌也走过。但OpenAI比它们多了一层——让AI参与建基础设施，再用更强的基础设施跑更强的AI。如果这个飞轮真的转顺了，它会自己踩油门。
首批部署定在2026年底，与微软等伙伴在吉瓦级数据中心落地。芯片和配套服务器不外卖，纯自用。博通CEO陈福阳在接受采访时甚至说，2027年1.3吉瓦的部署预测都偏保守了，需求远远跑在前面。
Jalapeño只是第一代。下一代叫什么还没人知道。
但设计它的，大概率不会再只是人了。

标签：芯片算力行业成本硅片用户网络 服务器 模型内核地方速度架构名字公司 投资人 技术问题内存部署工程边界拓宽理论板卡博通 高峰期 谷歌数据 供应商 数据中心 陈

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

SpaceX的成功，究竟能不能复制？

又双标？Anthropic指责阿里巴巴蒸馏其AI

闪现！马云低调现身麻省理工和哈佛大学

Saint-Gobain巴赞谈美国AI基建：“有钱，没电没人”

机构：Q1全球手持智能相机市场出货量414万台，同比增长33%

OpenAI博通联手发芯片，黄仁勋还能保持松弛吗？

全站最新

SpaceX的成功，究竟能不能复制？

又双标？Anthropic指责阿里巴巴蒸馏其AI

闪现！马云低调现身麻省理工和哈佛大学

Saint-Gobain巴赞谈美国AI基建：“有钱，没电没人”

热门推荐

SpaceX的成功，究竟能不能复制？

又双标？Anthropic指责阿里巴巴蒸馏其AI

闪现！马云低调现身麻省理工和哈佛大学

4部作品入选国家级IP推荐榜单盐言故事大力推进网文全链路IP开发

Saint-Gobain巴赞谈美国AI基建：“有钱，没电没人”

机构：Q1全球手持智能相机市场出货量414万台，同比增长33%

OpenAI博通联手发芯片，黄仁勋还能保持松弛吗？

华为汪涛预判2030：全球智能体千亿规模重写通信格局

岚图汽车公布代客泊车专利

OpenAI只用了9个月造出一颗芯片，行业平均要3年，英伟达真的开始慌了

Meta被曝使用AI取代人工审核员大模型已接管50%请求

宝丽来“另类营销”：趁数据中心还没把水喝干，赶紧下水玩吧

337亿对赌大限不足半年，货拉拉用“降抽成”能否换来第七次敲钟？

美光：人形机器人的存储容量是L2+汽车的十倍

俞浩上了新闻联播，个人社交账号被公司接管