当前位置: 首页 » 资讯 » 科技头条 » 正文

揭秘英伟达RTX Spark个人电脑 将数据中心级算力压进了一台笔记本

IP属地 中国·北京 编辑:周伟 小互AI 时间:2026-06-03 10:14:54

我们用了 40 年的个人电脑,这一周被重新发明了一次。

在英伟达 GTC Taipei 2026 上黄仁勋掏出一颗叫 RTX Spark 的超级芯片,宣布他们要重新定义 Windows 电脑。

这是 NVIDIA 十多年来第一次进入PC 处理器市场,也是它从数据中心向消费端延伸的关键一步。

这不是一款传统的、简单的个人PC电脑...

甚至它都不是为人类设计的

正如黄仁勋所说:以后的电脑,不再是你打开软件点来点去的机器,而是一台 AI Agent 替你干活的机器。

自动播放

RTX Spark 是英伟达首款面向 Windows 笔记本和迷你桌面 PC 的 ARM 架构超级芯片。

由英伟达与联发科联合设计,台积电 3nm 工艺制造,将 Blackwell GPU、Grace CPU 和最高 128GB 统一内存封装在同一块芯片上,FP4 AI 算力达到 1 PetaFLOP。

核心信息:

•20 核 Grace CPU + 6144 CUDA 核心 Blackwell GPU + 最高 128GB 统一内存,单芯片封装

•NVLink C2C 片内互连带宽 600 GB/s,是 PCIe Gen 5 的 5 倍

•本地可运行 1200 亿参数大模型,上下文窗口支持 100 万 token

•与微软合作推出 OpenShell 安全框架,让 AI Agent 原生跑在 Windows 上

•支持最新 DLSS 光追游戏,1440p 分辨率下 100+ FPS

•Adobe、Blender、剪映、ComfyUI 等 100 多家软件商首批适配

•ASUS、Dell、HP、Lenovo、MSI 多家 OEM 今年晚些时候出货

•路线图覆盖三代:Blackwell(2026)→ Vera Rubin(2027—2028)→ Feynman(2030)

先搞懂它到底想干什么

过去你怎么用电脑?打开 Word 写文档、打开 PS 修图、打开 PR 剪视频、打开浏览器查资料。无非是人坐在屏幕前点来点去,软件只是放在那里等你用的工具。

老黄这次想把这套逻辑彻底反转:未来不是人操作软件,而是 Agent 替你完成整件事。

这不是换个聊天框那么简单。Agent 跟你平时用的 ChatGPT、Claude 不一样,你问 ChatGPT 一句,它答完就断了。而一个真正干活的 Agent 需要常驻在你的电脑上,持续盯着你在做什么,自己去读本地文件、打开应用、调用模型、管理一堆子任务,而且很多操作你压根不希望它发到云端。

一旦电脑要服务的对象从「人」变成「Agent」,硬件的设计前提就全变了。人点一下鼠标多等两秒并不敏感,但 Agent 活在一个纳秒级的世界里,它要不停地调模型、读文件、跑代码、开软件,每慢一步整条任务都卡住。

所以这台电脑的每个部件,都是按「伺候一个不知疲倦的数字员工」重新设计的。

硬件:三颗心脏装进一块芯片

先说最硬的部分。

过去 PC 里 CPU 和 GPU 是两块独立芯片,中间靠 PCIe 总线传数据,这条路本身就是瓶颈。RTX Spark 干脆把 CPU、GPU、内存全部封装在一起,用 NVIDIA 自家的高速通道直连。

过去 CPU 和 GPU 之间隔着一条单车道公路,数据排队慢慢过;现在直接换成了五车道高速,数据搬运速度快了 5 倍。

具体配置:

CPU:20 核 ARM 架构(10 个大核 + 10 个能效核),联发科参与设计

GPU:Blackwell 架构,6144 个 CUDA 核心,规格和桌面端 RTX 5070 同级

内存:最高 128GB 统一内存,CPU 和 GPU 共用同一块内存池

AI 算力:FP4 精度下达到 1 PetaFLOP

翻译一下这堆参数:

CPU 管通用计算(开软件、跑程序),GPU 管并行计算(跑 AI 模型、渲染画面),过去它俩是两块独立芯片,各有各的内存,数据来回搬。

RTX Spark 把三者焊死在一块芯片上,共用 128GB 内存,就像一个人同时用左右脑还共享同一块记忆,左边想到什么右边瞬间就知道,不用再转述。6144 个 CUDA 核心意味着 GPU 部分的规格已经和你能买到的 RTX 5070 独立显卡同级。

而 1 PetaFLOP 的 AI 算力,换算过来是每秒一千万亿次运算,相当于把一个小型数据中心的 AI 处理能力压进了一颗笔记本芯片。

这里面最关键的一个设计,是「统一内存」。

普通笔记本跑大模型,数据要在 CPU 内存和 GPU 显存之间来回搬,搬一趟就慢一截。

RTX Spark 让 CPU 和 GPU 直接读写同一块 128GB 内存池,不用搬,不用等。

黄仁勋现场演示了一台原型机:同时跑 700 亿参数大模型(超过 40 tokens/秒)、实时视频分析和代码生成,全程靠电池供电

用过 MacBook 跑本地模型的人一看就懂,RTX Spark 想做的就是「NVIDIA 版的 Apple Silicon」,但加上了完整的 CUDA 生态。

英伟达给的本地能力上限是:能跑 1200 亿参数大模型,上下文支持 100 万 token。

翻译成人话就是,模型参数越多越聪明,1200 亿参数已经接近 GPT-4 级别的推理能力;对比一下,多数轻薄本受显存限制只能流畅跑 70 亿到 140 亿参数级的模型(大概是 ChatGPT 3.5 水平),要本地上 70B 通常得靠多卡工作站。RTX Spark 把这条线整整抬高了一个数量级。

不只是跑模型:这是一台 Agent 电脑

黄仁勋给 RTX Spark 的定位不是「AI 加速器」,而是「个人 AI 电脑」。区别在哪里?

过去你用 ChatGPT 或 Claude,每次请求都发到云端,模型帮你回答完就断了。

Agent 不一样,它需要常驻在你的设备上,持续观察你在做什么,调用本地文件、操作应用、管理多个子任务,而且对隐私要求高,很多操作你不希望离开本机。

为此微软专门给 RTX Spark 做了一套系统级方案:

Windows 安全基元:相当于给 Agent 发了张「工牌」,先验明身份,再圈一块沙箱让它干活,你定的规矩它越不过去。等于给一个能动你文件的 AI 上了三道锁

NVIDIA OpenShell:你可以自定义 Agent 能做什么、不能做什么;敏感请求优先交给本地模型处理,真要发到云端的内容会先脱敏

比如你在笔记本上跑一个本地 Agent,让它帮你整理本周的项目文档、汇总邮件要点、生成周报初稿。整个过程不离开本机,Agent 直接读取本地文件和邮件客户端数据,你的工作内容不经过任何云服务。

开源 Agent 项目 OpenClaw(OpenClaw 基金会)和 Hermes Agent已经在用这套安全框架开发 Windows 端的应用。

这些 Agent 可以在 Windows 应用内执行任务、跨应用推理工作流、生成图像视频、编写插件,还能对本地文件做语义搜索。

老黄现场那个建筑设计的例子

光说概念太虚,老黄在台上演示的那个建筑设计案例,看一眼就懂「Agent 替你干活」长什么样。

过去设计一套房子,流程是这样:查资料、画草图、建模型、排房间格局,再导入 Blender 加材质、打光、渲染出图。每一步都得人盯着、人动手。

现在的 Agent 是这么干的:你给它一张草图、一块风格板、一段文字需求,它自己读懂,自己打开 Rhino 建模,规划房间、墙体、门窗和动线,中途发现错误还能自动修正;做完再导入 Blender,调用生成式 AI,直接出照片级的效果图。

自动播放

整条链路,人从「每一步的操作者」变成了「提需求、做决策的那个人」。这才是这台电脑想卖的东西。

软件生态:不是 PPT,是首批适配名单

硬件再强,主流软件不跟也是白搭。RTX Spark 这次的首发阵容相当扎实,而且不少是「为它专门改」的级别。

创作工具

Adobe 专门为 RTX Spark 重写了 Photoshop 和 Premiere Pro 的核心渲染引擎,支持 Agent 加速创作工作流。Blackmagic Design、Blender 5.3、剪映(CapCut)、ComfyUI、OTOY 也都是首批适配。

官方演示的场景:用 OptiX 和 DLSS 渲染超过 90GB 的 3D 场景,用 Blackwell 视频解码器编辑 12K 4:2:2 视频,用 ComfyUI 生成 4K AI 视频,全部在一台笔记本上完成。

自动播放

AI 开发

本地推理方面,llama.cpp 和 vLLM 借助投机解码(一次预测多个 token 再批量校验)拿到 2 倍性能提升,ComfyUI 也做了多 GPU 优化。H Company 发布了专为 RTX 和 DGX PC 优化的桌面 Agent 工具和新模型。

游戏

最新的 DLSS 光线重建(Transformer 模型)、多帧生成、Reflex、G-Sync,完整的 RTX 游戏技术栈全部支持。官方数据:开启光追和 DLSS 后,1440p 分辨率下 3A 游戏可以跑到 100 FPS 以上。

自动播放

黄仁勋原话:It runs everything the world has ever created, plus AI agents.

超过 1000 款游戏和应用已经支持 RTX 技术,KRAFTON、网易、Remedy Entertainment、Riot Games、XBOX 等游戏开发商也在适配这个新平台。

和 DGX Spark 是什么关系?

可能有人会想起去年的 DGX Spark,容易搞混,这里捋一下。

去年那台 DGX Spark 用的是同源的 GB10 芯片(同样是 Grace CPU + Blackwell GPU 的组合),但跑 Linux,定位是开发者的桌面 AI 工作站,售价 4200 英镑(约合人民币 3.8 万元)。

RTX Spark 其实就是把同源芯片带进 Windows 生态,做成笔记本和迷你 PC,面向更广的消费和专业用户,比如 MSI 就拿它做了一台 Mini PC。

同时 NVIDIA 还发布了更高一档的 DGX Station for Windows,基于 GB300 Grace Blackwell Ultra 超级芯片,最高 748GB 统一内存、20 PetaFLOP FP4 算力(RTX Spark 的 20 倍),面向需要在本地做重度 AI 开发的专业用户。

同时 NVIDIA 还发布了更高一档的 DGX Station for Windows,基于 GB300 Grace Blackwell Ultra 超级芯片,最高 748GB 统一内存、20 PetaFLOP FP4 算力(RTX Spark 的 20 倍),面向需要在本地做重度 AI 开发的专业用户。

三者的分层一张表看清:

公开承诺三代十年的路线图,对 OEM 和软件伙伴是个重要的信任信号。做一颗芯片不难,难的是围绕它把硬件生态、软件适配和开发者社区都建起来,那才是真正的壁垒。

一个值得追问的问题

叙事很漂亮,硬件参数也漂亮,不过有个信号不能忽略:Geekbench 6(一个跨平台的 CPU 性能测试工具,业内最常用的横向对比基准)的跑分显示,这颗 20 核 CPU 的通用计算性能,没跑赢苹果 2023 年的 M3 Max。

这说明 RTX Spark 的竞争力压根不在传统 CPU 性能上,而在 GPU 算力和 CUDA 生态上。如果你的活儿重度依赖 CUDA,比如本地跑模型、ComfyUI 出图、Blender 渲染、视频编辑,它的价值一目了然。但如果你日常就是轻办公、刷网页、写文档,现在的 Apple Silicon 或 Snapdragon X 可能依然更趁手。

说到底,NVIDIA 赌的是未来每台 PC 上都常驻一个 AI Agent,而 Agent 要的不是更快的 CPU 单核,是更大的内存池、更强的 GPU 算力,加一整套完整的 AI 软件栈。如果这个赌注成立,RTX Spark 就是提前占住了那个入口。PC 行业真正的战争,可能今天才刚刚开始。

标签: 内存 芯片 agent 模型 ai nvidia 笔记本 windows 参数

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新