本地也能跑万亿大模型：苹果与 LM Studio 联手解锁 Mac Studio 算力极限

IP属地中国·北京 编辑：大力财经头部财经 时间：2026-06-23 01:04:48

在刚刚落幕的 WWDC 2026 期间，人工智能的本地化部署迎来了一个标志性时刻。LM Studio 与苹果达成深度技术合作，成功在由四台 Mac Studio 组成的集群上，流畅运行了月之暗面的万亿参数大模型 Kimi K2.6。这一演示不仅打破了大型模型必须依赖云端集群的刻板印象，更展示了消费级硬件在承载前沿 AI 算力方面的巨大潜力。
Kimi K2.6 作为一款基于 MoE（混合专家）架构的巨型模型，其总参数规模达到惊人的 1 万亿。在四台 Mac Studio 的集群配置下，利用苹果强大的统一内存架构，该系统实现了约 1.5TB 的总内存容量，完美覆盖了该模型推理所需的内存带宽与存储需求。开发者测试数据显示，在这种集群架构下，Kimi K2.6 不仅能保持稳定的运行，特定模式下的生成速度甚至可达到约 28 tokens/s，且整体功耗远低于传统的企业级 GPU 集群。
除了展示强大的算力吞吐能力，本次合作还向外界演示了极具实用价值的跨设备协作场景。通过 LM Studio 旗下的 LM Link 功能，用户可以实现安全、远程的本地化访问。在演示中，研发人员通过 MacBook Neo 笔记本以及 iPhone，就能直接与集群上的模型进行高频互动。值得一提的是，所有交互过程中的数据处理均保留在本地局域网内，实现了真正的“私有化部署”，极大提升了数据隐私安全性。
随着 Thunderbolt 5 等先进互联技术的引入，多设备内存共享能力正成为苹果生态在 AI 时代的“护城河”。本次演示中所使用的 LM Link 功能，已于今年 6 月初正式适配 Mac 及 iOS 平台，支持端到端加密连接。
对于开发者与极客群体而言，这项进展释放了一个明确信号：随着硬件互联技术与本地推理平台的协同进化，万亿参数级的大模型将不再是巨头们的“专属”，通过高效的本地硬件集群，个人或小型团队同样能够构建出高性能、隐私可控的 AI 算力底座。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

解决飞行器“失控”“失明”难题

马云带队插秧，吴泳铭、邵晓锋、蒋凡、吴泽明、蒋芳等到场

雷军：攻击我的人只是为了流量

小米“寻天”SUV谍照来袭原厂自带车顶帐篷瞄准户外露营市场

暑期回国研学新选择：北上深杭科技之旅，让孩子边玩边学收获满满

喜欢合资轿车别错过！这三款车配置足舒适佳还省油，闭眼入不踩雷

全站最新

解决飞行器“失控”“失明”难题

马云带队插秧，吴泳铭、邵晓锋、蒋凡、吴泽明、蒋芳等到场

雷军：攻击我的人只是为了流量

小米“寻天”SUV谍照来袭原厂自带车顶帐篷瞄准户外露营市场

热门推荐

解决飞行器“失控”“失明”难题

马云带队插秧，吴泳铭、邵晓锋、蒋凡、吴泽明、蒋芳等到场

雷军：攻击我的人只是为了流量

字节切入网约车！豆包打车功能在北京、杭州开启灰度测试

马云率阿里高管下田插秧，以种田之道诠释AI战略深耕决心

谷歌DeepMind工程师：进顶尖AI实验室需具备目标感、毅力与数学成熟度

SpaceX加速布局AI算力市场与Reflection AI达成长期高额算力合作

DeepMind工程师揭秘：进顶尖AI实验室，需目标感、毅力与超强数学力

马云携阿里高管下田插秧，周靖人现身力破离职不实传闻

马云领衔阿里高层下田插秧首席科学家周靖人现身破离职传闻

第二代豆包AI手机将至：突破隐私困境，携手Agent开启智能协作新篇

XREAL AURA空间计算眼镜发布开启沉浸式体验新纪元助力“浦东智造”

广州苹果手机应急寄存指南：选正规直营机构，看透明流程与全额赔付保障

小米18系列发布有新动态：Pro版先发标准版随后，背屏与AI按键成亮点

小米YU7 GT纽北自动驾驶圈速破纪录，第一视角揭秘性能与科技魅力