机器之心发布
过去几年,大模型竞争主要发生在 AI 公司之间。但随着 AI 开始从数字世界进入真实设备与物理世界,竞争逻辑正在发生变化。
最近,机器之心注意到,一个长期相对低调、但拥有全球最大消费电子生态之一的科技巨头,正在快速进入大模型核心战场 ——三星 Samsung。
而且,它走的路线,和大多数互联网公司并不相同。
最近一段时间,三星连续发布多篇大模型相关工作,覆盖模型架构、强化学习、Physical AI 等多个方向。这些工作的背后,都在释放一个非常明确的信号:
三星正在全面构建自己的 Foundation Model 体系。
与此同时,据此前媒体报道,三星已经采购数万张 GPU,用于 AI 基础设施建设。随着 HBM 等高带宽存储需求在 AI 训练中持续爆发,三星在 AI 基础设施领域的优势,也开始被重新认识。
相比多数互联网公司,三星还有一个更特殊的优势:它不仅拥有模型能力,还拥有全球最完整软硬的生态之一。
从手机、智能家居到机器人设备,三星几乎覆盖了用户生活中的全部核心场景。而当 AI 开始从「聊天助手」进入「真实世界交互」阶段,这种生态能力的重要性,也正在迅速提升。
三星最近一项备受关注的工作,是其提出的Memory-Based 大模型新架构 Meki,尝试在资源受限条件下重新定义模型 Scaling 的方式。
![]()
论文地址:https://arxiv.org/pdf/2602.03359项目链接:https://github.com/ningding-o/MeKi
过去几年,大模型的发展逻辑非常直接:更大的参数规模、更大的训练数据,以及更强的算力。
但当 AI 开始进入真实设备与物理世界后,这条路径开始逐渐遇到限制。因为无论是移动设备、智能家居,还是机器人系统,端侧设备的 RAM、带宽与功耗都十分有限,而传统 Transformer 通常要求大量参数常驻内存运行,这使得模型规模很难持续扩大。
但另一方面,这些设备往往拥有远大于 RAM 的存储空间(ROM)。于是,三星提出了一个新的方向:能否利用 ROM,进一步扩展模型能力?
Meki 提出了一种 Memory-Based Architecture,通过参数化 Memory Bank 的方式,将大量知识存储在 ROM 中,并在推理过程中动态读取。简单来说,RAM 负责实时计算,ROM 负责知识存储,而模型则进一步突破端侧容量限制。
相比传统 Transformer,这种架构更加适合长期运行的端侧 AI 与 Physical AI 场景。尤其是在机器人等 Physical AI 系统中,模型不仅面临更严格的资源限制,同时还需要满足低延迟、实时交互与长期在线运行等要求,因此,这类面向端侧资源约束的架构创新,正在变得越来越重要。
除了模型架构外,三星近期提出的 M2RL,则进一步探索了 Multi-Domain RL 的训练范式。
![]()
论文地址:https://arxiv.org/pdf/2602.12566
随着 AI 开始进入真实设备与现实世界,仅靠静态数据已经越来越不够。模型需要与环境持续交互,需要感知设备状态,需要学习长任务,也需要适应动态世界。下一代基础模型,正在从「静态语言模型」演化为「交互式智能系统」。
在这一背景下,三星提出的 M2RL,系统研究了不同领域强化学习能力之间如何协同演化,包括混合多任务 RL、模型融合、多阶段后训练等方向。相关工作发现,数学、代码、科学推理等高密度推理任务之间,并不存在明显冲突,反而能够形成协同增强效应。这也意味着,强化学习正在推动基础模型持续获得更强的推理、规划与复杂环境交互能力。
此外,三星也开始布局面向物理世界智能的评测体系。其提出的 LiveClawBench,正试图解决一个行业越来越明显的问题:当 AI 开始真正进入设备、机器人与 Physical AI 场景后,传统 Benchmark 已经越来越难有效评测下一代模型能力。
![]()
论文地址:https://arxiv.org/abs/2604.13072
过去的大模型评测,大多基于静态任务、固定环境与标准答案,但真实世界中的 AI 系统并不是这样。现实环境中,设备状态会变化,任务链路更长,环境也更加复杂,模型需要持续感知、规划、执行与调整。对于真正运行在现实世界中的 AI 系统而言,仅靠「刷题式 Benchmark」已经远远不够。
为此,三星在 LiveClawBench 中提出了一个「三维复杂度框架」,从 Environment Complexity(环境复杂度)、Cognitive Demand(认知复杂度)以及 Runtime Adaptability(运行时适应能力)三个维度,系统评测模型在真实复杂环境中的长期任务执行能力。
相比传统 Agent Benchmark,LiveClawBench 更强调真实任务链路、多环境协同以及复杂长期任务。某种意义上,它正在探索的,其实是:当 AI 真正进入物理世界后,下一代智能系统应该如何被评测。
这些工作的背后,都来自三星一个新组建的核心技术攻坚组织:AI Model TF。
公开信息显示,TF(Task Force)是三星面向公司级战略任务设立的核心攻坚组织,通常承担决定未来核心竞争力的关键技术方向。
而 AI Model TF,则是三星于 2025 年由集团 CTO 直接推动成立的大模型团队,核心定位是面向三星全球业务体系,打造先进的 Foundation Model 能力,以此为根基向物理智能(Physical AI) 方向演进。
在业内看来,这也释放出一个非常明确的信号:三星正在以前所未有的战略力度,加速投入下一代 AI 能力建设,并将其提升至集团级核心战略高度。
相比传统互联网公司,三星不仅拥有模型研发能力,还同时具备覆盖手机、家居、机器人到底层芯片与 AI 基础设施的全球最完整终端设备生态,这也使其天然具备将大模型落地到真实物理世界与用户场景中的能力。
随着大规模 GPU 集群与 AI 基础设施持续投入,AI Model TF 正在快速聚集基础模型、强化学习等方向的核心人才,被外界视为三星下一代 AI 战略最关键的技术组织之一,也承载着三星在 Foundation Model、Physical AI 等未来智能体系上的核心突破任务。
而近期这些工作的通讯作者,均为AI Model TF 负责人、三星高级技术总监唐业辉。据了解,他目前主要负责三星大模型训练与核心技术方向推进,长期深耕基础模型与 Physical AI,在超大规模模型训练、模型架构与系统优化等方向拥有深厚积累。其研究重点涵盖高效模型、Agentic AI、World Model 等前沿领域,并拥有基于万卡集群开展超大规模模型训练的丰富经验。
从三星近期在基础模型、端侧智能与 Physical AI 等方向持续取得的突破来看,这或与其快速搭建的高水平 AI 人才体系密切相关。
公开资料显示,唐业辉博士毕业于北京大学,Google Scholar 引用超过 1.3 万次,并长期担任 NeurIPS、ICML 等国际顶级 AI 会议的领域主席。





京公网安备 11011402013531号