MIT携手英伟达开发TLT技术，推理大模型训练效率最高提速210%

IP属地中国·北京 编辑：陈丽 IT之家 时间：2026-02-28 12:11:53

IT之家 2 月 28 日消息，MIT News 于 2 月 26 日发布博文，报道称麻省理工学院（MIT）联合英伟达等机构，发布“驯服长尾”（TLT）技术，可以大幅提升推理大语言模型（LLM）的训练效率。
IT之家援引博文介绍，推理大模型擅长通过拆解步骤来解决复杂问题，但在强化学习（RL）的训练过程中，算力与能耗的消耗极为巨大。
研究团队发现，生成多个备选答案的“推演”（rollout）阶段占据了高达 85% 的训练时间。由于不同处理器生成回答的长度不一，完成较快的处理器只能被迫闲置，等待其他处理器完成长文本任务，从而形成了严重的效率瓶颈。
MIT 研究人员为解决该痛点，联合英伟达、苏黎世联邦理工学院等机构，提出了一种名为“驯服长尾（TLT）”的自适应解决方案。
该方案的核心在于创新性地运用“投机解码”技术，即训练一个较小的“草稿模型”（drafter）来快速预测大模型的未来输出，随后由大模型批量验证这些猜测。这样一来，大模型无需逐个顺序生成输出，从而大幅加快了处理进程。
在传统的投机解码中，草稿模型通常只训练一次并保持静态。然而在强化学习中，主模型需要更新数千次，静态草稿模型会迅速失效。
因此，TLT 系统引入了“自适应草稿训练器”。一旦部分处理器完成短查询进入闲置状态，系统会立即调度它们实时训练草稿模型。
同时，“自适应推演引擎”会根据工作负载特征自动调整解码策略，确保草稿模型始终与目标大模型保持高度同步，且不增加额外算力开销。
基于真实世界数据集的测试表明，TLT 技术在保持模型准确率完全无损的情况下，将多个推理大语言模型的训练速度提升了 70% 到 210%。
不仅如此，训练得到的轻量级草稿模型还可以作为免费的副产品，直接用于后期的高效部署。研究团队未来计划将该技术融入更多训练与推理框架中，进一步降低 AI 开发成本并提升能源利用率。

标签：模型草稿 处理器 技术解码算力投机闲置机构方案 真实世界 驯服 创新性 效率 麻省理工学院 痛点能源系统博文人员 利用率 苏黎世 联邦 理工学院 测试表明 团队策略目标传统

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

2.8万亿、全球最大、马斯克第二次点赞：Kimi K3凭什么刷屏海内外

腾讯联合越疆，“物理AI”走进制造工厂｜直击WAIC

“优必选们”急需打补丁

WAIC观察｜越疆携手腾讯，让Physical AI走进真实工厂

阿里云王坚：对AI理解科学的想象，还局限在人类写出来的知识里

智元精灵G2 Max人形机器人发布，将应用于京东物流智狼仓

全站最新

吉利发布“雷霆16合1智能电驱” 打破技术壁垒树新能源自研新标杆

2.8万亿、全球最大、马斯克第二次点赞：Kimi K3凭什么刷屏海内外

腾讯联合越疆，“物理AI”走进制造工厂｜直击WAIC

“优必选们”急需打补丁

热门推荐

红米新机来袭：7英寸大屏搭配8K级大电池，新功能加持现已火热开售

首批L3级AI终端测试结果出炉联想42款产品领跑行业占比超六成

2.8万亿、全球最大、马斯克第二次点赞：Kimi K3凭什么刷屏海内外

腾讯联合越疆，“物理AI”走进制造工厂｜直击WAIC

“优必选们”急需打补丁

报道：苹果与美国司法部就反垄断案进行早期和解谈判

WAIC观察｜越疆携手腾讯，让Physical AI走进真实工厂

GameStop CEO：索尼停产实体游戏盘对我们无关紧要

国产大模型Kimi K3自主设计AI芯片：45nm工艺 100Mhz频率

社评：面对人工智能时代之问，世界期待中国方案

阿里云王坚：对AI理解科学的想象，还局限在人类写出来的知识里

智元精灵G2 Max人形机器人发布，将应用于京东物流智狼仓

企业级Agent落地生产困境何解？评估先行成破局关键密码

高德问店上线：AI赋能商户，一站式解决选址经营难题获用户好评

AI产品开箱即用腾讯智能体集中亮相WAIC