苹果MTP技术：大语言模型响应速度最高提升5倍

IP属地中国·北京 编辑：钟景轩三言科技 时间：2025-08-09 12:19:13

据报道，苹果提出“多token预测”（MTP）技术，在不牺牲输出质量的情况下，可将大语言模型响应速度提升2至3倍，特定场景下最高可达5倍。传统大语言模型逐个输出token，速度受限。苹果研究发现模型内部蕴含对后续多个词的潜在判断能力，据此提出MTP框架，支持模型一次生成多个词。该技术通过“掩码”token作为占位符，并行推测后续多个词，并在推测结果与标准自回归解码结果不符时自动回退，确保输出质量。实验基于开源模型Tulu3 - 8B进行，训练其最多推测8个后续token，在问答和对话等通用任务中，响应速度平均提升2至3倍；在代码生成、数学推理等结构化场景中，提速可达5倍。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

理想L6升级51kWh电池包：增程老将转型，纯电浪潮下如何破局突围？

2026海南欢乐节启幕！欢乐巴士、自驾、公交等多样出行攻略来啦

阿里“AI编程第一”，智谱、Kimi答应吗？

B站连续三年亮相WAIC 月均超1.9亿用户消费AI内容

华为MateBook Pro获国家级人工智能认证L3级首证

Kimi K3震荡美股，有望最快6个月内港股上市

全站最新

理想L6升级51kWh电池包：增程老将转型，纯电浪潮下如何破局突围？

2026海南欢乐节启幕！欢乐巴士、自驾、公交等多样出行攻略来啦

保时捷911 GT3测试车现身纽北，“鸭尾”设计重现经典元素引关注

智己LS9 Hyper携线控转向入场30万级市场，技术实力能否撬动销量？

热门推荐

理想L6升级51kWh电池包：增程老将转型，纯电浪潮下如何破局突围？

2026海南欢乐节启幕！欢乐巴士、自驾、公交等多样出行攻略来啦

五菱星光L上市，思行：产品外观在所有的购车因素里排名第一

阿里“AI编程第一”，智谱、Kimi答应吗？

B站连续三年亮相WAIC 月均超1.9亿用户消费AI内容

华为MateBook Pro获国家级人工智能认证L3级首证

Kimi K3震荡美股，有望最快6个月内港股上市

实测Kimi K3：强得意外，慢得着急

吉利银河同款技术下放！领克20官宣搭载全球首款16合1电驱

造车新规矩落地！工信部要求车企自查零部件供应链一致性

一只猴卖20万！净利润飙涨超1300%，“猴茅”昭衍新药赚翻了

黄牛捏造张凌赫三地见面会疯狂售票阿维塔发布严正声明

荣耀CEO李健：AI将向“伙伴型类人生命体”演进

机器人不缺表演，缺的是工作经验

网传尚界汽车脱离鸿蒙智行，官方辟谣