据报道,苹果提出“多token预测”(MTP)技术,在不牺牲输出质量的情况下,可将大语言模型响应速度提升2至3倍,特定场景下最高可达5倍。传统大语言模型逐个输出token,速度受限。苹果研究发现模型内部蕴含对后续多个词的潜在判断能力,据此提出MTP框架,支持模型一次生成多个词。该技术通过“掩码”token作为占位符,并行推测后续多个词,并在推测结果与标准自回归解码结果不符时自动回退,确保输出质量。实验基于开源模型Tulu3 - 8B进行,训练其最多推测8个后续token,在问答和对话等通用任务中,响应速度平均提升2至3倍;在代码生成、数学推理等结构化场景中,提速可达5倍。
苹果MTP技术:大语言模型响应速度最高提升5倍
IP属地 中国·北京
编辑:钟景轩 三言科技 时间:2025-08-09 12:19:13
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
全站最新
热门推荐
- 春晚上“夸父”追的太阳,竟然是它?
- 蔚来“分芯”:李斌暂缓一下焦虑
- 1亿用户、80%暴跌:全球最大在线白板公司的自救
- 谷歌不相信眼泪,但相信运气
- 娄底抖音短视频方案|长沙新博雅数字科技有限公司全域营销体系
- 华为云码道引爆AI编程革命!10大核心企业产业链深度解析
- 2025年微博热点趋势报告:活人感
- 2026年AI智能体趋势报告重塑角色工作流程与商业价值的五大转向-谷歌云
- 杭州小程序定制开发公司品牌精选(2026最新版):小程序开发公司哪家强?
- 预算两千多,这台过气手机把新机都卷麻了。。。
- 疑似Vision GT概念超跑现身后,小米宣布MWC还有One more thing
- 杭州小程序定制开发公司品牌精选(2026最新版):小程序开发公司哪家强?
- 算力救不了AI智商?谷歌新大招终结「随机鹦鹉」争论!
- 亚马逊豪掷500亿美元投资OpenAI,共建有状态AI开发环境
- 美国“无法接受”,马斯克赞不绝口,这位中国年轻人实在强得可怕





京公网安备 11011402013531号