据报道,苹果提出“多token预测”(MTP)技术,在不牺牲输出质量的情况下,可将大语言模型响应速度提升2至3倍,特定场景下最高可达5倍。传统大语言模型逐个输出token,速度受限。苹果研究发现模型内部蕴含对后续多个词的潜在判断能力,据此提出MTP框架,支持模型一次生成多个词。该技术通过“掩码”token作为占位符,并行推测后续多个词,并在推测结果与标准自回归解码结果不符时自动回退,确保输出质量。实验基于开源模型Tulu3 - 8B进行,训练其最多推测8个后续token,在问答和对话等通用任务中,响应速度平均提升2至3倍;在代码生成、数学推理等结构化场景中,提速可达5倍。
苹果MTP技术:大语言模型响应速度最高提升5倍
IP属地 中国·北京
编辑:钟景轩 三言科技 时间:2025-08-09 12:19:13
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
全站最新
热门推荐
- 3.4亿“地中海”,撑起蔓迪国际IPO
- 就业越“难”,BOSS直聘越“赚”?
- 中金“三合一”整合,券业再添“万亿级”新玩家
- 《狂野时代》的文青病,易烊千玺也遭不住
- 英伟达不香了?Meta要买谷歌TPU
- 必胜客客单价6年降了40块,但还是比萨莉亚贵
- 惠普计划裁员 6000 人,未来将加大 AI 工具应用
- OpenAI 与 Perplexity 进军 AI 购物,垂直领域初创公司面临挑战与机遇
- 华纳音乐与 AI 音乐平台 Suno 达成和解,版权争议告一段落
- 百度宣布新设两大模型研发部 均向李彦宏直接汇报
- 小马智行宣布将无人驾驶车队扩大两倍,商业化加速致营收激增72%
- 当 AI 出错时,谁该为其负责?研究揭示共享责任的重要性
- iPhone Pocket卖光了:已全球售罄 售价1299元
- xAI 宣布 Grok5将在2026年公开挑战《英雄联盟》顶级职业战队
- 首款真全面屏iPhone或到来?iPhone Fold首发苹果屏下前摄技术





京公网安备 11011402013531号