据报道,苹果提出“多token预测”(MTP)技术,在不牺牲输出质量的情况下,可将大语言模型响应速度提升2至3倍,特定场景下最高可达5倍。传统大语言模型逐个输出token,速度受限。苹果研究发现模型内部蕴含对后续多个词的潜在判断能力,据此提出MTP框架,支持模型一次生成多个词。该技术通过“掩码”token作为占位符,并行推测后续多个词,并在推测结果与标准自回归解码结果不符时自动回退,确保输出质量。实验基于开源模型Tulu3 - 8B进行,训练其最多推测8个后续token,在问答和对话等通用任务中,响应速度平均提升2至3倍;在代码生成、数学推理等结构化场景中,提速可达5倍。
苹果MTP技术:大语言模型响应速度最高提升5倍
IP属地 中国·北京
编辑:钟景轩 三言科技 时间:2025-08-09 12:19:13
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
全站最新
热门推荐
- 江苏省沿海土地资源发展公司增资至18亿 增幅约13%
- 快手在北京成立米乐星科技公司 注册资本1000万
- 起底招聘要求余额超三百涉事公司
- 招聘条件引争议银行涉多起纠纷
- 华望半导体公司董事长变更
- 宋祖儿曾因合同纠纷被索赔700万
- 中金资本等在武汉成立创业投资基金 出资额20亿
- 宇树科技表演机器人专利获授权 可使机器人完成多种舞蹈动作
- 中国物流加速迈向智能化,现存物流相关企业超192万家
- 2030年将健全心理服务体系,现存心理咨询相关企业超14.9万家
- 3月我国汽车产销显著回暖,现存相关企业超175.6万家
- 光线传媒起诉白象食品侵权
- 三一重能在德州成立风电设备制造公司 注册资本1000万
- 从低谷到狂飙:新能源与储能产业的反转逻辑与增长动能
- 中国电动汽车海外“狂飙”,国内现存电动车相关企业超180万家





京公网安备 11011402013531号