谷歌开源26B文本扩散MoE，劈柴：生成速度像赛马一样快

IP属地中国·北京 编辑：苏婉清机器之心Pro 时间：2026-06-12 00:25:55

机器之心编辑部
今天一早，谷歌又发新模型了！
Gemmna 家族有了新成员 ——DiffusionGemma，一个探索文本扩散的实验性开源模型，在文本生成任务上速度极快。
根据官方介绍，DiffusionGemma 采用了 Apache 2.0 许可证发布，是一个 26B 规模的混合专家模型（MoE）。
该模型没有沿用典型自回归大语言模型（LLM）那种按顺序、逐 token 生成的方式，而是可以同时生成整块文本，在 GPU 上，文本生成速度最高可提升至 4 倍。
DiffusionGemma 建立在 Gemma 4 家族业界领先的「每参数智能水平」之上，同时吸收了 Gemini Diffusion 的前沿研究成果。它引入了一种全新的扩散式输出头，目标很明确：尽可能提高生成速度。
需要说明的是，自回归版本的 Gemma 4 仍然是高质量生产级输出的首选。而 DiffusionGemma 更适合研究人员和开发者探索那些对速度要求极高、强调本地交互体验的工作流，比如行内编辑、快速迭代，以及生成非线性的文本结构。
谷歌 CEO 皮查伊表示，「DiffusionGemma 是一款开放的实验性模型，它把我们的文本扩散研究带到了 Gemma 4 上。速度像赛马一样快

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

2011年初，在王虹近乎绝望的时候，雷军为什么愿意写推荐信？

深圳一企业，获超10亿融资！阿里、腾讯投了，创始人是华为天才少年

Harness原生Agent新突破！微软发布OpenForge RL：在任意环境中端到端训练

全球首个Agentic扩散模型来了：边行动边纠错，128K上下文追平自回归

OpenAI前研究与安全副总裁北大才女翁荔因身体透支官宣离职

曝PS6性能达PS5两倍！120帧无压力轻松应对光追

全站最新

2011年初，在王虹近乎绝望的时候，雷军为什么愿意写推荐信？

深圳一企业，获超10亿融资！阿里、腾讯投了，创始人是华为天才少年

Harness原生Agent新突破！微软发布OpenForge RL：在任意环境中端到端训练

全球首个Agentic扩散模型来了：边行动边纠错，128K上下文追平自回归

热门推荐

国产 GPU 也能跑万亿大模型：海光 DCU 适配 Kimi K3，896 专家并行不卡顿

"抱抱脸"向 OpenAI 索赔 1 亿美元算力：智能体失控入侵后，开源社区开出价码

2011年初，在王虹近乎绝望的时候，雷军为什么愿意写推荐信？

深圳一企业，获超10亿融资！阿里、腾讯投了，创始人是华为天才少年

Harness原生Agent新突破！微软发布OpenForge RL：在任意环境中端到端训练

阿里Qoder上线实时语音交互智能体：动动嘴，让Agent干活

全球首个Agentic扩散模型来了：边行动边纠错，128K上下文追平自回归

OpenAI前研究与安全副总裁北大才女翁荔因身体透支官宣离职

曝PS6性能达PS5两倍！120帧无压力轻松应对光追

上汽通用总经理卢晓调任上汽乘用车，原华域汽车总经理徐平接任

梅赛德斯-奔驰集团第二季度收入321亿欧元，同比下降3.31%

安徽卫视开播AI短剧，网友热议

iPhone 18系列全面预测：标准版为什么可能缺席9月发布会

罗永浩吐槽复古菱形绗缝皮革座椅：款式设计老气

消息称英伟达首批美国制造的GB300 GPU下线，封装本土化仍待补齐