DiffusionGemma是一匹“赛马”。
与自回归模型逐个生成 token 不同,扩散模型并行处理所有 token,逐步优化整体输出质量,在本地低带宽计算环境下具有显著的推理速度优势。在单块 H100 GPU 上,DiffusionGemma 达到…
谷歌推出DiffusionGemma文本扩散模型:本地AI推理速度提升4倍
谷歌发布开源实验性模型DiffusionGemma,采用文本扩散技术,在专用GPU上实现最高四倍的文本生成加速,为开发者在低延迟本地工作流场景中提供了新的技术路径。 DiffusionGemma的发布标志着谷…
05/29 10:26
04/01 16:41
10/31 16:58