智谱联合华为开源图像生成模型 GLM-Image

IP属地中国·北京 21世纪经济报道 时间：2026-01-14 10:20:33

21世纪经济报道记者孔海丽
1月13日，智谱联合华为开源新一代图像生成模型GLM-Image，在科普插画、多格图画、社交媒体图文、商业海报、写实摄影等方面均可落地。

图片由GLM-Image生成
GLM-Image是首个在国产芯片上完成全程训练的SOTA多模态模型，全流程均在昇腾Atlas 800T A2设备上完成，验证了在国产全栈算力底座上训练前沿模型的可行性。
依托昇腾NPU和昇思MindSpore AI框架，使用动态图多级流水下发、高性能融合算子、多流并行等特性，智谱自研了模型训练套件，全面优化数据预处理、预训练、SFT和后训练的端到端流程。通过动态图的多级流水优化机制，将Host侧算子下发的关键阶段流水化并高度重叠，消除下发瓶颈；通过多流并行策略，通信和计算互掩，打破文本梯度同步、图像特征广播等操作的通信墙，极致优化性能；使用AdamW EMA、COC、RMS Norm等昇腾亲和的高性能融合算子，同步提升训练的稳定性和性能。
近期，以Nano Banana Pro为代表的闭源图像生成模型正在推动图像生成与大语言模型的深度融合。技术范式正从单一的图像生成，进化为兼具世界知识与推理能力的认知型生成，这些模型在海报、PPT、科普图等知识密集型场景及高保真细节呈现上表现较好。
据了解，GLM-Image采用自主创新的“自回归+扩散解码器”混合架构，实现了图像生成与语言模型的联合，API调用模式下，生成一张图片仅需0.1元，速度优化版本即将更新。
GLM-Image所涉及的“自回归”架构利用其语言模型的底座优势，专注于提升对指令的语义理解和画面的全局构图；“扩散解码器”则配合Glyph Encoder的文本编码器，专注于还原图像的高频细节和文字笔画，以此改善模型“提笔忘字”的现象。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

2.8万Star爆款作者竟被谷歌裁了！硅谷大佬火速抢人

一个智谱，相当于半个阿里巴巴？

GTA6开启预购，Anthropic称又遭中国模型蒸馏攻击，张雪机车首次批量出口欧洲，谷歌前CEO批中国 AI 开源，这就是今天的其他大新闻！

360周鸿祎：打造中国版Mythos，抵御用智能体产生的自动进攻

中国电信网优任务大模型白皮书发布

百度开源Unlimited OCR模型：解析文档告别AI越生成越慢

全站最新

朱江明透露零跑新动向：明年推创新车，D99提档上市打造“电动埃尔法”

宝马十年深耕电池回收：数字赋能溯源，退役电池开启“重生”双路径

从溯源到重生：宝马以创新实践为退役电池开启绿色循环新篇章

2.8万Star爆款作者竟被谷歌裁了！硅谷大佬火速抢人

热门推荐

阿里内测AI互动故事产品「向尾」，加码剧情互动新赛道

两名顶尖AI研究员离开谷歌，转投Anthropic

国产小机械火遍海外，现存挖掘机相关企业超2.8万家

2.8万Star爆款作者竟被谷歌裁了！硅谷大佬火速抢人

一个智谱，相当于半个阿里巴巴？

GTA6开启预购，Anthropic称又遭中国模型蒸馏攻击，张雪机车首次批量出口欧洲，谷歌前CEO批中国 AI 开源，这就是今天的其他大新闻！

中粮、中铁、中交开始抢物业的活干

世界杯狂热，衣食住行都是生意

腾讯不当“AI老登”，微信Agent能否炸场？

18亿元，魅族卖“魂”

360周鸿祎：打造中国版Mythos，抵御用智能体产生的自动进攻

中国电信网优任务大模型白皮书发布

百度开源Unlimited OCR模型：解析文档告别AI越生成越慢

硬刚马斯克，软银称已开始量产机器人，将成为“压倒性的世界第一”

2026年财富中国科技50强出炉华为/字节跳动/联想入选