智谱开源GLM-OCR模型：仅0.9B参数，多项基准取得SOTA表现

IP属地中国·北京 编辑：孙明凤凰网科技 时间：2026-02-03 10:07:49

2月3日，智谱宣布正式发布并开源GLM-OCR。据介绍，该模型仅0.9B参数规模，支持vLLM、SGLang和Ollama部署，在公式识别、表格识别、信息抽取的多项主流基准中均取得SOTA表现。
据官方信息，GLM-OCR针对手写体、复杂表格、代码文档、印章识别及多语言混排等场景进行了优化。在效率方面，其处理PDF文档的吞吐量可达1.86页/秒。通过API调用，其定价为0.2元/百万Tokens。
该模型采用“编码器-解码器”架构，集成了自研的CogViT视觉编码器，并采用“版面分析→并行识别”的两阶段技术流程。模型完整SDK与推理工具链已同步开源，适用于高并发及边缘计算场景。

标签：文档模型表格 glm 基准 解码器 代码 吞吐量

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

iQOO 15/15 Ultra手机新一轮涨价，最高涨700元

马云名下云锋基金入股峥研软件

Omdia：2026年智能手机平均售价将涨21%至565美元

软银CEO孙正义回应AI泡沫论：这是对AI的侮辱

微信鸿蒙版App获8.0.19.16版本邀测升级，新增朋友圈好友状态显示等功能

即梦AI上线Seedance 2.0 VIP原生4K版本

全站最新

iQOO 15/15 Ultra手机新一轮涨价，最高涨700元

马云名下云锋基金入股峥研软件

Omdia：2026年智能手机平均售价将涨21%至565美元

软银CEO孙正义回应AI泡沫论：这是对AI的侮辱

热门推荐

英伟达突然不香了？GPU租赁价格持续回落……

胖东来转线上VS鲜啤店猛扩张，精酿步入岔路口

万亿智谱阴影下，中国互联网巨头们的“身份危机”

补税14亿，北大荒一年白干

美国AI狂飙，亚洲抢先吃饱

7亿收入、万亿市值，智谱值吗？

香水柠檬的“半生”：红了几年，还没真正长大

谁把智谱推上了万亿神坛？

单票价连涨3个月，顺丰不想送难挣钱的快递了

大疆影石打了一年，谁更焦虑？

2026年最大Biotech神话：一款II期药，261名员工，卖了109亿美元

从“工具人”到“悦己者”，中男消费的转折时刻

艺人独立风潮下，太合音乐赴港募资押宝AI：版权摊销侵蚀利润，16亿优先股悬顶

iQOO 15/15 Ultra手机新一轮涨价，最高涨700元

马云名下云锋基金入股峥研软件