当前位置: 首页 » 资讯 » 科技头条 » 正文

智谱开源GLM-OCR模型:仅0.9B参数,多项基准取得SOTA表现

IP属地 中国·北京 编辑:孙明 凤凰网科技 时间:2026-02-03 10:07:49

2月3日,智谱宣布正式发布并开源GLM-OCR。据介绍,该模型仅0.9B参数规模,支持vLLM、SGLang和Ollama部署,在公式识别、表格识别、信息抽取的多项主流基准中均取得SOTA表现。

据官方信息,GLM-OCR针对手写体、复杂表格、代码文档、印章识别及多语言混排等场景进行了优化。在效率方面,其处理PDF文档的吞吐量可达1.86页/秒。通过API调用,其定价为0.2元/百万Tokens。

该模型采用“编码器-解码器”架构,集成了自研的CogViT视觉编码器,并采用“版面分析→并行识别”的两阶段技术流程。模型完整SDK与推理工具链已同步开源,适用于高并发及边缘计算场景。

标签: 文档 模型 表格 glm 基准 解码器 代码 吞吐量

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新