12月20日,在华尔街见闻和中欧国际工商学院联合主办的「Alpha峰会」上,金山办公助理总裁、资深技术专家朱熠锷发表题为《WPS AI:迈向更高质量的知识增强生成》的演讲。
![]()
他表示,当前AI应用的核心挑战已经从模型能力的竞争,转向如何高效利用企业私域数据。模型能力的趋同,意味着其本身难以形成垄断优势。
他强调,真正决定AI应用价值的关键,在于将企业内大量复杂、非结构化的文档数据,转化为高质量、可被模型理解的知识资产。传统RAG面临“文档不等于知识”以及“语义相似不等于逻辑相关”的根本局限,因此必须推动技术范式从“以模型为中心”升级为“以数据/知识为中心”。
他强调,未来的路径是发展“KAG(Knowledge Augmented Generation,知识增强生成)”。这要求企业像管理数据一样,系统性地对知识进行治理、建模与应用。具体而言,需要通过VLM、知识图谱等技术,融合多模态、多结构化的知识,并构建“数据湖”与“知识湖”双湖并重的架构。最终目标是让AI真正“掌握”而非仅仅“看到”企业知识,从而在专业领域问答、智能写作与合规创作等场景中发挥可靠价值,完成从数字化到智能化的关键跨越。
以下为演讲精彩观点:
企业AI应用正从“以模型为中心”转向“以数据为中心”。数据质量成为决定AI应用效果的关键。WPS AI以知识增强生成(Knowledge-Augmented Generation)为目标,帮助大模型真正“掌握”企业的知识资产。
要像管理数据一样管理知识。将数据与知识转化为AI可用的资产,是企业从数字化迈向智能化的基石。DATA 2.0时代,企业要像管理数据一样管理知识,WPS 365通过知识建模、知识治理与多模态融合,为企业构建专属的“企业大脑”。
高质量的输出,必须始于高质量的输入。如果输入的是混乱、冲突的原始数据,无论模型多强大,产出的结果都不可靠。因此,知识治理是AI在专业领域落地的基石,其重要性将超越算法优化本身。
AI的专业化应用是一场“知识工程”,而非简单的技术集成。从合规报告撰写到精准信息抽取,其本质都是将专业领域知识系统化、结构化的过程。谁能率先完成自身知识资产的升级,谁就能在AI时代建立真正的竞争优势。
真正的智能不是“看到”文档,而是“理解”逻辑。当前主流的AI应用(如RAG)因“语义相似不等于逻辑相关”而遭遇瓶颈。真正的突破在于融合知识图谱、业务规则等多源知识,让AI能进行逻辑推理与精准回答,从而解锁专业场景的价值。
以下是华尔街见闻整理的精华内容:
大模型之后,真正的瓶颈是什么?
当前一个关键的共识是,前沿大模型的综合智能在知识储备与逻辑理解上已超越普通员工,且模型能力趋同,难以垄断。那么,核心问题便转向了:大模型如何在实际应用中发挥真正的价值?
我们的答案是:必须与外部数据,尤其是企业私域数据深度结合。但以“文档”形式存在的数据本身不等于“知识”,是由于企业海量的文档(文字、表格、PDF等)存在格式复杂、组织混乱、内容矛盾等“先天不足”。一份文档中,未休年假折算比例可能是200%,另一份却是300%;一份法规要求存储六个月数据,另一份则说只保留必要数据。这些冲突不解决,AI的输出就不可靠。
更深刻的挑战在于主流技术范式。当前广泛应用的RAG(检索增强生成)技术,其核心是“向量相似度检索”。这带来了一个根本性局限:语义相似,不等于逻辑相关。例如,问“笔记本电脑开不了机怎么办”,系统可能召回一篇详细介绍“MacBook Pro 14寸”规格的文档(语义相似),却错过了真正解决问题但未提及“笔记本”三个字的故障排查指南(逻辑相关)。这导致许多AI应用“出Demo惊艳,上生产困难”。
从RAG到KAG,构建“知识增强生成”新范式
为了突破这些瓶颈,我们提出必须从RAG演进到KAG(Knowledge Augmented Generation,知识增强生成)。这不是简单的优化,而是一次范式转移。其核心观点有两个:
一是高质量输入才有高质量输出。知识必须先经过治理,解决冲突、补齐缺失、建立结构。
二是必须系统性融合多模态、多结构的知识资产。不能只检索文档,还要融合企业已有的知识图谱、结构化标签、流程SOP等,为AI生成提供高质量输入。
基于此,我们设计了一个双层架构。底层是“知识治理层”,负责文档解析、知识抽取、图谱构建与质量监控;上层是“知识应用层”,它多源融合检索引擎、动态排序模块、上下文工程体系为核心组件,构建能够赋能各类专业场景的知识基座。
在四个关键场景中落地KAG
基于KAG架构,我们研发了智能文档库产品,并聚焦于四个核心场景:
第一,知识治理。 我们通过自动化的知识抽取与图谱构建,帮助客户发现文档库中的重复内容、逻辑冲突和知识缺失。例如,系统可以自动标出关于年假折算比例的两个冲突版本,或指出一个“IT支持”知识库还缺少“打印机驱动安装”的关键章节,辅助管理员进行决策和优化。
第二,专业智能问答。在融合了私域文档图谱与行业法规、SOP等结构化知识后,我们的问答系统能处理复杂的专业查询。例如,用户可以问:“在浙江省,生产某种特定粒径的原料药,是否可以使用X成分?请仅依据2025年的规定。”系统能精准解析地点、成分、年份等多个约束条件,并给出精确答案。
第三,复杂文档的智能抽取。我们针对医疗报告、合同、发票中常见的复杂表格、复选框、手写体等进行了专项优化。一家医药客户利用此功能,将药物不良反应报告的邮件附件自动解析、抽取关键字段,并回填至客户的药物管理系统,将原本人工处理需数小时的工作缩短到几分钟。
第四,专业领域的智能写作。这不同于写请假条,而是撰写有严格格式与数据引用精准要求的行业报告(如临床研究报告CSR)。我们通过两个智能体(Agent)协同工作:一个负责根据范例和法规生成包含大纲、数据需求的“智能模板”;另一个则依据模板,从海量实验数据中精准定位、无损引用所需的数据和表格,最终生成格式合规、数据准确的专业报告,将撰写周期从数周大幅缩短。
像管理数据一样管理知识
最后,我想做一个总结。从RAG到Graph RAG再到KAG,是一个从“让大模型看到文档”,到“理解文档间逻辑”,再到“真正掌握企业知识资产”的升级。
我们认为,在智能化时代,企业需要构建 “数据湖”与“知识湖”双湖并重 的新架构。未来,企业不仅要积累原始数据,更要像过去管理数据一样,系统地进行知识运营、知识建模和知识治理。这,将是企业从数字化迈向智能化的关键基石,也是AI在专业领域发挥真正提效作用的必经之路。





京公网安备 11011402013531号