当前位置: 首页 » 资讯 » 科技头条 » 正文

当AI遇上规章制度,彩智科技帮你排除幻觉|“抓住下一个Z一鸣”速访

IP属地 中国·北京 编辑:苏婉清 钛媒体APP 时间:2025-09-02 14:18:36


图片由AI生成

这次的速访嘉宾是来自北京彩智科技公司CEO徐剑军。彩智科技的核心产品是深知可信知识模型,能帮助大模型修正幻觉问题,让智能体可以“开箱即用”地得到准确可信的业务知识,从而能够在严肃工作场景下解决信息不准确和内容不安全的问题。

智客Zhiker:请介绍下核心团队背景。

徐剑军:我们核心团队由两部分组成,一部分来自于清华大学计算机系知识工程组,专业做知识图谱知识工程与大模型融合。另一部分长期做传统行业的政企业务。

我在清华读博期间协助导师做了一些校企合作项目,承接一些部委的顶层架构设计、数据资源图谱与对应语义网络分析等工作。毕业后,我们依然在服务一些大型企业和政府,做行业标准规范以及数据资源规划,也就是把数据资源背后的原数据图谱化。我们做的案例有:为2008年北京奥运旅游官网做的旅游资源梳理;原华北电力集团的采购体系梳理等。

智客Zhiker:是什么契机转型做深知可信?

徐剑军:2020年GPT-3发布,它在语言理解能力、推理能力和编程能力上已经展现了惊人的潜力,我们深刻认识到新的时代即将到来,项目制的知识图谱无法代表知识工程领域的未来,真正的未来应该是与深度学习体系深度融合。

而另一方面,我们还有一个判断,就是无论transform和强化学习发展到什么程度,它的强项始终是针对自然形成的知识与能力。因为本质上,transform就是一种自监督或者无监督算法。它可以凭借巨大的算力,来训练全人类的所有文献,以此来获得全人类自然形成的各种能力。在这些能力上,它一定会比肩乃至超过人类。

但是对于非自然形成的知识,例如我们人类社会所构建的大量规章制度、组织流程、商业规则等内容,从原理上是没有办法通过自监督或无监督训练的。因为这些知识本身并不是通过自然知识推理而得的产物,而是由人类社会根据特定目标和需求,人为构建的。大语言模型通过概率算法来学习这些非自然形成的知识,一定会产生大量幻觉,最终还是得回到知识图谱这种结构化梳理。这也是整个产业界给知识工程留的最后一片阵地。

智客Zhiker:大语言模型会产生怎样的幻觉?

徐剑军:你去问通用大模型一些行业标准、行业规范或者一些国家政策,你会发现所有的大模型都能给你回答,但他们的回答中一定会有10%—20%的内容是不准确的。

我举个例子,比如涉及到卫生许可证,全国几百个城市的规定都有差别,这方面的商业规则以每个城市不同的最新规范文件为准。但目前的通用大模型,是综合按过去20年所有城市在这方面发布的文件数据进行无监督计算,主要通过概率来找规律,这完全无法保证准确性。

智客Zhiker:会为每个客户单独构建知识图谱来训练垂直行业的模型吗?

徐剑军:那太不酷了,不代表通用人工智能。关键是过去一年半在这种项目制知识工程做大模型应用落地,有不少失败教训。

我们深知可信做的第一件事情就是一个大知识工程。通用人工智能时代里,不应该是我们需要服务哪个行业或者哪家公司了,再花时间学习梳理,构建图谱。大知识工程本身不再为某一个行业或者具体公司服务,而是把全中国,所有中文语境里能找到的章程类知识全部结构化,形成一个覆盖法律、政策、标准、企业制度等领域的超大规模知识图谱。

目前,全国所有能够找到的网页,涉及到章程类知识,又没有版权纠纷的文件大概小100亿,技术去重之后剩20亿,业务溯源归一化之后只有1.7亿文件,共16亿的知识点。通过对这些知识点的结构化处理,我们构建了一个巨大的语义关系网络来判断在某一个场景下,到底适用于怎样的规则和条款。这就是我们做的第一件事,大知识工程。

今天这个大知识工程已经开放内测,全中国300多个城市,任何一个城市里涉及到章程和制度的知识,都可以来问我们的深知可信,我们给出的答案一定是目前市面上所有大模型中最准确的。

智客Zhiker:咱16亿知识点的整理,听起来是一个浩瀚的工程。

徐剑军:如果按照我们之前构建知识图谱的工作方式去处理这16亿知识点,我可能需要一支10万人的团队。因为这16亿的知识点并不是静态的,而是动态更新的。我们国家的所有规章制度平均每年的变化量是20%。显然不可能依靠传统的人工方式来维护如此庞大的知识体系。

这里就得提到4年半之前,我们承接的一个科技部重大专项的子课题任务——大规模知识图谱的自动化构建。这套知识工程模型,就是我们用来替代10万人工团队的核心技术。

智客Zhiker:这套知识工程模型是如何实现自动化构建?

徐剑军:一开始我们自研了一套大知识工程的自动化平台,这个平台的第一件事就是把我们人类知识分析师的工作拆成了十几道工序,以求先实现流水线作业。在流水线中,我们特别注重分析和知识标注的高质量,所以我们把十几个分析师分成两组交叉验证,一起负责构建同一批知识点。在每一个流水线环节都积累了有监督下的大量的输入和输出数据之后,我们按照人类分析师的行为训练出了一个“一是一、二是二”的消除了所有幻觉的专有大知识模型。

4年半以来,在一次次迭代升级中,大知识模型逐渐开始取代50%、60%、70%、80%的人工,到现在已经接近于完全的自动化。

我们团队和4年前相差无几,但是每天知识点的处理量已经从过去一个月几千到现在每天将近100万。再加上我们做了一个轻量化知识工程模型,也就是我们的深知可信知识模型,现在我们可以以更快的速度现场为客户做数据训练了。

智客Zhiker:训练是对大语言模型联想和推理功能的限制吗?

徐剑军:基于大语言模型的原理,我们在进行全量有监督训练的时候,不可避免会造成我们训练出的模型对他既有某些能力的遗忘,包括它的推理能力、数学能力。但是通过我们的工程实践,难能可贵地保留了最基础的通用能力,包括对自然语言的理解能力等,也算没有彻底练傻。

在这个过程中,我们还意外地发现,我们的模型实现了另一个很有价值的功能。

智客Zhiker:什么功能?

徐剑军:价值观的对齐。

智客Zhiker:如何实现这个功能?

徐剑军:推理模型就是太聪明了,太聪明就会出现一些幻觉,也会出现我们想象不到的安全隐患。而我们深知可信对于幻觉天生就有很强的抵抗能力,首先,我们是拿所有规范性文件训练出来的,不会别的,只会文件中的知识点。所以任何的诱导对我们的模型都没有用,这个是我们安全的基础。

另外,我们实现了深知可信知识模型和通用大模型之间的一个工作配合。我们把深知可信知识模型准确的知识召回能力和进行安全对话风控的能力,变成一个开放MCP接口。在很多实际场景下,通用大模型会是主导,他来主控,做常识的推演,但是涉及到章程和规则的问题,他就会来通过我们的MCP接口来召回准确的章程类的知识。

在通用大模型回答用户问题之前,也会经过我们独有的一个安全风控模型,判断一下该问题有没有安全风险。如果有安全风险,我们会给一个安全的识别码,然后由我们的模型代答,以规避风险。如果判断没有风险,回答过程就交给大模型智能体,只在需要调用规章知识时再调用我们的模型即可。

智客Zhiker:已经接入哪些通用大模型?

徐剑军:最早就接入了智谱开放平台,后来又接入了百度的千帆,华为的小e和鸿蒙的智能体生态,阿里的百链,还有腾讯的一个和元宝配合的生态,叫元气。四周以前,字节也主动找到我们,也一起顺势签约合作了。大家都比较重视这种严肃场景下的模型应用,也都愿意尝试与我们合作。尤其是智谱的开放平台bigmodel.cn。

智谱GLM4.5本身以Agentic能力见长,特别适合支撑智能体使用各类工具来解决场景问题。与之对应,智谱开放平台也对各类工具,一方面严加测试、另一方面又大力推广。我们在智谱开放平台上不仅仅有生态调用,甚至智谱本身的一些产品,如智谱数字人等也在调用我们的接口服务。这种综合性的平台生态能力,在我们看来,会是各家知名通用大模型企业大力发展的能力。

智客Zhiker:只能在中文语境使用吗?有出海打算吗?

徐剑军:国家在去年有一个指示,就是咱们中国的人工智能要出海。在这个背景下,目前相关机构与企业正在筹备成立自主大模型的社会组织,深知可信也很有幸受邀参与。事实上我们已经在深圳尝试了多语种模型,当时看起来有点超前,但未来一定会走向海外市场。

智客Zhiker:商业化情况如何?

徐剑军:我们目前的商业化分成两个方面:

第一,是未来的蓝海市场。我们会服务于各种各样的第三方的智能体和应用。比如说携程的智能体一直会有一个难题,就是关于护照制度的咨询。全中国办护照是以县为单位,每个县和每个县的规矩都不太一样。像这个问题,调用我们深知可信知识模型就非常合适。但这条收入渠道非常依赖于整个生态的成熟度,目前带来的收入还不足以规模化。

第二,是我们目前几个真正能赚钱的渠道。第一渠道是政府。政府门户网站、国务院政策问答平台、深圳市政务服务平台等都是我们的客户。政务数字化的大背景叠加人工智能的转型需求,给我们创造了不错的收入空间。

第二个渠道就是全国各地的12345。包括一些专项政务热线,像税务热线、公积金热线等。全国政务热线大概有1000家,每年的预算投入大几百个亿,70%是人员的投入。我们现在主打的产品叫智能知识助手,服务的是热线的坐席人员。目前全国政务热线平均完成一个咨询工单的响应时间是6分钟,我们的智能知识助手介入后,平均完成工单的响应时间可以缩短到1分钟。

第三个渠道就是这半年增长最快的市场——企业市场。出于企业自身降本增效的需求,以及我们能够在企业内部做有“私有知识接入即用、公共知识开箱即用”的快速训练的产品优势,我们的产品很受知识和规章驱动型企业的欢迎。这方面的增长在近几个月非常明显。尤其通过我们模型与MCP在各大厂生态上的推广,有不少从事传统软件业务的软件公司找我们合作形成了不少订单落地,我们深感企业在内控管理等领域对开箱即用、智能可信的知识服务有广阔需求。

我们去年的大模型业务年收入2000万左右,这三个渠道的占比为4:2:4。今年大模型收入应该能做到4500万,并且三个渠道的收入结构也会发生变化,可能会变成2:2:6。

智客Zhiker:融资进度怎么样?

徐剑军:其实我们深知智能立项之后只融过一轮。是智谱生态的星连资本(Z基金)最早投资的企业之一。又拿了一些份额给清华系的基金和盛景。

我们接下来的A轮融资,首先会更倾向于一些传统软件公司,因为他们不仅可以带来资金,更可以带来订单,这方面进展很顺利。同时我们也欢迎对通用人工智能有兴趣有信心的其它类型基金来了解与投资我们。(本文首发于钛媒体App,作者|郭虹妘,编辑|陶天宇)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。