所有AI幻觉都该被消灭? “管住高风险场景，留出创新空间”

IP属地中国·北京 南方都市报 时间：2026-06-17 08:15:36

制图:朱林(即梦AI生成)
保安和AI对话6个月，约定签约作品却被骗；AI搜索误判，执业律师变“罪犯”……随着AI渗透到生活工作的方方面面，其一本正经“胡说八道”的幻觉问题日益凸显，在质疑与采信之间不断摇摆的用户开始思考——AI幻觉是如何形成的?如何彻底消灭它?
360智脑技术副总裁、360AI高级研究员孙林指出，幻觉是AI创造力和想象力的一种体现，可能孕育新的认知或发现，不应被全盘否定。他建议开展场景化、分层次的可信AI治理，针对不同风险情形下的幻觉问题，采取差异化处置措施。
中国信息通信研究院人工智能研究所安全治理部主任石霖表示，现有研究表明，AI幻觉难以从根本上彻底消除，但可通过数据治理、模型优化和推理增强等手段持续降低发生概率。
　　现状
　　数据质量直接影响生成内容准确性
何为AI幻觉?孙林从技术角度解析，生成式AI系统的“幻觉”表现为，根据用户引导输出看似合理，但事实错误、证据不足、与用户指令不一致或前后逻辑矛盾的内容，通俗讲就是“一本正经地胡说八道”。
AI幻觉的形成，并非单一原因导致，而是一种涉及多层面的系统性风险。第一层风险来自数据层。AI大模型训练与推理需要海量数据，数据质量直接影响生成内容准确性。“如果(训练过程中)错误信息出现了100次，正确信息只出现1次，生成内容出现错误的可能性很大。”孙林说，由于很多高质量的数据集模型无法直接获取，AI也会在一些专业问题上“胡编乱造”。
孙林提到，当前大多模型都使用概率建模法，在实操中表现为根据用户输入的前几个字“猜”下一个字——既然是猜测，就有对错之分。相关参数设置会影响模型推理的保守或激进程度，导致不同模型的幻觉率存在差别。一般而言，推理模型的思考时间越长、自我反思能力越强，幻觉率就会越低。
在系统层面，几乎所有AI应用背后都不是单一模型提供技术支撑，还有搜索工具、智能体等多方面能力加持。这意味着，在复杂的技术链条中，任何一个环节出错都可能影响输出结果。而在产品设计上，一些大模型把“猜测”内容，包装成确定性答案展示给用户，也容易让用户轻信AI。
　　根据不同场景任务实现不同验证目标
6月12日，南都数字经济治理沙龙第21期活动:“AI出错，谁为模型‘幻觉’买单?”主题研讨会在北京举办。会上，孙林提出了一个有趣的追问:所有的AI幻觉都该被消灭吗?他的答案是否定的。
在他看来，“AI幻觉”好比人类创意工作者的“头脑风暴”，是AI创造力和想象力的一种体现。在金融、医疗、政务、教育等严肃性场景中，基本不容出错，减少幻觉很有必要。但在一些创意领域，模型可以基于过往知识实现跨领域的思维重组、联想和外推，这一能力对于创意生成、科学研究等意义重大。
“我更愿意把AI幻觉称为‘AI偏离’。”孙林认为，AI幻觉包括误导性偏离，即偏离了既定事实、证据或上下文，却被过度包装成正确答案或可信结论，进而被用户直接采纳，这类情形需重点治理。另一类是探索性偏离，生成内容未必能被过往知识库立刻证明为真，但可能孕育新的认知或发现。
“如果把模型完全训练成一个只会复述既有事实的系统，它也许会更保守，但在很多开放式任务上的价值也会明显下降。”孙林解释，一个新观点出现时往往不符合主流认识，也缺乏已有权威知识库的支持。如果AI系统把暂未获得认同的新发现通通认定为“错误”，就可能压制有价值的想法和创意。
孙林强调，解决幻觉问题的关键在于，根据不同场景任务实现不同的验证目标。在医疗问答、法律咨询、金融建议、政务服务等事实型任务中，必须强调“真实性约束”，坚持内容来源的真实性，反复核对表达。一旦超出能力边界时，模型也应该学会“知之为知之、不知为不知”，拒绝回答。
　　要避免模型“裸答”，还要避免“强行答”
在探索型任务中，孙林主张追求“可检验性约束”，不要求模型立刻验证输出内容的真实性，但需满足不与已知自然基本规律冲突，能够被实验、推演等基本条件。
“未来好的AI系统不应只有一种模式，而是能在不同场景切换角色。有时是保守、可追责的可靠顾问，有时是帮人类提出新方向的‘假设生成器’。”他说。
在孙林看来，针对AI幻觉治理核心并非追求“零幻觉”，而是做场景化、分层次的可信治理。如何采取有效措施降低AI幻觉风险?来自企业一线、长期深耕AI领域的他从产品设计角度给出了具体建议。
孙林认为，在创意生成、头脑风暴等低风险、开放式场景，可以保留更强的发散能力，但需注明“是灵感和假设而非事实结论”；在搜索问答、教育辅导、新闻摘要、消费建议等中风险场景，应强化来源展示，增加不确定性提示，并尽量提供多源视角；在医疗、法律、金融、政务等高风险场景下，应引入更严格的机制，包括优先调用权威知识源、限制直接给出确定性结论、明确建议人工复核、保留日志和审计链路，必要时让AI只提供辅助不做决策等。
孙林还提醒，企业既要避免模型“裸答”，还要避免“强行答”。在生成之后增加事实核验、来源核验和高风险拦截环节，避免把第一次输出内容直接交给用户。更重要的是，在科研探索和创意场景中，给模型保留一定的假设生成空间，避免追求“一刀切”消灭所有AI“偏离”。
　　预防
　　从“编造事实”到法律风险，AI幻觉影响正外溢
据石霖介绍，“幻觉”原本是心理学概念，指在没有客观刺激的情况下产生的知觉体验。延伸到人工智能领域，大模型幻觉主要表现为模型生成的内容不符合用户输入要求，或者与客观事实不一致。目前，业内通常将其划分为“忠实性幻觉”和“事实性幻觉”两类。
其中，忠实性幻觉是指模型未能严格遵循用户指令完成任务。例如，用户要求将中文翻译成英文，但模型输出了其他语言内容；事实性幻觉则是指模型生成与现实情况不符的信息，例如对图片内容进行错误描述等。
石霖指出，从当前行业研究和实践情况来看，忠实性幻觉已成为影响大模型应用的重要问题之一。
随着大模型广泛应用于办公、搜索、教育和咨询等场景，幻觉带来的风险日益凸显。石霖表示，错误信息可能导致用户形成认知偏差，在医疗健康等专业场景甚至可能产生误导性建议。同时，大模型“编造”内容还可能引发名誉侵权、虚假信息传播等法律风险。
石霖还分享了工作中的案例，提醒大模型生成内容需进行必要核验，不能完全替代人工判断。
　　AI幻觉无法彻底消除，但可以被缓解和控制
AI幻觉从何而来?在石霖看来，这并非单一因素导致，而是贯穿于数据准备、模型训练和推理生成全过程。
在数据层面，训练数据中的错误信息、偏见内容以及知识覆盖不足等问题，都会影响模型输出质量。特别是在长尾知识、新知识以及部分受法律法规限制的信息领域，模型可能存在知识缺失或知识边界问题，从而增加幻觉发生概率。
在训练阶段，由于大模型本质上基于概率预测机制生成内容，更关注语言模式和上下文关联，而非事实验证，因此容易产生偏差。同时，在模型对齐过程中，模型往往倾向于生成更符合人类偏好的答案，而不一定是最准确的答案，这也可能带来一定程度的幻觉风险。
在推理阶段，模型可能表现出过度自信倾向。当面对语义相近或复杂问题时，容易在细节上出现错误。此外，长链条推理过程中出现的信息累积偏差，以及模型蒸馏、量化压缩等技术处理，也可能进一步放大幻觉问题。
针对幻觉问题，目前学术界和产业界已经开展了大量检测和治理研究。例如，通过构建事实核查机制、引入外部知识库、建立专门评测数据集等方式识别和评估模型幻觉风险；通过数据清洗、检索增强生成(RAG)、模型架构优化和推理增强等技术手段降低幻觉发生概率。
不过，石霖强调，从现有研究结论来看，大模型幻觉难以从根本上被彻底消除。由于大语言模型基于概率生成的技术原理，其本身存在一定的固有局限性，因此，当前行业更多是通过技术手段对幻觉进行缓解和控制，而非完全消灭幻觉。
　　推理过程越长、越复杂，AI幻觉就越少吗?
石霖提醒，用户在使用大模型时，也应充分认识其能力边界和不确定性。尽管思维链等推理机制能够在一定程度上降低幻觉率，但目前并没有充分证据表明推理过程越长、越复杂，幻觉就一定越少。
值得关注的是，石霖提到，围绕幻觉是否完全有害，学术界和产业界也存在一些讨论。他表示，幻觉本质上是一种偏离事实或既有认知的表达，但在部分观点看来，这种非线性的生成方式也可能与创造性、创新性存在一定关联。因此，对于幻觉现象的认识仍存在不同视角。
石霖还披露了中国信通院在大模型幻觉领域的最新研究成果。据介绍，中国信通院自去年开始构建包含5000余条样本的幻觉测试集，从忠实性和事实性两个维度开展专项评测。研究发现，当前主流模型的事实性幻觉总体低于忠实性幻觉，后者已成为影响模型可靠性的重要问题。
测试结果还显示，在同类型模型中，参数规模越大，整体幻觉率越低。与此同时，推理模型相较于传统通用模型表现出更好的幻觉控制能力，在一定程度上有助于缓解幻觉问题，但并不能完全消除幻觉；而经过蒸馏压缩的模型，则可能出现忠实性幻觉增加的问题。
石霖表示，未来需要通过技术创新、安全治理和标准建设等多方面协同推进，不断提升人工智能系统的真实性、可靠性和可信度，推动人工智能产业健康有序发展。
　　典型案例
　　遭AI诬陷的律师黄贵耕:
　　我不反AI，只反甩锅AI的恶意侵权
去年9月，北京锦钟律所黄贵耕律师因被AI造谣“威胁法官、伪造印章”，将涉事平台告上法庭。日前，黄贵耕结合自身维权经历，剖析了生成式AI侵权背后的现实困境与法律争议。“我从未对AI宣战，我抵制的是将AI幻觉作为恶意侵权挡箭牌的行为。”　　
　　AI幻觉侵权正演变为公共危害　　
“作为一名执业律师，我亲身经历了被AI平台捏造虚假信息、恶意诽谤的全过程。”当天，在论坛分享环节，黄贵耕展示了一组截图。截图中，AI精准标注了他的姓名和执业机构，并凭空捏造出他“威胁法官”“介绍贿赂”“伪造印章”“涉嫌刑事犯罪被吊销执照”等恶劣情节。
黄贵耕表示，这些虚假负面信息被案件当事人及亲友广泛传播，致使他的社会评价严重贬损，潜在客户流失不可估量，承受着巨大的精神压力。
这并非孤例。据黄贵耕介绍，南京李小亮律师、北京安振杰律师均遭涉事AI及其旗下产品捏造定罪判刑的虚假内容；公益人士寇延丁被无端诬陷“判刑十三年”；山东青年冀承祥被恶意编造“组织卖淫罪”；就连“清芝灵卵磷脂”“栖贤山黄酒”等企业产品也未能幸免，被造谣为禁售商品。除了李小亮一案已宣判外，律师黄贵耕、作家寇延丁两人分别提起的另外两起诉讼，目前仍处于法院审理程序。
“从自然人到企业，受害者范围持续扩大。”黄贵耕指出，这类频繁侵害不特定个人名誉权的行为，已不仅是针对个人的伤害，更暴露出极大的公共危害性，势必造成社会秩序混乱和公众对AI技术的信任崩塌。
　　享受AI红利必须承担对等责任　　
AI侵权发生后，平台是否真的无法核查和纠错?黄贵耕在论坛现场引用了山东教育电视台的一则报道:腾讯元宝AI在除夕夜出现辱骂用户的异常输出后，官方迅速核查日志并发布致歉声明，明确“与用户操作无关，不存在人工回复，属于小概率下的模型异常输出”，并承诺后续将紧急优化。
“这说明生成式AI服务提供者，具备对用户调取AI服务的操作日志进行全面核查及整改的技术能力。”因此黄贵耕认为，其所诉涉事平台以“AI幻觉”不可预见为由，在首次侵权出现后未及时整改，持续生成侵权内容，实属以算法黑箱甩锅。“这就像司机明知刹车失灵仍上路撞人，不能把责任推给汽车。”
在法律责任的界定上，黄贵耕驳斥了平台常引用的“技术中立”和“AI非民事主体”的免责逻辑。他认为，司法实践中，“技术中立”的前提是平台已尽到合理防控义务。若同行业其他产品可规避同类错误，唯独某平台反复出现恶性侵权，就证明平台存在明显过错。“所谓的‘避风港原则’，针对的是平台仅作为信息载体、供用户上传内容的情况。但我所诉的AI恶意侵权内容是平台自主生产的，本质是平台行为的延伸，根本不适用避风港原则。”黄贵耕说。
“平台从AI服务中攫取了巨大流量与商业收益，绝无可能只享红利而不承担风险。”他强调，根据《生成式人工智能服务管理暂行办法》等相关法规，AI服务提供者必须落实内容安全主体责任。在将AI产品推向公众时，有义务对生成内容审核把关、留存日志、及时处置违法虚假信息。
尽管深受AI幻觉侵权之害，但黄贵耕始终对人工智能技术持正面态度。“媒体报道中说我‘对AI宣战’，这是不准确的，我只是对涉事AI平台的恶意侵权行为说不。”　　
A12-15版
统筹:程姝雯李玲
采写:南都记者李玲杨柳黄莉玲樊文扬吕虹王子黎莫倩如

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

市场监管总局回应腾讯收购喜马拉雅

王健林走了，于东来来了

让循环经济环环相扣（编辑手记）

科大讯飞、蔚来投资，卡车自动驾驶方案商主线科技二闯港股

早读｜今年“618”，AI工具抢占“购物前的入口”

联想推出PB9拯救者170W带屏移动电源，489元

全站最新

市场监管总局回应腾讯收购喜马拉雅

王健林走了，于东来来了

让循环经济环环相扣（编辑手记）

科大讯飞、蔚来投资，卡车自动驾驶方案商主线科技二闯港股

热门推荐

京东即将开源视觉语言实时交互模型

曝鸿蒙智行将全面引入电池二供宁德时代独供时代终结

市场监管总局回应腾讯收购喜马拉雅

王健林走了，于东来来了

让循环经济环环相扣（编辑手记）

科大讯飞、蔚来投资，卡车自动驾驶方案商主线科技二闯港股

全国首个Token服务性能监测平台发布

中德汽车产业在深度重构中探寻合作共赢新路径

苹果(AAPL.US)2027年放大招！计划推出AI版AirPods、折叠屏及20周年纪念版iPhone

80岁老年人都在试它！用了以后，走路轻松不少

早读｜今年“618”，AI工具抢占“购物前的入口”

阿根廷媒体：AI算法需摆脱西方偏见

为拿欧洲FSD许可，特斯拉被爆夸大安全数据

谷歌(GOOGL.US, GOOG.US)推出Android 17系统 AI功能将分阶段上线 Wear OS与XR生态同步升级

联想推出PB9拯救者170W带屏移动电源，489元

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

所有AI幻觉都该被消灭? “管住高风险场景，留出创新空间”