Anthropic 近日正式发布了其最新一代人工智能模型Claude Fable5。作为公司目前面向大众开放的最强 AI,它在生物学、网络安全等领域的潜力备受期待。然而,这款模型在实际使用中却表现出一种“选择性失忆”:即便面对高中水平的基础生物学问题,它也往往拒绝回答,并主动将请求转接给其前代旗舰模型Claude Opus4.8。
这种现象并非源于模型能力的缺失,而是 Anthropic 出于极高安全标准所做的刻意限制。作为Mythos级模型,Claude Fable5具备极强的高阶任务处理能力,同时也伴随着显著的滥用风险。在开发与上线过程中,Anthropic 将生物学领域视为安全红线的重中之重,其防护策略甚至到了“矫枉过正”的地步。
在实际测试中,这种保守策略的副作用显而易见。无论是关于细胞线粒体功能的科普、花粉症成因的探讨,还是哮喘药物原理等无害医学常识,Claude Fable5均予以驳回。甚至连埃博拉病毒这类公共卫生相关话题,也触发了其屏蔽机制。这种“无差别拦截”导致原本具备学术价值和科普意义的交流被迫中断。
Anthropic 对此回应称,此举核心目的是为了防范恶意用户利用先进 AI 从事高风险生物研究,例如开发生物武器。公司发言人帕鲁尔・马赫什瓦里表示,为了让模型能够尽早上线,团队选择了极端保守的防护路线,并承认目前存在较多的识别误判。
对比来看,Claude Fable5在化学与网络安全领域的限制则显得更加灵活。虽然它会拒绝提供炸药制造工艺或炭疽杆菌培养方式等危险信息,但对于氯气用途、密码安全及物理学原理等中性技术问题,模型能够正常作答。只有在涉及剧毒物质等极端场景时,它才会调用上一代模型进行辅助处理。
目前,Anthropic 正致力于优化识别机制以减少误判,并计划在未来针对生物医学领域的专业用户,推出能够解锁这些限制的特定版本,旨在平衡科研效率与社会安全。这一“受限发布”模式,或许正是当前顶尖 AI 模型在追求强大性能与严苛安全之间寻找平衡的一个缩影。





京公网安备 11011402013531号