AIPress.com.cn报道
1月31日消息,OpenAI 在一篇官方博客中介绍了其 AI 代理在访问网页时,如何降低恶意链接与提示注入(Prompt Injection)带来的潜在威胁。
OpenAI 指出,AI 代理在代表用户执行任务时,往往需要直接控制浏览器并与大量外部网站交互,而互联网中存在的钓鱼网站、恶意页面及数据窃取风险,使代理系统必须具备基础的安全判断能力。
在设计上,OpenAI 并未采用仅允许访问“白名单网站”的方式。公司认为,这种做法虽然安全性较高,但会显著限制代理的可用性与灵活性。作为替代方案,OpenAI 构建了一套独立的网络索引系统,用于记录已经公开存在于互联网上的 URL 地址,该索引不依赖任何用户数据。
根据这一机制,当 AI 代理尝试访问的链接已被记录在独立索引中时,系统将允许其正常打开;若该链接未出现在索引内,用户则会收到提示,需明确授权后才能继续访问。OpenAI 表示,这一设计将安全判断从“是否信任某个网站”转化为“该具体地址是否以公开方式出现在开放网络中”。
OpenAI 还提到,网页可能通过“提示注入”等方式对 AI 模型进行隐蔽操控,诱导其执行非预期操作,例如请求敏感信息或破坏系统安全。公司在此前发布的研究论文中,对此类攻击方式及其防范手段进行了更为技术化的说明。
OpenAI 强调,上述机制只是多层防护体系中的一环,并不能保证所有网页内容都是安全的。部分网站仍可能包含社会工程手段或其他恶意设计,AI 代理在当前阶段未必能够完全识别。(AI普瑞斯编译)





京公网安备 11011402013531号