6月27日消息,北京时间6月27日,OpenAI正式发布新一代旗舰大模型GPT-5.6系列。这是该公司迄今为止最强大的AI模型系列,在编程、网络安全、生物学等多个领域均实现了显著突破。
不过,因美国政府的介入,GPT-5.6并未全面开放,而是仅向少数“可信合作伙伴”提供预览权限。
三款模型,太阳、地球与月亮
OpenAI本次共发布三款模型:Sol(太阳)、Terra(地球)和Luna(月亮)。

GPT-5.6 Sol 是旗舰型号,定位面向最复杂推理、科研、软件开发、网络安全、生物研究以及AI Agent工作流。Sol引入了两种高阶模式:Max模式可进行更长时间的深入推理;Ultra模式则能协调多个子Agent协同完成复杂长期任务。
GPT-5.6 Terra 定位均衡型,主打综合能力,相较GPT-5.5保持接近性能的同时成本降低约50%,适合企业及日常生产力场景。
GPT-5.6 Luna 则是速度最快、价格最低的轻量版,适合大规模在线服务及高吞吐场景。
编程能力超越竞品,安全防护全面升级
根据OpenAI官方提供的数据,在性能方面,GPT-5.6 Sol表现抢眼。在检验编程工作流的Terminal-Bench 2.1测试中,Sol标准模式下得分88.8%,超过主要竞争对手Anthropic的Claude Mythos 5(88.0%),开启Ultra模式后更是达到91.9%。Terra的表现与Mythos的首个公开发布版本Fable 5持平,而轻量化的Luna也能比Anthropic目前仍能公开提供的旗舰模型Opus 4.8更强。

在网络安全领域,Sol在ExploitBench测试中与Mythos预览模型表现相当,但仅使用了约三分之一的输出token,显著降低了成本。在生物学GeneBench v1测试中,该模型消耗更少token,性能表现却比GPT-5.5更强。
此外,据开发者披露,GPT-5.6的上下文窗口从100万tokens扩展至150万tokens,提升约43%,能够一次性处理整个代码库或数本书籍的内容。在长链条Agent任务上,token消耗据称比GPT-5.5再节省10%至15%。
安全方面,OpenAI表示GPT-5.6系列采用分层防护体系,包括模型内置拒答、生成过程实时分类器、账户级风险审查、差异化访问、监控和执法机制。对于高风险情况,系统可暂停生成并交由更大推理模型复核。OpenAI特别强调,GPT-5.6被训练为会拒绝提供被禁止的网络安全协助。
定价仅为Anthropic Fable 5的一半
定价方面,GPT-5.6旗舰模型Sol的输入/输出价格为每百万token 5美元/30美元、均衡模型Terra为2.5美元/15美元、轻量模型Luna为1美元/6美元。
值得注意的是,Sol的定价仅为Anthropic Claude Fable 5(10美元/50美元)的一半左右。
GPT-5.6 还引入了更可预测的提示缓存,包括支持显式缓存断点和至少 30 分钟的缓存生存期。对于 GPT-5.6 及更高版本模型,缓存写入按模型未缓存输入费率的 1.25 倍计费,而缓存读取继续享受 90% 的缓存输入折扣。
政府审查:从“自愿框架”到“一客一审”
相比模型性能,更受市场关注的是此次的发布方式。
OpenAI在公告中披露,在发布之前已向美国政府展示了计划及模型能力,“应政府要求”,将首先向一小部分“可信合作伙伴”提供有限预览,这些合作伙伴的参与情况已向政府报备。据报道,首批获得权限的企业约二十家左右。
更令人关注的是审批方式,部分客户的模型访问权限甚至需要美国政府逐一批准。OpenAI CEO山姆·奥特曼在内部备忘录中明确写道,在GPT-5.6的预览期内,客户将被逐一审批访问权限。这在AI发布史上尚属首次。
这一安排源于特朗普政府6月2日签署的AI行政令,该命令建立了针对前沿AI模型的安全评估框架,允许政府在模型发布前至多30天获取访问权限进行审查。虽然行政令强调参与“自愿”,但实际操作中已演变为事实上的强制审批。此前,Anthropic的Fable 5发布仅3天便被要求下线。
OpenAI公开表达不满
虽然配合了政府要求,但OpenAI在公告中罕见加入了措辞强硬的声明:“我们不认为这种政府访问审批流程应成为长期默认做法。它剥夺了需要这些最佳工具的用户、开发者、企业、网络防御者和全球合作伙伴的使用权”。
公司表示,目前的限量预览是“短期措施”,是未来几周实现更广泛开放的最有力路径。OpenAI计划未来与政府合作制定网络安全行政令框架,以及可重复执行的模型发布流程。
另外,OpenAI还计划于7月在Cerebras上线GPT-5.6 Sol,速度最高可达每秒750 token。





京公网安备 11011402013531号