GPT-5在SWE-bench Verified中得分74.9%,在Aider Polyglot得分88%。
ChatGPT智能体模型在Humanity's Last Exam(pass@1)中得分率为41.6%
07/09 12:23
07/09 12:22
07/09 12:21
07/09 12:20