在HLE测试中,ChatGPTagent拿下了41.6%高分;并在数学FrontierMath基准上,同样刷新SOTA,碾压o4-mini和o3模型。 在最难的数学基准测试FrontierMath中,Ch…
07/09 12:23
07/09 12:22
07/09 12:21
07/09 12:20