在HLE测试中,ChatGPTagent拿下了41.6%高分;并在数学FrontierMath基准上,同样刷新SOTA,碾压o4-mini和o3模型。 在最难的数学基准测试FrontierMath中,Ch…
10/31 16:58
10/31 16:56
10/31 16:55