这份报告最动人的地方在于透明。
DeepSeek推出DeepSeekMath-V2模型,主打自验证数学推理能力
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能
05/29 10:26
04/01 16:41
10/31 16:58