DeepSeek推出DeepSeekMath-V2模型,主打自验证数学推理能力
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能
10/31 16:58
10/31 16:56
10/31 16:55