实验表明,Parallel-R1 不仅在多个数学基准上带来高达 8.4% 的平均准确率提升,更通过一种 “中程训练脚手架” 的策略,在AIME25 测试中实现了 42.9% 的性能飞跃。 第二阶段(能力泛…
10/31 16:58
10/31 16:56
10/31 16:55