4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能
考生名单:DeepSeek、字节豆包、讯飞星火、通义千问、腾讯混元、文心一言、GPT。
05/29 10:26
04/01 16:41
10/31 16:58