在这场长达两个多小时的对谈中,翁家翌披露了OpenAI内部Post-Training系统的构建逻辑,也解释了OpenAI为何能持续产出爆款模型。他说,自己的一位OpenAI同事也曾是强化学习方向的PhD,后…
06/25 00:17
06/25 00:16
06/25 00:15