在这场长达两个多小时的对谈中,翁家翌披露了OpenAI内部Post-Training系统的构建逻辑,也解释了OpenAI为何能持续产出爆款模型。他说,自己的一位OpenAI同事也曾是强化学习方向的PhD,后…
04/01 16:41
10/31 16:58
10/31 16:56