研究团队发现,即使滑动窗口保持不动(Frozen),仅优化较早的时间步,MixGRPO依然能够取得良好效果,尤其是在ImageReward和UnifiedReward指标上表现突出。 在评估计算开销时,研究…
面对行业的困局,Surge AI没有选择在“如何更快、更便宜地种菜”上内卷,而是直接掀了桌子,决定开一家“AI数据界的米其林厨房”。Surge AI没有去优化“数据标注”这个旧问题的答案,而是重新定义了问…
像Surge AI这样的破局者,用全新的思维和范式,告诉我们游戏还有另外一种玩法。
在人工智能大模型迅猛发展的当下,大模型参数和计算量呈指数级增长,大规模深度学习模型的训练离不开多硬件设备的分布式计算。在鲲鹏昇腾科教创新卓越中心的算力支持下,北京大学计算机学院崔斌教授团队创新研发了面向大模型…
10/31 16:58
10/31 16:56
10/31 16:55