科学发现要变天?北大团队让AI自主发现“牛顿第二定律”
这个新范式,究竟突破在何处?
总的来说,MSL这篇新论文的核心思想是通过一种LanguageSelf-Play(LSP)的方法,让大型语言模型在没有额外训练数据的情况下实现自我提升。 为了将这个博弈转化成模型强化学习的过程,研究中采用…
10/31 16:58
10/31 16:56
10/31 16:55