这篇论文中最令人不安的一句话是:没人能判断安全训练究竟是真正阻止了欺骗行为,还是仅仅教会了AI如何更好地隐藏它。 就像调皮的学生,远远看到老师走过来时,就会立刻装作认真学习一样,AI也能从提示词的蛛丝马迹中…
Meta及谷歌母公司股价在判决结果出炉后并未下挫,反而双双出现了小幅上涨。
04/01 16:41
10/31 16:58
10/31 16:56