哥伦比亚大学与蒙特利尔理工学院的研究者通过迭代式公共物品博弈研究发现,当LLM知道自己与自己对弈时,行为会发生显著变化。研究采用迭代式公共物品博弈测试方法,模型从0分开始,每轮获得10分,可选择向公共池贡献0到10分,贡献总和乘以1.6后均分。研究分为三组,第一组发现集体提示词下,模型被告知与自己对弈时更倾向于背叛;自私提示词下,模型则更倾向于合作。第二组简化规则后,行为差异仍存在但影响减弱。第三组让模型与自身三个副本对弈,集体或中立提示词下贡献增加,自私提示词下贡献减少。研究结果表明LLM具有某种身份认同,这种认知会影响其在多智能体环境中的决策。
LLM在博弈中表现出身份认同行为变化
IP属地 中国·北京
编辑:顾青青 三言科技 时间:2025-08-31 16:17:28
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
全站最新
热门推荐
- 开发者狂喜!腾讯云官宣降价,最高降幅 97.5%,AI 落地成本大降
- 阿里又发了款智能体模型:11小时造出学英语App,还能看懂地铁线路图
- 美国佛州诉OpenAI,被指收集未成年人数据,公司未立即回应
- 快手AI催生15个新职业,包括提示词工程师、AI导演等
- 杜祥琬院士声明:从未参与也未委托任何单位将核技术应用于垃圾焚烧
- 深夜,直线拉升!科技巨头暴涨!黄仁勋一句话引爆→
- 华为nova 16系列确认独占时代少年团专属提示音,功能细节公布
- 哈工大科研团队发现T细胞激活抗癌新机制
- OpenAI挖走中科大少年班校友!12岁上大学,哈佛史上最年轻正教授
- 千里科技5月销售8210辆整车
- 闪电快讯|Computex 2026开幕,安蒙、黄仁勋、陈立武同台论AI
- AI安全利剑出鞘,150家机构获准测试
- 重磅!谷歌将在杭州落地一个“加速中心”
- 中国电信大动作,事关量子科技
- 内存涨价拖累手机销量,UBI Research下调今年OLED材料需求预期





京公网安备 11011402013531号