滴滴出行:推动算法透明化 绝大多数订单由距离最近的司机接单
实测结果:别等Mythos了,现有AI已“高危”
SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI
从谄媚到作弊,Anthropic发现AI内部还有另一套东西
单纯延长模型内部推理轨迹的时代将过去,未来的主导将是在与环境交互中持续迭代的智能体思考。
大学教授实测AI眼镜“作弊”:30分钟斩获92.5分 碾压95%的学生
06/25 00:17
06/25 00:16
06/25 00:15