文本/代码 推理/agent 终于大一桶
实测GPT-5:写作坠入谷底,编程一骑绝尘
GPT-5在SWE-bench Verified中得分74.9%,在Aider Polyglot得分88%。
“观众”们的反应有点微妙......
本次更新最值得关注的改进,就是添加了AI智能体插件
GPT-5内测抢先公布:日常推理首次击败人类,编程数学科学问题能力都很强
相机教练功能将提供实时反馈,并在构图、照明和角度上提出改进建议
华为车辆编队专利公布 可提高智能驾驶安全性
周鸿祎谈英伟达芯片是否“留后门”:技术上很难判断 关键看是否有意引入漏洞
有一点可以肯定的是:GPT-5,只是新战局的起点,而不是终点。
07/09 12:20
07/09 12:19
07/09 12:18