AI编程大战打响!OpenAI推出GPT-5.3-Codex,与Anthropic同步发布新模型
引文幻觉大幅下降的AI模型OpenScholar诞生,准确率与人类专家相近
全球中文大模型战力榜发布:前三被海外包揽 国产有惊喜
智谱开源GLM-OCR模型:仅0.9B参数,多项基准取得SOTA表现
OpenAI推出macOS版Codex应用:整合智能体化开发逻辑
杨植麟亲自发布Kimi K2.5开源新王:指挥“智能体大军”,效率暴涨450%
DeepSeek-OCR 2发布:让AI像人一样“读懂”复杂文档
研究团队开发了一个名为EDIR的全新评估基准,就像为图像检索领域量身定制了一套更精确的"体检设备",能够更细致地检测AI模型在这项任务上的真实能力。 A:EDIR解决了传统评估的两大问题:一是覆盖更全面,包含…
新测试表明AI实际办公准确率不足25%,但进展比想象更快
这也为未来的技术发展指明了方向:真正的突破不在于进一步提升单句翻译的准确率,而在于增强AI系统在语篇层面的理解和协调能力。DiscoX的测试结果显示,即使是最先进的AI系统,在专业长文档翻译方面仍有明显不足,…
百度发布文心大模型5.0正式版:2.4万亿参数,具备全模态理解与生成能力
05/29 10:26
04/01 16:41
10/31 16:58