GPT-5在SWE-bench Verified中得分74.9%,在Aider Polyglot得分88%。
Claude 4.1 发布:更强的Agent、代码和推理
奥特曼深夜官宣:OpenAI重回开源!两大推理模型追平o4-mini,号称世界最强
目前,该模型已在魔搭社区与Hugging Face开源。
LPU,专为推理而设计的硬件。
在Video-TT出现之前,视频理解领域已有相应的评测标准,但这些标准普遍存在一定局限性,导致AI的真实能力无法被准确衡量。在这种情况下,一些顶尖模型的表现接近甚至达到了人类水平(上图左侧),这容易给人一种…
目前,该模型已在魔搭社区和HuggingFace平台全面开源。
被OpenAI点名后,智谱刚刚发布新开源模型:国产最全能,一句话造出搜索引擎
为了考察大模型在实际金融场景中部署的能力,蚂蚁数科还联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构联合推出Finova大模型金融应用评测基准,深度考察智能体能力、复杂推理…
支持零样本声音复刻,提升沟通自然度。
在多人会议等复杂场景中英双向翻译准确率超70%。
10/31 16:58
10/31 16:56
10/31 16:55