马斯克抢先谷歌一步放大招,Grok 4.1登顶LMArena,创意写作直逼GPT-5.1
JetBrains发布AI编码智能体基准测试平台DPAI Arena
AI大模型实时投资比赛“Alpha Arena”落幕,阿里千问Qwen夺冠
ChatbotArena像一个用户社区评测中心,它改变了通过学科测试来评测AI技术的传统方式,将评价权交给了社区用户,并且采用匿名、众包的成对比较,来评估大模型。 Chiang希望LMArena能够成为一…
以往,以GPT系列为代表的闭源大模型在技术和性能上一直占据领先地位。 有观点认为,正是DeepSeek等开源大模型能够与闭源顶尖模型相抗衡,才使得众多应用端公司得以将精力集中在模型调优和应用优化上,从而加速了…
在这一榜单中,还出现了DeepSeek、Qwen、GLM等多个系列的不同型号模型,以及Kimi在7月份开源的K2模型。Hugging Face发布的中国AI社区7月开放成果中,包括阿里、智谱、昆仑万维等多家厂…
06/25 00:17
06/25 00:16
06/25 00:15