综合能力媲美顶级闭源模型 Claude Sonnet-4
阿里云通义千问Qwen Code宣布每日可免费运行2000次
奥特曼深夜官宣:OpenAI重回开源!两大推理模型追平o4-mini,号称世界最强
IT之家 7 月 31 日消息,字节跳动 Seed 团队今天宣布推出实验性扩散语言模型 Seed Diffusion Preview,目标是以结构化的代码生成为实验领域,系统性地验证离散扩散技术路线作为下一代…
该论文第一作者当时写这篇论文时还只是Deepseek的实习生
近期,一项针对大型语言模型(LLM)的研究揭示了一个惊人的发现:当输入文本的长度扩展到1万个tokens时,多个主流大模型的性能出现了显著下滑,宛如“智商”骤降。 这项研究由Chroma团队完成,他们利用升级…
04/01 16:41
10/31 16:58
10/31 16:56