【新智元导读】英伟达发布全新架构9B模型,以Mamba-Transformer混合架构实现推理吞吐量最高提升6倍,对标Qwen3-8B并在数学、代码、推理与长上下文任务中表现持平或更优。 除了模型,英伟达表…
英伟达开源9B参数Nemotron-2模型,混合架构实现6倍推理速度提升。
华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,金融行业在AI推理应用中面临三大核心挑战:一是长序列输入导致的“推不动”;二是并发上不去且每Token时延长造成的“推得慢”;三是耗费大量算力做KV重复计算…
综合能力媲美顶级闭源模型 Claude Sonnet-4
阿里云通义千问Qwen Code宣布每日可免费运行2000次
奥特曼深夜官宣:OpenAI重回开源!两大推理模型追平o4-mini,号称世界最强
IT之家 7 月 31 日消息,字节跳动 Seed 团队今天宣布推出实验性扩散语言模型 Seed Diffusion Preview,目标是以结构化的代码生成为实验领域,系统性地验证离散扩散技术路线作为下一代…
10/31 16:58
10/31 16:56
10/31 16:55