让模型自信的深度思考。
【新智元导读】英伟达发布全新架构9B模型,以Mamba-Transformer混合架构实现推理吞吐量最高提升6倍,对标Qwen3-8B并在数学、代码、推理与长上下文任务中表现持平或更优。 除了模型,英伟达表…
英伟达开源9B参数Nemotron-2模型,混合架构实现6倍推理速度提升。
华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,金融行业在AI推理应用中面临三大核心挑战:一是长序列输入导致的“推不动”;二是并发上不去且每Token时延长造成的“推得慢”;三是耗费大量算力做KV重复计算…
综合能力媲美顶级闭源模型 Claude Sonnet-4
阿里云通义千问Qwen Code宣布每日可免费运行2000次
07/09 12:23
07/09 12:22
07/09 12:21
07/09 12:20