大象新闻记者从阿里了解到,千问3.5实现了底层模型架构的全面革新,此次发布的Qwen3.5-Plus版本总参数为3970亿,激活仅170亿,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,…
有业内人士表示,Agent能力大幅增强的千问3.5,或将进一步打开千问APP在工作和生活中帮人办事的想象空间。面向不同国家的AI开发者和企业的需求,千问大模型还在持续演进:千问3.5扩展支持201种语言,将词…
千问团队自研的门控技术成果,曾斩获全球AI顶会2025 NeurIPS最佳论文,该前沿技术已融入千问3.5创新的混合架构中去,团队结合线性注意力机制与稀疏混合专家MoE模型架构,实现了397B总参数激活仅17…
千问团队自研的门控技术成果,曾斩获全球AI顶会2025 NeurIPS最佳论文,该前沿技术已融入到千问3.5创新的混合架构中去,团队结合线性注意力机制与稀疏混合专家MoE模型架构,实现了397B总参数激活仅1…
在这场技术进击中,北京在中国AI企业中一马当先、表现亮眼,抖音、智谱AI、月之暗面、生数科技等企业相继推出新一代大模型产品,在通用大语言模型、多模态视频生成、代码编程、具身智能等核心赛道实现全面突破。从“会…
与前代产品不同,Qwen3.5实现了从纯文本模型到原生多模态模型的代际跃迁。 性能方面,Qwen3.5在MMLU-Pro知识推理评测中得分87.8分,超越GPT-5.2;在博士级难题GPQA测评中斩获88.…
这次的豆包2.0包括Pro、Lite、Mini三款通用Agent模型和Code模型,灵活适配各类业务场景。 具体来看,豆包 2.0 全面升级了多模态能力,在各类视觉理解任务上均达到世界顶尖水平,视觉推理、感…
刘庆峰坦言,受限于国产算力的训练效率和资源规模,讯飞在通用模型迭代上比国际巨头慢3到6个月,“但流水不争先,争的是滔滔不绝”。在年会现场,刘庆峰给出了科大讯飞的三大国家战略定位:全栈自主可控大模型持续对标全球…
06/25 00:17
06/25 00:16
06/25 00:15