9月12日,阿里通义发布下一代基础模型架构Qwen3-Next和基于新架构的模型Qwen3-Next-80B-A3B,包含两个版本:更擅长理解和执行指令的指令(Insctruct)模型,以及更擅长多步推理和…
基于 Qwen3-Next 的模型结构,通义团队训练了 Qwen3-Next-80B-A3B-Base 模型,该模型拥有 800亿参数(仅激活 30 亿参数),实现了与 Qwen3-32B dense 模…
微软豪掷重金自研AI芯片集群,谋求技术自主能力
阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列
在大会开幕式上,中国工程院院士、之江实验室主任、阿里云创始人王坚发表主题演讲,提出了一个重要观点:在AI时代,开源的内涵正在发生“革命性变化”——从以往“源代码的开放”逐渐转向“资源的开放”。模型权重的开放本…
王坚谈道,大模型权重的开放,本质上是数据资源和计算资源的开放,“因为有了模型开放以后,你再也不需要自己花那么多计算资源重新做有人替你做过的事情”。“到了今天,只是开放源代码,其实不解决过去在软件时代解决的问题…
10/31 16:58
10/31 16:56
10/31 16:55