实测阿里万亿参数大模型：开源路线跑通了吗？

IP属地中国·北京 编辑：周伟划重点KeyPoints 时间：2025-09-06 16:04:48

划重点：
1、阿里发布史上最大模型，参数量超过1万亿，编程能力直接反超Claude，证明Scaling Law依旧在奏效。
2、阿里“模+云”的策略形成了从技术研发到商业化落地的最短路径，是Qwen能够取得后来者居上成绩的关键之一。
3、阿里开源模式的核心挑战在于如何平衡开放与收益。Qwen未来不仅需要在技术上持续突破，更需要在商业模式和组织能力上证明自己。
作者林易
编辑重点君
昨天Anthropic刚玩了一手“极端措施”，阿里深夜一波大的直接反手一记重拳——推出其史上最大的模型，Qwen3-Max-Preview，参数量足足超1万亿！
用“通义大模型”微信公众号官方的标题来形容它的能力，就是“强得不止一点”。
因为从基准测试结果来看，Qwen3-Max-Preview已经超越了此前自家的Qwen3-235B-A22B-2507。
并且官方还放出了与Kimi K2、Claude Opus 4（Non-thinking），以及DeepSeek-V3.1的对比结果。
从下面的表格中不难看出，Qwen3-Max-Preview已经在SuperGPQA、AIME2025、LiveCodeBench V6、Arena-Hard V2和LiveBench等基准测试中，均超越了其它选手。
尤其是在编程能力方面，此前Claude默认是业内最强，这次Qwen3-Max-Preview直接以大力出奇迹的方式实现了反超，也是让一众网友惊叹不已。
Qwen在X上的推文中似乎也是一语道破“玄机”：Scaling works（规模化扩展是有效的）。
01
实测阿里史上最大模型
目前，Qwen3-Max-Preview已经可以体验，只需在模型下拉选项中选择即可：
体验地址：https://chat.qwen.ai
并且官方的API服务也已经开放：https://bailian.console.aliyun.com/?tab=model#/model-market（搜索Qwen3-Max-Preview）。
在实际效果方面，已经有不少国内外的网友们展开了实测；例如X上的知名博主AK，他就在HuggingFace集成了Qwen3-Max-Preview的项目AnyCoder中，输入了这样的Prompt：
Design and create a very creative, elaborate, and detailed voxel art scene of a pagoda in a beautiful garden with trees, including some cherry blossoms. Make the scene impressive and varied and use colorful voxels. Use whatever libraries to get this done.
然后，据AK的描述，Qwen3-Max-Preview一次性就实现了如下的效果：
当我们在官网中输入这样的Prompt：
Create a beautiful celebratory landing page for the launch of Qwen3 Max.
只需短短几秒钟的时间，Qwen3-Max-Preview就生成了一个完整的庆祝页面，响应速度实测是非常快的：
接下来，我们加大难度，直接上经典的编程问题——弹跳球模拟碰撞。
先小试牛刀一个：
Write a javascript code that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically, implement it in javascript and html.
可以看到，小球会基于物理规律在六边形的框内运行；并且在用“向上键”去给小球一个力时，它也能立即做出响应。
当我们把球的数量设置到10个，一次性生成的效果也是相当自然：
最后，我们再让Qwen3-Max-Preview生成一个小游戏：
做一个《愤怒的小鸟》的小游戏。
不过虽然是一次性生成成功，但或许因为Prompt过于简单，这个小游戏还是有一些小瑕疵，例如怪物的位置不是很准确；感兴趣的小伙伴可以多次尝试一下。
02
Qwen凭什么后来者居上？
从这次阿里直接从千亿参数模型飙升到万亿规模（近四倍提升），并且一举在众多评测中拿下第一来看，Qwen已然在全球范围内站稳了第一梯队的位置。
但有一说一，纵观整场AI大模型的竞赛，阿里并不是最早在中国推出对标ChatGPT产品的公司，但绝对属于后来者居上的那一个。
相较于国内先行者（如百度），阿里大模型初期可以说是相对低调，不过它的路径却是格外的清晰——用模型开源来构建生态，用自研闭源探索技术前沿。
例如在开源这件事上，从2023年开始，Qwen就以惊人的速度向全球开发者开源多个版本模型。从70亿参数的Qwen-7B到140亿、720亿参数，再到视觉、音频等多模态模型，几乎覆盖所有主流尺寸和应用场景。更关键的是，阿里不仅开源模型权重，还开放商业化授权，极大激发了中小企业和个人开发者的热情。
这一系列动作让它迅速在Hugging Face等全球顶级开源社区建立广泛影响力，吸引了大量开发者围绕Qwen生态创新开发，形成强大社区驱动力。这种广积粮的策略为通义千问赢得了宝贵的开发者心智和应用场景数据，这可以说是闭源模型难以企及的优势。
但在开源之外，阿里内部也从没有停止对模型能力上限的探索。正如官方发布万亿参数模型时所言，Scaling works（规模化扩展有效）。这背后是对Scaling Law的一种笃信——随着模型参数、数据量和计算量指数级增长，模型能力会涌现质的飞跃。
训练Qwen3 Max Preview这样的万亿参数模型，不仅是资源堆砌，更要求在超大规模计算集群稳定性、分布式训练算法效率、数据处理精细度以及工程优化的每个细节上都做到极致。
这背后是阿里数年来在算力基础设施上的巨大投入，以及在AI工程化领域的深厚积累。正是这种大力出奇迹式的饱和投入，让Qwen在编程、推理等核心能力上实现了对Claude Opus等顶级模型的反超。
在开源模型和能力探索之外，阿里云，也是Qwen能够后来者居上的关键一环。
毕竟大模型训练推理是名副其实的算力吞金兽，阿里云为Qwen研发提供了稳定高效的算力基础设施，整合了从数据标注、模型开发、分布式训练到部署推理的全链路工具，极大降低了研发团队工程负担，使其专注算法和模型创新。
并且在模型的应用和普及方面，同样是因为阿里云的MaaS战略，可以让Qwen快速在各行各业中深耕；例如企业客户无需从零训练模型，可直接在阿里云调用Qwen API，或利用平台工具对开源Qwen模型微调，快速构建AI应用。
这种“模+云”的策略形成了从技术研发到商业化落地的最短路径。
03
但也并非完美
虽然阿里在大模型发展的战略和选择促成了它后来者居上的优势，但这并不意味着现阶段的Qwen没有隐患。
因为阿里选择的开源模型引流、云服务变现可以说是一条机遇与挑战并存的道路；它与Meta的Llama系列相似，目标通过开放生态快速抢占市场份额和开发者心智，最终将商业价值导向自家基础设施。
这与OpenAI、Anthropic等闭源+API的精英路线形成鲜明对比，它们优势在于更好保护核心技术，维持技术代差，通过高价值API服务直接获得高额利润。
而阿里开源策略虽能快速普及技术，但这也意味着其最先进模型很难与竞争对手拉开绝对差距，商业模式也更加迂回，需要客户首先认可其云平台价值。
开源模式的核心挑战在于如何平衡开放与收益，当企业可以免费获取并私有化部署性能足够好的开源模型时，他们为官方云服务付费的意愿又会有多强呢？
换言之，阿里云不仅要提供简单模型托管，还必须提供远超开源版本的性能优化、安全保障、以及强大工具链和企业级服务，才能构建足够深的护城河。如何让庞大开源用户群体有效转化为高价值付费云客户，是这条道路上最关键的商业惊险一跃。
除了商业化的挑战之外，在顶尖AI人才争夺进入白热化的今天，任何核心人才流失都可能对团队造成深远影响。
近年来，包括AI框架和基础设施领域关键人物贾扬清在内的一些核心技术人才先后离开阿里，投身创业浪潮或加入其他巨头。虽然对于阿里这样体量的公司而言，个别人员离开未必动摇根基，但负面影响依然存在。
毕竟核心领军人物离开可能影响团队士气，对外传递负面信号，增加后续吸引顶尖人才的难度；在关键技术方向上，领军人物的变动还可能给项目长期战略延续性带来不确定性。
也正像Meta在硅谷持续上演的抢人大战，离开的人才往往成为新竞争对手，他们对原有体系优劣势了如指掌，可能在细分领域构成更精准威胁。
因此，阿里如何在高强度竞争下持续保持对全球顶尖AI人才的吸引力，并建立稳定可持续的人才梯队，是它在未来发展过程中必须面对的严肃课题。
结语
总体来看，阿里通义千问无疑是中国乃至全球大模型领域的顶级力量。它凭借“开源与自研并行”的清晰战略、依托阿里云的强大生态、以及深厚技术人才积累，成功在激烈竞争中占据领先地位。万亿参数模型的发布更是彰显了其在Scaling Law上的决心和实力。
然而，成功之路也伴随着清晰挑战。以开源换生态的商业模式，其盈利能力的持续性仍需市场检验；与OpenAI等闭源巨头的技术代差追逐将是长期过程；而顶级人才的保留与吸引，则是维持创新活力的生命线。
Qwen在未来不仅需要在技术上持续突破，更需要在商业模式和组织能力上证明自己的独特价值。它能否将今天的技术优势转化为明天不可动摇的市场胜势，将是整个行业、包括资本市场关注的焦点。这也是阿里未来市值能否更上一层楼的关键。

标签：模型开源能力 开发者 人才技术全球参数领域关键生态公司团队顶级 基础设施 市场核心大力心智路线 分布式 优势人员规律编程 商业模式 顶尖工具价值 领军人物 商业

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

GSMA MWC26上海盛大开幕，AI、机器人、无人机引领创新浪潮

荒地上的万亿存储赌局：长鑫、合肥与一群人的十年

独家对话｜李开复：我想通了

探索大模型的装配足迹：代码民族志的方法渊源与实践指南

豆包大模型2.1发布，Coding能力进入国际第一梯队

来啦！微信推出独立「支付」App，不怕被封号了

全站最新

GSMA MWC26上海盛大开幕，AI、机器人、无人机引领创新浪潮

荒地上的万亿存储赌局：长鑫、合肥与一群人的十年

独家对话｜李开复：我想通了

探索大模型的装配足迹：代码民族志的方法渊源与实践指南

热门推荐

GSMA MWC26上海盛大开幕，AI、机器人、无人机引领创新浪潮

荒地上的万亿存储赌局：长鑫、合肥与一群人的十年

REDMI K90至尊版搭载骁龙8至尊版处理器 Max同款风冷散热

豪掷 6 亿港元激励全员：MiniMax 以“真金白银”提振团队信心

独家对话｜李开复：我想通了

探索大模型的装配足迹：代码民族志的方法渊源与实践指南

豆包大模型2.1发布，Coding能力进入国际第一梯队

李想力挺增程：技术无高下，用户价值才是终极标尺

来啦！微信推出独立「支付」App，不怕被封号了

美团副总裁陶雪璇：大众点评反对和抵制AI评价

继钉钉、美团后，「置身米内」又来了

当大模型平台与存储厂商深度绑定，将产生哪些冲击波？

“存储浩劫”最新案例：游戏主机厂商直言“能上市已是奇迹”

Token成本算盘打响，Seedance开始驶向“五环外”

天味食品4.22亿元收购坛坛香食品后涨停：从川味复调切入湘式剁椒，近22亿募资扩产后再押并购