“三年前,在世界人工智能大会(WAIC)上,我们正式发布了通义大模型,并承诺将核心模型开源开放。如今,通义千问已实现全尺寸、全模态的全面开源,真正打破了开源与闭源模型之间的技术壁垒。”7月27日在WAIC期间举办的阿里云Agent应用生态论坛上,阿里云副总裁、大数据和智能实验室负责人叶杰平这样总结阿里的开源进程。
与此同时,南都N视频记者关注到,近一周,包括7月28日发布并开源的视频生成模型通义万相Wan2.2,阿里已接连发布和开源4款重磅大模型。
7月28日,阿里发布电影级视频生成模型通义万相Wan2.2,此次共开源文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-TI2V-5B)三款模型。目前,Wan2.2直接将光影、色彩、镜头语言三大电影美学元素装进模型,可以随意组合60多个直观可控的参数,可生成5秒的高清视频,用户可通过多轮提示词进一步完成短剧制作。
此前一周,阿里一口气发布了3个模型,发布后模型快速斩获基础模型、编程模型和推理模型等主流领域全球开源冠军。
其中,千问3最新版基础模型(非思考版),被权威AI研究机构Artificial Analysis评为“全球最智能的非思考基础模型”;千问3推理模型比肩顶级闭源模型Gemini2.5 pro、o4-mini,并斩获推理模型的全球开源冠军;AI编程模型Qwen3-Coder在代码能力及Agent调用能力方面取得重大突破,超越GPT4.1、Claude4等顶尖闭源模型,一举登顶全球最大开源社区Hugging Face模型总榜冠军。
在本届世界人工智能大会展区,阿里巴巴全面展示了从AI基础设施到大模型再到平台及应用的“全栈AI”能力,吸引开发者关注。在展会以外,开源已经成为阿里的固有标签。阿里巴巴三大模型接连开源后,在全球范围内引发新一轮中国开源AI浪潮。海外知名模型API聚合平台OpenRouter数据显示,阿里千问API调用量暴涨,三天突破1000亿Tokens,热度超越GPT、Gemini、Claude等顶级模型,千问包揽OpenRouter趋势榜前三名,创下国产模型的最佳纪录。
“今天任何一个技术站在开源的聚光灯下,都需要具备技术实力,也要主动迎接来自全球的挑战和评判,并且要把这些评判跟反馈不断当作模型和技术迭代的动力。”阿里云百炼高级产品专家徐志远在会后接受媒体采访时表示,开源让阿里在参与全球市场竞争时清楚地知道自己的生态位在哪里,全球开发者都会众测然后给到反馈和信息,这些信息无论是数据还是bad case都比商业世界里面来得更直接,也让模型可以迭代得更快。
数据显示,截至目前,通义千问在全球主要模型社区的下载量已经突破4亿,衍生模型突破14万个,超越Meta的Llama系列成为全球第一的开源模型家族。
采写:南都N视频记者 林文琪