新智元报道
编辑:编辑部
在新智元十周年峰会上,昆仑万维董事长兼CEO方汉分享了企业三年四代「天工」的演进故事。从音乐、视频到智能体,昆仑万维在AIGC与AGI浪潮中不断突破,实现了从互联网平台到AI原生公司的转型。昆仑万维凭借全球化布局与持续创新,正在勾勒「破界·融合·共生」的未来愿景。
通用人工智能(AGI)无疑是科技界最令人向往的理想之一,它代表着人类智慧的极致想象。
这个愿景令所有人心驰神往,遗憾的是,暂时我们还难以触碰。
与之相比,人工智能生成内容(AIGC)像流星般划破夜空惊艳了所有人。
现在每个人都可以使用AI生成作品!
当下,用AIGC来生成文字、图片、音乐、影视等作品已经成为时代浪潮!
不论是年初ChatGPT引发的吉卜力热潮,还是谷歌nano banana发布后的香蕉革命,都证明一件事:
每个人都有一颗渴望表达的心。
有机构统计,AIGC市场规模在2023年达到16亿美元,预计到2030年将增长至187亿美元。
2024-2030年预测期间的复合年增长率高达25.39%!
据Global Market Insights报告,AIGC市场预计从2025年的297亿美元增长,2024年已达270亿美元,年复合增长率为11.6%
在这股浪潮中,国内外公司纷纷布局,但有一家中国公司提前就洞察到AIGC的潮流趋势。
在多模态领域不断创新,推出AI智能助手、AI视频、AI音乐与音频、AI游戏、AI社交等的产品矩阵。
在「新智元十周年峰会」上,昆仑万维董事长兼CEO方汉登台,以「破界·融合·共生」为题,分享了昆仑万维如何在全球AI浪潮中完成转型,走向AGI产业实践。
2025年,新智元也一同见证了昆仑万维AI产品的迭代和升级爆发之路。
让打工人沸腾的AI版Office,天工超级智能体(Skywork Super Agents),我们进行了全面实测,从此键盘鼠标彻底退休!
对标李飞飞的World Labs,中国自研的世界模型Matrix-3D,只需单张图就能生成可自由探索的3D世界!
还有中国首个开源的AI短剧模型SkyReels-V1,也出自昆仑万维之手,可以4090(单台显卡80秒)秒生好莱坞级大片!
以上并不是全部,还有很多的产品和模型。
在AI技术浪潮席卷全球的今天,如何将前沿的大模型技术转化为具备商业价值的落地应用,是所有从业者面临的核心课题。
昆仑万维董事长兼CEO方汉先生在峰会上回顾公司发展历程:
昆仑万维在长达17年的发展过程中一直在努力求新求变,不断寻找第二曲线,也不断进行高速转型。
在此基础上,他进一步分享了对多模态AGI产业化的独到见解。
他认为,通用Agent并非万能解,垂类行业的深度推理数据是构筑技术壁垒的关键。
同时,他提出了AI商业落地的核心逻辑:toB在于「增效」,而toC的根本在于「降本」。
方汉还提到一个有趣的观点,情感陪伴这种看似小众的需求,反而是最接近C端用户的真实痛点,这方面的token消耗仅次于编程的需求。
在探索中发现机会
昆仑万维是一家典型的中国互联网企业,17年来不断求新求变、勇于自我转型。
公司成立早期主要在海外实现增长,之后进军网络游戏并成功上市,再到布局互联网平台。
而从2022年起,公司坚定转向AGI与AIGC业务,逐步形成了「三驾马车」:
AGI与AIGC业务(核心增长引擎)
信息分发与元宇宙业务(以Opera浏览器为代表)
投资业务
早在2022年12月,昆仑万维就发布了国内首个开源13B中文预训练大模型,走在行业前列。
事实上,自2020年起,公司便果断押注AI,开启了音乐大模型研发。
如今,音乐模型已成为昆仑万维技术最强、成果最显著的方向之一。
可在当时,创始团队同样面临十字路口:
转型互联网平台五六年,取得了一些成绩,下面该选择什么方向?
当时摆在面前的有四条赛道:Web 3.0、元宇宙、VR、AI。
就在GPT-3带来震动之时,他们押下了那一注。方汉回忆:
当时我们并不知道什么是AGI,但我们相信,GPT-3给我们带来了方向,AIGC会大行其道。
事实印证了选择的正确。
这一步,不仅改变了昆仑万维的未来,也让它在AI浪潮中站上了前排。
昆仑万维的成长轨迹,几乎就是中国互联网企业的缩影。
2008年成立,2015年登陆深交所,公司一度凭借页游、手游出海打开全球市场,业务已覆盖100+ 国家与地区、全球月活近 4 亿;
2025年上半年营收37亿元,海外占比92%。
在发展的前十余年里,昆仑万维经历了三次关键转折:
真正的转折点,发生在2022年。
全球AI浪潮骤起之时,昆仑万维果断All in AI——从开源中文预训练模型起步,迅速延展到音乐、视频、搜索与智能体。
多模态推理、生成与应用「三线并进」,公司由互联网平台型企业,加速跃迁为AI原生公司。
如果说转型是方向,那产品就是验证方向的最好证据。方汉直言:
昆仑万维在AI上的投入是从2020年开始的,最初的探索就是音乐大模型。
三年时间,昆仑万维在语言、音乐、视频、智能体等多模态领域全面开花。
昆仑万维AGI发展里程碑
多模态产品矩阵的持续突破
起点|天工大模型:从1.0 到4.0
天工系列是昆仑万维进入大模型赛道的起点。
2023年,天工1.0发布,成为中国首个对标ChatGPT的双千亿级语言模型;
2024年,天工2.0和3.0相继上线,采用混合专家架构拉开差距;
2025年,4.0进化为多模态,面向C端免费开放,实时语音对话更顺畅。
年四代,主线清晰——以「用」促「研」,把大模型带到更多人手边。
Skywork Super Agents:8小时缩短到8分钟
演讲中,方汉花了最多时间介绍的,是Skywork Super Agents。
这款产品切入的,正是所有人都离不开的办公场景。
传统的office产品:Word、Excel、PPT用起来割裂,来回切换,既耗时又低效。
哪怕是微软、Office、谷歌Workspace这样的全球产品,也没能真正解决这个问题。
方汉一针见血地指出:
80%的办公时间耗在Office。一个大会PPT,动辄2万—10万才能做出专业水准。
过去的AI办公助手,也只是给出一些模糊的建议,真正落地还得由人进行二次加工。
Super Agents想要解决的,就是这种低效。
它走的是一条完全不同的路——不是「问你想做什么」,而是「你最终要什么?」
这个过程是可以追溯的,为的就是确保产品完全不会出现幻觉,显著降低「胡说」风险。
就这样一步步对齐目标;后一口气交付文档、表格、PPT、播客,甚至视频。
过去几天的工作量,如今几分钟就可以交付。
Skywork Super Agents我们做过非常详细的测评,完全就是想象中「智能体」的样子!
首先是支持的模式非常多,几乎涵盖了「打工人」日常能够想到和用到的所有场景。
而且其中有几个场景运行起来真的是那种「科幻般」的效果!
你懂吗,就是钢铁侠和贾维斯互动那种感觉。
方汉现场还分享了一个券商用户的故事:
刚毕业三年之内的初级研究员应该不可能做得比我们这个产品更好。
只有高级研究员才能做得比我们更好,应该来说我们满足了很多用户的刚需。
自5月发布以来,一周内社交媒体话题阅读量破3.5 亿;上线首日因访问量过大限流,一度登顶GAIA榜单全球第一。
它不仅是一款爆款,更成为昆仑万维全球化战略的重要支柱。
艺术与娱乐:Mureka与SkyReels
音乐大模型是昆仑万维最早的布局,也是最具代表性的成果。
2025年3月,Mureka 01发布全球首款音乐「推理」大模型,在指标上对标并超越Suno;
升级至V7.5后,在中文歌曲的音色、演奏技法以及咬字、发言、情感体现上都已经是目前最好的模型。
方汉表示:
昆仑万维的AI音乐模型MurekaV7.5,可以Suno可以相提并论。
如今,从歌词、旋律到演唱、MV,全都能由Mureka一键生成,真正做到了AI「音乐生产一条龙」。
视频方向的代表作品是SkyReels。
2025年2月发布的V1,是国内首个面向短剧创作的生成模型,同年4月迭代到V2。
一张照片 + 一段语音 = 会说话的短剧镜头;还能改台词仍口型自然。
8月A3进一步升级!
方汉笑称说:
昆仑万维不光能驱动人,还能驱动物。
这句话让现场观众会心一笑。
8月升级版SkyReels-A3更进一步,数字人表演效果逼真,成为AI视频生成的一个标杆。
持续拓展的多模态拼图:Matrix与其他新品
另一大亮点,是Matrix系列世界模型。
首先是Matrix-Game2.0:支持实时交互视频的生成,表情动作符合物理逻辑,可用于虚拟游戏训练。
这一产品打通了从游戏自动生成训练数据的管道,从理论上来说可以把所有类型的游戏都变成虚拟世界。
Matrix-3D:能把一张图片和一句话扩展为可探索的3D世界。
Matrix给出另一条路:让AI直接生成可探索的虚拟世界。
除了重点产品,昆仑万维还在不断扩展多模态版图:
Skywork UniPic 2.0:整合生成、编辑与理解,首次引入渐进式双任务强化学习,在复杂指令下表现更稳定;
Skywork Deep Research Agent:打破传统搜索边界,不只检索文本,还能分析小红书、推特、Instagram上的多模态内容。
它们补齐了昆仑万维的多模态拼图,展现了构建完整生态的野心。
大模型落地应用的思考
方汉也分享了他对大模型落地的一些思考。
站在全球市场看趋势,才能更清晰地理解产业逻辑。
昆仑万维如今94%的收入来自海外,AI产品的落地同样以海外为主。
从Token的消耗看人类情感需求
方汉提到一个有趣的现象。
美国的OpenRouter作为大模型聚合API,对外统计过token的消耗情况。
结果显示,87%的token被用于代码相关任务,这个也印证了目前以Cursor为主的编程智能体是主流方向。
但排名第二的并不是大家以为的个人助理或市场营销,而是——情感聊天与角色扮演。
这背后说明了两个事实:
一方面,编程依旧是大模型最强的应用场景;另一方面,情感陪伴这种看似小众的需求,反而是最接近C端用户的真实痛点。
通用Agent解决所有问题是伪命题
方汉在介绍Agent时,提出一个有意思的观点:
通用Agent也许不能解决所有问题。
像过去的Windows+Office、安卓+GMS以及其它的所有行业软件都各有巨头。
从历史上来看,没有任何一家公司能够垄断所有方向。
一个通用Agent能解决所有问题吗?方汉认为非常有难度。
原因可以从目前token的消耗比例和大模型发布时喜欢「打榜」窥见一二。
现在不管是GPT-5,还是Grok 4,还是最新发的Claude 4.1,发布时的评测榜单以数学和编程榜单最多。
现在token消耗最多的是编程,那为什么大家都去打数学榜单?
难道所有人用大模型都是为了解数学题吗?
根本原因是,目前人类能够获得最好的数据其实还是代码和数学。
尤其在GPT-4o把CoT引入大模型之后,所有大模型要想能力提高,都需要非常好的、非常全的推理数据,也就是说有解题过程的数据。
而很令人幸运的是,由于GitHub大规模版本控制工具中心的出现,人类的代码有史以来过程数据最详尽,每次做代码提交都要写原因,都要写注释,代码质量是最高的。
而数学由于中国、印度的K12教育是全世界发展最好的,人类积累了将近2亿条K12教育的数据,尤其数学题的数据。
所以说,数学题也能解得很好。
反观其它领域的数据其实没有中间过程。
比如法院判决书会写理由,却不会告诉你法官的完整思考链条。
缺乏推理过程的数据,就很难支撑模型能力的跃升。
因此,在他看来,通用Agent不是最优解。
未来真正的突破口,在于各个垂直行业自己去积累和构建推理数据,才能像编程和数学一样,出现质变。
未来愿景:破界·融合·共生
在方汉看来,这些产业观察并不是和产品割裂的,而是共同勾勒出未来大模型发展的方向。
科研突破、产品迭代、产业落地,最终都要汇聚到一个更宏大的愿景:破界、融合、共生,就像昆仑万维的产品矩阵一样。
昆仑万维多模态AGI产业生态
昆仑万维在坚持「All in AGI & AIGC」 的同时,依托海外收入占比92%的先发优势,走出「先全球化、再本土化」的产业落地路径。
在演讲的最后,方汉用一句话点明了大模型落地的逻辑:
ToB是增效,ToC是降本,这是两个最基本的逻辑。
无论是Skywork Super Agents提升办公效率,还是Mureka、SkyReels让音乐与视频创作的门槛大幅降低,背后都对应着同一个趋势——
智能红利,正在以更低成本、更高效率,触达更多人。
站在十周年的新起点,新智元与昆仑万维一起回望过去十年的AI浪潮,更要展望未来的「破界·融合·共生」。
方汉强调的是:
AGI是一个理想;
但AIGC让每个人更好地表达自我,这是可以落地的。
这也是昆仑万维的愿景:实现通用人工智能,让每个人更好地塑造与表达自我。
今天,中国企业在AIGC领域迎来了特殊机遇。
一方面,受限于融资环境,许多企业被迫更专注于商业落地与盈利模式探索;另一方面,这种压力反而加速了中国厂商在AIGC赛道上的实践和创新。
正如「穷人的孩子早当家」,昆仑万维坚信中国企业必将在AIGC这一最接近C端用户、最具增长潜力的领域,实现突破和领先。
在破界、融合、共生的过程中,让我们共同见证并推动AGI产业的繁荣发展。