当前位置: 首页 » 资讯 » 科技头条 » 正文

字节AI1080天闪电逆袭:从后知后觉到AGI全面发力

IP属地 中国·北京 21世纪经济报道 时间:2025-12-25 12:16:16



21世纪经济报道记者雷晨

站在2025年的岁末回望,字节已全面投入人工智能领域将近三年。

2023年初,当GPT-4如海啸般席卷全球科技界,字节内部却弥漫着浓浓的焦虑——在生成式AI这场决定未来十年格局的竞赛中,他们似乎已经落后。彼时,公司尚无统一的大模型战略,多个业务线各自为战,AI Lab早已从“前沿探索”转向“技术中台”,研究重心倾斜于推荐优化,技术积累与时代浪潮之间出现了一道危险的裂隙。

然而,三年之后的今天,字节不仅补上了课,更以惊人的执行力构建起覆盖基础模型、应用产品、开发者生态乃至硬件终端的全栈AI能力。

从仓促组队到全面拥抱AGI,从承认落后到局部领跑,字节用一场自上而下的组织革命与技术重构,完成了一次堪称教科书式的战略转身。

截至2025年12月,火山引擎披露已有超50万家企业接入字节AI相关能力;豆包作为核心产品,用户规模与商业化进程持续提速,成为国内AI原生应用赛道的标杆之一。

这些成绩背后,是一场始于危机、成于决断的AI闪电战。

字节并非没有AI基因,但在生成式AI赛道确实错失了先机。

尽管字节以算法驱动内容分发起家,其AI技术积累可追溯至更早时期——2016年便成立了AI Lab,最初由微软亚洲研究院前常务副院长马维英负责,直接向张一鸣汇报,团队规模在2018年达到150人,覆盖机器人、AI4S等多个前沿方向,抖音的推荐算法、短视频特效等核心功能均脱胎于此。

但随着抖音、TikTok占据绝对市场优势,流量商业化成为集团Top级任务,AI Lab的定位在2020年从集团级前瞻性项目转为技术中台,汇报对象也变为抖音负责人张楠,研究重心集中在“优化推荐系统”和“提升广告转化”,而非构建通用智能。

在大模型这一新范式面前,字节既无统一战略,也无核心底座。多个业务线各自为战:搜索团队尝试训练语言模型,抖音探索AIGC工具,TikTok则在海外试水聊天机器人——资源分散,方向模糊。2020年年中,马维英离开字节,AI Lab负责人一职由李航接任。

转折发生在2023年3月。GPT-4发布后,其展现的多模态能力与逻辑推理水平震撼全球科技界,也让字节高层彻底意识到差距。梁汝波迅速召开紧急高管会,成立“大模型专项”,由时任AI Lab负责人李航牵头,明确以“快速追赶、聚焦应用”为核心目标推进研发。

与此同时,产品侧由时任TikTok产品技术负责人的朱文佳主导,启动名为“豆包”(Doubao)的AI助手原型开发——彼时“豆包”尚未与“云雀”大模型绑定,只是一个临时整合的产品名称。初期版本集成于抖音搜索,试图通过流量优势快速获客。

这一年,字节加大AI领域资源投入,重点用于算力采购与人才招聘,但只推出了豆包1.0、抖音AI特效等几款浅度产品。年底的战略复盘会上,梁汝波再次强调:“承认落后不可怕,可怕的是不敢彻底变革。”

2024年初,字节启动成立以来最彻底的AI体系重组,标志着AI业务从“支持职能”正式升级为“一级战略”。核心调整是拆分出两大独立单元——Seed(基础模型研究)与Flow(AI产品创新),与抖音、TikTok、火山引擎等业务线平级,直接向梁汝波汇报。

(一)Seed:整合力量,确立技术路线

关键人物吴永辉的加入成为Seed团队的转折点。吴永辉曾任Google DeepMind研究副总裁,在强化学习与多智能体系统领域具有深厚积累,是全球AI界公认的“工程化落地大师”。他于2025年2月正式入职字节。

2025年2月后,李航卸任AI Lab负责人,转为公司顾问,吴永辉正式接管Seed团队,随后启动了更大规模的组织整合——将原AI Lab下属的NLP组、视频生成模型团队PixleDance、智能创作团队等分散力量全部并入Seed,确立“多模态优先、高效训练、低成本部署”的技术路线。

为保障长期创新,字节还对Seed团队取消了季度考核,改为年度OKR评估,允许团队投入20%的资源用于探索性研究,例如AI4S(AI for Science)、通用机器人等前沿方向。

(二)Flow:产品创新,流量赋能

Flow部门由产品副总裁朱文佳主导,创新采用“特种兵小组”模式:每个产品由3–5人组成独立单元,组长多为3-2职级,拥有高度自主权,可直接调用Seed的模型能力。

Flow团队聚焦AI产品的快速落地与迭代,依托字节全域流量,推出一系列爆款应用:豆包 App 独立上线,支持多轮对话与内容创作;Coze(扣子)平台开放给开发者,提供低代码 AI 应用搭建工具;Seedance视频生成工具实现超高清视频秒级生成,音画同步体验大幅优化。

这些产品通过字节庞大的流量网络形成协同效应:抖音内嵌豆包入口,TikTok海外版测试CozeBot,PicoVR设备接入即梦视频引擎,剪映集成AI剪辑功能。

效果立竿见影。据QuestMobile数据,截至2024年12月,豆包MAU达7523万,稳居国内AI原生应用首位,AI原生APP整体MAU突破1.2亿,同比增长232%。

如果说2024年是“应用领先”,2025年则是字节在AI赛道“跑马圈地”的关键之年。公司不仅实现“后来居上”,更在前沿技术、全球化布局、硬件生态、基础设施四大维度全面加码。

最显著的信号是创始人张一鸣的回归。

2025年4月,张一鸣通过内部全员信宣布,亲自带队新加坡AI实验室,聚焦三大前沿方向:多模态大模型、AI智能体(Agent)、自研AI芯片。这是他淡出日常管理三年后首次明确负责具体业务,足见AI在字节战略中的核心地位。

在技术研发层面,2025年字节持续迭代多模态大模型,目标是在工具调用、长期记忆、跨模态推理等维度实现突破。新一代模型采用“基础模型+任务模型”的模块化架构,可根据不同场景快速适配,例如在数学推理场景接入专用推理模块,在视频生成场景强化视觉建模能力。2025年12月发布的豆包大模型1.8,针对多模态Agent场景进行定向优化,在工具调用、复杂指令遵循和OS Agent能力上显著提升。

生态建设方面,火山引擎推出“AI节省计划”,覆盖所有按量后付费的大模型产品,通过阶梯式折扣帮助企业最高节省47%的成本;同时开放豆包大模型API、Seedance视频生成API等核心能力,进一步完善围绕字节AI的开发者生态。

值得关注的是,字节在2025年下半年加快了AI硬件的布局:与歌尔股份合作开发的AR眼镜预计于2026年量产;OlaFriend AI耳机第二代产品进入研发测试阶段,拟新增健康监测、智能降噪功能;豆包手机助手深度植入字节合作机型,具备跨应用串联任务的能力;PicoVR设备接入豆包多模态能力,支持语音控制、虚拟人交互、AI生成VR内容。

时间给出了一个清晰的刻度:从2023年初的“后知后觉”,到今天的“全面拥抱AGI”,字节用三年时间完成了一场AI战略转身。

当前,AI浪潮仍然汹涌,全球AI竞赛已进入深水区,技术突破的窗口期正在缩短。海外OpenAI、Google DeepMind持续领跑前沿技术,国内的百度、阿里、华为等大厂也在加大投入,DeepSeek等创业公司凭借专注领域的优势快速崛起。

对于字节而言,三年前的焦虑已经转化为一种持续的压力。未来,值得期待,更充满变数。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。