当前位置: 首页 » 资讯 » 科技头条 » 正文

更能干活的豆包2.1 Pro来了,字节这回为什么要强调「质变」?

IP属地 中国·北京 编辑:唐云泽 雷科技 时间:2026-06-23 18:18:44

今天北京的天气出奇的好,微风不燥。

雷科技受邀来到了北京国家会议中心,准备好好探一探这场预热已久的火山引擎Force原动力大会。

刚走到会场门口,好家伙,这阵仗属实给我看呆了。

(图源:雷科技)

在现场排队签到的不仅有穿着格子衫的自媒体老熟人,还混进去了大批西装革履的传统行业大佬,以及不少大学生样貌的AI爱好者们,大家都像商量好了一样跑来前排吃瓜。

小雷我自然是早早找了个视野不错的前排位置,准备好好看看字节今天到底准备端上来什么活。

豆包2.1领衔,视频AI再升级

自豆包大模型发力以来,字节的大模型业务在国内市场已经领先了很长一段时间。

这次主论坛刚开场,火山引擎总裁谭待就披露,截至今年6月,豆包大模型日均Token调用量已突破180万亿,过去一年增长超10倍。IDC数据显示,在中国公有云MaaS服务市场,火山引擎以49.5%的市场份额位居第一。

(图源:雷科技)

手持日活用户最多的AI应用,占据接近一半的Token用量市场,这确实是足够惊人的成绩。

有了这样的成绩做底气,字节这才为我们带来了全新的豆包大模型2.1 Pro。

作为本次大会发布的主力模型,豆包2.1 Pro在 Coding(编程)、Agent(智能体)、VLM(视觉语言模型)三大核心方向实现能力跃升,能真正满足企业与个人在生产场景中的使用需求。

(图源:雷科技)

为了让这次提升更形象,大会放出了一系列极其硬核的成绩。

在好几个国际权威评测里,豆包2.1 Pro的代码和智能体能力直接一脚踹开了全球第一梯队的大门。

就拿那个叫Terminal Bench 2.1的仿真编程评测来说吧,豆包2.1 Pro的成绩居然和行业里领先的Claude Opus 4.7基本打平了;在另一个叫SciCode的科研测试里更是直接拿了59.8的高分,把Opus 4.7和GPT-5.5都甩在了后面。

(图源:雷科技)

那它能做什么呢?

谭待在现场展示了一个案例,豆包2.1 Pro模型可以自主思考、决策,灵活调用50个智能Agent同步协作,完成上千轮工具调用,生成超百栋建筑,最终完成3D虚拟城市场景的搭建。

这样的Agent调度和场景搭建能力,几乎可以取代传统游戏行业里的地编一职。

价格方面,豆包2.1 Pro输入价格为每百万Token 6元,输出价格30元。在实际使用成本上,相比Claude Opus 4.6可以降低接近80%。

与此同时,他们还推出了更新更快的Doubao-Seed-Evolving版本,计划以每月两到四次的频率持续更新。

当然,全场最让人惊掉下巴的,还得是视频模型Seedance的进化。

首先,Seedance 2.0现在已经能直接硬搓原生4K高清视频了,支持10-bit高位深直出,画面细节里的头发丝、建筑边缘的纹理都清清楚楚,完全可以拿去当院线广告片播。

(图源:雷科技)

但更猛的还在后头,官方预告了七月初才会正式上线的Seedance 2.5版本。

这个还在画饼阶段的2.5版本,能一口气生成30秒的超长原生视频,这直接干碎了目前行业里普遍卡在5-15秒的瓶颈,能让镜头表达变得更加连贯,这样一分钟的短剧只需要衔接一次就行。

不仅如此,它还能一次性塞进去50个不同模态的素材让它参考,背景声音、参考角色、参考视频都能添加;而且还支持局部修改,从现场演示来看,你真的可以圈选画面里的一个物品进行替换,不用因为角落有个小bug就全盘重新抽卡。

(图源:雷科技)

这说明,字节想做的绝不仅仅是一个能帮大家捏搞笑视频的玩具。

快速生成、一键出海,展区都是真家伙

听完台上画的饼,中场休息一到,小雷我立马百米冲刺扎进了外面的展区。

毕竟骡子是马,还得牵出来溜溜。

你别说,这次Force原动力大会的展区比往年要大不少,除了豆包自家的能力展示,还有不少实打实的产业落地案例。

我这边先是被“AI+汽车”的展台死死按住了脚步。

现场一共来了六款展品,其中不少都是上海车企的产品,而这些展品以及特斯拉全系车型,都已经接入了豆包模型作为新一代语音车控。

(图源:雷科技)

这可不是以前那种机械死板的语音助手,在端到端的实时语音模型加持下,你在车里随便打断它、跟它连续瞎扯,它都能极其自然地接上话。

反应速度快得离谱,体验感直接拉满。

接着走上2L,我转头就看到了刚才预告的Seedance 2.5的样片演示。

整个样片做得非常惊艳,剧情主线以男主制作的视频被孩子意外捣乱展开,看着男主不断发现AI世界里的错误并修正,真的完全没有违和感,甚至没有出现过画面拼接、重绘之类的破绽,一致性非常出色。

(图源:雷科技)

遗憾的是,现场并没有给我们上手体验的机会,这让我更加期待七月份正式上线的时候。

更让我震撼的是一个短剧出海的业务场景。

(图源:雷科技)

以前咱们国内的短剧和动漫想卖到海外,往简单了说也得找老外重新配音、甚至要去重新找老外进行翻拍,哪怕这些老外不一定是什么职业演员,但这来来去去的,成本也和重新拍一部短剧差不多了。

现在倒好,有了Seedance 2.0,直接一键替换影片里角色的脸,连配音的嘴型和口音都给你完美适配当地市场。

工作人员表示,目前已经有大量内容公司在使用类似方案进行海外发行。

(图源:雷科技)

谭待:价值比价格重要,AI性价比正持续提升

雷科技(ID:leitech)参加的群访环节里,有两个问题也挺有代表性。

第一个问题是,最近不少国产大模型的API价格水涨船高,火山引擎对此怎么看。

毕竟之前各家都在疯狂打骨折,现在突然来了一波回调,虽然比起海外的Tokens还是便宜不少,但大家心里多少有点嘀咕。

谭待给出的回答很直接:相比价格,他们更关注价值。

简单地说,虽然价格有了变动,但他们认为这批全新大模型带来的生产力跃升和业务价值提升,远远大于那点成本涨幅,实际上,整体的性价比是在提升的。

这套逻辑能不能说服市场暂且不谈,但确实代表了行业正在发生的变化。

第二个问题则是关于Seedance的。

(图源:雷科技)

有媒体问,Seedance 2.0目前为火山引擎带来的单日创收能力是非常强的,你们认为这个涨势能够持续多久?市场会不会已经接近饱和?

对此,他们的回答倒是很有意思。

首先,他们说市面上流传的那些短剧为Seedance带来的收入数据,很多都有点虚高,事实上远没有达到这样的水平。

更关键的是,短剧对Seedance来说,仅仅只是一个极小的落地场景,他们早就把手伸向了更广阔的产业里,比如电商的产品动态展示、枯燥说明书的视频化、售后指导、企业内训甚至教育课件等。

Seedance对视频门槛的降低,让很多传统媒介获得了升级的机会。

不仅如此,谭待表示,视频生成是通往世界模型的路径之一,在实体产业中有巨大的应用潜力。目前,已经有很多制造业和汽车产业的公司,正在通过Seedance输入环境数据,模拟不同决策带来的后果,帮助自身的技术更好地发展。

如果继续发展下去,它很可能会逐渐演化成世界模型的一部分。

说在最后

其实看完整场发布会之后,小雷印象最深的并不是豆包2.1 Pro的跑分,也不是Seedance 2.5能多生成了多少秒视频。

而是谭待在现场反复提到的那个词——质变点。

(图源:雷科技)

过去几年,大模型行业一直在讨论能力增长,模型更聪明了,上下文更长了,生成速度更快了,但这些变化很多时候都属于量变,用户能够感知到进步,却未必会因此改变工作方式。

而所谓质变点,本质上是模型开始真正进入生产流程的那个时刻,当我们不再把大模型视作一个“玩具”,而是能够稳定完成任务、创造实际价值的生产工具,才能算是跨越了质变点。

这个说法听起来有点抽象,但逛完展区之后反而很好理解。

(图源:雷科技)

无论是AI参与智能驾驶场景模拟,还是奔驰中国研发负责人宣布豆包上车;无论是漫剧出海时直接替换角色、口型和配音,还是企业利用视频生成完成产品展示、培训教育和售后服务,本质上都在证明一件事:

AI正在从演示案例,变成业务流程的一部分。

如果说过去的大模型竞争是在比谁更聪明,那么现在的竞争已经逐渐变成谁更能干活。

从这个角度来看,质变点更像一个行业信号。

当越来越多企业开始把AI放进真实业务流程,当越来越多收入来自实际生产场景,而不是技术演示的时候,大模型行业才算真正进入下一个阶段。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。