![]()
几天前,豆包又推出了一款新产品——豆包输入法。
输入法是古老的工具型产品。在移动端,用户早已习惯了使用手机自带的输入法,或是沿袭PC时代的习惯,使用搜狗输入法、QQ输入法等。
直到2022年微信输入法横空出世,这块稳得不能再稳的市场才迎来新的变量。凭借微信的庞大用户池,微信输入法很快成为许多用户的新选择。
但如前所述,微信对于输入法似乎兴趣不大。过去三年间,它并没有给输入法增添复杂花哨的功能,即便是AI能力也十分克制。这也和微信长期以来的产品哲学一脉相承。
相比之下,豆包输入法显得颇为“激进”。
它把语音输入作为最大卖点,传统的键盘输入只保留了拼音输入法,试图以更简单的使用体验吸引用户。
但显而易见的是,豆包及其背后的字节,并非对输入法市场产生了浓厚兴趣。豆包输入法更像是字节对微信的又一次突袭,角度极其刁钻,又十分精妙。
豆包此前已经成为国内用户量最大的AI APP,MAU(月活跃用户)达1.7亿。但与14亿MAU的微信相比,豆包仍存在数量级的差距。
这就造成了一个长期问题:字节使出浑身解数,为豆包吸引了近2亿用户;但倘若微信全面接入腾讯自己的AI服务,那么字节在AI应用层被腾讯反超,并非不可能。
事实上,腾讯已经在这么做了——微信搜索框已经演进为“AI搜索”。
豆包的解法是:既然无法正面击败微信,那就“化身”工具型应用,直接“住进”微信的聊天框里,满足微信用户的AI应用需求,从微信汲取新用户。
豆包输入法,就在这样的背景下诞生了。
除了输入法,从最基本的截图,再到效率化的办公工具,最后是会议纪要的智能,豆包正在针对微信的一系列“槽点”做文章,以期获取增长。
背负着十亿用户的微信,遇上豆包这个挑战者。前者实力雄厚,后者却不按常理出牌、专门挑微信的“软肋”进攻,肉搏战才刚刚开始。
A
打开豆包输入法,其页面布局、配色几乎和微信输入法相同,降低了用户从微信输入法切换到豆包输入法的门槛。
与微信输入法相比,豆包输入法的优势在于语音识别。
豆包用的是Seed - ASR2.0模型,而不是传统的机械转写语音。相较于传统语音识别,基于大模型的语音识别能够理解上下文、识别专业术语、自动断句。
实测中,能过滤说话时的 “嗯、呃” 等口头禅及重复表述,还会依据语境梳理语义。就算是用中英混合表达 ,比如“帮我scan入电脑做个copy,再share给大家” ,豆包输入法依然能准确识别并转写。
此外,当用户处在嘈杂的环境里用语音输入时,豆包也能够准确过滤背景噪音,识别出真正的语音内容。
使用微信输入法测试同样的内容,微信输入法也能识别中英混杂的语音。但是在嘈杂环境中,尤其是地铁场景,豆包输入法则更准确一些。
豆包输入法还提供了150MB的离线语音模型,无网时也能实现0.8秒低延迟语音转换,而微信输入法在离线场景下的语音识别表现较差,小错误较多。
相较于微信输入法,豆包输入法取消了输入法皮肤管理、五笔输入,手写输入、AI搜索等功能,仅保留了拼音输入和语音输入。
此外,豆包还压缩了安装包的体积,APK有146MB。相比之下,微信输入法安卓版将近200MB,iOS版更是有400MB。
但豆包输入法也有一些巧思。
比如输入“吴承恩是哪个朝代”,微信输入法会联想“的人”,而豆包输入法则是会在联想窗口回答“明朝”。当用户输入 “CT 值” 这类专业词汇时,豆包输入法能关联医学解释。
微信输入法:
![]()
豆包输入法:
![]()
豆包输入法发布时,字节方面表示之所以要删除传统输入法常见的功能,就是为了凸显AI元素,把AI作为输入法的核心竞争力来打造。
相比之下,微信似乎更看重输入法作为生态补充的角色,并没有投入全部资源去做极致的AI体验。微信输入法的关联更多是辅助社交场景的简单功能,像输入关键词关联表情包、小程序等,在深度语义联想、专业内容辅助上稍显不足。
微信输入法发布于2022年,2024年6月它就推出了接入腾讯混元大模型的首个AI版本,2025年1月更是迭代到了4.0版本。可是在实际产品的体验过程中,微信输入法的AI能力,展现得相当克制。
B
这不是字节第一次对微信发起挑战。
早在2019年,字节就推出独立社交产品多闪,主打视频社交,以“随拍”等功能对标微信朋友圈,发起对微信社交版图的首次高调挑战。
2025 年多闪更是密集迭代31次,升级为专注即时通讯的“抖音聊天版”并登顶应用商店社交榜,再次以生态协同的方式与微信形成竞争。
随着AI时代到来,豆包成为字节挑战微信的又一员大将。
2025年6月,豆包全量上线了AI播客功能。该功能最大的特点是真实感很强,比如自然的停顿、“嗯” 这类附和语,甚至偶尔还会出现主持人口误修正。
同时,豆包AI播客的处理速度很快,8万字的英文文档播客只需要3秒就能完成转换,且提供多音色选择,还会自动为播客配图、生成进度条和标签。
而且豆包AI播客具备实时交互和多轮追问能力。用户收听时可随时中断并提出问题,比如收听行业报告类播客时,追问市场规模预测逻辑,系统会结合文档内容给出针对性解答。
微信AI播客2025年8月开始灰度测试,仅在 “快讯” 板块实行,功能比较基础。生成男女主播对谈形式的快讯播客,更偏向资讯播报的风格,没有真人播客中那种交互感。
豆包对微信发起的突袭,命中了微信的一些“槽点”。
就拿截图功能来说,微信的截图支持方框、圆圈等基础标注,也有文字提取和翻译等常用能力,对于手机端的日常截图场景来说足够用了。但微信的截图功能不包含任何AI能力。
豆包的截图提问功能中,用户在截图完成后,可以让豆包总结截图的内容,还可以对截图内容进行追问、解答。
又比如,微信一大核心功能就是传文件,但是微信的文件传输功能存在有效期限制,且无法对传输的文件进行深度处理。
豆包则推出了AI云盘。这个功能不仅提供多设备文件同步和管理,更核心的是能对上传的各类文档、图片进行智能解析。
![]()
例如,用户上传一份项目策划PDF,微信仅能让接收方查看原文,而豆包可提取PDF中的核心目标,然后总结全文。
同时该云盘无普通文件有效期的困扰,用户随时可调用文件进行二次解读或编辑,这对于经常需要处理各类文档的职场人来说,比微信文件传输更可靠,分流了大量文件传输后的解析需求。
C
不过站在客观的立场上,微信之所以显得中规中矩,也有其深层原因。
微信作为一个承载了社交、支付、资讯、生活服务等功能的国民级应用,它的任何变动都需要评估广泛影响。这种考量在无形中提高了创新的门槛和风险。
一个功能上线前,产品团队需要考虑技术可行性和用户需求,对现有生态的影响、对不同用户群体的适应性、可能引发的舆论反应。一个看似简单的界面调整,可能会让数千万中老年用户感到困惑;一个新功能的推出,可能会影响到数百万小程序开发者的利益。
此前腾讯推出的ima就是个典型案例,其全称为 “信息管理助手” 的缩写,本质是一款聚焦信息管理的 AI 工作平台,核心功能围绕知识管理、办公协作、智能写作等展开。
它的能力包括全网AI搜索、知识库管理、AI 写作辅助、录音纪要、图片解读等,还推出了微信小程序,方便用户在微信生态内快速收藏公众号文章等内容到知识库。
然而,ima作为主打知识库的工具,却存在创建文档、表格等基础操作入口难寻的问题,打开后多为空白界面。还有用户反映,其宣传语模糊,难以清晰理解产品价值,导致实际使用率较低。
这种情况的出现,不是因为技术不够好,而是因为微信的用户基数太大、使用场景太多样化,任何功能都要迁就所有使用者,这就导致功能做到最后越来越臃肿,越来越复杂。
微信还背负着沉重的“技术债务”:多年的发展积累了海量的历史数据,需要兼容各个版本的功能,保证支付等金融功能的绝对稳定。任何技术栈的升级都可能引发连锁反应,影响到整个系统的稳定性。
系统越庞大,改动的风险就越高,一个小的bug可能影响数千万用户。所以微信的开发团队必须格外谨慎,每一行代码的改动都要经过严格的测试和评审。
![]()
这种谨慎当然是必要的,但也在客观上限制了创新的速度。当竞争对手快速迭代、大胆尝试新功能时,微信必须保持克制,优先保证系统的稳定运行。
微信团队当然知道哪些功能可以做得更好,哪些体验可以优化,但他们必须考虑改动的代价。一个新功能可能让一部分用户欣喜,但也可能让另一部分用户反感。一次界面调整可能提升了效率,但也可能增加了学习成本。这些都需要权衡和取舍。
微信的更新往往是温和的、渐进的,不会有激进的变革。新功能的推出会经过长时间的内测以及灰度测试,确保足够稳定才会全量发布。即使发布后,也会保留旧版本的入口,给用户适应的时间。这种做法保证了稳定,但也让微信在创新速度上落后于挑战者。
豆包作为挑战者,情况完全不同。
它没有需要兼容的历史版本,没有不能得罪的庞大用户群体,没有牵一发而动全身的复杂生态。想要尝试新功能,可以快速上线测试,效果不好就下线调整,不用担心引发用户流失或舆论危机。
这种灵活性让豆包能够敏捷地响应市场变化。当发现用户对某个功能有强烈需求时,可以在几周内完成开发和上线;当竞争对手推出新功能时,可以快速跟进甚至做得更好。这种速度是微信难以匹敌的。
豆包求变,微信求不变。这不是能力的差距,而是角色和生存位的不同。挑战者需要通过创新来打开市场,所以必须激进;守成者需要保护既有的优势,所以必须稳健。





京公网安备 11011402013531号