当前位置: 首页 » 资讯 » 科技头条 » 正文

真正“懂你”的输入法长什么样?讯飞用AI键作答

IP属地 中国·北京 脑极体 时间:2025-11-09 00:07:26



你逛过文创市集、二次元漫展、夜市,在跳蚤市场淘过宝吗?尽管购物中心、综合体等商业地产十分发达,但汇聚了无数个性摊主的市集,是自由、多元、烟火气的象征,依然充满了吸引力。

一个喧闹且鲜活的表达市集,或许才是输入法应该有的样子。因为在表达时,我们更渴望彰显个性、被世界理解。在这样的时刻:

想给老板发消息,不知道怎么措辞,心想,要是有个山东朋友就好了;

想拒绝别人借钱、加班的要求,又担心语气生硬,真希望有个嘴替;

回复暧昧对象的消息,打出来的字却口不对心,急需一个恋爱军师;

碰到反感的人事物,恨不得叫个“滴滴代骂”;

刷短视频评论,玩梗玩不过别人;

写工作汇报、职场怼杠精、饭圈磕CP、跟同担交流……



这时候,一个市集般丰富多元的输入法,才能真正懂你所需,给你所想。最近,讯飞输入法15.0正式推出“AI键盘”,包括一键连接AI服务,不打断输入的卡片式交互,语音指令快捷“问AI”。而AI键盘背后,还有一个智能体平台,支持创建自己的专属智能体,还可以分享给其他用户使用。

大模型可以让输入法做很多事,但智能体生态,才能让输入法做你需要的事。从这个角度看,讯飞输入法15.0,正在搭建表达界的创意市集。

讯飞输入法的生态做法,与业内大多数厂商有着鲜明的差异,也说明了一件事,AI 时代,输入法的未来不在大教堂,在集市,在千万人个性表达的喧闹之中。



埃里克・雷蒙德就曾在开源圣经《大教堂与集市》中提出:软件开发模式有两种,一种是自上而下、由少数专家精心设计的大教堂模式,一种是自下而上、由千万参与者协同创新的集市模式,后者可以快速迭代,更容易催生创新。

当AI浪潮席卷而来,互联网巨头和手机厂商,都相继入局输入法,但这种大厂主导的开发模式,建造了一座座精美却封闭的教堂式产品,存在几个问题:

1. 产品千人一面。大教堂模式的软件开发,往往由工程师专家团队主导设计,预设好通用人格,用户只能被动使用,无法自主定义。遇到学术毒舌风、技能五子棋式对话之类的个性化需求,往往很难触达。仅靠厂商逐一开发功能,效率很低,而且也不可能覆盖亿级用户的海量细分需求。科大讯飞AI文娱业务群执行总裁程坤举了个例子,比如“恋爱军师”就是输入法厂商针对特定的恋爱群体进行的精调智能体,类似需求的用户繁多,单靠厂商无法实现覆盖更多元的AI辅助表达。



2.AI生硬拼接。部分输入法产品为了体现AI能力,会在聊天场景插入AI辅助功能,但并未考虑到输入场景的用户路径。程坤直言,AI 建议出现太早会打断思维流,出现太晚用户已经手动打完,出现太频繁又会被反感,选择在什么切口引入AI,是难点和挑战。

3.场景理解不足。生硬拼接的原因,是无法在恰当的时机,自然连接AI服务,追根溯源是缺乏场景的理解能力。一些AI助手适合处理订机票这类主动、明确的任务,却无法自然融入回消息、发评论这类由场景触发、模糊的表达需求。

AI应用百花齐放,用户对产品体验的预期也越来越高,如何满足用户个性化的表达需求,成为所有输入法厂商必须回答的问题。

可以肯定的是,在中心化的大教堂模式下,每一个用户的个性表达是不可能被完全涵盖的。

没有任何一个团队能预设所有人的说话风格,但亿万用户可以自己定义自己。于是,讯飞输入法决定搭一个市集。



2023年,讯飞输入法率先将大模型融入产品,发现二者先天契合,大模型与输入法都擅长于内容创作和辅助表达。基于这一判断,讯飞输入法首先推出AI创作助手,承接用户的内容生成需求。而随着AI功能用户规模的扩大,来自真实场景的需求洞察持续刷新认知,升级为智能体驱动的AI辅助表达模式,将表达的主动权,真正交还给每一位用户。

在15.0版本中,讯飞输入法把自己变成了市集的组织者,让用户变成了逛市集的人和摆摊的摊主,可以在平台找到适配自己的智能体,也可以创建专属智能体,甚至获得收益。由此,海量长尾需求,便可以得到丰富的供给和满足。

作为组织者,讯飞主要做了三件事:

第一,搞基建,做好输入法的底层技术。

语音输入再次迭代,讯飞输入法用上了全球首发非自回归语音大模型架构,实现了推理效率大幅跃升。它能够并行、一次性输出整个文本序列,效果相对提升16%,推理成本下降520%。确保用户拥有最流畅、高效的输入体验。



同时,讯飞在键盘新增“AI 键”,AI入口前置,用户输完文字或说完语音后,一键即可触发润色、补全、纠错、风格转换等服务。就像把市集的招牌挂到用户眼前,程坤解释,“通过AI键,用户就会产生好奇,尝试去体验,就像当初的语音输入一样,慢慢培养用户的使用习惯,自然而然地接受”。

第二,做培训,理解场景和用户,实现精准推荐。

AI服务和能力做得再好,不懂场景,总是干扰用户,反而会招致反感。讯飞利用输入法独有的全域感知能力,将AI服务精准推荐,让用户觉得恰好是我想要的。

结合场景维度、输入内容、习惯偏好去综合考虑。比如说,有的用户喜欢让AI给自己润色,就会推送相关智能体,而有的用户更偏好自己原汁原味地表达,就会减少打扰。随着使用数据积累,输入法的AI会越来越懂用户。

第三,搭平台,丰富的智能体生态,满足个性化长尾需求。

讯飞行业首发输入法“智能体平台”,用户无需编程能力,一句话就能创建智能体,这是市集文化的灵魂,让普通人也能参与创造。



举个例子,小说作者可定制角色名识别智能体,仅在写作APP生效,避免全局热词干扰;有特定表达习惯的用户,能创建“自动加 emoji”智能体,无需手动输入符号。

智能体平台支持分发与商业化。普通用户可将智能体公开为模板,被他人使用时获得收益。高阶创作者可推出付费智能体,比如恋爱军师智能体中的服务,日收益达数万元。

平台化开发,不仅解决了个性化需求与开发成本的矛盾,更让输入法从效率工具变成了一个充满商业机遇的平台。

“一天有一个亿的活跃用户,一天300次键盘弹起,就有300亿的曝光机会。” 程坤的这句话,揭示了表达市集的商业潜力,还介绍了智能体平台的机制,官方只做底层能力,不做具体长尾功能,避免跟开发者争利,确保平台的公平规则。



大教堂供人仰望,集市让人创造。当输入法变成一个表达市集,倒逼行业从功能竞争转向生态竞争。

用户不只是用户,还是创作者,自己的表达风格,也能成为别人的解决方案,可以卖给全世界。除了C端用户,B端企业的需求更为复杂,也更具潜力。讯飞已落地多个案例,验证了智能体市集的行业价值。比如为友邦保险业务员定制沟通话术助手,将优质话术、产品套餐录入知识库,新业务员与客户沟通时,可一键生成适配话术,提升成单率;为新东方教师设计家校沟通辅助智能体,生成不同沟通内容,提高与家长的交流效果等。



输入法不再只是厂商定义的完美产品,是与个人和行业用户共创的生态平台,小众的需求、垂直的领域、要求苛刻的业务,都能找到适配的智能体。

结果就是,越多人创作,好用的智能体越多;越多智能体,越多人愿意用,输入法的生态护城河就这样建立起来了。

从大教堂到集市,讯飞输入法摸到了AI时代个性化需求的脉门。靠平台生态拉开了差距,有什么诀窍吗?

讯飞输入法对AI的思考并非偶然,从早年押注语音输入,到如今领跑大模型输入法,背后是一套经过多轮技术浪潮洗礼的AI产品方法论。程坤将其总结为三点:

1.相信技术趋势,笃定长期价值。

“当一个技术来了,我们会对它的发展做预判,让团队所有人都相信这个预判。”比如早年深度学习推动语音识别进步时,讯飞笃定“语音会成为移动互联网的主要输入方式”,即使初期准确率只有80%,也坚持投入。

2023年大模型出现后,又判断“大模型能解决输入法的意图理解难题”,快速启动团队迭代。2025年,搭载了全球首发非自回归语音大模型架构,实现了推理效率大幅阶跃,驱动语音识别效果持续突破。

讯飞每年都在语音和语言上坚持投入,正是这种对技术趋势的精准预判与长期深耕,让每一次迭代都能击中用户需求,持续领跑智能输入赛道。

2.快速MVP验证,用户反馈驱动迭代。

“即使技术不成熟,也先推向用户,用最小化产品(MVP)收集真实反馈。”比如发现个性化需求太多,就推出智能体平台。产品进化的每一步,都是基于用户群体的迭代优化,让 AI持续贴近大众需求。

3.极致打磨细节,解决真实痛点。

“做产品要有工匠精神”,这句产品界的老生常谈,能坚持做、日日做、做到细节里,并不容易。比如语音输入时,讯飞发现,用户在公共场合不愿大声说,就开发“轻声识别”,正是这些细节,让技术真正落地为好用的体验。

可以发现,做AI和输入法产品,其实没有秘密,都是常识。程坤也直言,没有什么太多复杂的方法论,最重要的是相信大模型的机遇,然后内部和业界一起努力,共同让用户接受,把AI输入法这件事做好。

讯飞输入法15.0证明,一个市集般丰富多元、千万人自由表达的智能体生态,将把输入法变成AI时代交互的核心入口。



免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新