当前位置: 首页 » 资讯 » 科技头条 » 正文

前端没死,AI APP正在返祖

IP属地 中国·北京 量子位 时间:2025-12-02 14:15:36

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

不用“噫吁嚱”——前端没被AI杀死,终端且得狂飙。

在许多人高呼“AI正在颠覆一切”的当下,这样的一句判断,竟显得如此反直觉。

但别急,看完下面的一张图,或许就能让众多迷茫的前端程序员瞬间醍醐灌顶:



在这张图中,我们看到的是三个跨时代的手机:2000年的诺基亚3310、2007年的初代iPhone,以及今年的iPhone 17 Pro。

三者并排放在一起,一个非常直观的感受就是,电路板变得越来越复杂;3310的主板,可能只是iPhone 17 Pro的一个小传感器。

很多人以为AI是对传统开发的降维打击、是一场彻底的革命,但当你拆开技术的“后盖”,盯着那些密密麻麻的线路时,你会发现,复杂度从未消失,它只是换了一种形式存在——

从电路板的物理堆叠,迁移到了模型、接口、网络、算力共同构成的数字堆叠。

这就是蚂蚁集团终端技术委员会负责人翁欣旦在SEE Conf大会中抛出的观点。

更进一步的,他还给出了一个非常发人深省的结论:

前端程序员的宿命从未改变,永远在对抗熵增(复杂系统)。但在AI时代,是时候要清算一下技术债了。


△蚂蚁集团终端技术委员会负责人,翁欣旦

一言蔽之,技术的浪潮更像是一个巨大的轮回,只是规模在放大,节奏在加快,体验在被不断刷新。

AI APP,其实在返祖

我们不妨先从最为直观的终端前端的效果开始讲起。

例如打开现在最火的AI应用,无论是OpenAI的ChatGPT,还是蚂蚁发布的AQ、灵光,你都会产生一种强烈的既视感:

它们太简单了。



一个输入框,一个对话流,一行行简洁排布的回答;没有复杂的导航、没有丰富的层级,也没有堆满屏幕的信息分发。

这个简洁的界面让人不禁回想起20年前的WAP网页,或者是那个功能单一、界面朴素的支付宝1.0时代。

这看似是一种倒退,毕竟移动互联网在经历了十几年雕花般的UI进化,把APP做得像精装修的豪宅之后,AI APP突然一夜回到毛坯房。

这背后是极简美学的回归吗?

在翁欣旦看来,我们正在经历两个技术上的轮回式的返祖。



首先是交互的轮回

计算机的发展史,可以说是一部从DOS(命令行界面)走向GUI(图形用户界面)的历史。

DOS时代的黑底白字,被Windows和Mac的窗口图标取代,因为点击比输入指令更符合直觉。

而现在的AI,似乎正试图把我们拉回CUI时代——用自然语言对话来解决一切。

但这真的高效吗?

翁欣旦在现场提出了一个非常务实的质疑:

如果小手轻轻一点就能办妥的事,用户为什么要打开一个Agent,跟它絮絮叨叨讲上一分钟?

Rabbit R1和AI Pin等纯AI硬件的翻车,已经给出了市场反馈。当用户必须对着一个没有屏幕或屏幕极小的设备说话,且无法通过视觉反馈确认操作状态时,沟通成本反而大幅上升。

单纯依赖CUI,在处理复杂任务时效率极低;交互的未来,注定不是CUI杀死GUI,而是两者的共生。

更明确一些来说,是让GUI负责高频、确定性的操作,CUI则是负责长尾、复杂的意图理解。

现在的AI APP界面之所以如此简陋,恰恰是因为这种“GUI+CUI”的深度融合范式尚未成熟,行业还在摸着石头过河。

其次是架构的轮回

在移动互联网爆发初期,API网关是一个里程碑式的存在,为了应对海量的APP请求,为了业务的灵活性,开发者们曾热衷于把接口做得很宽。

就像翁欣旦提到的那个血淋淋的例子:为了省事,很多核心业务逻辑被塞进了一个名为“extend_info”的字段里。



这种做法在当年是为了管好接口,给业务留足后路;但到了AI时代,这笔技术债开始爆雷了。

当我们试图让大模型去理解、去调用这些接口时,模型懵了:它读不懂那个黑盒一样的“extend_info”里到底藏了什么。

即便把几百行相关代码喂给模型,缺乏上下文的它依然无法理解其中的业务含义。

以前做API网关,是为了让以前的程序能跑通;现在做架构,是为了让大模型能看懂。

为了实现这一点,我们不得不重新定义接口,重新去把那些为了灵活性而牺牲的语义补回来。

这哪里是AI杀死了前端?这分明是AI逼着前端工程师把以前偷懒没做好的作业,重新做一遍。

AI原生应用看似全新,实则仍在解决老问题

如何在复杂性与可用性之间取得平衡,如何在开放与管控之间找到边界,如何在创新与工程之间保持节奏。

终端是不可被替代的

除了软件形态的返祖,另一种流行的焦虑是云端万能论

因为有不少人会认为,既然大模型都在云端运行,终端是不是只需要做一个显示器就好了?

这种想法忽略了两个最硬核的物理限制:网络算力

想象这样一个场景:你正兴致勃勃地跟AI聊得火热,突然走进电梯,或者经过一个信号盲区,屏幕上的文字戛然而止,那个原本流畅吐字的Token流断了。

这一刻的体验是灾难性的。无论云端的模型有多智能,无论流式传输技术吹得有多神,在物理网络缺失的那一秒,一切归零。

这就是终端存在的意义。



对此,翁欣旦将网络和算力放到了一个更大的三维坐标系来分析。

在X轴的网络维度看,通信技术的进步确实解放了交互模态:从GSM时代的纯文本WAP,到3G时代的图片,4G时代的视频,再到5G时代的3D和XR。

但物理世界的网络覆盖永远存在盲区,5G再快,也没法消灭信号死角。

从Y轴的算力维度看,终端设备正在经历一场悄无声息的服务器化。

回看2007年的初代iPhone,412MHz的CPU,128MB的内存。

那时的开发者如果听说只有这点资源,恐怕连个像样的Demo都跑不起来。

而今天的iPhone 17 Pro,拥有4.29GHz的多核CPU和12GB内存,堪比一个随身携带的小型服务器了。

随着端侧算力的暴涨,未来的手机将成为一个边缘计算(Edge Computing)的强力节点。

翁欣旦做了一个极具画面感的假设:

如果我们在会场搞一个彩蛋,让现场几百人同时拿出手机,用AI功能生成一个特效。如果完全依赖云端推理,这一瞬间的并发请求,足以把后端的推理算力打爆。如果连一个彩蛋特效都能把几百人的推理算力打爆,那云端永远无法承载亿级用户的实时AI互动。

未来的AI体验,一定是“云侧训练 + 端侧推理”的混合模式。

云端负责这一代模型的智力上限,而终端负责让这份智力随时随地、无延迟地服务于人。

在这个架构下,终端开发者的价值非但没有被稀释,反而因为要承载模型推理、保障隐私安全、处理极端场景而变得更加核心。

AI时代,更能体现程序员的价值

最后,我们还需要讨论一个问题:

既然前端没死,终端依然重要,那程序员的焦虑到底来自哪里?

很多时候,焦虑或许源于对新技术的误解,我们往往高估了技术的短期爆发力,而低估了它的长期渗透力。

翁欣旦讲了一个关于多点触控的故事。



当乔布斯在2007年的发布会上,用两根手指放大一张照片,全场惊呼“Apple invented Multi-touch”时,事实并非如此。

早在1970年代,多点触控的原型就已经在实验室里诞生;1999年,Fingerworks公司就开始将这项技术商业化。

苹果在2005年收购了这家公司,经过两年的打磨,才把它变成了iPhone上那个改变世界的交互。

从技术原型到产品爆发,中间隔了整整37年

AI亦是如此。

Transformer架构虽然是2017年才提出,但神经网络的理论基础早在1980年就已经成熟。

为什么当年没火?因为那是局域网时代,没有海量的数据去喂养它。是互联网这30年积累的浩如烟海的文本、图片、视频数据,才让Transformer在今天有了用武之地。



技术本身可能早已就位,缺的是应用体验的临门一脚,这正是前端和终端程序员的机会所在。

现在的AI技术,就像是一把刚刚铸好且性能强悍的锤子。但到底要钉什么钉子?钉多深?钉完之后是不是歪的?这需要人来把控。

用翁欣旦的话来说就是,应用是新技术的量尺,体验是C端应用的灵魂。



大模型给出了概率性的预测,但用户需要的是确定性的服务:

大模型能生成一段代码,但它无法理解这段代码在复杂业务场景下的副作用;大模型能画出一张图,但它不知道这张图在弱网环境下该如何优雅地加载。

“不要因为AI来了,就急着丢掉手里的螺丝刀。”

那些看似枯燥的工程能力——

如何优化首屏加载时间,如何处理内存泄漏,如何在高并发下保证稳定性,如何在复杂的手机碎片化环境中保证UI一致性,这些对抗熵增的经验,才是AI无法替代的护城河。

一言蔽之,机器学不会的对体验的极致敏感度,正是优秀的前端工程师的价值所在。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新