金磊 发自 凹非寺
量子位 | 公众号 QbitAI
不用“噫吁嚱”——前端没被AI杀死,终端且得狂飙。
在许多人高呼“AI正在颠覆一切”的当下,这样的一句判断,竟显得如此反直觉。
但别急,看完下面的一张图,或许就能让众多迷茫的前端程序员瞬间醍醐灌顶:
![]()
在这张图中,我们看到的是三个跨时代的手机:2000年的诺基亚3310、2007年的初代iPhone,以及今年的iPhone 17 Pro。
三者并排放在一起,一个非常直观的感受就是,电路板变得越来越复杂;3310的主板,可能只是iPhone 17 Pro的一个小传感器。
很多人以为AI是对传统开发的降维打击、是一场彻底的革命,但当你拆开技术的“后盖”,盯着那些密密麻麻的线路时,你会发现,复杂度从未消失,它只是换了一种形式存在——
从电路板的物理堆叠,迁移到了模型、接口、网络、算力共同构成的数字堆叠。
这就是蚂蚁集团终端技术委员会负责人翁欣旦在SEE Conf大会中抛出的观点。
更进一步的,他还给出了一个非常发人深省的结论:
前端程序员的宿命从未改变,永远在对抗熵增(复杂系统)。但在AI时代,是时候要清算一下技术债了。
![]()
△蚂蚁集团终端技术委员会负责人,翁欣旦
一言蔽之,技术的浪潮更像是一个巨大的轮回,只是规模在放大,节奏在加快,体验在被不断刷新。
AI APP,其实在返祖
我们不妨先从最为直观的终端前端的效果开始讲起。
例如打开现在最火的AI应用,无论是OpenAI的ChatGPT,还是蚂蚁发布的AQ、灵光,你都会产生一种强烈的既视感:
它们太简单了。
![]()
一个输入框,一个对话流,一行行简洁排布的回答;没有复杂的导航、没有丰富的层级,也没有堆满屏幕的信息分发。
这个简洁的界面让人不禁回想起20年前的WAP网页,或者是那个功能单一、界面朴素的支付宝1.0时代。
这看似是一种倒退,毕竟移动互联网在经历了十几年雕花般的UI进化,把APP做得像精装修的豪宅之后,AI APP突然一夜回到毛坯房。
这背后是极简美学的回归吗?
在翁欣旦看来,我们正在经历两个技术上的轮回式的返祖。
![]()
首先是交互的轮回。
计算机的发展史,可以说是一部从DOS(命令行界面)走向GUI(图形用户界面)的历史。
DOS时代的黑底白字,被Windows和Mac的窗口图标取代,因为点击比输入指令更符合直觉。
而现在的AI,似乎正试图把我们拉回CUI时代——用自然语言对话来解决一切。
但这真的高效吗?
翁欣旦在现场提出了一个非常务实的质疑:
如果小手轻轻一点就能办妥的事,用户为什么要打开一个Agent,跟它絮絮叨叨讲上一分钟?
Rabbit R1和AI Pin等纯AI硬件的翻车,已经给出了市场反馈。当用户必须对着一个没有屏幕或屏幕极小的设备说话,且无法通过视觉反馈确认操作状态时,沟通成本反而大幅上升。
单纯依赖CUI,在处理复杂任务时效率极低;交互的未来,注定不是CUI杀死GUI,而是两者的共生。
更明确一些来说,是让GUI负责高频、确定性的操作,CUI则是负责长尾、复杂的意图理解。
现在的AI APP界面之所以如此简陋,恰恰是因为这种“GUI+CUI”的深度融合范式尚未成熟,行业还在摸着石头过河。
其次是架构的轮回。
在移动互联网爆发初期,API网关是一个里程碑式的存在,为了应对海量的APP请求,为了业务的灵活性,开发者们曾热衷于把接口做得很宽。
就像翁欣旦提到的那个血淋淋的例子:为了省事,很多核心业务逻辑被塞进了一个名为“extend_info”的字段里。
![]()
这种做法在当年是为了管好接口,给业务留足后路;但到了AI时代,这笔技术债开始爆雷了。
当我们试图让大模型去理解、去调用这些接口时,模型懵了:它读不懂那个黑盒一样的“extend_info”里到底藏了什么。
即便把几百行相关代码喂给模型,缺乏上下文的它依然无法理解其中的业务含义。
以前做API网关,是为了让以前的程序能跑通;现在做架构,是为了让大模型能看懂。
为了实现这一点,我们不得不重新定义接口,重新去把那些为了灵活性而牺牲的语义补回来。
这哪里是AI杀死了前端?这分明是AI逼着前端工程师把以前偷懒没做好的作业,重新做一遍。
AI原生应用看似全新,实则仍在解决老问题:
如何在复杂性与可用性之间取得平衡,如何在开放与管控之间找到边界,如何在创新与工程之间保持节奏。
终端是不可被替代的
除了软件形态的返祖,另一种流行的焦虑是云端万能论。
因为有不少人会认为,既然大模型都在云端运行,终端是不是只需要做一个显示器就好了?
这种想法忽略了两个最硬核的物理限制:网络和算力。
想象这样一个场景:你正兴致勃勃地跟AI聊得火热,突然走进电梯,或者经过一个信号盲区,屏幕上的文字戛然而止,那个原本流畅吐字的Token流断了。
这一刻的体验是灾难性的。无论云端的模型有多智能,无论流式传输技术吹得有多神,在物理网络缺失的那一秒,一切归零。
这就是终端存在的意义。
![]()
对此,翁欣旦将网络和算力放到了一个更大的三维坐标系来分析。
在X轴的网络维度看,通信技术的进步确实解放了交互模态:从GSM时代的纯文本WAP,到3G时代的图片,4G时代的视频,再到5G时代的3D和XR。
但物理世界的网络覆盖永远存在盲区,5G再快,也没法消灭信号死角。
从Y轴的算力维度看,终端设备正在经历一场悄无声息的服务器化。
回看2007年的初代iPhone,412MHz的CPU,128MB的内存。
那时的开发者如果听说只有这点资源,恐怕连个像样的Demo都跑不起来。
而今天的iPhone 17 Pro,拥有4.29GHz的多核CPU和12GB内存,堪比一个随身携带的小型服务器了。
随着端侧算力的暴涨,未来的手机将成为一个边缘计算(Edge Computing)的强力节点。
翁欣旦做了一个极具画面感的假设:
如果我们在会场搞一个彩蛋,让现场几百人同时拿出手机,用AI功能生成一个特效。如果完全依赖云端推理,这一瞬间的并发请求,足以把后端的推理算力打爆。如果连一个彩蛋特效都能把几百人的推理算力打爆,那云端永远无法承载亿级用户的实时AI互动。
未来的AI体验,一定是“云侧训练 + 端侧推理”的混合模式。
云端负责这一代模型的智力上限,而终端负责让这份智力随时随地、无延迟地服务于人。
在这个架构下,终端开发者的价值非但没有被稀释,反而因为要承载模型推理、保障隐私安全、处理极端场景而变得更加核心。
AI时代,更能体现程序员的价值
最后,我们还需要讨论一个问题:
既然前端没死,终端依然重要,那程序员的焦虑到底来自哪里?
很多时候,焦虑或许源于对新技术的误解,我们往往高估了技术的短期爆发力,而低估了它的长期渗透力。
翁欣旦讲了一个关于多点触控的故事。
![]()
当乔布斯在2007年的发布会上,用两根手指放大一张照片,全场惊呼“Apple invented Multi-touch”时,事实并非如此。
早在1970年代,多点触控的原型就已经在实验室里诞生;1999年,Fingerworks公司就开始将这项技术商业化。
苹果在2005年收购了这家公司,经过两年的打磨,才把它变成了iPhone上那个改变世界的交互。
从技术原型到产品爆发,中间隔了整整37年。
AI亦是如此。
Transformer架构虽然是2017年才提出,但神经网络的理论基础早在1980年就已经成熟。
为什么当年没火?因为那是局域网时代,没有海量的数据去喂养它。是互联网这30年积累的浩如烟海的文本、图片、视频数据,才让Transformer在今天有了用武之地。
![]()
技术本身可能早已就位,缺的是应用体验的临门一脚,这正是前端和终端程序员的机会所在。
现在的AI技术,就像是一把刚刚铸好且性能强悍的锤子。但到底要钉什么钉子?钉多深?钉完之后是不是歪的?这需要人来把控。
用翁欣旦的话来说就是,应用是新技术的量尺,体验是C端应用的灵魂。
![]()
大模型给出了概率性的预测,但用户需要的是确定性的服务:
大模型能生成一段代码,但它无法理解这段代码在复杂业务场景下的副作用;大模型能画出一张图,但它不知道这张图在弱网环境下该如何优雅地加载。
“不要因为AI来了,就急着丢掉手里的螺丝刀。”
那些看似枯燥的工程能力——
如何优化首屏加载时间,如何处理内存泄漏,如何在高并发下保证稳定性,如何在复杂的手机碎片化环境中保证UI一致性,这些对抗熵增的经验,才是AI无法替代的护城河。
一言蔽之,机器学不会的对体验的极致敏感度,正是优秀的前端工程师的价值所在。





京公网安备 11011402013531号