每一天无论我们是在微信聊天记录里找一句话,还是在手机相册里找一张照片,背后都是手机在一行一行比对数据,这个过程不仅费电而且费时。
如果有一种芯片能在存储数据的地方直接完成搜索,不需要把数据搬来搬去,速度能快多少?能耗又能节约多少?近日,香港大学李灿教授和合作者造出了一种名为模拟内容寻址存储器的芯片,在搜索上快了大约一亿倍。
![]()
图 | 李灿(受访者)
该芯片由二硫化钼这种比发丝还细几万倍的二维材料打造而来。芯片里集成了 256 个闪存单元,组成一个 8×16 的阵列。当你输入一个查询值,所有存储单元同时开始比对。而且,该模拟芯片单元存储的不是数字计算机上的 0 和 1,而是我们直接感知世界的连续模拟值。
比对的过程中,哪个单元里的数据是匹配的,对应的那条路线就保持高电压。哪个单元里的数据是不匹配的,对应的那条线路电压就会瞬间降低。整个搜索过程只需要 36 皮秒。
一皮秒是一万亿分之一秒,光在真空中一皮秒只能走 0.3 毫米。也就是说,这几个芯片完成一次搜索的时间,光还没来得及从这头跑到那头。
此次芯片的能耗同样惊人,每搜索一个单元,只消耗不到 0.1 飞焦。一飞焦是一千万亿分之一焦耳,这种级别的能耗,比传统静态随机取存储器做的内容寻址存储器低了上万倍。
![]()
(https://doi.org/10.1038/s41565-025-02089-7)
李灿告诉 DeepTech:“从应用端来看,搜索有很大的价值。一方面是数据库搜索,另一方面和人工智能里面的注意力机制相关。注意力机制是支撑大语言模型的 Transformer 模型的 building block,本质上就是去学习到的压缩知识里面做搜索,然后取出来。我们在论文里演示的 KNN 分类应用也很有解释性,可以用于医疗诊断等对安全性非常敏感的应用。同时,在大数据时代大规模搜索也有很强的需求。”
为什么能够这么快和这么省电?关键在于他们优化了晶体管和金属之间的接触。
在传统芯片里,金属电极和半导体材料接触的地方,会形成一个叫做肖特基势垒的障碍,这就像一堵墙,电子要翻过去才能流动。这堵墙会让电阻变大、电流变小、速度变慢。
他们选择使用锑这种半金属作为电极。锑有个特点,它的电子态密度几乎为零,能够抑制金属诱导的能隙态,把费米能级从钉死状态解放出来。简单说,就是那堵墙被拆掉了,电子可以自由进出,接触电阻降到只有 400 到 700 欧姆每微米,接近了理论极限。
结果就是,单个闪存单元的开态电流能够达到 60 微安每微米,开关比超过 10 的 9 次方,这组数字在同类二维材料闪存里是最高的。
有了这么猛的器件,他们搭出了 256 个单元的阵列,成品率为 89.45%,每个单元的阈值电压可以被精确调节,存成不同的值。在搜索的时候,输入电压落在哪个单元的范围内,那个单元就判定为匹配。
![]()
(https://doi.org/10.1038/s41565-025-02089-7)
为了验证这套系统能否用在真实场景,他们做了一个 k 近邻分类的演示。把四个经典数据集的手写数字、鸢尾花、乳腺癌、葡萄酒的特征值存入芯片,然后输入查询向量。结果芯片直接算出汉明距离,也就是算出了两个向量有多少位不同,然后找出最近的三个邻居投票决定分类,准确率分别是 98.89%、93.33%、97.37% 和 100%。
他们还展示了两个进阶版本。一个是双栅结构的闪存,上下两个栅极都能控制沟道,开关比又提高了一个量级,电流也更大。另一个是三维堆叠的互补闪存,把 n 型的二硫化钼和 p 型的二硫化钨上下叠起来,做成一个单元。这一面积可以节约一半,互连更短,延迟更低。
![]()
(https://doi.org/10.1038/s41565-025-02089-7)
那么,这套技术能用在哪里?最直接的场景是边缘计算。手机、摄像头、传感器这些设备,不需要把数据传到云端,直接在本地就能快速搜索对比。比如刷脸解锁,设备里存了你的脸部特征向量,然后可以和摄像头刚拍摄到的特征向量做对比,找到匹配的就予以通过。整个过程都在芯片里完成,不用上传隐私,也不怕网络延迟。
还可用于网络路由。数据包过来之后,要通过查询路由表决定往哪里转发。传统方式是一行一行对比,速度非常慢吞。而使用内容寻址存储器,所有表项可以同时对比,一个时钟周期就能找到匹配的下一跳。
再比如数据库加速、机器学习推理、基因序列对比,只要是需要快速查找相似数据的场景都有用武之地。
![]()
(https://doi.org/10.1038/s41565-025-02089-7)
当然,距离真正走进手机还有一定距离。目前的阵列只有 256 个单元,要跑到上百万甚至上亿,还得解决良率、封装、驱动电路等一系列工程问题。但至少原理走通了,性能数据也摆在那里。
李灿表示:“注意力机制本质上也是搜索,我们也在探索能不能用搜索机制来实现大模型,这样二维材料高性能搜索硬件就更有优势。同时,我们也会持续跟二维材料和存内计算以及 AI 硬件的工业界沟通,看看有没有商业化的机会。”
参考资料:
相关论文 https://doi.org/10.1038/s41565-025-02089-7
排版:刘雅坤





京公网安备 11011402013531号