新型AI芯片能耗重大突破，已登Nature子刊

IP属地中国·北京 机器之心Pro 时间：2025-11-25 12:15:30

该研究由来自香港大学、香港科技大学和西电杭州研究院的团队共同完成。论文第一作者为香港大学博士生洪海桥。香港大学的刘正午博士、李灿教授和黄毅（Ngai Wong）教授为共同通讯作者，合作者还包括张薇教授（港科大）、毛伟教授（西电）等。
AI 浪潮席卷全球，但算力功耗的 “电费焦虑” 也随之而来。传统冯・诺依曼架构下，数据在 CPU 和内存间 “疲于奔命”，消耗了大量能量。
存算一体（Compute-in-memory, CIM）技术被寄予厚望。它直接在内存里 “算”，通过在模拟域执行高效的乘加运算，被视为消除数据搬运瓶颈的终极方案之一。
但，这只是故事的一半。模拟计算的结果，最终必须通过 “翻译官”—— 模数转换器（ADC）—— 变回数字信号，才能进行后续处理。
然而这个 “翻译官” 的开销，却成了新的 “拦路虎”。
在一篇新发表于《自然・通讯》（Nature Communications）的研究中，来自香港大学、香港科技大学和西电杭州研究院的团队指出，在先进的存算一体系统中，ADC 可能消耗高达 87% 的总能量和 75% 的芯片面积！

论文《Memristor-based adaptive analog-to-digital conversion for efficient and accurate compute-in-memory》论文链接：https://www.nature.com/articles/s41467-025-65233-w
这个占据绝对大头的能耗组件，几乎抵消了存算一体本应带来的巨大能效优势，成了整个架构中最亟待解决的瓶颈。
英雄的隐痛：为什么存算一体绕不开 ADC？
要理解这个瓶颈，我们得先看 AI 到底在 “算什么”。
正如《Nature》上的一篇综述（Lanza 等人，2025）所指出的，AI 应用的核心是海量的向量矩阵乘法。传统架构（如 CPU）必须将这些运算分解成无数个单独的步骤，在内存和处理器之间来回倒腾数据。这个过程极其低效：Lanza 等人的文章分析，数据传输带来的能耗可能是计算本身的 200 倍，并带来巨大的延迟。
存算一体通过在内存阵列（例如忆阻器）中直接利用物理定律（如欧姆定律和基尔霍夫定律）并行完成 VMM，完美解决了这个问题。
但魔鬼藏在细节中。模拟计算的结果是连续的电流或电压，而数字世界只认 0 和 1。ADC 就是这个翻译官。问题是，这个来自传统混合信号领域的 “翻译官”，他的工作方式极其 “一刀切”，在这种新型 AI 芯片中格格不入。

传统 ADC 采用的是 “均匀量化”（Uniform Quantization）。无论信号长什么样，都用一组固定的、等距的量化边界去 “切割”。
但这和神经网络的实际情况完全不符。研究人员展示，不同网络层的输出信号分布千差万别（如上图 Conv 1, 2, 3 所示），有的像正态分布，有的则是偏态或局部均匀的。用一套固定的边界去衡量千变万化的计算信号，必然导致在信号密集的区域 “分不清”，在信号稀疏的区域又 “浪费” 了边界，结果就是精度严重损失，AI 芯片推理效果不尽人意。
为了弥补这种损失，设计者被迫使用更高精度的 ADC（即更密集的边界），但这又会导致 ADC 的硬件开销（功耗和面积）呈指数级暴涨，陷入了恶性循环。
让量化边界学会自适应
既然固定的边界不行，那让它 “活动” 起来不就好了吗？
港大团队的思路是：既然你是固定的，那我就把你变成 “活” 的。他们看中了 “忆阻器”（Memristor）。
忆阻器是一种神奇的纳米器件，它的电阻值不是固定的，而是可以通过施加电压来编程，并且断电后也能 “记住” 这个状态。

简单的融合替换难以产生突破性的作用，团队利用忆阻器设计了一种全新的 “量化单元”（Q-cell），它本质上是一个模拟内容可寻址存储器。通过改变忆阻器的电阻值，研究人员可以在硬件上随意编程设置 ADC 的量化边界。
这样一来，ADC 就能 “看菜下碟”：
研究团队使用算法（如 Lloyd-Max）先分析 AI 模型每一层输出的数据到底长什么样，然后寻找出一套最优的、非均匀的量化边界，最后再通过忆阻器把这套 “定制边界” 写入硬件。
不止是 “量体裁衣”，更是 “瘦身革命”
这种 “量体裁衣” 的自适应方法（Adaptive Quantization），效果立竿见影。
在 VGG8 网络和 CIFAR-10 数据集上，4-bit 精度下，传统均匀量化的准确率仅为 52.3%，而自适应 ADC 能飙升到 88.9%。在 5-bit 精度下，忆阻器 ADC 也达到了 89.55% 的高准确率，逼近理想性能。
在更具挑战性的 ResNet18 网络上，这种优势依然明显，相较于均匀量化，自适应方案带来了显著的精度提升。

如果只是更准，那还不够。忆阻器 ADC 的真正杀手锏，在于它为整个存算一体系统带来的 “减负” 效应。
首先，ADC 本身的效率。与公开发表的 SOTA 设计相比，这款忆阻器 ADC 在 5-bit 精度下，实现了 15.1 倍的能效提升和 12.9 倍的面积缩减。
更关键的是系统层面。当这个高效 ADC 被集成回存算一体系统后：
在 VGG8 网络中，ADC 模块的系统能耗占比从 79.8% 猛降至 22.5%（系统总能耗降低 57.2%），面积占比也从 47.6% 降至 16.9%（系统总面积降低 30.7%）。

在 ResNet18 上，也实现了类似的 56.9% 的能耗和 25.1% 的面积节省。
这意味着，存算一体系统中最臃肿、最耗电的那个部件，被彻底 “驯服” 了。
这项工作为解决混合信号存算一体中的 ADC 瓶颈提供了一个全新的、硬件友好的范例，为实现高效、准确的下一代 AI 硬件铺平了道路。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

AI革命凸显三类“未来人才”：两栖科学家、垂直整合者、创业“造马人”

免疫系统竟会叛变？揭秘身体里的“平叛特种部队”，CAR细胞疗法有多能打

动员人海入局，京东意在“炼丹”具身数据

最高涨34％！阿里云、百度智能云同时宣布：涨价

算力需求持续攀升，百度智能云AI算力相关产品服务最高涨价30%

网易回应“网易互娱用AI替代所有外包岗位”：不实，系部分业务项目调整，属正常人员优化

全站最新

AI革命凸显三类“未来人才”：两栖科学家、垂直整合者、创业“造马人”

免疫系统竟会叛变？揭秘身体里的“平叛特种部队”，CAR细胞疗法有多能打

动员人海入局，京东意在“炼丹”具身数据

最高涨34％！阿里云、百度智能云同时宣布：涨价

热门推荐

AI革命凸显三类“未来人才”：两栖科学家、垂直整合者、创业“造马人”

免疫系统竟会叛变？揭秘身体里的“平叛特种部队”，CAR细胞疗法有多能打

动员人海入局，京东意在“炼丹”具身数据

最高涨34％！阿里云、百度智能云同时宣布：涨价

算力需求持续攀升，百度智能云AI算力相关产品服务最高涨价30%

网易回应“网易互娱用AI替代所有外包岗位”：不实，系部分业务项目调整，属正常人员优化

阿里巴巴重磅，阿里云AI算力和存储产品最高涨价34%！港股科技、云计算再度上涨！

2000万只“龙虾”进入企业，阿里的新企业Agent故事 | 最前线

全国网络法治宣传新征程开启

我翻到一条十年前的知乎问答，发现网友都是预言家。

腾讯电话会：马化腾首谈“养虾”构想，今年AI投资至少翻倍，智能体将催生去中心化新生态

全新车色、第二代VLA来了！新款小鹏P7发布，只要20.38万起

华为乾崑智驾公开赛今启报名，ADS V4.1车型可参与

微盟集团2025年来自AI收入破亿，SaaS商业化找到新路径｜最前线

别克至境世家纯电版上市，重塑纯电豪华MPV标杆