当前位置: 首页 » 资讯 » 科技头条 » 正文

光速!计算新纪元:上海交大发布全球首个光子生成式AI芯片|光锥读论文

IP属地 中国·北京 未来光锥 时间:2025-12-22 12:15:25

一片指甲盖大小的芯片上,集成了数百万个光子神经元,能够以光速完成高分辨率图像生成、风格转换甚至三维场景构建——这不是科幻小说,而是刚刚发表在Science上的前沿突破。

12月18日,中国上海交通大学团队的陈一彤团队成功研制出名为“LightGen” 的全光学生成式人工智能芯片。这不仅是实验室里的原理验证,更是一个在速度与能效上,全面碾压现有顶级电子芯片数百倍的实用化原型。


当智能的创造可以像光一样即时、廉价且无处不在时,人类迎来的将不仅仅是技术的升级,更是创造力解放的新纪元。

越聪明,胃口越大

AI正从“识别者”进化为“创造者”。无论是生成图像、视频、3D模型,还是进行科学模拟、药物设计,其本质都是处理和理解海量、高维的数据。当前的硅基芯片(CPU/GPU)建造的算力堤坝,在这股“数据洪水”前已显得力不从心——速度遇到瓶颈,能耗却高得惊人。有AI每创作1000张图像,产生的碳排放就相当于一辆燃油车行驶6.5公里。

核心矛盾在于电子的物理极限。电子在芯片中运动会遇到电阻,产生热量,速度也有上限。这是物理法则,而AI正在快速逼近极限。

而光,作为宇宙中最快的信使,没有电荷,几乎不产生热,不同波长的光可并行不悖——光天生就是更完美的计算载体。

让光学会思考和创造

但让光去“无中生有”,却面临三大天堑:

规模太小:之前的光子芯片最多只有几千个神经元,而像OpenAI的Sora这样的模型,动辄需要百万级规模。用勺子挖山,肯定不行。

信息难以操控:光信号高维而连续,不像数字那样可以灵活地“压缩”和“解压”,而生成式AI的核心能力,恰恰在于能在简洁的“概念空间”和复杂的“像素空间”之间自由转换。

无法训练创造力:教AI识别猫,可以给它看一万张猫的图片。但教AI创造一只世界上不存在的猫,却没有标准答案可供参考。

正因如此,科学界长期认为,光子计算难以胜任复杂的生成任务。

LightGen的突破,正是对这三道难题的精准解答:

三维集成,百万神经元:通过创新的三维堆叠封装,研究团队在一片仅136.5平方毫米(约指甲盖大小)的芯片上,集成了超过210万个光学神经元,实现了光子集成规模的指数级跨越。

构建“光的密码本”:这是最核心的创新。团队设计了一个光学隐空间。简单来说,他们用一束特殊的单模光纤阵列,将复杂的光场“翻译”成一套有规则的光学密码。调整密码,就能精准操控生成内容的语义特征(比如将狗变成猫,或给椅子换上不同的腿)。这首次在物理上实现了全光控的、高维度的信息编解码。

贝叶斯训练法:他们抛弃了“模仿标准答案”的传统思路,采用基于贝叶斯理论的算法,让芯片自己学习数据背后的统计分布规律。这相当于教会了AI“美的法则”而非“固定的画”,从而能创造出合理的新事物。


LightGen的示意图,包含光子编码器、光学隐空间(OLS)和光子生成器。图片来自论文

不止于“作画”的通用加速器

在实验中,LightGen展示了其作为通用生成加速器的惊人潜力:

视觉内容生成:它能以512x512的高分辨率,直接生成细节丰富的动物图像、完成艺术风格迁移、对模糊图像进行智能降噪。其质量已媲美Stable Diffusion等主流软件。


LightGen的架构。它由数百万个集成衍射光子神经元组成,采用三维封装于136.5平方毫米内。图片来自论文

三维结构与场景构建:通过分析二维图片,它能理解物体的三维结构。研究人员通过调整“光学密码”,就能让生成的椅子旋转视角,改变部件设计。这表明它能用于快速3D建模、数字孪生和元宇宙内容创建。

内在的物理信息处理优势:光的物理特性使其在特定任务上具有天然优势。例如,光在穿过散射介质(如雾、生物组织)时,其传播本身就蕴含了物理规律。LightGen架构可直接处理此类模拟光信号,未来在医疗成像(如快速OCT图像重建)、自动驾驶(穿雾成像)、物理模拟等领域可能有颠覆性应用。

视频与序列生成:其光速处理能力,使得实时生成或处理高帧率视频流成为可能,为下一代视频压缩、实时特效和交互式媒体打开大门。

所有上述能力,都建立在一个基石之上:前所未有的性能提升。

在完成与英伟达A100芯片相同质量的生成任务时,LightGen实测:

计算速度快 2个数量级(100倍以上)

能效比高 2个数量级(100倍以上)

这意味着,如果将这种技术部署于数据中心,可极大降低AI的碳足迹;如果集成于终端设备,则能让手机、AR眼镜等设备本地运行现在只能在云端进行的高强度AI创作。

光子计算的广阔应用场景

虽然论文中以视觉创作为主要演示场景,但LightGen技术的意义远不止于“作画”。

光的物理特性使其在一些关键领域具有天然优势:

医疗成像领域:光本身是医学影像(如OCT光学相干断层扫描)的探测工具。LightGen架构可以直接处理这些光学信号,实现更快速的医学图像重建和分析,为疾病诊断争取宝贵时间。

自动驾驶与遥感:光在雾、雨、烟尘中的传播规律复杂。能够直接处理光场信息的芯片,可能实现更强大的穿透成像和恶劣环境感知能力。

科学计算与模拟:许多物理现象(如流体动力学、量子效应)本质上就是波和场的相互作用。用光来模拟光,用场来计算场,可能在某些科学模拟任务上达到极高的效率和精度。

真正的边缘智能:百倍的能效提升意味着,未来可能将现在需要云端巨大算力支持的AI创作能力,集成到手机、AR眼镜甚至物联网设备中,实现真正的实时、本地的智能交互。

LightGen的成功,远不止于一块更快的“画板”,而在于证明了一条通往“光速智能”的现实技术路径,标志着光子计算正式从一个擅长“快算”的专才,成长为一个能“创造”的通才。它不仅是加快了几款AI应用,更是试图在底层为即将到来的“智能爆炸”时代,建造一条光速的高速公路。

LightGen技术最深远的意义,在于它为“可持续AI”提供了硬件层面的解决方案。如果未来的AI算力基础设施能基于此类光子芯片构建,全球AI的碳足迹有望大幅降低。当智能的创造可以像光一样即时、廉价且无处不在时,人类迎来的将不仅仅是技术的升级,更是创造力解放的新纪元。

编辑:吴欧

论文信息

发布期刊 science

发布时间 2025年12月18日

论文标题All-optical synthesis chip for

large-scale intelligent semantic

vision generation


免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。