点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
在全球科技行业努力应对人工智能应用和数字技术带来的巨大能源消耗之际,微软的研究人员可能已经找到了一个很有希望的解决方案。微软英国剑桥研究院的一个团队与剑桥大学的合作者成功开发了一款新型的模拟光学计算机(Analog Optical Computer, AOC),该计算机利用光的特性进行计算,有望在处理特定的人工智能和优化任务时,将能源效率提升高达 100 倍。相关研究成果已于 2025 年 9 月 3 日发表在《自然》(Nature)上。
图丨相关论文(来源:Nature)
随着各行各业对人工智能和大规模数据处理的依赖日益加深,传统数字计算机的能源消耗和数据传输瓶颈问题变得愈发突出。数字计算在处理复杂的优化问题和大规模 AI 模型推理时,往往需要消耗大量的电力,并受到数据在处理器和内存之间移动速度的限制,即所谓的“冯·诺依曼瓶颈”。为了突破这些限制,科学界一直在探索新的计算范式,而模拟计算,特别是利用光子进行计算的光学计算,被视为一个极具潜力的方向。
微软研发的这款 AOC 正是基于这一理念。它并非一台通用计算机,而是一种专用计算设备,旨在高效解决两类关键问题:人工智能推理(AI Inference)和组合优化(Combinatorial Optimization)。与依赖电子在“0”和“1”之间切换的数字计算机不同,AOC 利用光在通过光学元件时物理特性的连续变化来进行计算。这一模拟过程,避免了在数字与模拟信号之间进行耗能且耗时的转换。
该 AOC 系统的核心架构结合了三维光学系统和模拟电子器件。其基本工作原理是通过一个微型发光二极管(microLED)阵列来代表输入数据或变量,这些光源发出的光线经过复杂的透镜系统,投射到空间光调制器(Spatial Light Modulator, SLM)上。空间光调制器在这里扮演着关键角色,其上的每个像素可以被编程来调整通过光线的强度,从而实现输入数据与预设权重(或问题参数)的乘法运算。
图丨AOC 及其应用(来源:Nature)
随后,经过调制的光线被另一组透镜汇聚到光电探测器阵列上,完成加法运算。整个过程在物理层面瞬时完成了大规模的矢量-矩阵乘法,这是许多 AI 和优化算法中最为核心和计算密集的部分。模拟电子电路则负责处理非线性激活函数、反馈和迭代等其余的计算步骤。
(来源:Microsoft)
这种光电混合的模拟计算方式,使得 AOC 能够在一个统一的平台上,高效地执行 AI 推理和组合优化任务。其关键创新之一是一种被称为“快速定点搜索”(rapid fixed-point search)的机制。在 AI 模型推理中,系统通过迭代快速收敛到一个稳定的“定点”,这个定点就代表了模型的输出结果。
在解决优化问题时,这个定点则对应于问题的最优解或近似最优解。这种迭代过程的本质使其对模拟计算中固有的噪声具有很强的鲁棒性,因为每一次迭代都会将计算结果拉向正确的“吸引子”(attractor),从而有效抵消噪声的干扰。
为了验证 AOC 的实际应用能力,研究团队进行了一系列案例研究。在一个与微软健康未来团队合作的项目中,他们利用 AOC 的“数字孪生”(Digital Twin)——一个精确模拟硬件行为的软件模型——来处理医学图像重建任务。结果显示,该技术有潜力将核磁共振成像的扫描时间从 30 分钟大幅缩短至 5 分钟,这对于提升医疗效率和改善患者体验具有重大意义。
在金融领域,微软与巴克莱银行(Barclays)合作,将 AOC 应用于解决复杂的金融交易结算问题。这是一个典型的组合优化难题,需要在满足各种法律和信贷约束的条件下,找到最大化结算交易数量或价值的最佳方案。在一个包含 46 笔交易和 30 个约束条件的测试案例中,AOC 硬件成功找到了全局最优解,其表现甚至优于一些量子计算硬件在该问题上的尝试。
除了这些复杂的优化任务,该原型机也展示了其在 AI 推理方面的能力。研究团队成功地在 AOC 上运行了针对手写数字(MNIST)和时尚商品(Fashion-MNIST)图像识别的神经网络模型,以及非线性回归任务。测试结果显示,AOC 硬件的推理结果与数字孪生模型的模拟结果有超过 99% 的一致性,证明了从数字环境训练模型,再部署到模拟光学硬件上的可行性。
图丨用于机器学习推理的 AOC(来源:Nature)
目前,这台 AOC 原型机的规模还相对较小,其硬件能够处理的权重数量为 256 个,通过特定技术可以扩展到 4096 个。研究人员指出,要处理现实世界中更大规模的应用,例如驱动大型语言模型或解决更复杂的工业优化问题,硬件的可扩展性需要达到数亿甚至数十亿个权重。
尽管面临挑战,但研究团队对 AOC 的未来扩展性持乐观态度。他们指出,这台原型机的一个显著优势是其构建材料大多是消费级的成熟技术,例如智能手机摄像头中的传感器、微型 LED 和光学镜片等。这不仅能降低制造成本,也意味着未来的大规模生产可以利用现有的供应链。
研究团队设想,未来的 AOC 系统将采用模块化设计,通过集成多个小型的光电计算模块来处理更大规模的矩阵运算。据他们预测,一个由 25 个模块组成、能够处理 1 亿个权重的 AOC 系统,其功耗约为 800 瓦,而计算速度可达到每秒 400 千万亿次运算(Peta-OPS),能效预计可以达到每瓦 500 万亿次运算(TOPS/W),这比目前最先进的图形处理器(GPU)在同等精度下的效率高出超过 100 倍。
参考资料:
1.http://www.nature.com/articles/s41586-025-09430-z
运营/排版:何晨龙