德国科学家开发用光构成的神经网络

2024-08-06 11:01:19 - 媒体滚动

德国科学家开发用光构成的神经网络

马克斯-普朗克光科学研究所的研究人员开发出了一种利用光学系统实现神经网络的更简单、更可持续的方法。

德国科学家开发用光构成的神经网络

科学家们提出了一种用光学系统实现神经网络的新方法,这种方法可以使机器学习在未来更具可持续性。德国马克斯-普朗克光科学研究所的研究人员于7月9日在《自然-物理学》上发表了他们的新研究,展示了一种比以往做法简单得多的方法。

机器学习和人工智能的应用越来越广泛,从计算机视觉到文本生成,正如ChatGPT所展示的那样。然而,这些复杂的任务需要越来越复杂的神经网络,有些甚至需要数十亿个参数。

由于能耗和训练时间呈指数级增长,神经网络规模的快速增长已使这些技术走上了不可持续的道路。例如,据估计,GPT-3的训练消耗了1000多兆瓦时的能源,相当于一个小镇的日耗电量。

这一趋势催生了对更快、更节能、更具成本效益的替代品的需求,从而引发了神经形态计算领域的快速发展。这一领域的目标是用物理神经网络取代数字计算机上的神经网络。这些网络经过设计,能以更快、更节能的方式执行所需的物理数学运算。

光学和光子学是神经形态计算特别有前途的平台,因为能耗可以降到最低。并行计算的速度非常高,仅受光速的限制。然而,迄今为止,神经形态计算仍面临两大挑战:首先,实现必要的复杂数学计算需要很高的激光功率。其次,缺乏针对此类物理神经网络的高效通用训练方法。

来自马克斯-普朗克光科学研究所的克拉拉·万尤拉和弗洛里安·马夸特在《自然-物理学》上发表的新文章中提出的新方法可以克服这两个挑战。

“通常情况下,数据输入是印在光场上的。然而,在我们的新方法中,我们建议通过改变光的传输来印记输入。”研究所所长弗洛里安·马夸特解释道。

这样,输入信号就可以任意处理。即使光场本身以最简单的方式表现出来,即波之间相互干扰而不相互影响,情况也是如此。因此,他们的方法可以避免复杂的物理相互作用,从而实现所需的数学函数,否则就需要高功率光场。

这样,评估和训练这个物理神经网络就变得非常简单了:“这其实就像将光送入系统并观察透射光一样简单。这样我们就能评估网络的输出。同时,这还能让我们测量所有与训练相关的信息。”该研究的第一作者克拉拉·万尤拉说。

作者在模拟中证明,他们的方法可以用来执行图像分类任务,其准确性与数字神经网络相同。

今后,作者计划与实验小组合作,探索如何实施他们的方法。由于他们的建议大大放宽了实验要求,因此可以应用于许多物理上截然不同的系统。这为神经形态设备在广泛的平台上进行物理训练开辟了新的可能性。(逸文)

今日热搜