编辑 | X
自牛顿时代以来,自然的基本定律——光学、声学、工程学、电子学,最终都归结为一组重要的、广泛的方程。
现在,研究人员找到了一种新方法,可以使用受大脑启发的神经网络来比以前更有效地求解这些方程,在科学和工程领域有许多潜在的应用。
相关研究以《Physics-enhanced deep surrogates for partial differential equations》为题,发布在《Nature Machine Intelligence》上。
论文链接:https://www.nature.com/articles/s42256-023-00761-y
在现代科学和工程中,偏微分方程有助于对涉及多种变化率的复杂物理系统进行建模,例如在空间和时间上变化的系统。它们可以帮助模拟各种事物,例如经过飞机机翼的空气流动、空气中污染物的扩散,或者恒星坍塌成黑洞。
为了解决这些困难的方程,科学家们传统上使用高精度数值方法。然而,这些运行起来可能非常耗时且计算资源密集。
目前,存在更简单的替代方案,称为数据驱动的替代模型。这些模型(包括神经网络)根据数值求解器的数据进行训练,以预测它们可能产生的答案。然而,这些仍然需要来自数值求解器的大量数据进行训练。
该研究的主要作者、佐治亚理工学院的计算科学家 Raphaël Pestourie 表示,随着这些模型规模的扩大,所需的数据量呈指数级增长,使得这一策略难以扩展。
在一项新研究中,研究人员开发了一种开发替代模型的新方法。该策略使用物理模拟器来帮助训练神经网络以匹配高精度数值系统的输出。其目的是借助某个领域的专家知识(在本例中为物理学)生成准确的结果,而不是仅仅在这些问题上投入大量计算资源,然后使用蛮力找到解决方案。
研究人员发现,数值代理(此处以詹姆斯·克拉克·麦克斯韦的漫画为代表)可以解决以前需要高精度、强力数学的数学难题(以麦克斯韦 daguerreotype 为代表)。(来源:MIT)
科学家们在三种物理系统上测试了他们所谓的物理增强深度代理(PEDS)模型。其中包括扩散,例如染料随着时间的推移在液体中扩散;反应扩散,例如化学反应后可能发生的扩散;还有电磁散射。
研究人员发现,这些新模型在处理偏微分方程时的准确度是其他神经网络的三倍。同时,这些模型只需要大约 1000 个训练点。这将所需的训练数据减少了至少 100 倍,以实现 5% 的目标误差。
实验表明,PEDS 提供了一种通用的、数据驱动的策略,可以弥合大量简化物理模型与相应的蛮力数值求解器对复杂系统建模之间的差距,提供准确性、速度和数据效率,以及对过程的物理见解。
「这个想法非常直观——让神经网络进行学习,让科学模型进行科学,」Pestourie 说。「PEDS 表明,将两者结合起来远远大于各部分之和。」
PEDS 模型的潜在应用包括加速「工程中随处可见的复杂系统的模拟——天气预报、碳捕获和核反应堆等等。」Pestourie 说。