MIT和IBM合作开发的AI方法解决数学问题

编辑 | X
自牛顿时代以来,自然的基本定律——光学、声学、工程学、电子学,都可以用一组重要的方程来总结。
研究人员发现一种新方法,利用受大脑启发的神经网络更有效地解决方程,这在科学和工程领域具有广泛的潜在应用。
相关研究以《Physics-enhanced deep surrogates for partial differential equations》为题,发布在《Nature Machine Intelligence》上。
论文链接:https://www.nature.com/articles/s42256-023-00761-y
偏微分方程在科学和工程中扮演着重要角色,用于对多变量的复杂物理系统进行建模,包括空间和时间上的变化。它们在模拟飞机机翼上的空气流动、空气中污染物的传播以及恒星坍缩成黑洞等方面发挥着关键作用。
为了解决这些难题,科学家通常采用高精度数值方法,但这可能耗时且资源密集。
现在出现了更为简单的替代方案,被称为数据驱动模型。这些模型(如神经网络)利用数值求解器的数据进行训练,从而预测可能出现的结果。不过,这些模型仍需大量来自数值求解器的数据来进行训练。
佐治亚理工学院的计算科学家拉斐尔·佩斯图里表示,随着模型规模的增加,需要的数据量呈指数级增长,这使得这种策略的扩展变得困难。
在一项新研究中,研究人员开发了一种开发替代模型的新方法。该策略使用物理模拟器来帮助训练神经网络以匹配高精度数值系统的输出。其目的是借助某个领域的专家知识(在本例中为物理学)生成准确的结果,而不是仅仅在这些问题上投入大量计算资源,然后使用蛮力找到解决方案。
研究人员发现,数值代理(此处以詹姆斯·克拉克·麦克斯韦的漫画为代表)可以解决以前需要高精度、强力数学的数学难题(以麦克斯韦 daguerreotype 为代表)。(来源:MIT)
科学家们在三种物理系统上测试了他们所谓的物理增强深度代理(PEDS)模型。其中包括扩散,例如染料随着时间的推移在液体中扩散;反应扩散,例如化学反应后可能发生的扩散;还有电磁散射。
研究人员发现,这些新模型在处理偏微分方程时的准确度是其他神经网络的三倍。同时,这些模型只需要大约 1000 个训练点。这将所需的训练数据减少了至少 100 倍,以实现 5% 的目标误差。
实验表明,PEDS 提供了一种通用的、数据驱动的策略,可以弥合大量简化物理模型与相应的蛮力数值求解器对复杂系统建模之间的差距,提供准确性、速度和数据效率,以及对过程的物理见解。
「这个想法非常直观——让神经网络进行学习,让科学模型进行科学,」Pestourie 说。「PEDS 表明,将两者结合起来远远大于各部分之和。」
PEDS 模型的潜在应用包括加速「工程中随处可见的复杂系统的模拟——天气预报、碳捕获和核反应堆等等。」Pestourie 说。
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。