位置:首页 > 新闻资讯 > 行业技术 > 正文

超级计算机模拟器:人工智能在科学中的新角色

发布时间:2022-09-22 13:14:28   来源:   点击:


微软 AI4Science 负责人认为机器学习将部分取代模拟。
人工智能已成为许多科学家生活中不可或缺的工具,以至于研究人员使用它现在有了自己的绰号——AI4Science——被会议和实验室使用。上个月,微软宣布了自己的 AI4Science 计划,雇佣了遍布多个国家的数十名员工。
 
 
其主管克里斯·毕晓普 (Chris Bishop) 在被人工智能吸引之前就开始从事科学工作。他获得了博士学位,在爱丁堡大学攻读量子场论,然后在 1980 年代机器学习引起他的注意之前从事核聚变研究,他开始将神经网络应用到自己的工作中。“我比我早了 25 年,”他说,“但它真的起飞了。”
 
他于 1997 年加入微软研究院的剑桥实验室,最终成为其主任,现在有了新的角色。我们谈到了科学方法的演变、激光与啤酒以及书呆子 T 恤。以下为 IEEE Spectrum 与 Chris Bishop 的对话记录:
 
IEEE Spectrum:什么是 Microsoft AI4Science?
 
Chris Bishop:实际上,我们正在建立一支新团队。在接下来的十年里,我们在机器学习和自然科学——化学、物理学、生物学、天文学等领域——的交叉点看到了一个非常令人兴奋的机会。它超越了机器学习在自然科学中的简单应用。
 
IEEE Spectrum:它是如何超越的?
 
Chris Bishop:微软有一位技术研究员 Jim Gray,他谈到了科学发现的四种范式。
 
第一个范式是纯经验的,它正在观察我们周围世界的规律。
 
“我们看到一种新的范式正在出现。你可以追溯到几十年前,但这是在自然科学中使用机器学习的另一种方式。”
 
——Chris Bishop,微软研究院
 
第二个范式是理论范式。想想牛顿运动定律或麦克斯韦方程组。这些通常是微分方程。这是一个归纳步骤,假设他们更普遍地描述了世界。一个方程在许多长度和时间尺度上都非常精确,你可以把它写在你的 T 恤上。
 
科学发现的第三次转变始于 20 世纪中叶,随着数字计算机和模拟的发展,有效地解决了这些用于天气预报和其他应用的微分方程。
 
在 21 世纪起飞的第四范式不是使用计算机根据第一原理求解方程。而是使用计算机大规模分析经验数据。机器学习在这个领域蓬勃发展。想想大型强子对撞机、詹姆斯韦伯太空望远镜或蛋白质结合实验。
 
这四种范式一起工作。我们看到一种新的范式正在出现。你可以追溯到几十年前,但这是在自然科学中使用机器学习的另一种方式。在第三范式中,您在超级计算机上运行复杂的模拟;然后第二天,有人问了一个不同的问题。
 
你深吸一口气,向电表多投币。我们现在可以将这些模拟输入和输出用作机器学习深度神经网络的训练数据,这些网络学习复制或模拟模拟器。如果您多次使用模拟器,您将分摊生成训练数据的成本和训练成本。现在你有了这个希望相当通用的仿真器,你可以运行比模拟快几个数量级的仿真器。
 
IEEE Spectrum:训练一个模拟器大约需要多少模拟数据?
 
Bishop:很多机器学习都是一门经验科学。它涉及尝试不同的架构和数据量,并了解事物如何扩展。你不能提前说,我需要 5600 万个数据点来完成这个特定的任务。不过,有趣的是机器学习技术比常规训练更智能一些。主动学习和强化学习等技术,系统对其局限性有一定的了解。它可以在具有更多不确定性的地方请求更多数据。
 
IEEE Spectrum:仿真的弱点是什么?
 
Bishop:它们的计算成本仍然很高。此外,模拟器从数据中学习,因此它们通常并不比用于训练它们的数据更准确。此外,当呈现与他们所训练的场景明显不同的场景时,他们可能会给出不够准确的结果。
 
“我相信‘受使用启发的基础研究’——[就像]巴斯德的工作。他是酿酒业的顾问。为什么这种啤酒一直变酸?他基本上创立了整个微生物学领域。”
 
——Chris Bishop,微软研究院
 
IEEE Spectrum:微软 AI4Science 的所有项目都是基于仿真的吗?
 
Bishop:没有。我们在药物发现方面做了很多工作。目前这完全基于第四范式。它基于对某些分子特性的经验观察,并使用机器学习来推断不属于训练集的分子的特性,然后逆转该过程并说,给定一组特性,我们能找到 具有这些特性的新分子?我们与诺华公司建立了五年的研究合作伙伴关系。
 
IEEE Spectrum:您正在从事哪些其他项目?
 
Bishop:我们正在积极寻找合作伙伴关系。微软带来了一些东西。我们在机器学习方面拥有很多专业知识。我们在超大规模计算和云计算方面也有很多专业知识。然而,我们并没有努力做的是成为领域专家。我们不想成为一家制药公司,我们不想成为催化专家。我们正在引进在量子化学、量子物理学、催化等方面具有专业知识的人,但实际上是为了让我们能够与合作者和合作伙伴建立接口。
 
更大的图景是我们在任何有这些微分方程的地方工作。它可能是流体流动、设计涡轮机、预测天气、大规模天文现象、核反应堆中的等离子体。我们的很多重点是分子尺度模拟。从科学上讲,它包含了一些最具挑战性和一些最有趣的问题,但适用性也是巨大的——药物发现、可持续性。我们一直在考虑直接从空气中捕获二氧化碳。
 
IEEE Spectrum:目标是发表论文还是建立知识产权和产品?
 
Bishop:我猜,我们有三个目标。
 
首先,它是关于建立我们的研究。同行评议的出版物将是一个关键的出路。
 
其次,微软是一家商业模式是让他人获得成功的公司。因此,我们要寻找的一件事是如何将一些研究进展转化为基于云的服务,然后可以用于商业或学术界。它的适用范围可能是巨大的。如果你只考虑分子模拟,它是药物、润滑剂、防腐、碳捕获、化学工业的催化等等。
 
第三个目标最终是看到现实世界的影响:医疗保健、可持续性、气候变化。
 
IEEE Spectrum:您是否预见到不仅在您帮助合作伙伴的领域,而且在纯计算机科学和机器学习方面也会取得进步?
 
Bishop:这是一个很好的问题。我相信“以使用为基础的基础研究”,人们根据一个非常线性的模型进行思考,其中一方面进行基础研究,另一方面进行应用研究。一个很好的例子是爱因斯坦。他用铅笔、纸和大脑发现了受激辐射,然后它被用来制造激光。
 
但是有一种不同的研究,通常以巴斯德的工作为特征。他是酿酒业的顾问。为什么这种啤酒一直变酸?他基本上创立了整个微生物学领域。我认为这是受使用启发的基础研究。
 
我希望在我们解决真正困难的问题时能看到这一点。我们正在尝试建立一个能够理解分子动力学的神经网络,我们将需要新的神经网络架构。这可能会蔓延到完全不同的领域。
 
IEEE Spectrum:第六种科学范式会是什么?人工智能会产生新的假设吗?
 
Bishop:我不知道第六范式是什么。但我认为第五范式会让我们在接下来的十年或更长时间里保持忙碌。