位置:首页 >  综合看点 > 正文内容

DRNET可以解决数独问题,加速科学发现

更新时间:2021-09-25 19:00:32

假设你和一个朋友在一个熟悉的街区开车,朋友让你在下一个十字路口转弯。这位朋友没有说该向哪条路转弯,但既然你们都知道这是一条单行道,就明白了。

这类推理是一个新的人工智能框架的核心,该框架在重叠的数独游戏中成功测试,可以加快材料科学、可再生能源技术和其他领域的发现。

康奈尔·安·S·鲍尔斯计算与信息科学学院计算与信息科学教授Carla Gomes和Antonia V.Nielsen领导的跨学科研究团队开发了深度推理网络(DRNET),它将深度学习(即使是相对少量的数据)与对主体边界和规则的理解相结合,称为“约束推理”

陈迪(Di Chen)是戈麦斯团队的计算机科学博士生,他是9月16日在《自然机器智能》(Nature Machine Intelligence)上发表的《通过深度学习与约束推理相结合实现晶体结构相位映射自动化》一书的第一作者。

Gomes和John Gregoire博士09,加利福尼亚理工学院的研究教授,是资深作者。Gregoire是合著者R.Bruce van Dover实验室的前博士后研究员,R.Bruce van Dover是Walter S.Carpenter,Jr.工程学教授。

在2020年7月举行的第37届机器学习国际会议上引入的DRNET使机器学习更进一步,它增加了约束推理——将规则和先前的科学知识考虑在内的能力,以便用很少的数据作为输入来解决问题。

戈麦斯说,你可以通过向机器展示1000张狗的图片来教机器识别狗,但科学发现并非如此。

“你不会有太多的标记数据,”她说。“一般来说,你所举的例子并不完全是你所要寻找的,但是你可以推理你对这个领域的科学知识,你可以推断出新的知识。”

戈麦斯的研究小组十多年来一直致力于利用人工智能和机器学习技术加速材料发现,该小组通过将重叠的手写数独谜题网格与每个框中的两个数字或字母进行混合,对DRNET框架进行了测试。计算机必须在没有任何训练数据的情况下,将谜题分成两个已解决的数独题,并且能够以接近100%的准确率完成。

深度推理网络(DRNET)是一种新的人工智能框架,可以加速材料科学、可再生能源技术和其他领域的发现。学分:康奈尔大学

然后,研究人员将DRNET应用于一个实际问题:利用X射线衍射(XRD)模式自动绘制太阳能燃料材料的晶体结构相位图。晶体结构相位映射涉及将所需晶体结构的源XRD信号从XRD图案的“嘈杂”混合物中分离出来,这项任务通常无法获得标记的训练数据。

利用已了解的热力学规则、几位未标记的数据、总共307个XRD图谱和有关化学系统元素的最低信息,铋、铜和钒(Bi-Cu-V)氧化物DRNET能够识别和分离总共13个晶相(单相材料)在19种独特的单相材料混合物中。

DRNets的发现通过人工分析得到验证,从而发现了将太阳能转化为可储存太阳能化学燃料的晶体材料的复杂混合物。

Gregoire说:“13个相及其混合物构成了从测量的XRD图谱中的数千个特征中获得的科学知识。”他强调,人类专家和先前的算法“由于高度的复杂性,我们无法从XRD图谱中提取这些知识。人类可以推理物理规则,计算机可以处理复杂数据,但科学发现需要整合这些方法。”

戈麦斯说:“验证一个化学系统的溶液是否符合物理规则比生产它要容易,同样,检查一个完整的数独游戏是否正确也比完成它要容易。”

DRNets的关键是“可解释的潜在空间”的概念。基本上,它使DRNets能够从输入数据推断出该领域的约束条件(本例中为材料科学)。

戈麦斯说:“这确实是我们方法学上的一大进步:我们在没有计算机训练数据的情况下进行训练。”

数独实验,“这台机器从未见过‘6’和‘D’重叠的样子,但可以通过推理解决问题,使用有关数独规则的先验知识。

“同样地,”她说,“DRNET根据热力学规则和已知的晶相来解释X射线衍射图,而没有数据来训练。”

DRNets建立在该小组之前的工作基础上,该工作涉及与物种分布相关的公民科学,与康奈尔鸟类学实验室的eBird计划一起完成。捕获和解释物种与其当地环境之间的相互作用的需要是该研究中可解释的潜在空间的最初动机和灵感计算可持续性新兴领域的先驱戈麦斯说,DRNET框架。

版权声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益, 请作者持权属证明与本网联系,我们将及时更正、删除,谢谢您的支持与理解。