服务电话:133921763
当前位置: 免费心水 > 通天论坛免费心水区 > 正文

人工智能有助于材料制造 这是真的吗

发表时间: 2019-09-11

  近年来,诸如材料基因组计划和材料项目等研究工作已经产生了大量的计算工具,用于设计可用于从能源和电子到航空和土木工程等各种应用的新材料。

  麻省理工学院,马萨诸塞大学阿默斯特分校和加州大学伯克利分校的一组研究人员希望通过新的人工智能系统来弥补材料 - 科学自动化的差距,该系统将通过研究论文来推断“食谱”。生产特殊材料。

  “计算材料科学家在制造什么方面取得了很大进展 - 根据所需特性设计了什么材料,”麻省理工学院材料科学与工程系(DMSE)大西洋里奇菲尔德能源研究助理教授Elsa Olivetti说。 )。“但是由于这种成功,瓶颈已经转移到了,好吧,现在我该怎么做?”

  研究人员设想了一个数据库,其中包含从数百万篇论文中提取的材料配方。科学家和工程师可以输入目标材料的名称和任何其他标准 - 前体材料,反应条件,制造工艺 - 并提取建议的配方。

  作为实现这一愿景的一步,Olivetti和她的同事开发了一种机器学习系统,可以分析研究论文,推断其中哪些段落包含材料配方,并根据其在食谱中的作用对这些段落中的单词进行分类:目标材料的名称,数字量,设备名称,操作条件,描述性形容词等。

  在最新一期“ 材料化学 ”杂志上发表的一篇论文中,他们还证明机器学习系统可以分析提取的数据,以推断材料类别的一般特征 - 例如合成所需的不同温度范围 - 或者单个材料的特殊特征 - 例如当它们的制造条件变化时它们将采取的不同物理形式。

  Olivetti是该论文的高级作者,她与麻省理工学院DMSE研究生Edward Kim一同加入; Kevin Huang,DMSE博士后; 亚当桑德斯和安大略麦卡勒姆,麻省大学阿默斯特分校的计算机科学家; 和Gerbrand Ceder,伯克利材料科学与工程系的校长,香港白小姐开码结果。教授。

  研究人员使用有监督和无监督的机器学习技术对他们的系统进行训练。“监督”是指供给系统的训练数据首先由人类注释; 系统尝试查找原始数据和注释之间的相关性。“无监督”意味着训练数据未被注释,而系统则学习根据结构相似性将数据聚集在一起。

  由于材料配方提取是一个新的研究领域,Olivetti和她的同事们并没有多年来由不同研究团队积累的大量注释数据集。相反,他们必须自己注释他们的数据 - 最终,大约100篇论文。

  通过机器学习标准,这是一个非常小的数据集。为了改进它,他们使用了Google开发的一种名为Word2vec的算法。Word2vec查看单词出现的上下文 - 单词句子中的句法角色和围绕它们的其他单词 - 并将那些倾向于具有相似上下文的单词组合在一起。因此,例如,如果一篇论文中包含句子“我们将四氯化钛加热到500℃”,另一篇文章中包含“氢氧化钠被加热到500℃”的句子,Word2vec会将“四氯化钛”和“氢氧化钠”分组。一起。

  使用Word2vec,研究人员能够极大地扩展他们的训练集,因为机器学习系统可以推断附加到任何给定单词的标签可能适用于与其聚集的其他单词。因此,研究人员可以在大约640,000篇论文上训练他们的系统,而不是100篇论文。

  然而,为了测试系统的准确性,他们不得不依赖标记数据,因为他们没有评估其在未标记数据上的性能的标准。在这些测试中,系统能够以99%的准确度识别包含配方的段落,并以86%的准确度标记这些段落中的单词。

  研究人员希望进一步的工作将提高系统的准确性,并且在正在进行的工作中,他们正在探索一系列深度学习技术,这些技术可以进一步概括材料配方的结构,目的是自动设计材料配方中未考虑的材料配方。现有文献。

  Olivetti之前的大部分研究都集中在寻找更具成本效益和环保能力的方法来生产有用的材料,她希望材料配方数据库可以帮助该项目。

  “这是具有里程碑意义的工作,”加州大学圣塔芭芭拉分校材料科学研究所Fred和Linda R. Wudl教授Ram Seshadri说道。“作者已经采取了通过人工智能方法捕捉策略的艰难而雄心勃勃的挑战用于准备新材料。这项工作展示了机器学习的力量,但可以准确地说,最终成功或失败的判断需要令人信服的从业者相信这些方法的效用可以使他们更加本能地放弃他们接近“。

  这项研究得到了国家科学基金会,海军研究办公室,能源部的支持以及通过麻省理工学院能源倡议的种子支持。Kim得到了加拿大自然科学和工程研究委员会的部分支持。