基于计算机技术的材料研发方法

2022-11-22 09:07
信息记录材料 2022年9期
关键词:高通量结构材料

李 剑

(贵阳职业技术学院 贵州 贵阳 550081)

0 引言

随着材料科学的发展,新型材料的大量出现,已成为人们日常生活和生产的重要组成部分。计算机技术作为信息时代的产物,是现代工业发展的重要组成部分,在现代社会的生产、生活中占有重要地位,各种行业对计算机技术的需求与日俱增。因此,本文从材料研发的视角,探讨了计算机技术在材料研发方面的应用,以促进二者的相互结合,以及新材料的开发与利用。

1 新材料的相关概述

1.1 新材料

新型材料是近年来开发的具有优良特性的新型结构和功能性材料。与传统的材料相比,这种新型材料有了更多的新特性,可以更好地适应社会和人们对新材料的需求。新材料不只是已经开发的,还有部分材料也正在研究中。新材料技术从性能研究、材料设计、加工等一系列的研究与设计过程中,适应不同的应用要求。

1.2 新材料设计

新材料设计是新材料开发的关键。研发环节是对材料的组成、内部结构、材料性能进行预测和设计的过程。在新材料研发的实践中,材料研发可分为3个层面:微观研发层次、连续模型层次和工程层次研发。在此基础上,微观研发层次提出了新材料的原子层次和电子层次的研发。而连续模型层则是一种新型材料的连续介质,其大小为1 μm。工程研发层面指的是宏观材料,它是指有关大型物料的处理与应用特性的设计。

2 材料计算工具与平台

近年来,随着计算机硬件技术的迅速发展,材料的理论计算日益增多,量子第一性原理、分子动力学等已成为材料领域的重要前沿课题。长期以来,国内外的开发者均在编写各种材料计算软件,部分已经发展到较为成熟的地步,如VASP、ABINIT、Quantum Espresso等。为了更好地利用计算机软件进行材料的研究,研究者已经设计了一套数据处理软件和科学工作流程,并在此基础上发展出了一套能够实现大规模、自动化的、可批量生产的高通量计算平台。

2.1 材料计算数据处理工具

计算材料科学中各种材料计算专用软件的输入/输出形式也不尽相同,并有相应的分析方法。过去,从事材料计算工作的科研工作者大多是手工操作,对大量的计算资料进行分析、加工,工作量大且不易操作。利用材料计算软件,可以对材料的结构、属性的数据进行读写、格式转换、分析,从而极大地提高了科研工作的效率。当前,世界上最具代表性的材料计算分析工具有:Pymatgen、Atomate、ASE(atomic simulation environment)等。

Pymatgen是以python为基础的高流量计算软件,其性能非常好。该系统支持多种输入/输出形式,如VASP、ABINIT、高斯等。该系统可以从电子中直接提取出电子的能带、电子密度、电子结构等数据,对各种类型的相关运算进行综合分析,并进行数据处理。同时,可以对各种元素、点位、分子、结构等进行不同的表征。另外,Pymatgen的功能也被封装到了Materials项目中。

Atomate是一种开放的python架构,用于材料模拟、特性分析和设计。该软件将Pymatgen、Fireworks、custodian等软件集成一体,使其具有较强的数据处理能力和解析能力。

ASE包括一组工具,用以建立、控制、操作、可视和分析原子模拟。它具有使用方便、灵活和可定制的特点。

2.2 科学工作流

科学的工作流可以用来计算材料的性质,也可以进行数据的分析。在材料的研究中,大部分的材料计算工作均是经过规范化、程序化,形成一套科学的工作流程,从而提高了科研工作的效率。目前,很多工作流程应用于材料计算工作流的计算平台。在AIIDA平台上,应用了一种科学的工作流程,可以实现对复杂的数据进行自动处理,并能在处理各种计算任务间进行数据共享;Materials项目中采用Fireworks来管理工作流程,从而使计算任务能够自动完成。图1为科学工作流功能示意图,其主要特征为:一是能实现从材料结构到性能的自动计算;二是能实时监测和自动纠正运算过程。

图1 科学工作流功能示意图

工作流结构示意图如图2所示,可视为一个有向图,其中每个均可以被看成是一个步骤计算、一个操作或者一个子流程。它还支持循环运行,可以根据设置的终结条件来完成迭代。

图2 工作流结构示意图

2.3 材料计算平台

为了适应物料计算的批量化、自动化,研究者利用计算机技术将不同的计算软件与编码相结合,建立了一个高通量的计算平台。计算平台负责管理和调度各种资源,方便物料工作者对物料数据的采集与分析。目前,在世界范围内,已有许多高通量的材料计算平台。典型的材料计算平台有:AFLOW、AIIDA、高通量物质综合计算与数据管理平台(Matcloud)、高通量计算平台与信息平台(Materials Informatics Platform, MIP)、Pylada和MPInterfaces等。

AFLOW是一种以VASP为基础的高通量材料计算方法,其支持力学、磁学、热动力学、电子结构等方面的数值模拟。

AIIDA是一种用于计算机科学应用的自动化交互基础设施。这是一种介于用户与高性能计算机的中间层。用户可以通过API与这个平台进行交互。在ADES模型的指导下,开发了一个基于ADES模型的工作平台。

Matcloud是一种高通量的材料仿真系统。其目的在于方便材料研究人员对材料进行模拟和计算,并获得所需要的材料特性。Matcloud为用户提供了一组工作流程模板。另外,Matcloud还为用户提供了一个方便的图形用户接口。

材料信息平台是一种基于一级原理的高通量计算平台。该系统能够完成结构查询、自动计算、功能特性显示等一系列高通量的标准过程。

Pylada是一个模块化的python架构,用来进行物理模拟。其目的在于提供一个能够构建各种哈密顿量的基础结构块。Pylada可以让使用者轻松地计算出声子或产生焓。

MPInterfaces是一款高通量过滤接口系统的软件,该技术可以应用于固体/固体杂化结构、固体/隐含溶剂体系、纳米粒子/配位体系的界面结构的创建和运行。

3 材料研究中机器学习的应用

3.1 机器学习助力新材料研究

机器学习(machine learning,ML)是在学习模式的基础上,通过对具体的数据进行分类、归纳和总结,从而达到预期效果的一种有效途径。在新材料的研究中,深度学习(deep learning,DL)的作用尤其明显。本文主要介绍电催化材料、热电材料、有机光电材料、锂离子电池材料等方面的应用。

3.1.1 筛选电催化材料

仅用手工的方法来筛选电催化剂是一项非常繁琐、工作量很大的工作。因为电催化反应是一种加速和促进电极与电解质的化学反应。表面催化反应受到多种因素的影响,如:材料选择、晶面选择、反应位置的选择等。Tran等利用主动机器学习的方法,提出了一种用于CO2RR和HER的电催化剂的筛选和计算方法。本文以材料专题数据库中的金属间化合物为训练集,采用python材料基因组学工具对所选择的材料进行了列表,并采用三角剖分技术对各表面的吸附位置进行了详细的分析。每一吸附位点的指纹识别均是最关键的一步,该过程是ML的输入数据,并利用ML模型对吸附位置进行预测。

另外,Tran等还通过密度泛函理论对最佳预报进行了验证,从而提高了预报精度,且选出了10个适合CO2RR和HER的金属间化合物14个。以往的催化剂研究均是在现有的知识体系中进行,很难对其未来的发展做出准确的预测。主动的机器学习模式可以有效地解决这一问题,从而大大提高了研究的效率,甚至可以从催化剂的本质出发,探索其规律,这无疑是一种新的材料筛选手段。

3.1.2 发现热电材料

利用塞贝克效应和佩尔捷效应,可以使热电材料的热能转化为电能。高效率热电材料是一种全固态热电器件,结构简单,体积小,无排放,效率高,具有广阔的发展前景。开发性能优异的热电材料是关键,在过去几十年来,人们致力于提高热电材料的性能。在微观层面,试图了解不同的载流子,如电子与声子的交互作用。ML方法在热电材料领域具有很好的应用前景。Furmanchuk等利用回归分析法,研制出了一种能够预测300~1 000 K温度范围内结晶材料塞贝克系数的新方法。在此基础上,他们提出了一种新的描述方法,用以预测塞贝克系数。该设备能对多种结晶的特性、制备工艺和化学结构的组成进行对比。如果能够将该工具嵌入到网络应用程序中,那么将有助于科学家在新型热电材料方面的研究。

3.1.3 有机光电材料

改变传统的有机光电材料发展模式,必须在分子设计、有机合成、分子结构特点等方面开展更大规模的试验研究。在此基础上,采用了卷积神经网络的DL方法,将其图像视为图像的特征描述。首先,利用1 700个不同的物质资料,对其进行模拟,并对其光电转化效率进行了预测。结果表明,该方法的预测准确率在91%以上。通过试验对10种新的供体材料进行了光电转化,得到了与试验一致的结果。这也说明了ML方法的正确性。相信ML的最大价值在于节省时间、节省资源,大大促进了受体材料的开发,加速了高效率的有机光电器件的研究。

3.1.4 锂离子电池电极材料的设计

锂离子电池的主要特性是由电极材料决定的,但是从发现到应用的全过程是非常复杂的。在此基础上,提出了一种基于ML的方法,既可以避免手工操作,又可以利用大量的数据进行建模,从而总结出材料的特性和结构之间的相互关系。为高性能电极材料的筛选和开发提供了新的思路,并将理论与试验数据结合起来。采用SVM法,对LISICON型超离子导体进行了有效的、大规模的扫描,获得了LISICON超离子导体的组分和相位空间。这样,ML就大大加速了材料的设计。

3.2 机器学习促进更精确的材料结构和性能预报

ML方法是一种以数据为基础的新的研究范例,它对数据和学习模式的依赖性较强,因此具有较好的预测能力。在各种材料数据库的支撑下,ML对材料的性能进行了预测,其结果具有以下代表性。

3.2.1 二元化合物的结构

ML是一种包含多种不同的技术,它包含了从数据中获取有用的信息和模型。它的知识和技能来自于统计学、图论、数据库、数学和计算机。在此基础上,提出了一种广泛适用的数据挖掘算法,并将其用于许多二元化合物系统,它们已经被广泛地用于实验样本。利用非监督学习的方法,按照晶体的结构,把很多化合物分成子集。采用有监督学习的方法对未知化合物进行分类,将具有相似特征的化合物列入同一类化合物,共55个化合物具有正确的结构,其平均识别精度可达95%。讨论该化合物的特殊性质(熔点),通过计算和试验,预测了44个化合物的熔点,结果表明,该方法的相对误差约为12.8%。这是预测材料性能的一项新突破。

3.2.2 材料的形成能

形成能晶体结构的预测与表征是材料研究和发展的一个重要课题。通常情况下,利用离散傅里叶变换(discrete fourier transform,DFT)方法对候选结构进行精确的运算,或从大量的试验数据中抽取经验规律。

3.2.3 致密有韧性的二氧化硅玻璃

ML比较于常规的测试技术有其自身的优势,不仅具备通用性和高效率,还具备强大的可开发性,能够把测试数据和工艺参数密切的关联起来,由此增强了对产品的检测功能。大弹性模量、小密度SiO2基玻璃的化学结构正成为研发热门。

3.3 机器学习应用中的问题和思考

ML方法在数据分析、规则发现、关联等方面具有很强的应用价值,而ML方法的应用有助于加速材料的研究。但在实践中,仍然存在着许多问题。首先,ML的实际应用需要大量的数据,而在实际应用中,ML模型会出现适用性差、精确度低等问题。最后,提出了一种能够解释的ML模型。由于资料的缺乏,可以在小样本中添加领域知识,或通过随机抽样、分割等方式进行数据的扩展。由于研究对象的不同,其适应性和准确性也存在差异。研究者通过对各种ML模型的对比和确认,选择出最优的模型。在模型的解释性问题上,一方面要深入地探讨可解释性的SISSO、符号回归等ML方法;另一方面要通过对其特征的重要性进行推理,进而提高其对属性的预测能力。

4 结语

本文对当前材料研究中的计算机技术作了较为详尽的介绍,并对当前所使用的部分软件工具、平台以及ML方法在材料研发中的应用作了概述。计算机技术为材料科学,特别是材料基因组项目的实施提供了有力的技术支持和保证,并将在今后的材料科学和工程领域中扮演更重要的角色。

猜你喜欢
高通量结构材料
高通量卫星服务专用网络的应用模式探索
高通量血液透析治疗老年慢性肾衰竭对治疗有效率、Hb及ALB指标的影响研究
新一代高通量二代测序技术诊断耐药结核病的临床意义
《形而上学》△卷的结构和位置
土木工程材料的认识和应用
高通量血液透析临床研究进展
论结构
新材料赢得新未来
最美材料人
论《日出》的结构