1. 首页
  2. 太阳能电池

重庆大学孙宽&李勇建立基于深度学习的有机太阳能电池给体材料快速评估新方法

本文亮点:
1. 建立了适用于有机光伏材料性能预测的深度学习模型,可对设计的有机给体材料进行快速初筛,提高有机太阳能电池的研发速率。
2. 该深度学习模型可使用化学结构图直接作为输入,具有出色的非线性分析能力,对算力要求极低。
3. 优化后的模型预测准确率高达到91.02%。
【前沿部分】
为了以更加低廉的方式将太阳能转化为电能,近年来有机太阳能电池引起了广泛关注,且已实现了超过17%的光电转换效率。然而,现阶段开发高性能有机太阳能电池材料主要基于传统的试错方法,即需要经过分子设计、有机合成、器件制造及优化的不断循环。这是一个漫长的过程,且需要大量的资源投入,如时间、能源、材料、设备和人力。因此,在过去的数十年间有机太阳能电池的发展一直都很缓慢。实际上,定量构效(QSAR / QSPR)可以为材料开发提供补充替代方案。定量构效是一种计算方法,旨在建立化学或生物材料与其活性/性质之间的关系。与传统方法不同的是,定量构效方法能够通过对大数据进行学习将最终结果与输入相关联,而无需中间的过程或逻辑。因此,尽管太阳能电池性能取决于若干因素,例如受体材料、膜的形态、界面修饰和加工方式,但通过定量构效方法可以直接建立起有机太阳能电池给体材料的化学结构与电池光电转换效率之间的关系。
最近,重庆大学能源与动力工程学院孙宽研究员和经济与管理学院李勇教授团队采用深度学习方法作为快速评估有机太阳能电池给体材料的全新手段。该深度学习模型允许直接使用化学结构的图片作为输入,具有出色的非线性分析能力,并且对计算能力的要求很低,仅需一台个人计算机即可完成工作。作者发现,深度学习模型可以自动检测并提取图片中的特征,如元素、化学键、基团等信息,并通过对这些特征进行学习从而建立起化学结构与光电转换效率之间的关系。相较于其他机器学习方法,使用深度学习可以减少人工筛选特征、进行特征信息转换的步骤,因此更加快速简便。该成果近期以封面文章(如图1所示)发表在Advanced Theory and Simulations上。 
Advanced Theory and Simulations 是Wiley出版社于2018年1月发行的全新的跨学科理论模拟期刊,属于Advanced Materials系列期刊。该期刊旨在发表在自然科学领域,与理论方法、建模和仿真方法的开发和应用相关的工作,为材料科学与自然科学的基础理论层面研究提供了一个新的平台。
项目得到了国家自然科学基金委、重庆市科委、重庆大学以及低品位能源利用技术及系统教育部重点实验室的基金支持。重庆大学能源与动力工程学院硕士生孙文博为论文第一作者,能动学院孙宽研究员与经管学院李勇教授为共同通讯作者。
重庆大学孙宽&李勇建立基于深度学习的有机太阳能电池给体材料快速评估新方法
图1 Advanced Theory and Simulations, Volume 2, Issue 1封面图
【图文解析】
重庆大学孙宽&李勇建立基于深度学习的有机太阳能电池给体材料快速评估新方法
图2 人类视觉系统与深度神经网络的比较。(a)视觉系统的信息处理过程。(b)全连接的深度神经网络的结构。
深度学习是一种使用机器学习算法并依赖于多层神经网络进行非线性分析的方法。深度学习模型被设计为多层结构的原因是为了模拟人脑的认知过程。 David Hubel和Torsten Wiesel首先发现了视觉系统的信息处理过程。如图2(a)所示,视觉系统的输入是在视网膜上形成的像素,然后通过大脑皮层中的细胞获得更抽象和更高水平的信息表示。首先,从像素中识别边缘。之后,将边组合在一起,以便可以识别形状或物体的部分。最后,经过进一步处理使大脑判断这个物体是什么。而这正是神经网络(图2(b))的工作方式。深度学习的核心在于“表示学习”,它可以识别原始数据中可用于分类的特征,而不是依赖于人为设计的特征提取器。深度学习模型中的每一层都能够将前一层的输出数据转换为更高,更抽象的表示,然后将它们作为输入数据传递给下一层。通过足够的处理,模型可以识别隐藏在原始数据中并且对分类重要的特征。独特的结构使得深度学习具有表示学习的能力,这是其他机器学习方法所不具备的。
重庆大学孙宽&李勇建立基于深度学习的有机太阳能电池给体材料快速评估新方法
图3 卷积神经网络(CNN)的结构。
实验中用于对材料进行分类预测的深度学习模型称为卷积神经网络(CNN),如图3所示。该模型由两部分组成。第一部分的作用是数据处理。它由两种类型的层堆叠而成,即卷积层和池化层。卷积层具有从图像中提取特征的能力。图像的卷积处理类似于滤波器(称为卷积核)提取输入图像的特征值。卷积核扫描化学结构的每个小区域(如图3中输入图像上的黑色方块所示),为每个小区域产生特征值。在扫描整个图像之后,创建一个特征图(由图3中卷积层中的一个彩色块表示)。实际上,卷积层中有多个卷积核,并且每个核可以生成一个特征图。因此,不同的卷积核可以生成一系列特征图以显示相同输入图像的不同特征。池化是一种下采样方法,通常在卷积层之后使用。卷积过后特征图的大小还很大,在模型训练期间给计算机带来了很大的负担。池化层可以将相似的特征合并为一个,这可以带来两个积极的结果:第一,特征图的大小可以减少;第二,合并特征的统计特性仍然可以反映原始数据。因此池化过程可以减少训练模型的时间,并且可以有效地避免过拟合。CNN的第二部分包括一定数量的全连接层和Softmax层,它们提供分类能力。全连接层可以根据输入和一系列权重生成输出。Softmax层可以根据全连接层的输出计算不同标签对应的概率。如果某个标签在概率上具有最高分,则输入被分类到该标签中。通过反向传播算法来训练所有权重,可以优化CNN并实现以高准确率对输入进行分类的目标。
重庆大学孙宽&李勇建立基于深度学习的有机太阳能电池给体材料快速评估新方法
图4 二分类模型的结果。(a)模型的学习策略。(b)测试准确率vs. 模型的训练迭代次数。 (c)训练误差vs. 模型的训练迭代次数。(d)最佳模型的验证结果。
作者使用哈佛清洁能源项目的数据库训练、测试并验证模型。该数据库中包含有二百三十万种有机太阳能电池给体材料以及它们对应的理论光电转换效率(PCE)。作者从该数据库中随机选取了50,000个材料并构建了用于实验的数据集。数据集中的材料按照PCE大小被平均分为了两类。第一类被认为是低性能OPV,PCE在0~4.9%范围内;而第二类被认为是高性能OPV,PCE为5.0~9.9%。然后将5,0000个分子随机分成训练,测试和验证集,比例为7:2:1。
为了提高模型的准确性,作者为模型建立了学习策略(如图4(a)所示)。学习率(lr)是介于0和1之间的参数。小学习率使模型专注于输入数据中的微小差异;而一个大的学习率允许网络只关注大的差异。为了建立高效的学习策略,需要在不同阶段设计不同的学习率。例如,在学习过程开始时,宏观特征如化学结构中元素或基础构件的差异需要被提取,因此设置相对较大的学习率。随着学习的推进,应减少学习率以便可以区分诸如化学键键类型或某些元素所在位置之类的微小差异。在实验期间,为该模型建立了许多不同的学习策略。最有效的一个如图4(a)所示,即设定的初始学习率为0.001。在每经过22,500次迭代之后,学习率减少90%。在优化的学习策略下,模型的测试结果反映在图4(b)中。测试过程伴随着模型的训练,每训练迭代一定次数后需要对模型进行一次测试,测试的结果可反映模型当前的学习状态。从图4(b)可以看出,随着训练迭代次数的增加,模型的测试准确率都有所提高。在训练开始时,模型之间的误差很大,表明模型最初学习的特征是不同的。随着训练的进行,模型之间的误差逐渐减少。在训练结束时,三个模型之间几乎没有差距,并且所有模型都具有令人满意的测试准确率。此外,模型测试准确率的增长速度在迭代次数13,500和22,500次之间放缓,这可能是由于过拟合造成的。降低学习率或及时停止训练是减少过拟合影响的两种基本方法。实验中减小学习率之后,准确率再次提高,并且在90,000次迭代后最终达到0.9376且不再增高。图4(c)显示了最佳性能模型的训练误差vs.迭代次数的曲线。训练误差表示预测结果与训练集中真实值之间的误差。它在训练开始后急剧下降,并在前60,000次迭代期间逐渐平缓,这意味着该函数是收敛的。在60,000次迭代后,训练误差几乎没有变化,而在85,500次迭代后测试准确率略有下降,如图4(b)所示。为了避免过拟合,作者选择了经过80,000次迭代训练的模型来进行验证。验证相当于向训练好的模型输入全新的分子,并由模型做出预测判断。验证结果由图4(d)中的混淆矩阵所示。模型的预测准确率为91.02%。值得注意的是,评估过程很快。在训练过程中,每10,000次迭代在个人计算机上只需1小时。一旦模型被优化,每个分子的PCE预测仅花费2秒。因此,可以使用该模型进行快速材料筛选。
重庆大学孙宽&李勇建立基于深度学习的有机太阳能电池给体材料快速评估新方法
图5模型的可视化。(a)验证分子的输入图片。(b)模型中第一个卷积层的输出。(c)第一个池化层的输出。
作者进一步研究了深度学习的工作机理。通过将模型各层输出进行可视化,作者发现,当把图5(a)所示的分子图片输入给模型后,模型第一个卷积层产生的特征图(如图5(b)所示)中分子的不同部分被高亮出来。具体而言,在一些特征图中,整个分子被突出显示,以便目标对象可以与背景分离;而在一些特征图中,可能影响PCE的典型元素,化学键或结构被突出显示。这类似于分子描述符和分子指纹的作用,即从化学结构中提取有用信息。该实验证明卷积起到与特征提取器类似的作用。图5(c)显示了第一个池化层的输出,它位于第一个卷积层的后面。发现在排除冗余或重复信息或噪声之后,进一步增强了高亮的部分,但特征图也会更模糊。当数据通过卷积和池化层交替处理后,所获得的特征会变得越来越丰富。最终,足够的数据和特征使得深度学习模型可以将不同性能的OPV供体材料区分开。
重庆大学孙宽&李勇建立基于深度学习的有机太阳能电池给体材料快速评估新方法
图6 移除了侧链以适配哈佛清洁能源项目数据库的(a)P3HT;(b)PDPP3T;(c)Si-PCPDTBT和(d)P4TNTz-2F的化学结构图。
为了进一步研究模型学习的泛化能力,作者使用已经通过实验合成并验证的分子进行实验。选取的分子如图6所示。分子的实验数据如表1所示;模型预测的结果如表2所示。可以看出,模型预测的结果和实验结果可以很好吻合。值得注意的是,这四个分子与哈佛清洁能源项目中的数据完全不同。模型可以做出正确的预测,表明深度学习模型可以真正挖掘问题的规则/逻辑,而这些规则/逻辑隐藏在大量数据之下。之后该模型能够根据其自学的知识进行分类。本实验说明了深度学习方法的真正优势。
表1 文献报道的给体材料的实验数据
重庆大学孙宽&李勇建立基于深度学习的有机太阳能电池给体材料快速评估新方法
表2 文献报道的给体材料的预测结果重庆大学孙宽&李勇建立基于深度学习的有机太阳能电池给体材料快速评估新方法      
综上所述,该研究表明深度学习可有效地建立起材料结构与器件性能之间的关系,因此在新材料设计和清洁能源开发方面具有巨大潜力。不过深度学习仍存在一个缺陷,即模型类似于黑箱,它只是在没有提供理由的情况下作出判断。因此,研究人员通过模型只能知道一个分子是否会提供高PCE,但却无法知道为什么这样的分子是高性能的,这使得设计更好的分子变得困难。因此,理解深度学习如何“思考”将丰富深度学习领域,并扩展我们在决策和判断方面的知识。
Wenbo Sun, Meng Li, Yong Li, Zhou Wu, Yuyang Sun, Shirong Lu, Zeyun Xiao, Baomin Zhao, Kuan Sun, The Use of Deep Learning to Fast Evaluate Organic Photovoltaic Materials, Adv. Theory Simul., 2018, DOI:10.1002/adts.201800116

本文由能源学人编辑Lyncccom发布整理,非特别说明为独家版权,转请注明出处:https://nyxr-home.com/21837.html

参考文献: Adv. Theory Simul.

联系我们

15521390112

邮件:nyxrtg@energist..vip

工作时间:周一至周五,9:30-18:30,节假日休息

QR code