神操作!生物、化学深度学习库Chainer Chemistry发布
我们发布了Chainer Chemistry,Chainer 扩展来训练和运行神经网络,用于一些生物学和化学的任务。
·Github页面:https://github.com/pfnet-research/chainer-chemistry
·文档:https://chainer-chemistry.readthedocs.io
以上的页面可以帮助您轻松地在分子结构上进行深度学习。
例如,您可以将机器学习应用于毒性分级任务或HOMO(最高占用分子轨道)级别的回归任务。
该库是在PFN 2017夏季实习期间开发的,它的一部分已由京都大学的实习生秋田弘高实施。
支持的功能
Graph卷积神经网络(作用于图的卷积神经网络)的实现
最近提出的图形卷积网络打开了从“图形结构”输入进入应用深度学习的大门,图形卷积网络目前是一个活跃的研究领域。我们实现了几个图形卷积网络体系结构,包括今年的论文中介绍的网络。
以下模型已经被实现:
NFP:基于神经网络的指纹识别
GGNN:Gated-Graph神经网络
WeaveNet:分子图形卷积(Molecular Graph Convolutions )
SchNet:连续滤波卷积神经网络(continuous-filter convolutional Neural Network )
常见的数据预处理/研究数据集支持
各种数据集可以与这个库的通用接口一起使用。此外,一些研究数据集可以自动下载和预处理。
支持以下数据集:
·QM9 [7,8]:具有多达9个C / O / N / F原子的有机分子结构的数据集及其计算的物理属性值。这些值包括HOMO / LUMO水层级和内部能量。计算是量子化学的B3LYP / 6-31G级。
·Tox21 [9]:12个生物目标的毒性测量数据集
可用的训练/推理示例代码:
我们提供训练模型和推理的示例代码。您可以轻松地在这个库中尝试训练/推理这个模型,以便快速启动。
·https://github.com/pfnet-research/chainer-chemistry/tree/master/examples
背景
分子行为的模拟在发现新的药物领域是很重要的。当我们需要对量子效应进行高精度的计算时,DFT(密度泛函理论)被广泛使用。然而,它需要大量的计算资源,特别是大分子。在许多分子结构上应用模拟是困难的。
机器学习领域有一个不同的方法:学习在以前的实验中测量/计算过的数据,然后预测未经分析的分子的化学性质。神经网络可以比量子模拟更快地计算出预测结果。
一个重要的问题是如何处理化合物的输入/输出以便应用深度学习。主要问题是所有分子结构都有不同数量的原子,表现为不同的图形结构,而传统的深度学习方法是处理固定大小/结构化的输入。
然而,“图形卷积神经网络”被提出来处理输入的图形结构。
什么是图形卷积神经网络?
卷积神经网络引入了“卷积”层,其将内核应用于图像中的局部信息。它在许多图像任务中显示出结果,包括分类、检测、分割、甚至图像生成任务。
图形卷积神经网络引入了一个“图卷积”操作,在图上的相邻节点之间应用一个核函数来处理图形结构。
CNN是处理一个图像作为输入,而基于图形的CNN则可以处理图形结构(分子结构等)作为输入。
其应用不限于分子结构。 “图形结构”可以出现在社会网络、交通等诸多领域,图形卷积神经网络应用的研究是一个有趣的课题。例如,在图像上应用图形卷积,在知识库上应用,将其应用于交通预测上。
目标用户
·深度学习研究人员
该库提供最新的图形卷积神经网络实现
图形卷积应用不限于生物和化学,而是应用于各种领域。我们希望很多人使用这个库。
·材料/药物发现研究人员
该库使用户能够建立自己的模型来预测分子的各种化学性质。
将来的计划
这个库还是一个测试版本,并且正在积极开发中。可能会支持以下功能:
为推理提供预先训练的模型
添加更多的数据集
实施更多的网络