神操作!生物、化学深度学习库Chainer Chemistry发布

神操作!生物、化学深度学习库Chainer Chemistry发布

我们发布了Chainer Chemistry,Chainer 扩展来训练和运行神经网络,用于一些生物学和化学的任务。

·Github页面:https://github.com/pfnet-research/chainer-chemistry

·文档:https://chainer-chemistry.readthedocs.io

以上的页面可以帮助您轻松地在分子结构上进行深度学习。

例如,您可以将机器学习应用于毒性分级任务或HOMO(最高占用分子轨道)级别的回归任务。

该库是在PFN 2017夏季实习期间开发的,它的一部分已由京都大学的实习生秋田弘高实施。

支持的功能

Graph卷(作用于的卷)的实现

最近提出的图形卷积网络打开了从“图形结构”输入进入应用深度学习的大门,图形卷积网络目前是一个活跃的研究领域。我们实现了几个图形卷积网络体系结构,包括今年的论文中介绍的网络。

以下模型已经被实现:

NFP:基于神经网络的指纹识别

GGNN:Gated-Graph神经网络

WeaveNet:分子图形卷积(Molecular Graph Convolutions )

SchNet:连续滤波卷积神经网络(continuous-filter convolutional Neural Network )

的数据预处理/研究数据集支持

各种数据集可以与这个库的通用接口一起使用。此外,一些研究数据集可以自动下载和预处理。

支持以下数据集:

·QM9 [7,8]:具有多达9个C / O / N / F原子的有机分子结构的数据集及其计算的物理属性值。这些值包括HOMO / LUMO水层级和内部能量。计算是量子化学的B3LYP / 6-31G级。

·Tox21 [9]:12个生物目标的毒性测量数据集

可用的训练/推理示例代

我们提供训练模型和推理的示例代码。您可以轻松地在这个库中尝试训练/推理这个模型,以便快速启动。

·https://github.com/pfnet-research/chainer-chemistry/tree/master/examples

背景

分子行为的模拟在发现新的药物领域是很重要的。当我们需要对量子效应进行高精度的计算时,DFT(密度泛函理论)被广泛使用。然而,它需要大量的计算资源,特别是大分子。在许多分子结构上应用模拟是困难的。

机器学习领域有一个不同的方法:学习在以前的实验中测量/计算过的数据,然后预测未经分析的分子的化学性质。神经网络可以比量子模拟更快地计算出预测结果。

神操作!生物、化学深度学习库Chainer Chemistry发布

一个重要的问题是如何处理化合物的输入/输出以便应用深度学习。主要问题是所有分子结构都有不同数量的原子,表现为不同的图形结构,而传统的深度学习方法是处理固定大小/结构化的输入。

然而,“图形卷积神经网络”被提出来处理输入的图形结构。

什么是形卷

卷积神经网络引入了“卷积”层,其将内核应用于图像中的局部信息。它在许多图像任务中显示出结果,包括分类、检测、分割、甚至图像生成任务。

图形卷积神经网络引入了一个“图卷积”操作,在图上的相邻节点之间应用一个核函数来处理图形结构。

神操作!生物、化学深度学习库Chainer Chemistry发布

CNN是处理一个图像作为输入,而基于图形的CNN则可以处理图形结构(分子结构等)作为输入。

其应用不限于分子结构。 “图形结构”可以出现在社会网络、交通等诸多领域,图形卷积神经网络应用的研究是一个有趣的课题。例如,在图像上应用图形卷积,在知识库上应用,将其应用于交通预测上。

·深度学习研究人员

该库提供最新的图形卷积神经网络实现

图形卷积应用不限于生物和化学,而是应用于各种领域。我们希望很多人使用这个库。

·材料/药物发现研究人员

该库使用户能够建立自己的模型来预测分子的各种化学性质。

将来的计划

这个库还是一个测试版本,并且正在积极开发中。可能会支持以下功能:

为推理提供预先训练的模型

添加更多的数据集

实施更多的网络

相关推荐