深度学习撞上生物学 疾病研究将达新拐点?
眼睛一直被认为是灵魂的窗口,但谷歌的研究人员将其视为一个人健康的指标。他们正在通过分析视网膜照片,使用深度学习来预测一个人的血压、年龄和吸烟状况。谷歌的电脑会从血管排列顺序中收集线索。一项初步研究表明,机器可以使用这些信息来预测人是否有心脏病发作的危险。
这项研究依赖于卷积神经网络,这是一种正在改变生物学家如何分析图像的深度学习算法。科学家正在使用这种方法来寻找基因组中的突变,并预测单个细胞布局的变化。谷歌的这个方法在八月份的预印本中有所描述(网址为https://arxiv.org/abs/1708.09843; 2017)是新一代深度学习应用程序的一部分,这些应用程序正在使图像处理变得更容易更通用,甚至可以识别被忽视的生物现象。
加利福尼亚州山景城谷歌研究部门的工程总监菲利普·纳尔逊(Philip Nelson)表示,“以前,把机器学习应用到生物学的许多领域是不切实际的。但现在你可以使用机器学习让人类发现以前见不到的东西。
卷积神经网络允许计算机高效且全面地处理图像,而不会将其分割成多个部分。该方法在2012年左右在科技领域取得了成功,这得益于计算机电源和存储的进步。例如,Facebook使用这种深度学习来识别照片中的脸部,但是科学家们努力将这个网络应用到生物学领域,部分原因在于领域之间的文化差异。 Calico的首席计算官Daphne Koller表示,“让一群聪明的生物学家把他们放在一个聪明的计算机科学家的房间里,他们会互相谈两种不同的语言,因为他们有不同的思维方式。”
科学家还必须确定哪些类型的研究可以通过网络进行,它们必须接受大量图像训练的然后才能开始进行预测。当谷歌希望利用深度学习来发现基因组中的突变时,科学家们不得不将DNA的字母转换成计算机可以识别的图像。然后在已经与参考基因组进行比对并且突变已知的DNA片段上训练他们的网络。最终的结果是DeepVariant,这是12月发布的一个工具,可以发现DNA序列的小变化。在测试中,DeepVariant至少和传统工具一样。
华盛顿州西雅图的艾伦研究所的细胞生物学家正在使用卷积神经网络将光学显微镜捕获的细胞的平坦、灰色的图像转换成3D图像,其中一些细胞的细胞器被标记为彩色。这种方法消除了细胞染色的需要。但这个过程需要更多的时间和复杂的实验室,并且可能会损坏细胞。上个月,该小组发表了一项先进技术的细节,该技术可以使用一些数据(如细胞的轮廓)预测更多细胞部分的形状和位置(GR Johnson et al。Preprint at bioRxiv http:// doi .org / chwv; 2017)。
美国马萨诸塞州麻省理工学院和哈佛大学Broad研究所成像平台主任Anne Carpenter认为,“现在看到的是机器学习如何能够完成与成像有关的生物学任务,这是前所未有的转变。 2015年,她的跨学科团队开始使用卷积神经网络处理细胞图像,卡彭特(Anne Carpenter)则表示,网络处理了她的中心约15%的图像数据。她预测,这种方法将成为几年来该中心的主要处理模式。
其他人则对以下观点感到兴奋:用卷积神经网络分析图像可能无意中会揭示微妙的生物现象,促使生物学家提出他们以前可能没有考虑过的问题。
根据艾伦研究所执行董事Rick Horwitz的说法,这样的偶然发现可能有助于推动疾病研究。如果深度学习可以揭示个体细胞中癌症的微妙标记,他说,这可能会有助于改善研究人员如何分类肿瘤进展。这反过来可能引发关于癌症如何传播的新的假说。
生物学中的其他机器学习鉴赏家已经将目光投向了新的领域,现在卷积神经网络正在进行图像处理。德国Neuherberg环境健康研究中心的计算生物学家Alex Wolf认为,“成像是重要的,但化学和分子数据也是重要的。沃尔夫希望调整神经网络,以便分析基因表达。他表示,“认为未来几年将会有一个非常大的突破,使生物学家能够更广泛地应用神经网络。”