深度学习在乳腺癌上的应用!
乳腺癌是女性最常见的浸润性癌症,也是继肺癌之后致女性死亡的第二大癌症。在本文中,作者将构建一个基于WideResNet的神经网络。将幻灯片图像分为两类,一类使用深度学习分析乳腺癌,另一类不使用深度学习。
浸润性导管癌(IDC),是最常见的乳腺癌类型。美国癌症协会预估,每年本土有超过18万名妇女被诊断患有浸润性乳腺癌。而癌症的类型又大多属为IDC。
准确识别和区分乳腺癌类型是一项重要的任务。而使用基于人工智能的自动化检测可以大大节省时间并减少误诊的可能性。
在本文中,作者将构建一个基于WideResNet的神经网络,并将展示的图像分为两类,一类是使用深度学习分析乳腺癌,另一类是不使用深度学习。
关于数据集
俄亥俄州克利夫兰的凯斯·西储大学的研究员承担了这次数据集的收集。
(详见:http://gleason.case.edu/webdata/jpi-dl-tutorial/IDC_regular_ps50_idx5.zip)
数据集中有162个完整的幻灯片图像。这些幻灯片通过了40倍分辨率的扫描后,又被划分成275215个50x50的像素贴片。然后将0和1的标签分配给每个贴片。对于包含IDC的贴片,标签为1,不包括IDC的贴片,标签为0。
用WideResNet对幻灯片进行分类
在刚才的分类中,我们发现使用RESNET架构连接非常成功。通过对WideResNet体系结构的研究,我们发现如果深度小到16层,也可以实现类似的性能。而这也有助于解决关于Reset的各种问题,如爆炸/消失梯度和退化。
通过阅读Vincent Fung和Apil Tamang博客中的信息,我们可以对ResNet的实际用途有更深的了解。
ResNet的核心思想是引入一个或多个层跳过所谓的“身份快捷方式连接”。
作者认为,让叠加层符合剩余映射比让它们直接适合所需的下铺映射要容易得多。这也表明,深层次的模型应该比浅层模型要有更小的出错率才行。ResNet也迅速成为各种计算机任务中最常用的体系结构之一。
故而,WideResNet的存在是有原因的:每增加一个百分点改进精度的成本几乎是增加层数的两倍。而且训练非常深的残余网络会导致可重复利用特征的减少,这也将拖慢网络训练的速度。
为了解决以上问题,Zagoruyko和Komodakis对ResNet模块的结构进行了详细的实验研究,并在此基础上提出了一种新的结构。在这种架构下,他们减少了网络的深度并增加了宽度。他们称之为广域网。
现在我们将逐步展示用WideResNet架构解决这个问题的过程。我们正在通过深度学习工作室,帮助我们能够快速构建神经网络,而无需担心编码、语法和数据集的摄入。
1.创建项目
登录本地或云端运行深度学习工作室,然后单击“+”创建一个新项目。
2.数据集摄取
然后,我们在“数据”选项卡中设置此项目的数据集。通常,20%-80%是训练和验证之间的一个很好的分离。但如果你愿意,你也可以使用其他设置。如果你机器的内存足够大,你也可以将全部数据集加载到内存中。但请不要忘记将“内存中的加载数据集”设置为“完整数据集”。
3.创建神经网络
你可以通过拖放层来创建如下所示的神经网络。
确保将WideResNet 的属性设置为可训练。
首先密集层(Dense_3)应该具有20个左右的ReLU作为激活功能的神经元。最终浓度图层(Dense_1)应该将输出尺寸设置为1,并将其激活为sigmoid。这是因为我们将这个问题设置为回归而不是进一步划分。如果回归结果低于0.5,那么我们可以说输入属于0,(即没有IDC癌症),否则就有IDC癌症。
4.超参数与训练
我们使用的超级参数如下所示。(你可以随意的改变图中数据。)
最后,你可以查看训练选项卡,或监视培训仪表板的进度。
完成训练后,您可以在结果选项卡中查看结果。你可以发现,在价格为每小时0.90美元的K80 GPU上,我们的精确度在85%以上。
5.部署模型
部署的模型可以作为webapp或RESTAPI访问,如下所示:
总结
因此,你可以看到,构建深度学习模型只需花几分钟时间。然后在深度工作室中进行部署即可。它可以帮助许多开发人员解决复杂的问题,而不必担心编码、API等。