传统生物医学数据分析技术在大数据时代背景下,面临着巨大挑战,而深度学习技术在生物医学分析领域的应用,迎来了巨大的发展机遇。本文综述了深度学习在生物医学数据分析领域的最新研究进展。首先阐述了深度学习方法及工具,随后以时间为主线,围绕生物医学问题的提出、数据预处理方法、模型建立方法、训练算法重点总结了近五年深度学习在生物医学数据分析中的具体应用,并重点强调了医疗辅助诊断中的深度学习应用。最后给出了未来深度学习在生物医学数据分析领域可能的发展方向。
引用本文: 李肃义, 唐世杰, 李凤, 齐建卓, 熊文激. 基于深度学习的生物医学数据分析进展. 生物医学工程学杂志, 2020, 37(2): 349-357. doi: 10.7507/1001-5515.201907016 复制
引言
21 世纪被称为信息时代,信息传播与处理的速度都以几何级数的方式爆炸增长,随之而来的便是大数据时代。随着网络的发展,越来越多大型的公开数据库可供研究人员使用,例如美国临床试验数据库、中国的神州基因组数据云等。在大数据时代背景下,随着生物医学数据采集技术的快速发展,研究者可以用更多的方式来更加全面地进行生物医学数据分析研究。传统的生物医学数据挖掘和分析方法面对海量增长的数据可能会显得效率较低,因为一方面生物医学大数据维度更高,计算更复杂,另一方面不同类型的生物医学数据的处理方式复杂多变,对模型的数据处理能力要求更高。近年来深度学习在自然语言处理、计算机视觉、语音识别以及基因组学和蛋白质结构等领域取得了突破性的进展,由于其具有强大的特征提取能力,非常适合处理生物医学大数据统计分析等相关问题,于是得到了越来越多的生物医学研究人员的关注[1-5]。
深度学习起源于人工神经网络,多层感知器就是一种经典的深度学习模型[6]。深度学习模型具有自动学习特征的特点,在训练过程中自动整合提取到的数据特征,通过组合低层特征形成更加抽象的高层特征。作为机器学习的一个领域,深度学习也分为监督学习和无监督学习,但和传统的机器学习模型如决策树(decision tree,DT)、支持向量机(support vector machine,SVM)等相比更具灵活性[7-8]。
本文首先介绍了深度学习方法及工具框架,随后总结了近五年深度学习技术在生物医学数据分析中的具体应用,最后给出了未来深度学习在生物医学数据分析领域可能的发展方向。
1 深度学习方法及工具
1.1 深度学习方法
深度学习方法包含多种深度学习模型,其中基础模型有深度信念网络(deep belief network,DBN)和堆栈自编码器(stacked automatic encoder,SAE),但现在生物医学数据分析领域更常用的模型是卷积神经网络(convolutional neural network,CNN)、循环神经网络(recurrent neural network,RNN)、生成式对抗网络(generative adversarial network,GAN)和图神经网络(graph neural network,GNN)等[9-14]。本节将详细介绍这些模型的基本单元、工作原理和训练过程等。
从神经学角度来说,CNN 的设计灵感来自动物视觉皮层对外界事物的感知,感受野的发现对 CNN 的意义重大[15]。CNN 在图像识别领域有着广泛的应用,它主要包括输入层、卷积层、池化层、全连接层和输出层等,模型训练过程中的核心操作是卷积过程和池化过程。卷积过程主要是特征提取的过程,池化过程主要是数据降维的过程,卷积池化过程中用到了权值共享原理,减少了模型的训练参数。CNN 是通过卷积层和池化层的堆叠,然后加上全连接层和输入输出层构成的。CNN 的训练过程与传统神经网络类似,参照了反向传播算法,分为前向传播阶段和后向传播阶段。在不同的应用领域,CNN 有着不同的变体,例如常见的分类网络,如谷歌网络(GoogLeNet);还有常见的分割网络,如 U 型网络(U-Net)等[16-17]。图 1 展示了一个简单的 CNN 模型,它具有两个卷积层、两个池化层、一个全连接层和输入输出层。

RNN 是用来处理和预测序列数据的深度学习模型,广泛应用于语音识别、自然语言处理、图像描述生成等领域。RNN 能充分利用序列数据前后信息,每个隐藏层的输入包括上一层的输出和上一时刻该隐藏层的输出,网络会对前面的信息记忆并应用于计算当前输出。RNN 采用时间反向传播算法训练,但普通 RNN 在处理长序列问题时可能会遇到梯度消失或梯度爆炸等问题[18-19]。解决这一问题的方法是采用长短期记忆网络结构(long short-term memory,LSTM),该模型是在 RNN 的基础上加入了三个门结构,分别是输入门、遗忘门和输出门,使不同时期记忆信息的尺度动态变化,从而能够处理长序列问题[20]。LSTM 是目前最为常用的 RNN 模型,结构如图 2 所示,其中 Ct-1 是上一时刻的长期状态,ht-1 为上一时刻的输出,Ct 为当前时刻的状态,ht 为当前时刻的输出。

GAN 模型包含两部分,分别是生成模型和判别模型。生成模型用来捕捉样本数据的分布,用服从某一分布的噪声生成一个类似真实训练数据的样本;判别模型充当一个二分类器,估计输入样本来自于真实数据的概率,如果样本来自于真实数据,判别模型输出较大概率,否则输出较小概率。GAN 的训练过程为先固定一方,然后更新另一方的网络权重,交替优化网络,从而形成竞争对抗,直到两个网络达到一个动态平衡,最终生成模型获得了和真实数据几乎相同的样本。GAN 在图像生成领域有着广泛的应用,可以在数据量不足的情况下生成数据,适用于训练数据较少时进行数据扩增。由于隐私等问题,生物医学领域中数据的获取可能较难,显然 GAN 可以在小数据样本的情况下生成数据以弥补不足。图 3 展示了一个简单的 GAN 模型。

图数据包含十分丰富的关系型信息,例如句子的依赖树、图像的场景图等,从这些非结构化数据中进行推理学习都需要图推理模型。图 4 展示了一个简单的 GNN 模型。GNN 依靠图中节点之间的信息传递来捕捉图中的依赖关系。GNN 相对于传统的神经网络有独特的优势,标准的 CNN 和 RNN 不能处理图输入这种非顺序排序的特征表示。用传统的 CNN 和 RNN 来处理图数据,只能遍历图中节点所有可能的出现顺序作为模型的输入,这样的计算量对模型来说是难以承受的。然而 GNN 的输出不随节点的输入顺序转移,GNN 分别在每个节点上传播,忽略了节点之间输入的顺序。另外,图中的连接线表示两个节点之间的依赖关系。在传统的神经网络中,这种依赖关系只能通过节点的特征表示来体现。GNN 可以依赖周围的状态来更新节点的状态。近年来,很多新的 GNN 变体应运而生,特别是图卷积网络(graph convolutional network,GCN)在生物医学领域中已有诸多应用[21]。

1.2 深度学习工具
由于深度学习模型的运算过程中包含了大量的线性代数计算、概率统计计算和最优化计算,导致不同模型代码之间的计算过程有很多相似之处,所以有关研究人员开发了不同的深度学习框架,方便他人开发利用各种模型。本节分析了八种常见的深度学习框架,基本可以满足研究人员的需求。
Deep learning toolbox 是 MATLAB 软件中的深度学习工具箱,其包含了 SAE、DBN、CNN 等模型,代码简单,适合初学者学习[22]。Caffe 是模块化的深度学习框架,速度极快,由 C++语言编写,也适用于 Python,在图像处理方面表现优越[23]。Theano 是一个高效运算的 Python 库,用来定义、优化和评估涉及多维数组的数学表达式[24]。TensorFlow 是使用数据流图进行数值计算的开源库,最初由 Google 研究人员开发,并一直开源给公众,现在已经开发出 TensorFlow 2.0 版本,是目前使用人数最多的开源框架。TensorFlow 的主要优点是分布式计算,特别是在应用大量图形处理器(graphics processing unit,GPU)的场合,所以 TensorFlow 目前主要被应用于工业领域中[25]。MXNet 也是由 C++语言实现的,同时提供了 Python、R 等多种语言接口,它也支持多个 GPU 分配训练网络,编程效率和运行效率都非常高[26]。Keras 是一个低限度的、模块化的神经网络库,它把 Theano、TensorFlow、MXNet 包装成了更具人性化的应用程序接口,是一种较为简单的框架[27]。PyTorch 是由 Facebook 开源的神经网络框架,与 TensorFlow 的静态计算图不同,PyTorch 的计算图是动态的,可以根据计算需要实时改变计算图[28]。Deeplearning4j 是用 Java 实现的深度学习框架,该框架中的网络模型是可组合的,即 CNN、SAE、RNN 等浅层神经网络可以相互叠加,组合成不同类型的深度网络,同时与 Hadoop 和 Spark 紧密结合,运行效率高且支持大规模分布式运算[29]。
2 深度学习在生物医学分析中的具体应用
随着生物医学大数据时代的到来,深度学习方法在生物医学领域中的应用逐渐增多。近年来许多研究团队取得了很大的进展,进一步推动了生物医学领域的发展。本节主要从医学数据分析和生物数据分析两个方面介绍近五年生物医学数据分析领域应用深度学习技术的研究进展,重点综述了医学数据分析领域中利用医学图像辅助疾病诊断,包括深度学习方法在医学图像分割和医学图像分类识别中的应用。
2.1 医疗辅助诊断中的深度学习应用
疾病辅助诊断是深度学习在医学数据分析上的主要应用之一,深度学习技术能够基于患者疾病的相关数据,预测异常病变,且其判断不易受到主观因素的干扰,不仅能够减轻医生工作的负担,还能提升医生诊断的效率和准确率。2016 年,Lipton 等[30]将 LSTM 用于儿科重症监护病房的临床数据分类,主要包括血糖、心率、舒张压和收缩压等时间序列数据,利用 LSTM 处理序列数据的能力辅助诊断,实验获得了良好的结果,证明 LSTM 优于受过训练的多层感知器,对疾病的早期诊断有很大帮助。2018 年,Haque 等[31]利用因果卷积网络(causal CNN,C-CNN)通过面部表情、语言和交谈的文本记录诊断抑郁症,该模型通过多模态输入将语音识别、计算机视觉和自然语言处理等技术结合辅助医生诊断,准确率达到 83.3%,召回率达到 82.6%,并且该模型可以部署到手机上,使得抑郁症的诊断更加方便高效。
深度学习在计算机视觉领域中的应用发展非常迅速,研究人员相继提出图像处理的有关算法,此外随着医疗设备的不断改进,医学图像的获取也越来越容易,如计算机断层扫描(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)等,因此利用医学图像分析辅助疾病诊断的方式日益增多,其中主要包括医学图像分割和医学图像分类识别。
2.1.1 医学图像分割
医学图像分割是医学图像分析的基础,对后续的疾病定量分析和分类识别都十分重要,近五年的主要代表成果如表 1 所示。

2016 年,Kamnitsas 等[32]提出了一种双路径的 11 层三维 CNN 用于脑病变分割的挑战任务,对具有创伤性脑损伤、脑肿瘤和缺血性中风患者的 MRI 数据进行了分析评估,两条路径在多个尺度上处理输入图像,分别获取不同的特征并融合分析,其实验结果在 2015 年的脑肿瘤分割(brain tumor segmentation,BRATS)和缺血性中风病变分割(Ischemic Stroke Lesion Segmentation,ISLES)比赛中获得了最高排名。Wang 等[33]提出了中心聚焦卷积神经网络(central focus CNN,CF-CNN),用于分割来自 CT 图像中的肺结节,通过在池化层中加入中心聚焦的策略来保留特征图中央的特征,解决了肺结节与其周围环境之间存在类似视觉特征导致分割困难的问题,该方法在肺部图像数据库联盟与图像数据库资源计划(Lung Image Database Consortium and Image Database Resource Initiative,LIDC-IDRI)和医院采集的数据集上的准确率分别为 82.15% 和 80.02%,表现出了优越的分割性能,并与放射科医师诊断结果的一致性进行了比较,差异仅为 1.98%。2018 年,Zhao 等[34]通过将全卷积神经网络(fully CNN,FCNN)和条件随机场(conditional random field,CRF)集成在一个统一的框架中,提出了一种基于深度学习的新型脑肿瘤分割模型,在模型训练过程中将 CRF 作为 RNN 训练得到 CRF-RNN,然后将 FCNN 和 CRF-RNN 集成进行微调,这种方法可以逐层切割脑图像,获得具有外观和空间一致性的分割结果,其实验结果在 BRATS-2016 上排名第一。
U-Net 是 CNN 的变体,基于 FCNN 改进和数据增强模式使得它能够对少量样本数据进行训练,目前在医学图像分割领域表现较好。2018 年,Alom 等[35]以 U-Net 架构为基础改进了循环卷积神经网络(recurrent CNN,RCNN)和循环残差卷积神经网络(recurrent residual CNN,RRCNN),分别称为 RU-Net 和 R2U-Net,并将两种网络模型应用在视网膜血管分割、皮肤癌病变分割和肺部病变分割实验中。实验结果表明,与包括 U-Net 和残差 U-Net 在内的现有方法相比,所提出的 RU-Net 和 R2U-Net 模型在具有相同网络参数数量的分割任务中表现出更好的性能。2019 年,叶海等[36]提出了基于 FCNN 的胎儿脑部超声图像分割算法,将医院采集的 12 609 张超声图像作为数据集,在原始 U-Net 中加入空洞卷积实现胎儿脑部超声图像中颅骨光环的分割与提取,并和 U-Net 进行对比分析,原始 U-Net 模型在下采样过程中经过池化所丢失的信息在上采样过程中无法弥补,而空洞卷积可以有效地提升感受野,并且不需要减少图像大小,避免了池化过程中的信息损失,所以改进后的方法能够更好地学习颅骨光环的纹理和边缘等特征。实验结果表明经过空洞卷积改进过的分割方法在精确率上比原始方法高 9.6%。
目前深度学习在医学图像分割上的应用主要集中在二维图像分割,然而有些病例在二维图像上没有明显征象,如动脉瘤。随着深度学习技术的发展,医学图像分割正在逐步向三维图像分割发展,三维网络模型可以利用要分割组织的三维连通性,结合图像层间信息,得到更精细的分割结果。
2.1.2 医学图像分类识别
医学图像分类识别通过在给定的数据集上训练模型来完成新数据上的特定任务。相比传统的医学图像识别方法,深度学习能够挖掘到医学图像中潜在的非线性关系,自动提取高级的抽象特征进行分类识别,近五年的主要代表成果如表 2 所示。

2016 年,Anthimopoulos 等[37]利用深度卷积神经网络(deep CNN,DCNN)对间质性肺疾病(interstitial lung disease,ILD)的肺纹进行分类研究,通过将肺部 CT 图像分为 7 类,包括 6 种不同的 ILD 类型和健康组织,用 DCNN 来提取肺组织的低级纹理特征,该方法在 14 696 个 CT 图像数据上达到最优结果,准确率达到了 85.5%。2017 年,Shen 等[38]提出了一种多因素卷积神经网络(multi-crop CNN,MC-CNN),研究肺结节恶性肿瘤可疑性分类问题,该模型通过在池化层中加入多因素策略,使得池化层能够对特征图进行多尺度特征提取,同时能够简化训练过程,缩短训练时间,在 LIDC-IDRI 数据集上分类准确率达到了 87.14%,该方法不仅可以实现肺结节可疑性分类,还有助于模拟结节恶性肿瘤。Esteva 等[39]研究自动分类皮肤损伤,用 129 450 个临床图像数据训练 CNN,并与 21 名皮肤科医生的测试结果进行对比分析,实验表明 CNN 分类的结果和医生的诊断结果相近。
2018 年,Mohsen 等[40]将离散小波变换与深度神经网络(deep neural network,DNN)相结合,将脑部 MRI 分为正常和 3 种类型的恶性脑肿瘤,包括胶质母细胞瘤、肉瘤和支气管肺癌转移瘤,与 SVM 等传统分类方法相比表现出了更高的精度。Xie 等[41]提出了一种融合多特征的肺结节分类算法,在判定水平上使用纹理和形状等信息来区分恶性肺结节和良性肺结节,使用 DCNN 自动学习结节特征表示,将深度模型学习的图像表示与决策级别的传统视觉特征相结合,在 LIDC-IDRI 数据集上评估的结果显示该算法提高了结节分类的性能,优于 MC-CNN 等方法。2019 年,Mao 等[42]提出 ImageGCN,一种用于多关系图像建模的 GCN 框架,使用原始像素特征和相关图像的特征来学习图像的表示,并将其应用于胸部 X 线图像,其中丰富的关系信息可用于疾病识别,通过对肺部 X 线数据库(ChestX-ray14)中的 14 种疾病进行分类的对比试验可以发现,该方法优于亚历克斯网络(AlexNet)、牛津大学视觉几何组(Visual Geometry Group,VGG)提出的 VGGNet、残差网络(residual network,ResNet)等 CNN 模型。鉏家欢等[43]提出了一种融合图像和指标的阿尔茨海默病多分类诊断模型,采用阿尔茨海默病神经影像学计划(Alzheimer’s Disease Neuroimaging Initiative,ADNI)中的数据进行多分类实验,包括正常、轻度认知障碍和阿尔茨海默病三类数据,该模型将 VGGNet 进行改进用于大脑三正交平面 MRI 图像特征向量的提取,并和由人口统计学信息、生物学检测等组成的指标特征向量通过典型相关分析进行线性融合,进一步提高了多分类的有效性,在阿尔茨海默病多分类上的正确率可达到 86.7%。刘振宇等[44]构建了用于白内障分类的数据集,包含 16 239 张眼部晶体图像,分为正常、早期和白内障三类数据,并通过旋转、平移和镜像等方式进行数据扩增,然后用 Inception-V3 模型和迁移学习的方法进行训练,实验结果为模型的准确率达到 94.85%,召回率达到 92.27%,为临床诊断起到了更好的辅助作用。
心电图(electrocardiogram,ECG)能展现心脏兴奋的电活动过程、心肌受损的程度和心房心室的功能结构情况,对心脏病理相关研究具有重要的参考价值,对心脏疾病的诊断有很大帮助。2017 年,Acharya 等[45]利用 DCNN 来自动诊断心肌梗死,将 ECG 数据集划分为有无噪声两部分,在有噪声的数据集上的结果为 93.53% 的准确度、93.71% 的灵敏度和 92.83% 的特异度,在无噪声的数据集上的结果为 95.22% 的准确度、95.49% 的灵敏度和 94.19% 的特异度,这些结果表明该方法可以被引入临床环境,帮助临床医生诊断心肌梗死。李岭海[46]利用常见疾病患者的超声心动图,使用尺度不变特征变换(scale-invariant feature transform,SIFT)、加速稳健特征(speeded up robust features,SURF)、KAZE 算法和 CNN 分别提取所有患者超声切面图像的特征,然后比较测试图像特征值和训练图像特征值的距离,计算识别的准确率,实验结果为 SIFT 准确率为 62%、SURF 准确率为 71%、KAZE 准确率为 54%、CNN 准确率为 98%,表明传统算法提取的是图像的浅层特征,不能确切地反映图像的本质,而 CNN 将每个卷积层提取的特征进行组合,提取图像的高维特征,更利于分类识别。
还有一种较为重要的数据是脑电图(electroencephalogram,EEG),它对于各种颅内病变,如脑卒中、脑炎、脑瘤和癫痫等有很大的研究价值。2018 年,Acharya 等[47]利用一个 13 层的 CNN 对 EEG 数据进行分析,用于癫痫的诊断,得到的平均准确度为 88.7%、特异度为 90%、灵敏度为 95%,该模型是 DCNN 在基于 EEG 的癫痫发作检测中的首次应用。
近几年深度学习在医学数据中的应用一直在如火如荼地进行,但是医学领域数据的独特性也在制约着其发展,医疗数据难以获取这一特性导致深度学习方法所需的数据不足或者数据类别不均衡,从而影响深度学习方法的最后结果,因此如何利用小样本数据集结合深度学习方法是未来的研究方向之一,例如利用 GAN 生成数据以弥补数据不足,以及使用不依赖于标注数据的无监督深度学习算法等。
2.2 生物数据分析中的深度学习应用
相比医学问题,生物学中数据分析问题更加复杂。目前,深度学习技术在生物数据分析中的应用主要包括基因组学和蛋白质结构分析等领域,近五年的主要代表成果如表 3 所示。

2016 年,Quang 等[48]提出了一种将 CNN 和双向长短期记忆网络(bi-directional LSTM,BLSTM)组合的框架 DanQ,用于预测 DNA 序列的功能,DanQ 中的 CNN 提取序列矩阵图中的特征,BLSTM 提取序列矩阵图之间的方向和空间距离特征,最后通过损失函数和真实目标的比较获得非编码 DNA 序列中表观遗传标记的概率,根据表观遗传变化实现对非编码 DNA 序列功能的预测,实验结果表明 DanQ 优于 LR 和 DeepSEA 方法。2018 年 Pan 等[49]提出了一种基于深度学习预测序列结构基序的方法(inferring sequence-structure motifs using deep learning,iDeepS),使用 CNN 和 BLSTM 同时识别 RNA 序列的结合序列和结构基序,实验中使用 CNN 提取抽象特征,使用 BLSTM 提取由 CNN 识别的结合序列和结构基序之间的前后相关性,最后将两个输出结果加权之后输入到分类层,预测 RNA 结合蛋白(RNA binding protein,RBP)的结合位点。该方法在具有代表性的紫外交联免疫沉淀结合高通量测序(crosslinking-immunprecipitation and high-throughput sequencing,CLIP-Seq)数据集上进行了验证,实验的 AUC 值达到了 0.86,表明 iDeepS 可以可靠地预测 RBP 结合位点,并且优于 DeepBind 等方法。Liu 等[50]提出了深度开放预测网络(deep openness prediction network,Deopen),一种基于 DCNN 和前馈神经网络的开源框架,可以自动学习 DNA 序列的调控编码并预测染色质可及性,通过将 Deopen 框架中 CNN 和前馈网络的输出连接起来形成混合特征向量,再利用 softmax 分类器进行预测,在微球核酸酶序列(micrococcal nuclease sequence,MNase-Seq)数据集和脱氧核糖核酸酶序列(deoxyribonuclease sequence,DNase-Seq)数据集上选取基准模型和 Deopen 方法进行对比分析,通过精确二项检验和曼-惠特尼秩和检验,分析得出 Deopen 方法更具有统计学意义。李洪顺等[51]提出了一种只利用序列信息预测 RNA 结合蛋白的深度学习模型,该模型由 CNN 和 LSTM 结合而成,利用 CNN 局部感知的优势去探测序列中的 motif 信息,利用 LSTM 学习 motif 与 motif 之间的依赖关系,实验使用通用蛋白质数据库(Universal Protein,UniProt)中的数据作为训练集,使用蛋白质数据库(Protein Data Bank,PDB)的数据作为验证集,实验结果表明该方法优于 SVM 等机器学习方法。2019 年,Rossi 等[52]采取端到端的方式,利用 GCN 对非编码 RNA 数据进行分类识别,该模型在 13 个类别分类实验中达到了 85.73%的准确率,并且该实验模型还结合了边缘感知卷积和基于注意力的池化机制,使得它在非编码 RNA 分类的挑战性任务中达到了目前最优的结果。
除了基因组学和蛋白质结构预测之外,深度学习方法在生物数据分析上的应用还有很多,比如生物数据建模、癌细胞的检测和药物研发等。然而生物数据复杂的特性使得现有的深度学习技术也难以快速高效地进行生物数据分析,因此开发专用于生物领域的深度学习工具是未来的主要发展方向之一,这样可以使研究人员更有效地进行数据分析处理,提高工作效率。
3 总结与展望
随着人工智能和大数据的发展,深度学习技术受到了越来越多研究人员的关注。本文对深度学习方法作了简要介绍,包括 CNN、RNN、GAN、GNN 等,回顾了近五年深度学习在生物医学数据分析中的具体应用。由于生物医学数据的特殊性,深度学习技术在生物医学数据分析领域还有巨大的发展空间。
生物数据复杂多变、特征多样、维度较高,深度学习技术在生物领域进一步的发展要将多模态信息进行融合并充分利用,例如将组学数据、图像、信号、电子记录等协同使用,然后结合专用于生物领域的深度学习技术,不仅能够有效地避免单模态数据实验的缺陷,还能快速高效地进行生物数据分析。
对于医学数据分析,一方面,专业的医疗机构以高精度为首要目标,利用最新的现代化大型服务器进行数据分析,高性能的 GPU 代表着超高的计算效率,可以分析更加复杂的深度模型,因此在研究过程中可以逐渐增加模型的深度。同时,还需要不断优化模型。常用的优化算法有自适应动量估计(adaptive moment estimation,Adam)等,通过自动调节学习速率等参数去更好地逼近目标函数,获得更优异的分析结果。以 CNN 的发展为例,从 AlexNet 到 VGGNet,再到 ResNet,模型的层数不断叠加,使用的优化算法复杂程度不断增加,对机器计算能力的要求也越来越高,只有装载多 GPU 的大型机器才能满足计算要求。另一方面,普通家用的医学数据分析仪器以普适性及便携式为首要目标,通过微处理技术,将压缩后的深度学习模型集成在小型仪器或个人计算机上。常用的压缩模型的方法有卷积核分解和模型剪枝优化等。模型剪枝通过永久删除不重要的连接来减少相应参数和计算,使剪枝后的网络能够继承原网络的关键信息并保持性能。此外,改变卷积方式也是一种不错的方法,例如移动网络(MobileNet),使用深度可分离卷积构建轻量级的深度神经网络,虽然精度有所降低,但是减少了卷积核的冗余表达,减少了计算量和参数数量,适用于小型仪器。
深度学习技术以其深厚的理论价值和广阔的市场前景在生物医学数据分析中占据越来越重要的地位,随着人工智能、智慧城市、微处理技术等理念的发展,生物医学领域的深度学习技术将会在医用和家用两个领域发挥巨大作用,因此开发具有更高精度和更深层次的深度模型算法以及简单高效适用于微型仪器的算法都是未来的主要发展方向。
利益冲突声明:本文全体作者均声明不存在利益冲突。
引言
21 世纪被称为信息时代,信息传播与处理的速度都以几何级数的方式爆炸增长,随之而来的便是大数据时代。随着网络的发展,越来越多大型的公开数据库可供研究人员使用,例如美国临床试验数据库、中国的神州基因组数据云等。在大数据时代背景下,随着生物医学数据采集技术的快速发展,研究者可以用更多的方式来更加全面地进行生物医学数据分析研究。传统的生物医学数据挖掘和分析方法面对海量增长的数据可能会显得效率较低,因为一方面生物医学大数据维度更高,计算更复杂,另一方面不同类型的生物医学数据的处理方式复杂多变,对模型的数据处理能力要求更高。近年来深度学习在自然语言处理、计算机视觉、语音识别以及基因组学和蛋白质结构等领域取得了突破性的进展,由于其具有强大的特征提取能力,非常适合处理生物医学大数据统计分析等相关问题,于是得到了越来越多的生物医学研究人员的关注[1-5]。
深度学习起源于人工神经网络,多层感知器就是一种经典的深度学习模型[6]。深度学习模型具有自动学习特征的特点,在训练过程中自动整合提取到的数据特征,通过组合低层特征形成更加抽象的高层特征。作为机器学习的一个领域,深度学习也分为监督学习和无监督学习,但和传统的机器学习模型如决策树(decision tree,DT)、支持向量机(support vector machine,SVM)等相比更具灵活性[7-8]。
本文首先介绍了深度学习方法及工具框架,随后总结了近五年深度学习技术在生物医学数据分析中的具体应用,最后给出了未来深度学习在生物医学数据分析领域可能的发展方向。
1 深度学习方法及工具
1.1 深度学习方法
深度学习方法包含多种深度学习模型,其中基础模型有深度信念网络(deep belief network,DBN)和堆栈自编码器(stacked automatic encoder,SAE),但现在生物医学数据分析领域更常用的模型是卷积神经网络(convolutional neural network,CNN)、循环神经网络(recurrent neural network,RNN)、生成式对抗网络(generative adversarial network,GAN)和图神经网络(graph neural network,GNN)等[9-14]。本节将详细介绍这些模型的基本单元、工作原理和训练过程等。
从神经学角度来说,CNN 的设计灵感来自动物视觉皮层对外界事物的感知,感受野的发现对 CNN 的意义重大[15]。CNN 在图像识别领域有着广泛的应用,它主要包括输入层、卷积层、池化层、全连接层和输出层等,模型训练过程中的核心操作是卷积过程和池化过程。卷积过程主要是特征提取的过程,池化过程主要是数据降维的过程,卷积池化过程中用到了权值共享原理,减少了模型的训练参数。CNN 是通过卷积层和池化层的堆叠,然后加上全连接层和输入输出层构成的。CNN 的训练过程与传统神经网络类似,参照了反向传播算法,分为前向传播阶段和后向传播阶段。在不同的应用领域,CNN 有着不同的变体,例如常见的分类网络,如谷歌网络(GoogLeNet);还有常见的分割网络,如 U 型网络(U-Net)等[16-17]。图 1 展示了一个简单的 CNN 模型,它具有两个卷积层、两个池化层、一个全连接层和输入输出层。

RNN 是用来处理和预测序列数据的深度学习模型,广泛应用于语音识别、自然语言处理、图像描述生成等领域。RNN 能充分利用序列数据前后信息,每个隐藏层的输入包括上一层的输出和上一时刻该隐藏层的输出,网络会对前面的信息记忆并应用于计算当前输出。RNN 采用时间反向传播算法训练,但普通 RNN 在处理长序列问题时可能会遇到梯度消失或梯度爆炸等问题[18-19]。解决这一问题的方法是采用长短期记忆网络结构(long short-term memory,LSTM),该模型是在 RNN 的基础上加入了三个门结构,分别是输入门、遗忘门和输出门,使不同时期记忆信息的尺度动态变化,从而能够处理长序列问题[20]。LSTM 是目前最为常用的 RNN 模型,结构如图 2 所示,其中 Ct-1 是上一时刻的长期状态,ht-1 为上一时刻的输出,Ct 为当前时刻的状态,ht 为当前时刻的输出。

GAN 模型包含两部分,分别是生成模型和判别模型。生成模型用来捕捉样本数据的分布,用服从某一分布的噪声生成一个类似真实训练数据的样本;判别模型充当一个二分类器,估计输入样本来自于真实数据的概率,如果样本来自于真实数据,判别模型输出较大概率,否则输出较小概率。GAN 的训练过程为先固定一方,然后更新另一方的网络权重,交替优化网络,从而形成竞争对抗,直到两个网络达到一个动态平衡,最终生成模型获得了和真实数据几乎相同的样本。GAN 在图像生成领域有着广泛的应用,可以在数据量不足的情况下生成数据,适用于训练数据较少时进行数据扩增。由于隐私等问题,生物医学领域中数据的获取可能较难,显然 GAN 可以在小数据样本的情况下生成数据以弥补不足。图 3 展示了一个简单的 GAN 模型。

图数据包含十分丰富的关系型信息,例如句子的依赖树、图像的场景图等,从这些非结构化数据中进行推理学习都需要图推理模型。图 4 展示了一个简单的 GNN 模型。GNN 依靠图中节点之间的信息传递来捕捉图中的依赖关系。GNN 相对于传统的神经网络有独特的优势,标准的 CNN 和 RNN 不能处理图输入这种非顺序排序的特征表示。用传统的 CNN 和 RNN 来处理图数据,只能遍历图中节点所有可能的出现顺序作为模型的输入,这样的计算量对模型来说是难以承受的。然而 GNN 的输出不随节点的输入顺序转移,GNN 分别在每个节点上传播,忽略了节点之间输入的顺序。另外,图中的连接线表示两个节点之间的依赖关系。在传统的神经网络中,这种依赖关系只能通过节点的特征表示来体现。GNN 可以依赖周围的状态来更新节点的状态。近年来,很多新的 GNN 变体应运而生,特别是图卷积网络(graph convolutional network,GCN)在生物医学领域中已有诸多应用[21]。

1.2 深度学习工具
由于深度学习模型的运算过程中包含了大量的线性代数计算、概率统计计算和最优化计算,导致不同模型代码之间的计算过程有很多相似之处,所以有关研究人员开发了不同的深度学习框架,方便他人开发利用各种模型。本节分析了八种常见的深度学习框架,基本可以满足研究人员的需求。
Deep learning toolbox 是 MATLAB 软件中的深度学习工具箱,其包含了 SAE、DBN、CNN 等模型,代码简单,适合初学者学习[22]。Caffe 是模块化的深度学习框架,速度极快,由 C++语言编写,也适用于 Python,在图像处理方面表现优越[23]。Theano 是一个高效运算的 Python 库,用来定义、优化和评估涉及多维数组的数学表达式[24]。TensorFlow 是使用数据流图进行数值计算的开源库,最初由 Google 研究人员开发,并一直开源给公众,现在已经开发出 TensorFlow 2.0 版本,是目前使用人数最多的开源框架。TensorFlow 的主要优点是分布式计算,特别是在应用大量图形处理器(graphics processing unit,GPU)的场合,所以 TensorFlow 目前主要被应用于工业领域中[25]。MXNet 也是由 C++语言实现的,同时提供了 Python、R 等多种语言接口,它也支持多个 GPU 分配训练网络,编程效率和运行效率都非常高[26]。Keras 是一个低限度的、模块化的神经网络库,它把 Theano、TensorFlow、MXNet 包装成了更具人性化的应用程序接口,是一种较为简单的框架[27]。PyTorch 是由 Facebook 开源的神经网络框架,与 TensorFlow 的静态计算图不同,PyTorch 的计算图是动态的,可以根据计算需要实时改变计算图[28]。Deeplearning4j 是用 Java 实现的深度学习框架,该框架中的网络模型是可组合的,即 CNN、SAE、RNN 等浅层神经网络可以相互叠加,组合成不同类型的深度网络,同时与 Hadoop 和 Spark 紧密结合,运行效率高且支持大规模分布式运算[29]。
2 深度学习在生物医学分析中的具体应用
随着生物医学大数据时代的到来,深度学习方法在生物医学领域中的应用逐渐增多。近年来许多研究团队取得了很大的进展,进一步推动了生物医学领域的发展。本节主要从医学数据分析和生物数据分析两个方面介绍近五年生物医学数据分析领域应用深度学习技术的研究进展,重点综述了医学数据分析领域中利用医学图像辅助疾病诊断,包括深度学习方法在医学图像分割和医学图像分类识别中的应用。
2.1 医疗辅助诊断中的深度学习应用
疾病辅助诊断是深度学习在医学数据分析上的主要应用之一,深度学习技术能够基于患者疾病的相关数据,预测异常病变,且其判断不易受到主观因素的干扰,不仅能够减轻医生工作的负担,还能提升医生诊断的效率和准确率。2016 年,Lipton 等[30]将 LSTM 用于儿科重症监护病房的临床数据分类,主要包括血糖、心率、舒张压和收缩压等时间序列数据,利用 LSTM 处理序列数据的能力辅助诊断,实验获得了良好的结果,证明 LSTM 优于受过训练的多层感知器,对疾病的早期诊断有很大帮助。2018 年,Haque 等[31]利用因果卷积网络(causal CNN,C-CNN)通过面部表情、语言和交谈的文本记录诊断抑郁症,该模型通过多模态输入将语音识别、计算机视觉和自然语言处理等技术结合辅助医生诊断,准确率达到 83.3%,召回率达到 82.6%,并且该模型可以部署到手机上,使得抑郁症的诊断更加方便高效。
深度学习在计算机视觉领域中的应用发展非常迅速,研究人员相继提出图像处理的有关算法,此外随着医疗设备的不断改进,医学图像的获取也越来越容易,如计算机断层扫描(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)等,因此利用医学图像分析辅助疾病诊断的方式日益增多,其中主要包括医学图像分割和医学图像分类识别。
2.1.1 医学图像分割
医学图像分割是医学图像分析的基础,对后续的疾病定量分析和分类识别都十分重要,近五年的主要代表成果如表 1 所示。

2016 年,Kamnitsas 等[32]提出了一种双路径的 11 层三维 CNN 用于脑病变分割的挑战任务,对具有创伤性脑损伤、脑肿瘤和缺血性中风患者的 MRI 数据进行了分析评估,两条路径在多个尺度上处理输入图像,分别获取不同的特征并融合分析,其实验结果在 2015 年的脑肿瘤分割(brain tumor segmentation,BRATS)和缺血性中风病变分割(Ischemic Stroke Lesion Segmentation,ISLES)比赛中获得了最高排名。Wang 等[33]提出了中心聚焦卷积神经网络(central focus CNN,CF-CNN),用于分割来自 CT 图像中的肺结节,通过在池化层中加入中心聚焦的策略来保留特征图中央的特征,解决了肺结节与其周围环境之间存在类似视觉特征导致分割困难的问题,该方法在肺部图像数据库联盟与图像数据库资源计划(Lung Image Database Consortium and Image Database Resource Initiative,LIDC-IDRI)和医院采集的数据集上的准确率分别为 82.15% 和 80.02%,表现出了优越的分割性能,并与放射科医师诊断结果的一致性进行了比较,差异仅为 1.98%。2018 年,Zhao 等[34]通过将全卷积神经网络(fully CNN,FCNN)和条件随机场(conditional random field,CRF)集成在一个统一的框架中,提出了一种基于深度学习的新型脑肿瘤分割模型,在模型训练过程中将 CRF 作为 RNN 训练得到 CRF-RNN,然后将 FCNN 和 CRF-RNN 集成进行微调,这种方法可以逐层切割脑图像,获得具有外观和空间一致性的分割结果,其实验结果在 BRATS-2016 上排名第一。
U-Net 是 CNN 的变体,基于 FCNN 改进和数据增强模式使得它能够对少量样本数据进行训练,目前在医学图像分割领域表现较好。2018 年,Alom 等[35]以 U-Net 架构为基础改进了循环卷积神经网络(recurrent CNN,RCNN)和循环残差卷积神经网络(recurrent residual CNN,RRCNN),分别称为 RU-Net 和 R2U-Net,并将两种网络模型应用在视网膜血管分割、皮肤癌病变分割和肺部病变分割实验中。实验结果表明,与包括 U-Net 和残差 U-Net 在内的现有方法相比,所提出的 RU-Net 和 R2U-Net 模型在具有相同网络参数数量的分割任务中表现出更好的性能。2019 年,叶海等[36]提出了基于 FCNN 的胎儿脑部超声图像分割算法,将医院采集的 12 609 张超声图像作为数据集,在原始 U-Net 中加入空洞卷积实现胎儿脑部超声图像中颅骨光环的分割与提取,并和 U-Net 进行对比分析,原始 U-Net 模型在下采样过程中经过池化所丢失的信息在上采样过程中无法弥补,而空洞卷积可以有效地提升感受野,并且不需要减少图像大小,避免了池化过程中的信息损失,所以改进后的方法能够更好地学习颅骨光环的纹理和边缘等特征。实验结果表明经过空洞卷积改进过的分割方法在精确率上比原始方法高 9.6%。
目前深度学习在医学图像分割上的应用主要集中在二维图像分割,然而有些病例在二维图像上没有明显征象,如动脉瘤。随着深度学习技术的发展,医学图像分割正在逐步向三维图像分割发展,三维网络模型可以利用要分割组织的三维连通性,结合图像层间信息,得到更精细的分割结果。
2.1.2 医学图像分类识别
医学图像分类识别通过在给定的数据集上训练模型来完成新数据上的特定任务。相比传统的医学图像识别方法,深度学习能够挖掘到医学图像中潜在的非线性关系,自动提取高级的抽象特征进行分类识别,近五年的主要代表成果如表 2 所示。

2016 年,Anthimopoulos 等[37]利用深度卷积神经网络(deep CNN,DCNN)对间质性肺疾病(interstitial lung disease,ILD)的肺纹进行分类研究,通过将肺部 CT 图像分为 7 类,包括 6 种不同的 ILD 类型和健康组织,用 DCNN 来提取肺组织的低级纹理特征,该方法在 14 696 个 CT 图像数据上达到最优结果,准确率达到了 85.5%。2017 年,Shen 等[38]提出了一种多因素卷积神经网络(multi-crop CNN,MC-CNN),研究肺结节恶性肿瘤可疑性分类问题,该模型通过在池化层中加入多因素策略,使得池化层能够对特征图进行多尺度特征提取,同时能够简化训练过程,缩短训练时间,在 LIDC-IDRI 数据集上分类准确率达到了 87.14%,该方法不仅可以实现肺结节可疑性分类,还有助于模拟结节恶性肿瘤。Esteva 等[39]研究自动分类皮肤损伤,用 129 450 个临床图像数据训练 CNN,并与 21 名皮肤科医生的测试结果进行对比分析,实验表明 CNN 分类的结果和医生的诊断结果相近。
2018 年,Mohsen 等[40]将离散小波变换与深度神经网络(deep neural network,DNN)相结合,将脑部 MRI 分为正常和 3 种类型的恶性脑肿瘤,包括胶质母细胞瘤、肉瘤和支气管肺癌转移瘤,与 SVM 等传统分类方法相比表现出了更高的精度。Xie 等[41]提出了一种融合多特征的肺结节分类算法,在判定水平上使用纹理和形状等信息来区分恶性肺结节和良性肺结节,使用 DCNN 自动学习结节特征表示,将深度模型学习的图像表示与决策级别的传统视觉特征相结合,在 LIDC-IDRI 数据集上评估的结果显示该算法提高了结节分类的性能,优于 MC-CNN 等方法。2019 年,Mao 等[42]提出 ImageGCN,一种用于多关系图像建模的 GCN 框架,使用原始像素特征和相关图像的特征来学习图像的表示,并将其应用于胸部 X 线图像,其中丰富的关系信息可用于疾病识别,通过对肺部 X 线数据库(ChestX-ray14)中的 14 种疾病进行分类的对比试验可以发现,该方法优于亚历克斯网络(AlexNet)、牛津大学视觉几何组(Visual Geometry Group,VGG)提出的 VGGNet、残差网络(residual network,ResNet)等 CNN 模型。鉏家欢等[43]提出了一种融合图像和指标的阿尔茨海默病多分类诊断模型,采用阿尔茨海默病神经影像学计划(Alzheimer’s Disease Neuroimaging Initiative,ADNI)中的数据进行多分类实验,包括正常、轻度认知障碍和阿尔茨海默病三类数据,该模型将 VGGNet 进行改进用于大脑三正交平面 MRI 图像特征向量的提取,并和由人口统计学信息、生物学检测等组成的指标特征向量通过典型相关分析进行线性融合,进一步提高了多分类的有效性,在阿尔茨海默病多分类上的正确率可达到 86.7%。刘振宇等[44]构建了用于白内障分类的数据集,包含 16 239 张眼部晶体图像,分为正常、早期和白内障三类数据,并通过旋转、平移和镜像等方式进行数据扩增,然后用 Inception-V3 模型和迁移学习的方法进行训练,实验结果为模型的准确率达到 94.85%,召回率达到 92.27%,为临床诊断起到了更好的辅助作用。
心电图(electrocardiogram,ECG)能展现心脏兴奋的电活动过程、心肌受损的程度和心房心室的功能结构情况,对心脏病理相关研究具有重要的参考价值,对心脏疾病的诊断有很大帮助。2017 年,Acharya 等[45]利用 DCNN 来自动诊断心肌梗死,将 ECG 数据集划分为有无噪声两部分,在有噪声的数据集上的结果为 93.53% 的准确度、93.71% 的灵敏度和 92.83% 的特异度,在无噪声的数据集上的结果为 95.22% 的准确度、95.49% 的灵敏度和 94.19% 的特异度,这些结果表明该方法可以被引入临床环境,帮助临床医生诊断心肌梗死。李岭海[46]利用常见疾病患者的超声心动图,使用尺度不变特征变换(scale-invariant feature transform,SIFT)、加速稳健特征(speeded up robust features,SURF)、KAZE 算法和 CNN 分别提取所有患者超声切面图像的特征,然后比较测试图像特征值和训练图像特征值的距离,计算识别的准确率,实验结果为 SIFT 准确率为 62%、SURF 准确率为 71%、KAZE 准确率为 54%、CNN 准确率为 98%,表明传统算法提取的是图像的浅层特征,不能确切地反映图像的本质,而 CNN 将每个卷积层提取的特征进行组合,提取图像的高维特征,更利于分类识别。
还有一种较为重要的数据是脑电图(electroencephalogram,EEG),它对于各种颅内病变,如脑卒中、脑炎、脑瘤和癫痫等有很大的研究价值。2018 年,Acharya 等[47]利用一个 13 层的 CNN 对 EEG 数据进行分析,用于癫痫的诊断,得到的平均准确度为 88.7%、特异度为 90%、灵敏度为 95%,该模型是 DCNN 在基于 EEG 的癫痫发作检测中的首次应用。
近几年深度学习在医学数据中的应用一直在如火如荼地进行,但是医学领域数据的独特性也在制约着其发展,医疗数据难以获取这一特性导致深度学习方法所需的数据不足或者数据类别不均衡,从而影响深度学习方法的最后结果,因此如何利用小样本数据集结合深度学习方法是未来的研究方向之一,例如利用 GAN 生成数据以弥补数据不足,以及使用不依赖于标注数据的无监督深度学习算法等。
2.2 生物数据分析中的深度学习应用
相比医学问题,生物学中数据分析问题更加复杂。目前,深度学习技术在生物数据分析中的应用主要包括基因组学和蛋白质结构分析等领域,近五年的主要代表成果如表 3 所示。

2016 年,Quang 等[48]提出了一种将 CNN 和双向长短期记忆网络(bi-directional LSTM,BLSTM)组合的框架 DanQ,用于预测 DNA 序列的功能,DanQ 中的 CNN 提取序列矩阵图中的特征,BLSTM 提取序列矩阵图之间的方向和空间距离特征,最后通过损失函数和真实目标的比较获得非编码 DNA 序列中表观遗传标记的概率,根据表观遗传变化实现对非编码 DNA 序列功能的预测,实验结果表明 DanQ 优于 LR 和 DeepSEA 方法。2018 年 Pan 等[49]提出了一种基于深度学习预测序列结构基序的方法(inferring sequence-structure motifs using deep learning,iDeepS),使用 CNN 和 BLSTM 同时识别 RNA 序列的结合序列和结构基序,实验中使用 CNN 提取抽象特征,使用 BLSTM 提取由 CNN 识别的结合序列和结构基序之间的前后相关性,最后将两个输出结果加权之后输入到分类层,预测 RNA 结合蛋白(RNA binding protein,RBP)的结合位点。该方法在具有代表性的紫外交联免疫沉淀结合高通量测序(crosslinking-immunprecipitation and high-throughput sequencing,CLIP-Seq)数据集上进行了验证,实验的 AUC 值达到了 0.86,表明 iDeepS 可以可靠地预测 RBP 结合位点,并且优于 DeepBind 等方法。Liu 等[50]提出了深度开放预测网络(deep openness prediction network,Deopen),一种基于 DCNN 和前馈神经网络的开源框架,可以自动学习 DNA 序列的调控编码并预测染色质可及性,通过将 Deopen 框架中 CNN 和前馈网络的输出连接起来形成混合特征向量,再利用 softmax 分类器进行预测,在微球核酸酶序列(micrococcal nuclease sequence,MNase-Seq)数据集和脱氧核糖核酸酶序列(deoxyribonuclease sequence,DNase-Seq)数据集上选取基准模型和 Deopen 方法进行对比分析,通过精确二项检验和曼-惠特尼秩和检验,分析得出 Deopen 方法更具有统计学意义。李洪顺等[51]提出了一种只利用序列信息预测 RNA 结合蛋白的深度学习模型,该模型由 CNN 和 LSTM 结合而成,利用 CNN 局部感知的优势去探测序列中的 motif 信息,利用 LSTM 学习 motif 与 motif 之间的依赖关系,实验使用通用蛋白质数据库(Universal Protein,UniProt)中的数据作为训练集,使用蛋白质数据库(Protein Data Bank,PDB)的数据作为验证集,实验结果表明该方法优于 SVM 等机器学习方法。2019 年,Rossi 等[52]采取端到端的方式,利用 GCN 对非编码 RNA 数据进行分类识别,该模型在 13 个类别分类实验中达到了 85.73%的准确率,并且该实验模型还结合了边缘感知卷积和基于注意力的池化机制,使得它在非编码 RNA 分类的挑战性任务中达到了目前最优的结果。
除了基因组学和蛋白质结构预测之外,深度学习方法在生物数据分析上的应用还有很多,比如生物数据建模、癌细胞的检测和药物研发等。然而生物数据复杂的特性使得现有的深度学习技术也难以快速高效地进行生物数据分析,因此开发专用于生物领域的深度学习工具是未来的主要发展方向之一,这样可以使研究人员更有效地进行数据分析处理,提高工作效率。
3 总结与展望
随着人工智能和大数据的发展,深度学习技术受到了越来越多研究人员的关注。本文对深度学习方法作了简要介绍,包括 CNN、RNN、GAN、GNN 等,回顾了近五年深度学习在生物医学数据分析中的具体应用。由于生物医学数据的特殊性,深度学习技术在生物医学数据分析领域还有巨大的发展空间。
生物数据复杂多变、特征多样、维度较高,深度学习技术在生物领域进一步的发展要将多模态信息进行融合并充分利用,例如将组学数据、图像、信号、电子记录等协同使用,然后结合专用于生物领域的深度学习技术,不仅能够有效地避免单模态数据实验的缺陷,还能快速高效地进行生物数据分析。
对于医学数据分析,一方面,专业的医疗机构以高精度为首要目标,利用最新的现代化大型服务器进行数据分析,高性能的 GPU 代表着超高的计算效率,可以分析更加复杂的深度模型,因此在研究过程中可以逐渐增加模型的深度。同时,还需要不断优化模型。常用的优化算法有自适应动量估计(adaptive moment estimation,Adam)等,通过自动调节学习速率等参数去更好地逼近目标函数,获得更优异的分析结果。以 CNN 的发展为例,从 AlexNet 到 VGGNet,再到 ResNet,模型的层数不断叠加,使用的优化算法复杂程度不断增加,对机器计算能力的要求也越来越高,只有装载多 GPU 的大型机器才能满足计算要求。另一方面,普通家用的医学数据分析仪器以普适性及便携式为首要目标,通过微处理技术,将压缩后的深度学习模型集成在小型仪器或个人计算机上。常用的压缩模型的方法有卷积核分解和模型剪枝优化等。模型剪枝通过永久删除不重要的连接来减少相应参数和计算,使剪枝后的网络能够继承原网络的关键信息并保持性能。此外,改变卷积方式也是一种不错的方法,例如移动网络(MobileNet),使用深度可分离卷积构建轻量级的深度神经网络,虽然精度有所降低,但是减少了卷积核的冗余表达,减少了计算量和参数数量,适用于小型仪器。
深度学习技术以其深厚的理论价值和广阔的市场前景在生物医学数据分析中占据越来越重要的地位,随着人工智能、智慧城市、微处理技术等理念的发展,生物医学领域的深度学习技术将会在医用和家用两个领域发挥巨大作用,因此开发具有更高精度和更深层次的深度模型算法以及简单高效适用于微型仪器的算法都是未来的主要发展方向。
利益冲突声明:本文全体作者均声明不存在利益冲突。