注意缺陷多动障碍(ADHD)是一种高发于学龄儿童的行为障碍综合症。目前,ADHD 的诊断主要依赖主观方法,导致漏诊率和误诊率较高。基于此,本文提出一种基于卷积神经网络的 ADHD 客观分类算法。首先,对脑部磁共振图像(MRI)进行头骨剥离、高斯核平滑等预处理;其次,对大脑的右侧尾状核、左侧楔前叶和左侧额上回部位的MRI进行粗分割;最后,利用 3 层卷积神经网络进行分类。实验结果表明:① 本文的算法能有效地对 ADHD 和正常人群进行分类;② 右侧尾状核和左侧楔前叶的 ADHD 分类准确率要高于 ADHD-200 全球竞赛中所有方法达到的 ADHD 最高分类准确率(62.52%);③ 利用上述 3 个脑区对 ADHD 患者和正常人群进行分类,其中右侧尾状核的分类准确率最高。综上所述,本文提出了一种利用粗分割和深度学习对 ADHD 患者和正常人群进行分类的方法。本文方法分类准确率高,计算量小,能较好地提取不明显的图像特征,改善了传统 MRI 脑区精确分割耗时长及复杂度高的缺点,为 ADHD 的诊断提供了一种可参照的客观方法。
引用本文: 朱莉, 张丽英, 韩云涛, 曾佺, 常为科. 基于卷积神经网络的注意缺陷多动障碍分类研究. 生物医学工程学杂志, 2017, 34(1): 99-105. doi: 10.7507/1001-5515.201606058 复制
引言
注意缺陷多动障碍(attention deficit/hyperactivity disorder,ADHD)是一组带有情绪与行为的综合症群体,其特征主要表现为注意力不集中、过度兴奋、做事冲动、行为不可控等,也是儿童期较常见的一种心理障碍 [1]。ADHD 会对患儿产生严重影响,比如出现学习障碍、成绩不好、与人关系紧张以及道德与行为问题等。国内有报告其发病率大约占学龄儿童的 1.5%~12%,国外报告为 3%~10%[2]。年龄和性别不同,ADHD 的发病率也不相同。男性的发病率要高于女性,比例为 4∶1~9∶1[3]。Cohen 等[4] 发现,儿童期男生患 ADHD 的概率为 17%,女生则为 8%;而青少年期男生患 ADHD 的概率为 11%,女生则为 6%。ADHD 发病通常是始于儿童期,有些家长认为,随着孩子年龄的增长, ADHD 的症状自然会慢慢消失。但最近有研究指出,ADHD 如果得不到及时有效地正确诊断和合理治疗,其仍可能持续到青春期或成年期,并将影响个人生活的各个方面,甚至有可能导致违法犯罪行为,从而影响患者终生。我国有研究报道,有 58% 的成人持续存在 ADHD[5]。然而,目前 ADHD 的诊断主要依赖于问卷等主观形式。临床诊断主要依据美国精神病学学会制定的精神障碍诊断与统计手册第 4 版(the diagnostic and statistical manual of mental disorders,DSM-IV)诊断标准 [6],该标准将 ADHD 分为:注意缺陷主导型(ADHD inattentive subtype,ADHD-I)、多动冲动主导型(ADHD hyperactive-impulsive subtype,ADHD-H)和混合型(ADHD combined hyperactive-impul-sive and inattentive subtype,ADHD-C)三种亚型,这三种类型在行为认知损伤方面的表现及其神经机制上都存在着明显差异。
虽然已有大量研究者对 ADHD 展开研究而且取得了较多的科研成果,但是,目前 ADHD 研究仍存在以下问题:① 缺乏客观的诊断量化指标。现有 ADHD 研究的诊断标准尚不完善, ADHD 与其他常见的精神障碍类疾病一样,缺少特异的病理学或病因学研究。现有的诊断主要是通过 DSM-IV、问卷和量表的形式 [7],一般由父母或老师通过观察儿童的行为来判断,以上行为都存在主观性,易造成误诊,所以需要找到可以辅助诊断的客观体征 [1]。 ② 缺少对 ADHD 临床脑部磁共振图像(magnetic resonance images,MRI)的自动诊断研究。 ③ 现有的 ADHD 自动诊断方法分类准确率低,亚型分类精度不高。例如,在 ADHD-200 全球竞赛中,利用一维的个人特征数据(年龄,性别,智力等)和逻辑回归分类器对 ADHD 患者和正常人群进行分类,取得的竞赛结果中最高分类准确率只有 62.52% [8],且该方法容易出现欠拟合。因此,如果有准确、量化的 ADHD 的神经影像指标,可以帮助医生更客观、更准确地做出诊断。
现有的 MRI 已经包含可用于建立判别模型的很多信息。已有研究表明,脑部 MRI 可以呈现部分 ADHD 患者脑部解剖结构存在的特异性 [9]。例如,ADHD 患儿与正常儿童之间大脑皮层的结构和体积存在很大差异。ADHD 患儿总皮质体积较正常儿童下降超过 7%~8%,两侧皮层表面积减少超过 7%[10]。皮层厚度和折叠指数也存在解剖异常,尤其是在后脑区和前脑区域 [11]。因此, ADHD 患者的脑部 MRI 应该是 ADHD 诊断分类的理想数据形式。但是,由于 ADHD 患者脑部 MRI 的特异性并不明显,临床上医师通常是通过重复看片来确诊,非常耗时耗力;同时,有些图像由于存在伪影,会干扰医生对病症的客观判断。因此,通过 MRI 诊断 ADHD 虽然能提供客观指标,但是人工判读诊断的误诊率和漏诊率较高。
本课题组在前期的研究中观察 ADHD 患儿脑电位发现,可用 P2-N2 峰峰值(P2 成分是 200 ms 左右出现的一个正向脑电波,N2 成分是 P2 成分后的第一个负向脑电波)、频谱在 11 Hz 左右峰值作为评价 ADHD 患儿认知功能的客观诊断指标 [12]。然而,课题组前期研究中是采用的一维脑电信号[12],不能准确定位具体的脑区病变,不利于进一步分析 ADHD 患儿的神经机制。
本文在文献 [12] 的基础上进一步研究 ADHD 患者的二维脑部结构病变及其自动诊断,提出了基于粗分割和卷积神经网络(convolutional neural networks,CNNs)的 ADHD 患者脑部 MRI 分类方法。首先,将 MRI 进行预处理,再对大脑的右侧尾状核、左侧楔前叶和左侧额上回部位的 MRI 进行粗分割,最后提出 3 层深度学习的 CNNs,实现了 ADHD 患者和正常人群的分类。研究结果表明,本文方法分类准确率高、计算量小,能较好地提取不明显的图像特征,改善了传统 MRI 脑区精确分割耗时长及复杂度高的缺点,可为今后开展针对 ADHD 客观、高效的临床诊断研究奠定新的思路。
1 实验数据
本文研究所用 MRI 数据来自 ADHD-200 全球竞赛数据集(http://fcon_1000.projects.nitrc.org/ indi/adhd200/)中的北京大学(Peking University,Peking_1和Peking_2)子数据集。本文研究采用了数据集中的结构磁共振图像(structural magnetic resonance images,SMRI)。MRI 数据经过了三维(3D)解剖扫描,采用了 3.0 T 的 MRI 扫描机(GE Signa,General Electric Healthcare,Milwaukee,WI),扫描范围为颅底至颅顶。北京大学的子数据集共有 152 个中国人的 MRI 样本,包括 59 名 ADHD 患者和 93 名正常人。本文从 59 名 ADHD 患者中筛选出了 55 名年龄(11.5±2.8)岁,范围为 9~14 岁的 ADHD 患者,并从 93 名正常人中筛选出了 55 名年龄为(11.5±2.5)岁,范围为 9~14 岁的正常儿童。筛选出的 110 名儿童中 88 名用于训练,22 名用于测试,训练组中 ADHD 患者和正常儿童数量均为 44,测试组中 ADHD 患者和正常儿童数量均为 11。两组受试者均排除精神发育迟滞、广泛性发育障碍、品行障碍、情绪问题、精神病史和物质滥用等情况。均为右利手,均无因头部外伤引起意识丧失的历史,经中国儿童修订版全面韦氏智力量表(full-scale Wechsler intelligence scale for Chinese children-revised,WISCC-R)测试,分数值 ≥80[13]。
2 方法
本文运用 CNNs 算法对前述 ADHD 患者和正常对照组进行分类。该研究方法的整个算法流程图如图 1 所示。将 MRI 数据分为训练集和测试集,两个数据集的 MRI 均经过图像预处理和图像粗分割,作为 CNNs 的输入。训练集数据用于训练 CNNs 网络,以获取最优的模型,测试集数据用于测试模型的匹配分类性能。

2.1 数据预处理
本文研究的 MRI 数据采用功能性神经影像分析软件(analysis of functional neuroimaging,AFNI)和功能性磁共振成像软件库(functional magnetic resonance images software library,FSL)进行了数据预处理,AFNI 和 FSL 软件均为针对 MRI 脑部成像的综合性分析工具。数据预处理包括头骨剥离,灰质、白质、脑脊液分割,归一化(1 mm×1 mm×1 mm)和高斯核平滑等。
头骨剥离:头骨剥离是将脑部组织从非脑组织中分离出来,去除非脑部组织,确保脑白质、灰质和脑脊液的精确分割。头骨剥离是脑组织分割中的一个关键步骤。本文的数据经过了 AFNI 软件的三维头骨剥离,步骤包括:① 体积预处理。消除整个空间图像的非均匀性,重新定位大脑;② 反复扩大一个球形表面直到它可以包围整个大脑。使用脑部提取工具(brain extraction tool,BET)删除整个头部图像的非脑组织,消除内外颅骨表面和外头皮表面。③ 创建大脑模型的表面以及头骨部分。
灰质、白质、脑脊液分割:本文将大脑的三维图像分割为灰质、白质、脑脊液,同时还校正了空间强度的变化。基本的方法是基于马尔可夫随机场模型和相关联的最大期望算法,该方法的抗噪性能优于大多数有限混合基于模型的方法。整个过程可以产生一个偏磁场校正输入图像和基于概率的部分体积组织分割。
归一化:将头骨剥离后的解剖图像匹配同一个 1 mm×1 mm×1 mm 分辨率的模板空间。
高斯核平滑:用 6 mm 的半高全宽(full width at half maximum,FWHM)高斯滤波器模糊归一化图像。
预处理后结果如图 2 所示。

2.2 MRI 粗分割
据文献[14-15]介绍,ADHD 患者在左侧楔前叶、左侧额上回,右侧尾状核处大脑皮质灰质浓度要低于正常人,故本研究通过区域选择大脑中右侧尾状核、左侧楔前叶、左侧额上回并粗略分割作为特征区域。以右侧尾状核为例,大脑右侧尾状核定位图如 图 3 所示。

已有的基于 MRI 的病类分类的算法均需要对脑区进行图像分割,分割的结果直接影响分类的准确率和后续的计算量。本文采取粗分割的方式,避免了由于对图像过度精确分割而带来的工作量大、耗时较长的繁琐计算。研究选用大脑矢状面的特征区域,扩大粗分割区域,以确保右侧尾状核、左侧楔前叶、左侧额上回分别在各自的待检测区域内,用以代替精确分割这些特征区域。本文设定的粗分割区域均为固定像素方形区域,像素大小均为 79×79,分割后的灰度图像数据进行归一化处理。右侧尾状核、左侧楔前叶和左侧额上回 3 个脑区的粗分割结果如 图 4 所示。

2.3 基于 CNNs 的 ADHD 的 MRI 分类
本文采用深度学习方法分析 ADHD 患者的 MRI 图像,深度学习法能够更好地提取图像特征,尤其在特征不明显的图像中更能体现其优势 [16]。在本研究中,采用的是 CNNs 来对图像进行特征提取和分类。CNNs 由卷积层和采样层交替构成。本文提出了 3 层 CNNs 结构,基于 CNNs 的 ADHD 分类的整体网络结构(以右侧尾状核区域为例)如 图 5 所示,包含 3 个卷积层,2 个采样层和 1 个全连接层。其中,卷积层用于提取图像特征,采样层用于降低图像相关性并减少运算量,全连接层为分类识别步骤。

输入层:输入经上述粗略分割的矢状面右侧尾状核(左侧楔前叶、左侧额上回)图像,由 79×79 的像素点组成。
卷积层 C1:在卷积层中进行的是二维卷积运算,卷积的过程实际上就是特征提取的过程。输入的图像与卷积核进行卷积,并将运算结果通过激活函数输出得到卷积层的 66×66 的特征图。卷积层的输出可按如下公式计算:
$ C{1_i} = \left( {\rm {sigm} \rm {oid}\left( {{{{w}}_i} \otimes {{x}}} \right)} \right)\;\;\;\;i = 1:N $ |
其中 x 为输入的图像; 代表卷积;N 为卷积核大小;C1 的卷积核大小为 14×14,核数为 2;wi代表对应于 i 的权值,即卷积核里的每一个数值,wi随机初始化再用反向传播(back propagation,BP)梯度算法训练得到最优化;C1i代表卷积层 1 的输出特征图;本研究所用激活函数为概率分布函数 (sigmoid),即 。
采样层 S2:采样层进行采样处理,采样的过程就是降维,减少了数据量。采样通常有均值采样和最大值采样两种,本文用的是均值采样(meanPool),即对特征图像的全部采样值求均值。采样层输出的特征图 S2i 是卷积层 C1 输出的特征图C1i作为采样层的输入经均值采样的结果。本文采样步长均为 2,故采样层的输出特征图为输入特征图大小的一半。采样层公式如下:
$ S{2_i} = {\mathop{\rm meanPool}\nolimits} (C{1_i}) $ |
卷积层 C3、C5 与卷积层 C1 计算过程一样,但卷积核的大小以及卷积核的数目各层是不同的;其中,C3 的卷积核大小为 22×22,核数为 3;C5 的卷积核大小为 2×2,核数为 1。采样层 S4 与采样层 S2 计算过程一样,采样步长也相同。整个网络上一层的输出均是下一层的输入。
全连接层 F6:全连接层是个一维线性排布的网络节点,与前一层是全连接的网络,将前一层的最后结果编码成一维向量。
输出层 F7:输出层与前一层是全连接的,它的结点个数与分类数目有关。本文我们要对 MRI 分成 2 类,因此输出层有 2 个结点。
3 结果及分析
本文选择右侧尾状核,左侧楔前叶,左侧额上回 3 个脑区进行研究,探求 ADHD 患者在哪个脑区与正常人存在差异,并探索 CNNs 对 ADHD 分类问题的具体应用。本文算法对 3 个脑区的测试结果如 图 6 所示,右侧尾状核 22 个测试样本分类结果中,17 个样本测试值与真实值相等,有 5 个样本测试值与真实值不相等;右侧尾状核 ADHD 分类准确率为 77.27%。左侧楔前叶 15 个样本测试值与真实值相等,左侧楔前叶 ADHD 分类准确率为 68.18%。左侧额上回 13 个样本测试值与真实值相等,左侧额上回 ADHD 分类准确率为 59.09%。

3 个特征脑区分类结果的各项指标如 表 1 所示。由表可知,右侧尾状核特征脑区分类准确率 77.27%,相比其他特征脑区准确率是最高的;灵敏度 81.82%,相比其他脑区也是最高的。然而特异性左侧额上回是最高的,结果为 90.91%;假阳性率左侧额上回相比其他脑区是最低的。假阴性率右侧尾状核相比其他脑区是最低的。综合看来,利用右侧尾状核特征脑区对 ADHD 的分类准确率最高,效果较明显。

目前,在 ADHD-200 全球竞赛结果中,所有方法达到的该竞赛中最高分类准确率为 62.52% [8]。基于以上研究结果显示,本文方法可有效地应用于基于 MRI 的 ADHD 诊断;利用右侧尾状核和左侧楔前叶进行分类,本文方法取得的结果明显高于 ADHD-200 竞赛的最高分类准确率;与此同时,本文方法利用右侧尾状核诊断的分类准确率最高,可见在该特征区域处 ADHD 患者与正常人有较明显的差异。目前,MRI 脑部图像分割主要有基于聚类的算法、基于形变模型的分割方法、图割算法、形态学分水岭算法以及基于图谱的分割方法等,这些方法包含手动操作时间和算法运算时间,耗时均较长,且受制于软硬件环境 [17],本文所采用的 MRI 数据粗分割属于固定分割,所有图像均截取固定区域,速度快,几乎无计算量损耗。此外,虽然 ADHD-200 竞赛中的个人特征数据算法取得了最高分类准确率,但是该方法无法直观反映病变机制,而本文采用 MRI 图像,其信息更能反映脑部因神经机制而引起的病变,从而对医学诊断有基础性的研究价值。本文采用了深度学习和图像粗分割的方法分析 ADHD 患者和正常人群的 MRI,深度学习法能够更好地提取图像特征,尤其在特征不明显的图像中更能体现其优势;采取粗分割 MRI 的方式,避免了由于对图像过度精确分割而带来的工作量大、耗时较长的繁琐计算。本文方法中 CNNs 只需要 3 层卷积,通常 CNNs 需要很高的层数才能达到较好的分类效果,可见,本文方法减少了计算量,提高了计算效率。
4 讨论
本文提出了一种利用 MRI 图像诊断 ADHD 的新算法,将深度学习的 CNNs 结合预处理和脑区粗分割,能有效地将 ADHD 患者和正常儿童分类,从而实现 ADHD 临床脑部 MRI 自动分类与诊断。应用本文方法对 3 个脑区进行分析,获得了较高的分类准确率;其中,利用右侧尾状核区域和左侧楔前叶进行分类,准确率高于 ADHD-200 竞赛的最高准确率。新算法的分类结果表明,ADHD 患者较正常儿童大脑皮质灰质浓度低,在右侧尾状核、左侧楔前叶和左侧额上回存在差异,其中在右侧尾状核脑区处的分类最高准确率可达 77.27%,高于 ADHD-200 全球竞赛中所达到的 ADHD 最高分类准确率 62.52%[8]。
综上所述,本文方法具有分类准确率高、训练速度快、计算耗时小等优点,为 ADHD 的诊断提供了一种可参照的客观方法。由于本文所采用的 CNNs 与输入样本相关,而且不同的年龄和性别的人群其听觉和视觉注意力的神经机制差异较 大[18-19],因此,下一阶段的研究需要将受试对象继续扩大,在不同的年龄段以及不同的性别组进行进一步的研究[20]。
引言
注意缺陷多动障碍(attention deficit/hyperactivity disorder,ADHD)是一组带有情绪与行为的综合症群体,其特征主要表现为注意力不集中、过度兴奋、做事冲动、行为不可控等,也是儿童期较常见的一种心理障碍 [1]。ADHD 会对患儿产生严重影响,比如出现学习障碍、成绩不好、与人关系紧张以及道德与行为问题等。国内有报告其发病率大约占学龄儿童的 1.5%~12%,国外报告为 3%~10%[2]。年龄和性别不同,ADHD 的发病率也不相同。男性的发病率要高于女性,比例为 4∶1~9∶1[3]。Cohen 等[4] 发现,儿童期男生患 ADHD 的概率为 17%,女生则为 8%;而青少年期男生患 ADHD 的概率为 11%,女生则为 6%。ADHD 发病通常是始于儿童期,有些家长认为,随着孩子年龄的增长, ADHD 的症状自然会慢慢消失。但最近有研究指出,ADHD 如果得不到及时有效地正确诊断和合理治疗,其仍可能持续到青春期或成年期,并将影响个人生活的各个方面,甚至有可能导致违法犯罪行为,从而影响患者终生。我国有研究报道,有 58% 的成人持续存在 ADHD[5]。然而,目前 ADHD 的诊断主要依赖于问卷等主观形式。临床诊断主要依据美国精神病学学会制定的精神障碍诊断与统计手册第 4 版(the diagnostic and statistical manual of mental disorders,DSM-IV)诊断标准 [6],该标准将 ADHD 分为:注意缺陷主导型(ADHD inattentive subtype,ADHD-I)、多动冲动主导型(ADHD hyperactive-impulsive subtype,ADHD-H)和混合型(ADHD combined hyperactive-impul-sive and inattentive subtype,ADHD-C)三种亚型,这三种类型在行为认知损伤方面的表现及其神经机制上都存在着明显差异。
虽然已有大量研究者对 ADHD 展开研究而且取得了较多的科研成果,但是,目前 ADHD 研究仍存在以下问题:① 缺乏客观的诊断量化指标。现有 ADHD 研究的诊断标准尚不完善, ADHD 与其他常见的精神障碍类疾病一样,缺少特异的病理学或病因学研究。现有的诊断主要是通过 DSM-IV、问卷和量表的形式 [7],一般由父母或老师通过观察儿童的行为来判断,以上行为都存在主观性,易造成误诊,所以需要找到可以辅助诊断的客观体征 [1]。 ② 缺少对 ADHD 临床脑部磁共振图像(magnetic resonance images,MRI)的自动诊断研究。 ③ 现有的 ADHD 自动诊断方法分类准确率低,亚型分类精度不高。例如,在 ADHD-200 全球竞赛中,利用一维的个人特征数据(年龄,性别,智力等)和逻辑回归分类器对 ADHD 患者和正常人群进行分类,取得的竞赛结果中最高分类准确率只有 62.52% [8],且该方法容易出现欠拟合。因此,如果有准确、量化的 ADHD 的神经影像指标,可以帮助医生更客观、更准确地做出诊断。
现有的 MRI 已经包含可用于建立判别模型的很多信息。已有研究表明,脑部 MRI 可以呈现部分 ADHD 患者脑部解剖结构存在的特异性 [9]。例如,ADHD 患儿与正常儿童之间大脑皮层的结构和体积存在很大差异。ADHD 患儿总皮质体积较正常儿童下降超过 7%~8%,两侧皮层表面积减少超过 7%[10]。皮层厚度和折叠指数也存在解剖异常,尤其是在后脑区和前脑区域 [11]。因此, ADHD 患者的脑部 MRI 应该是 ADHD 诊断分类的理想数据形式。但是,由于 ADHD 患者脑部 MRI 的特异性并不明显,临床上医师通常是通过重复看片来确诊,非常耗时耗力;同时,有些图像由于存在伪影,会干扰医生对病症的客观判断。因此,通过 MRI 诊断 ADHD 虽然能提供客观指标,但是人工判读诊断的误诊率和漏诊率较高。
本课题组在前期的研究中观察 ADHD 患儿脑电位发现,可用 P2-N2 峰峰值(P2 成分是 200 ms 左右出现的一个正向脑电波,N2 成分是 P2 成分后的第一个负向脑电波)、频谱在 11 Hz 左右峰值作为评价 ADHD 患儿认知功能的客观诊断指标 [12]。然而,课题组前期研究中是采用的一维脑电信号[12],不能准确定位具体的脑区病变,不利于进一步分析 ADHD 患儿的神经机制。
本文在文献 [12] 的基础上进一步研究 ADHD 患者的二维脑部结构病变及其自动诊断,提出了基于粗分割和卷积神经网络(convolutional neural networks,CNNs)的 ADHD 患者脑部 MRI 分类方法。首先,将 MRI 进行预处理,再对大脑的右侧尾状核、左侧楔前叶和左侧额上回部位的 MRI 进行粗分割,最后提出 3 层深度学习的 CNNs,实现了 ADHD 患者和正常人群的分类。研究结果表明,本文方法分类准确率高、计算量小,能较好地提取不明显的图像特征,改善了传统 MRI 脑区精确分割耗时长及复杂度高的缺点,可为今后开展针对 ADHD 客观、高效的临床诊断研究奠定新的思路。
1 实验数据
本文研究所用 MRI 数据来自 ADHD-200 全球竞赛数据集(http://fcon_1000.projects.nitrc.org/ indi/adhd200/)中的北京大学(Peking University,Peking_1和Peking_2)子数据集。本文研究采用了数据集中的结构磁共振图像(structural magnetic resonance images,SMRI)。MRI 数据经过了三维(3D)解剖扫描,采用了 3.0 T 的 MRI 扫描机(GE Signa,General Electric Healthcare,Milwaukee,WI),扫描范围为颅底至颅顶。北京大学的子数据集共有 152 个中国人的 MRI 样本,包括 59 名 ADHD 患者和 93 名正常人。本文从 59 名 ADHD 患者中筛选出了 55 名年龄(11.5±2.8)岁,范围为 9~14 岁的 ADHD 患者,并从 93 名正常人中筛选出了 55 名年龄为(11.5±2.5)岁,范围为 9~14 岁的正常儿童。筛选出的 110 名儿童中 88 名用于训练,22 名用于测试,训练组中 ADHD 患者和正常儿童数量均为 44,测试组中 ADHD 患者和正常儿童数量均为 11。两组受试者均排除精神发育迟滞、广泛性发育障碍、品行障碍、情绪问题、精神病史和物质滥用等情况。均为右利手,均无因头部外伤引起意识丧失的历史,经中国儿童修订版全面韦氏智力量表(full-scale Wechsler intelligence scale for Chinese children-revised,WISCC-R)测试,分数值 ≥80[13]。
2 方法
本文运用 CNNs 算法对前述 ADHD 患者和正常对照组进行分类。该研究方法的整个算法流程图如图 1 所示。将 MRI 数据分为训练集和测试集,两个数据集的 MRI 均经过图像预处理和图像粗分割,作为 CNNs 的输入。训练集数据用于训练 CNNs 网络,以获取最优的模型,测试集数据用于测试模型的匹配分类性能。

2.1 数据预处理
本文研究的 MRI 数据采用功能性神经影像分析软件(analysis of functional neuroimaging,AFNI)和功能性磁共振成像软件库(functional magnetic resonance images software library,FSL)进行了数据预处理,AFNI 和 FSL 软件均为针对 MRI 脑部成像的综合性分析工具。数据预处理包括头骨剥离,灰质、白质、脑脊液分割,归一化(1 mm×1 mm×1 mm)和高斯核平滑等。
头骨剥离:头骨剥离是将脑部组织从非脑组织中分离出来,去除非脑部组织,确保脑白质、灰质和脑脊液的精确分割。头骨剥离是脑组织分割中的一个关键步骤。本文的数据经过了 AFNI 软件的三维头骨剥离,步骤包括:① 体积预处理。消除整个空间图像的非均匀性,重新定位大脑;② 反复扩大一个球形表面直到它可以包围整个大脑。使用脑部提取工具(brain extraction tool,BET)删除整个头部图像的非脑组织,消除内外颅骨表面和外头皮表面。③ 创建大脑模型的表面以及头骨部分。
灰质、白质、脑脊液分割:本文将大脑的三维图像分割为灰质、白质、脑脊液,同时还校正了空间强度的变化。基本的方法是基于马尔可夫随机场模型和相关联的最大期望算法,该方法的抗噪性能优于大多数有限混合基于模型的方法。整个过程可以产生一个偏磁场校正输入图像和基于概率的部分体积组织分割。
归一化:将头骨剥离后的解剖图像匹配同一个 1 mm×1 mm×1 mm 分辨率的模板空间。
高斯核平滑:用 6 mm 的半高全宽(full width at half maximum,FWHM)高斯滤波器模糊归一化图像。
预处理后结果如图 2 所示。

2.2 MRI 粗分割
据文献[14-15]介绍,ADHD 患者在左侧楔前叶、左侧额上回,右侧尾状核处大脑皮质灰质浓度要低于正常人,故本研究通过区域选择大脑中右侧尾状核、左侧楔前叶、左侧额上回并粗略分割作为特征区域。以右侧尾状核为例,大脑右侧尾状核定位图如 图 3 所示。

已有的基于 MRI 的病类分类的算法均需要对脑区进行图像分割,分割的结果直接影响分类的准确率和后续的计算量。本文采取粗分割的方式,避免了由于对图像过度精确分割而带来的工作量大、耗时较长的繁琐计算。研究选用大脑矢状面的特征区域,扩大粗分割区域,以确保右侧尾状核、左侧楔前叶、左侧额上回分别在各自的待检测区域内,用以代替精确分割这些特征区域。本文设定的粗分割区域均为固定像素方形区域,像素大小均为 79×79,分割后的灰度图像数据进行归一化处理。右侧尾状核、左侧楔前叶和左侧额上回 3 个脑区的粗分割结果如 图 4 所示。

2.3 基于 CNNs 的 ADHD 的 MRI 分类
本文采用深度学习方法分析 ADHD 患者的 MRI 图像,深度学习法能够更好地提取图像特征,尤其在特征不明显的图像中更能体现其优势 [16]。在本研究中,采用的是 CNNs 来对图像进行特征提取和分类。CNNs 由卷积层和采样层交替构成。本文提出了 3 层 CNNs 结构,基于 CNNs 的 ADHD 分类的整体网络结构(以右侧尾状核区域为例)如 图 5 所示,包含 3 个卷积层,2 个采样层和 1 个全连接层。其中,卷积层用于提取图像特征,采样层用于降低图像相关性并减少运算量,全连接层为分类识别步骤。

输入层:输入经上述粗略分割的矢状面右侧尾状核(左侧楔前叶、左侧额上回)图像,由 79×79 的像素点组成。
卷积层 C1:在卷积层中进行的是二维卷积运算,卷积的过程实际上就是特征提取的过程。输入的图像与卷积核进行卷积,并将运算结果通过激活函数输出得到卷积层的 66×66 的特征图。卷积层的输出可按如下公式计算:
$ C{1_i} = \left( {\rm {sigm} \rm {oid}\left( {{{{w}}_i} \otimes {{x}}} \right)} \right)\;\;\;\;i = 1:N $ |
其中 x 为输入的图像; 代表卷积;N 为卷积核大小;C1 的卷积核大小为 14×14,核数为 2;wi代表对应于 i 的权值,即卷积核里的每一个数值,wi随机初始化再用反向传播(back propagation,BP)梯度算法训练得到最优化;C1i代表卷积层 1 的输出特征图;本研究所用激活函数为概率分布函数 (sigmoid),即 。
采样层 S2:采样层进行采样处理,采样的过程就是降维,减少了数据量。采样通常有均值采样和最大值采样两种,本文用的是均值采样(meanPool),即对特征图像的全部采样值求均值。采样层输出的特征图 S2i 是卷积层 C1 输出的特征图C1i作为采样层的输入经均值采样的结果。本文采样步长均为 2,故采样层的输出特征图为输入特征图大小的一半。采样层公式如下:
$ S{2_i} = {\mathop{\rm meanPool}\nolimits} (C{1_i}) $ |
卷积层 C3、C5 与卷积层 C1 计算过程一样,但卷积核的大小以及卷积核的数目各层是不同的;其中,C3 的卷积核大小为 22×22,核数为 3;C5 的卷积核大小为 2×2,核数为 1。采样层 S4 与采样层 S2 计算过程一样,采样步长也相同。整个网络上一层的输出均是下一层的输入。
全连接层 F6:全连接层是个一维线性排布的网络节点,与前一层是全连接的网络,将前一层的最后结果编码成一维向量。
输出层 F7:输出层与前一层是全连接的,它的结点个数与分类数目有关。本文我们要对 MRI 分成 2 类,因此输出层有 2 个结点。
3 结果及分析
本文选择右侧尾状核,左侧楔前叶,左侧额上回 3 个脑区进行研究,探求 ADHD 患者在哪个脑区与正常人存在差异,并探索 CNNs 对 ADHD 分类问题的具体应用。本文算法对 3 个脑区的测试结果如 图 6 所示,右侧尾状核 22 个测试样本分类结果中,17 个样本测试值与真实值相等,有 5 个样本测试值与真实值不相等;右侧尾状核 ADHD 分类准确率为 77.27%。左侧楔前叶 15 个样本测试值与真实值相等,左侧楔前叶 ADHD 分类准确率为 68.18%。左侧额上回 13 个样本测试值与真实值相等,左侧额上回 ADHD 分类准确率为 59.09%。

3 个特征脑区分类结果的各项指标如 表 1 所示。由表可知,右侧尾状核特征脑区分类准确率 77.27%,相比其他特征脑区准确率是最高的;灵敏度 81.82%,相比其他脑区也是最高的。然而特异性左侧额上回是最高的,结果为 90.91%;假阳性率左侧额上回相比其他脑区是最低的。假阴性率右侧尾状核相比其他脑区是最低的。综合看来,利用右侧尾状核特征脑区对 ADHD 的分类准确率最高,效果较明显。

目前,在 ADHD-200 全球竞赛结果中,所有方法达到的该竞赛中最高分类准确率为 62.52% [8]。基于以上研究结果显示,本文方法可有效地应用于基于 MRI 的 ADHD 诊断;利用右侧尾状核和左侧楔前叶进行分类,本文方法取得的结果明显高于 ADHD-200 竞赛的最高分类准确率;与此同时,本文方法利用右侧尾状核诊断的分类准确率最高,可见在该特征区域处 ADHD 患者与正常人有较明显的差异。目前,MRI 脑部图像分割主要有基于聚类的算法、基于形变模型的分割方法、图割算法、形态学分水岭算法以及基于图谱的分割方法等,这些方法包含手动操作时间和算法运算时间,耗时均较长,且受制于软硬件环境 [17],本文所采用的 MRI 数据粗分割属于固定分割,所有图像均截取固定区域,速度快,几乎无计算量损耗。此外,虽然 ADHD-200 竞赛中的个人特征数据算法取得了最高分类准确率,但是该方法无法直观反映病变机制,而本文采用 MRI 图像,其信息更能反映脑部因神经机制而引起的病变,从而对医学诊断有基础性的研究价值。本文采用了深度学习和图像粗分割的方法分析 ADHD 患者和正常人群的 MRI,深度学习法能够更好地提取图像特征,尤其在特征不明显的图像中更能体现其优势;采取粗分割 MRI 的方式,避免了由于对图像过度精确分割而带来的工作量大、耗时较长的繁琐计算。本文方法中 CNNs 只需要 3 层卷积,通常 CNNs 需要很高的层数才能达到较好的分类效果,可见,本文方法减少了计算量,提高了计算效率。
4 讨论
本文提出了一种利用 MRI 图像诊断 ADHD 的新算法,将深度学习的 CNNs 结合预处理和脑区粗分割,能有效地将 ADHD 患者和正常儿童分类,从而实现 ADHD 临床脑部 MRI 自动分类与诊断。应用本文方法对 3 个脑区进行分析,获得了较高的分类准确率;其中,利用右侧尾状核区域和左侧楔前叶进行分类,准确率高于 ADHD-200 竞赛的最高准确率。新算法的分类结果表明,ADHD 患者较正常儿童大脑皮质灰质浓度低,在右侧尾状核、左侧楔前叶和左侧额上回存在差异,其中在右侧尾状核脑区处的分类最高准确率可达 77.27%,高于 ADHD-200 全球竞赛中所达到的 ADHD 最高分类准确率 62.52%[8]。
综上所述,本文方法具有分类准确率高、训练速度快、计算耗时小等优点,为 ADHD 的诊断提供了一种可参照的客观方法。由于本文所采用的 CNNs 与输入样本相关,而且不同的年龄和性别的人群其听觉和视觉注意力的神经机制差异较 大[18-19],因此,下一阶段的研究需要将受试对象继续扩大,在不同的年龄段以及不同的性别组进行进一步的研究[20]。