本文尝试通过脑电信号检测方法辅助多动症儿童进行临床个体化诊断。首先基于一种经典的干扰控制试验任务Simon-spatial Stroop范例采集14名多动症儿童和16名正常儿童的脑电数据, 并完成滤波、分段、去伪迹等预处理; 然后采用主成分分析(PCA)进行电极优化选择, 分别选取每种刺激模式下出现率90%以上的优化电极作为共有电极, 并提取共有电极潜伏期(200~450 ms)波幅的均值特征; 最后采用基于欧氏距离的k-最近邻(KNN)和基于径向基核函数的支持向量机(SVM)分类器来分类。实验发现同种试验任务中多动症儿童比正常儿童表现出更低的反应正确率和更长的反应时间; 多动症儿童与正常儿童的前额叶优化电极均出现N2, 顶枕叶均有P2出现, 且多动症儿童的峰值更低; 在该实验中KNN分类准确率高于SVM分类器, StI刺激模式下KNN分类器的最高分类准确率为89.29%。以上结果说明, 干扰控制试验中多动症儿童与正常儿童的前额叶及顶枕叶的脑电信号存在差异, 该结果可为多动症个体的脑电信号临床诊断提供一定科学依据。
引用本文: 杨姣姣, 郭倩, 李文杰, 王苏弘, 邹凌. 基于脑电主成分分析和k-最近邻的多动症儿童与正常儿童分类研究. 生物医学工程学杂志, 2016, 33(2): 232-238. doi: 10.7507/1001-5515.20160041 复制
引言
多动症,全称为注意缺陷多动障碍(attention-deficit/hyperactivity disorder,ADHD),是一种发生在儿童学龄初期以注意力涣散、多动和冲动为主要特征的神经心理行为疾病,是儿童九大发育行为问题之首。美国《精神疾病的诊断和统计手册》(Diagnostic And Statistical Manual of Mental Disorders,DSM-IV-TR)将其分为注意缺陷型、多动冲动型和混合型三种,其中注意缺陷型最为常见[1]。来自2014年国际生物医学学术大会的数据统计表明,多动症的发病率为1.5%~13.4%,且呈逐年上升趋势,有近1/3的儿童症状会持续到青春期。多动症通常会伴发品行障碍、对立违抗障碍、学习障碍等行为疾病。这些临床症状会对儿童的认知和行为功能产生持续不良影响,不仅危害儿童的成长发育,还会给其家庭带来沉重的经济和心理负担[2]。可见,多动症已成为一种严重的社会公共卫生问题。
由于目前尚缺乏针对多动症的特异性测试工具,临床医生一般依据DSM-IV-TR的标准,通过父母访谈、儿童评估和教师信息报告等主观印象进行诊断,而采用量化的方法如脑电图(electroencephalogram,EEG)测量为多动症的诊断提供客观证据也成为研究热点之一。Shaw等[3]认为多动症存在明显的皮质发育延迟,而大脑发育与脑电信号及其脑功能连接密切相关[4]。Rubia等[5]猜想前额叶和纹状体的活动异常可能是引起多动症外部症状的关键原因。Barkley[6]认为行为失控是多动症的基本缺陷,而干扰控制是与行为抑制相关联的第三个阶段。为了研究多动症的脑神经缺陷机制,干扰控制刺激常作为诱发脑电信号的实验任务。除了持续行为测试(continuous performance test,CPT)范例,Simon任务、Stroop任务和Flanker任务也被广泛用来研究干扰控制。Simon任务中受试个体的前扣带皮质、辅助运动区和楔前叶脑区有明显的反应激活,而Stroop任务中受试的顶叶皮层涉及明显的激活[7]。Simon-spatial Stroop任务是Simon任务和Stroop任务的联合,也是研究多动症的经典干扰控制范例之一。多动症儿童难以对目标刺激保持持续关注,从而在干扰任务中表现较差(更多的错误,更长的平均反应时间和标准偏差),这反映了其受损的干扰控制,但行为方式本身并没有表现潜在的认知加工神经机制。然而,锁定时域脑电信号可以揭示神经信号在毫秒数量级的变化,从而提供人在处理事情时大脑活动的实时改变[8]。因此初步推断,检测干扰控制任务中多动症儿童和正常儿童的脑电信号可辅助多动症儿童临床个体化诊断。
已有多种特征提取方法应用于脑电信号的研究。Siuly等[9-10]认为很多分析方法对于非平稳的脑电信号并不是最好,甚至运算效率不高,而且对于高导联的脑电信号,很多现有的分析方法并不合适。可见,在研究多导联的脑电信号时,如何提高其分析效率是一个值得思考的问题。Wei等[11]也证实使用优化电极的方法可提高分类准确率。因此为了提高128导联脑电信号的运算效率和分类准确率,可采用电极优化的方法来进行研究。基于Rayleigh系数改进的遗传算法可选择有效的通道从而有利于运动想象脑电信号分类[12],Arvenah等[13]也提出了一种稀疏的公共空间模式算法来选择脑电信号电极。然而很少有方法考虑了单个时间窗内所有观测信号的变化关系,甚至多数情况下并没有通过实验数据本身的关系评估来选择参数,而参数的选择对数据的分析结果有重要的影响[10]。主成分分析(principal component analysis,PCA)方法通过对锁定的分段时间窗内的脑电信号进行线性变换筛选出较少导联的重要变量,其一组多变量数据的主成分包含大部分原始数据信息,随着原始数据主要特征的确定,实现了数据降维,并能选取重要的显著成分[14]。脑电信号一般有大量的冗余信息不能应用于临床诊断,而PCA方法可以去除这些冗余信息[10],因此可利用PCA方法寻找分段时间窗内的脑电信号显著成分,挑选出脑电信号的优化子集。
目前已有多种方法应用于脑电信号分类研究。作为分类技术中最简单的方法之一,k最近邻(k-nearest neighbor,KNN)法根据特征空间中接近训练示例的对象进行分类,适用于类域的交叉或重叠较多的待分样本集。Ghassemi等[15]将KNN用于多动症儿童和正常儿童的脑电信号分类取得了较好结果。Cao等[16]发现多动症儿童和正常儿童的潜伏期(200~450 ms)脑电信号差异并不十分明显。因此,猜想多动症儿童和正常儿童的脑电信号存在交叉或重叠,可尝试KNN算法研究分类。Poil等[17]研究了不同年龄阶段多动症患者静息态脑电信号特征,发现支持向量机(support vector machine,SVM)可对多动症成人和正常成人分类,但不能区分多动症儿童和正常儿童。因此,本文尝试研究基于径向基核函数的SVM是否能成功对干扰控制任务下的多动症儿童和正常儿童脑电信号进行分类,并与KNN进行对比研究。
本文基于一种经典的干扰控制试验任务Simon-spatial Stroop范例,对多动症和正常儿童的脑电信号进行了研究,首先采用PCA方法对预处理后的脑电信号进行了电极优化选择,然后根据不同刺激模式从所有受试的优化电极中选取出现率90%以上的电极作为共有电极,并提取共有电极潜伏期(200~450 ms)波幅的均值特征,最后用KNN和SVM分类器分类,尝试检测多动症儿童与正常儿童的脑电信号,并研究其差异性以辅助多动症儿童的临床个体化诊断。
1 方法
1.1 受试信息
14名多动症儿童,年龄8~11.4岁,平均年龄8.2岁,其中包括4名女孩,10名男孩,均来自苏州大学第三附属医院;16名正常儿童,年龄7.3~10.1岁,平均年龄8.8岁,其中包括10名女孩,6名男孩,均来自周边小学。多动症儿童均根据心理疾病的标准诊断和统计手册经过门诊专业诊断评估。根据瑞文推理测验和韦氏智力量表中国儿童修订版进行测试,所有受试的IQ≥80,无颅脑损伤、癫痫或其他精神疾病。所有受试视力或矫正视力正常,左右手能正常活动。
1.2 试验范例
本试验选取了经典的干扰控制任务Simon-spatial Stroop范例[16]。试验环境安静舒适,受试头戴电极帽坐在正对17英寸显示屏80 cm处的舒适椅上,水平和垂直视力翻转角均小于3。在详细的指导下,受试需要根据试验图片快速地做出准确、稳定的按键反应,并尽量减少眨眼次数。试验分三个阶段,前两个阶段为试验训练阶段,第三个阶段为正式试验阶段。试验刺激为3.5 cm×4.5 cm的白色向上或向下箭头。第一个训练阶段由15个向上箭头和15个向下的箭头组成。当向上的箭头出现时,要求受试用左手食指点击反应盒左键;当向下的箭头出现时,要求受试用右手食指点击反应盒右键。第二个训练阶段包含32个试验,箭头随机地出现在中心十字的左、右、上、下四个方向,构成四种不同的刺激模式:SmC-箭头的位置与反应按键相一致(如:向上的箭头位于中心十字的左侧,用左手食指点击左键;或向下的箭头位于中心十字的右侧,用右手食指点击右键);SmI-箭头的位置与反应按键相反(如:向上的箭头位于中心十字的右侧,用左手食指点击左键;或向下的箭头位于中心十字的左侧,用右手食指点击右键);StC-箭头的位置与方向一致(如:向上的箭头位于中心十字的上侧);StI-箭头的位置与方向不一致(如:向上的箭头位于中心十字的下侧)。正式试验由288个试验组成,分两个块呈现,每个块包括144个试验,SmC、SmI、StC和StI四种刺激模式等概率随机呈现,每个刺激呈现时间为1 000 ms,每次刺激之间的时间间隔从2 000、2 500、3 000或3 500 ms四个时段随机选取。第一个块呈现结束,受试可休息2 min。
1.3 脑电信号采集和预处理
实验设备为美国EGI公司生产的128导脑电信号采集系统,参考电极为平均参考,采集软件为Net Station,采样频率500 Hz,每个电极阻抗降至100 kΩ以下。脑电信号预处理使用EGI 4.5.6版的Net Station软件,数据重滤波范围是0.3~30 Hz,分段(-200~1 000 ms),基线校准(-200~0 ms)。通过窗口移动算法排除实验中噪声较多的导联和试验、按键不正确的试验、反应时间超出设定时间200~1 500 ms的试验,及眼动、眨眼或坏通道数量过多(> 10)的试验。
1.4 PCA算法
PCA方法考虑了锁定分段时间窗内所有观测信号的变化关系,可去掉脑电信号中的冗余信息[10]。针对预处理后的脑电数据通过PCA方法研究分段时间窗内各导联脑电信号的变化关系从而确定主成分分量,可选取显著信号成分对应的优化电极,实现数据降维[14]。为了不丢失信号的有效成分,本文选取了累积方差贡献率99%的优化电极,其余均被当成噪声成分。
1.5 分类器
1.5.1 KNN分类器
基于欧氏距离的KNN方法计算简单,根据特征空间中接近训练示例的对象进行分类[15]。提取多动症组和正常组儿童的共有电极潜伏期(200~450 ms)振幅的均值特征后,本文选用KNN分类器通过计算测试样本与训练样本的欧氏距离,根据同种刺激任务下单次试验逐一投票的方法判定测试样本所属类别。
1.5.2 SVM分类器
本研究选用SVM作为第二个分类器,尝试对干扰控制任务下多动症儿童和正常儿童的脑电信号分类。SVM是采用监督式的学习方法,其主要思想是将输入向量映射到高维的特征向量空间,并在该特征空间中构造最优分类面[18]。在分类研究过程中,为了建立分类器模型,本文随机选择70%的特征样本作为训练样本,剩下样本用来测试。为了测试分类器的稳定性,本文尝试了多次运算。其具体步骤如下。
步骤一:给出两组受试的脑电信号特征作为输入样本X以及与之对应的期望输出类别Y。其表达式如下:
$ \boldsymbol{X}=\left[ {{x_1}\; \;{x_2}\; \; \cdots \; {x_N}} \right] $ |
$ \boldsymbol{Y}=\left[ {{y_1}\; \;{y_2}\; \; \cdots \; {y_N}} \right]\; \;\; \;{y_i} \in \left\{ { + 1, -1} \right\} $ |
xi(i=1, 2, …, N)为提取的脑电信号特征向量,其中+1表示正常儿童,-1代表多动症儿童。
步骤二:为使分类面尽可能对所有信号样本正确分类并具备分类间隔,需在约束条件c=0和ai≥0 (i=1, 2, …, N)下,求得分类面的最大差值d,从而得到最优解ai*。为了解决该约束最优化问题,可引入Lagrange函数进行约束优化[18]。约束条件和分类面的最大差值表达式如下:
$ c=\sum\limits_{i=1}^N {{y_i} \cdot {a_i}} $ |
$ d=\sum\limits_{i=1}^N {{a_i}}-\frac{1}{2}\sum\limits_{i, j=1}^N {{a_i} \cdot {a_j}} \cdot {y_i} \cdot {y_j} \cdot \left({{x_i} \cdot {x_j}} \right) $ |
步骤三:根据特定的支持向量xN计算出信号的最优权值向量w*和最优偏执向量b*:
$ {\boldsymbol{w}^*}=\sum\limits_{i=1}^N {{a_i}} \cdot {y_i} \cdot {x_i} $ |
$ {\boldsymbol{b}^*}=\frac{1}{{{y_N}}}-{\boldsymbol{w}^*} \cdot {x_N} $ |
步骤四:本文选择径向基核函数K(xi, xj),通过计算求得分类函数f(x)的值,计算式如下:
$ \begin{array}{*{20}{c}} {f\left(x \right)={\mathop{\rm sgn}} \left({\sum\limits_{i=1}^N {{a_i}^*} \cdot {y_i} \cdot K \cdot \left({{x_i}, x} \right) + {b^*}} \right) \cdot \sum\limits_{i, j=1}^N {{a_i} \cdot {a_j}} }\ { \cdot {y_i} \cdot {y_j} \cdot \left({{x_i} \cdot {x_j}} \right)} \end{array} $ |
根据f(x)的值为+1或-1,判断出测试信号样本所属类别,与期望输出类别进行对比,即可求出分类准确率。
2 结果
2.1 行为测试结果
多动症儿童和正常儿童的行为数据结果如表 1所示,与不协调的试验任务相比,在协调一致的任务中所有受试均表现出更高的反应正确率和更短的反应时间;在同种任务中多动症儿童比正常儿童表现出更高的出错率和更长的反应时间,且多动症儿童的稳定性更差。

2.2 电极选择结果
每个受试预处理后的脑电信号为128导,经PCA方法选择累计方差贡献率99%的主成分后,排除了75%左右的导联,减少了电极个数,提高了数据分析的效率。根据不同刺激模式,从所有受试的优化电极中选取出现率90%以上的电极作为共有电极,选取的共有优化电极如表 2所示。

四种刺激模式下的共有电极均位于前额叶脑区和顶枕叶脑区,随着出现率的提高共有电极个数会减少。为了研究不同出现率的共有电极对分类结果的影响,根据潜伏期(200~450 ms)振幅均值特征,本文采用KNN分类器进行了分类。如表 2所示,根据SmI和StI刺激任务所选的共有电极进行分类时,分类正确率相对较高,该两种刺激模式下多动症儿童和正常儿童的前额叶脑区和顶枕叶脑区的脑电信号表现出更明显的差异。
为了进一步研究两组受试前额叶和顶枕叶脑区的事件相关电位,分别对四种刺激模式下优化电极出现率100%的共有电极的脑电信号进行了组内叠加平均。四种刺激模式下两组受试分别叠加平均后的脑电信号时域波形图如图 1所示,可见在四种刺激任务下多动症儿童和正常儿童的前额叶脑区均有N2(200~450 ms),而在顶枕区均有P2出现;在同种任务中多动症儿童的N2和P2振幅峰值比正常儿童低,但其差异显著性有待进一步研究。

2.3 分类结果
由于不同的刺激模式下不同共有电极的分类准确率不同,当选用StI刺激模式优化电极出现率96%的顶枕叶电极进行分类时分类准确率达到最高。因此对SmI和StI两种刺激模式出现率96%以上的共有电极潜伏期振幅均值特征,本文采用了SVM分类器与KNN分类器分类对比,结果如表 3所示。

如表 3所示,两种刺激模式下KNN分类器的分类准确率高于SVM;当选用顶枕叶共有电极进行分类时分类准确率较高,StI刺激模式下KNN分类器的分类准确率最高可达89.29%,而SVM最高分类准确率只有60.50%。
3 讨论
本文尝试采用脑电信号检测方法辅助多动症儿童临床个体化诊断。前人报道了多动症受损的干扰控制能力[6, 8]。因此,本文基于干扰控制任务Simon-spatial Stroop试验范例,采集了30名受试的脑电信号,针对预处理后的脑电数据,首先采用PCA方法筛选了优化电极(累计贡献率≥99%),减少了分析数据的维度,提高了运算效率。研究发现主成分相关电极主要位于前额叶和顶枕叶脑区。四种刺激模式下,多动症儿童与正常儿童前额叶均有N2(200~450 ms),顶枕叶均有P2,且同种刺激模式下两组受试的N2和P2峰值表现出差异性。在研究优化电极出现率的过程中,由于数据集的限制,90%是设定的阈值下限,若阈值小于90%会筛选出更多电极,使得筛选出的这些电极中有部分电极并不属于某些受试的优化电极,从而无法体现分段时间窗内不同电极贡献率高低的差异性。若受试数量较多,可研究分段时间窗内不同累积贡献率所选电极分类结果。
在特征提取方面,本文主要研究脑电信号潜伏期时域特性,结合了两组受试在行为测试中的反应差异,在前人研究报道基础上[16],根据两组受试在干扰控制试验任务中表现出的N2和P2潜伏期特征尝试了试验筛选,有效地排除了受试做出正确按键反应但不满足该特征的试验数据,一定程度上减少了数据运算量。后期的研究可从干扰控制任务组合和特征组合方面展开,也可结合频域特征或其他非线性特征研究多动症儿童和正常儿童的脑电信号差异性。如表 2所示,针对SmI和StI两种试验任务运用SVM分类器和KNN分类器分类对比,KNN取得了较好的结果,在后期的研究中可从优化权重的投票方法深入。基于径向基核函数的SVM分类器分类准确率较低,与Poila等[17]的研究结果一致,但稳定性较好,不失为后期深入研究的基础。
总之,本文研究了干扰控制任务中多动症儿童和正常儿童脑电信号,通过PCA方法实现了脑电信号降维,并运用KNN和SVM分类器进行了分类对比,KNN取得的最高的分类准确率为89.29%。研究初步认为,干扰控制试验中多动症儿童与正常儿童的前额叶及顶枕叶脑电信号存在差异,为多动症儿童临床个体化诊断和脑神经缺陷机制基础研究提供了一定的科学依据。
引言
多动症,全称为注意缺陷多动障碍(attention-deficit/hyperactivity disorder,ADHD),是一种发生在儿童学龄初期以注意力涣散、多动和冲动为主要特征的神经心理行为疾病,是儿童九大发育行为问题之首。美国《精神疾病的诊断和统计手册》(Diagnostic And Statistical Manual of Mental Disorders,DSM-IV-TR)将其分为注意缺陷型、多动冲动型和混合型三种,其中注意缺陷型最为常见[1]。来自2014年国际生物医学学术大会的数据统计表明,多动症的发病率为1.5%~13.4%,且呈逐年上升趋势,有近1/3的儿童症状会持续到青春期。多动症通常会伴发品行障碍、对立违抗障碍、学习障碍等行为疾病。这些临床症状会对儿童的认知和行为功能产生持续不良影响,不仅危害儿童的成长发育,还会给其家庭带来沉重的经济和心理负担[2]。可见,多动症已成为一种严重的社会公共卫生问题。
由于目前尚缺乏针对多动症的特异性测试工具,临床医生一般依据DSM-IV-TR的标准,通过父母访谈、儿童评估和教师信息报告等主观印象进行诊断,而采用量化的方法如脑电图(electroencephalogram,EEG)测量为多动症的诊断提供客观证据也成为研究热点之一。Shaw等[3]认为多动症存在明显的皮质发育延迟,而大脑发育与脑电信号及其脑功能连接密切相关[4]。Rubia等[5]猜想前额叶和纹状体的活动异常可能是引起多动症外部症状的关键原因。Barkley[6]认为行为失控是多动症的基本缺陷,而干扰控制是与行为抑制相关联的第三个阶段。为了研究多动症的脑神经缺陷机制,干扰控制刺激常作为诱发脑电信号的实验任务。除了持续行为测试(continuous performance test,CPT)范例,Simon任务、Stroop任务和Flanker任务也被广泛用来研究干扰控制。Simon任务中受试个体的前扣带皮质、辅助运动区和楔前叶脑区有明显的反应激活,而Stroop任务中受试的顶叶皮层涉及明显的激活[7]。Simon-spatial Stroop任务是Simon任务和Stroop任务的联合,也是研究多动症的经典干扰控制范例之一。多动症儿童难以对目标刺激保持持续关注,从而在干扰任务中表现较差(更多的错误,更长的平均反应时间和标准偏差),这反映了其受损的干扰控制,但行为方式本身并没有表现潜在的认知加工神经机制。然而,锁定时域脑电信号可以揭示神经信号在毫秒数量级的变化,从而提供人在处理事情时大脑活动的实时改变[8]。因此初步推断,检测干扰控制任务中多动症儿童和正常儿童的脑电信号可辅助多动症儿童临床个体化诊断。
已有多种特征提取方法应用于脑电信号的研究。Siuly等[9-10]认为很多分析方法对于非平稳的脑电信号并不是最好,甚至运算效率不高,而且对于高导联的脑电信号,很多现有的分析方法并不合适。可见,在研究多导联的脑电信号时,如何提高其分析效率是一个值得思考的问题。Wei等[11]也证实使用优化电极的方法可提高分类准确率。因此为了提高128导联脑电信号的运算效率和分类准确率,可采用电极优化的方法来进行研究。基于Rayleigh系数改进的遗传算法可选择有效的通道从而有利于运动想象脑电信号分类[12],Arvenah等[13]也提出了一种稀疏的公共空间模式算法来选择脑电信号电极。然而很少有方法考虑了单个时间窗内所有观测信号的变化关系,甚至多数情况下并没有通过实验数据本身的关系评估来选择参数,而参数的选择对数据的分析结果有重要的影响[10]。主成分分析(principal component analysis,PCA)方法通过对锁定的分段时间窗内的脑电信号进行线性变换筛选出较少导联的重要变量,其一组多变量数据的主成分包含大部分原始数据信息,随着原始数据主要特征的确定,实现了数据降维,并能选取重要的显著成分[14]。脑电信号一般有大量的冗余信息不能应用于临床诊断,而PCA方法可以去除这些冗余信息[10],因此可利用PCA方法寻找分段时间窗内的脑电信号显著成分,挑选出脑电信号的优化子集。
目前已有多种方法应用于脑电信号分类研究。作为分类技术中最简单的方法之一,k最近邻(k-nearest neighbor,KNN)法根据特征空间中接近训练示例的对象进行分类,适用于类域的交叉或重叠较多的待分样本集。Ghassemi等[15]将KNN用于多动症儿童和正常儿童的脑电信号分类取得了较好结果。Cao等[16]发现多动症儿童和正常儿童的潜伏期(200~450 ms)脑电信号差异并不十分明显。因此,猜想多动症儿童和正常儿童的脑电信号存在交叉或重叠,可尝试KNN算法研究分类。Poil等[17]研究了不同年龄阶段多动症患者静息态脑电信号特征,发现支持向量机(support vector machine,SVM)可对多动症成人和正常成人分类,但不能区分多动症儿童和正常儿童。因此,本文尝试研究基于径向基核函数的SVM是否能成功对干扰控制任务下的多动症儿童和正常儿童脑电信号进行分类,并与KNN进行对比研究。
本文基于一种经典的干扰控制试验任务Simon-spatial Stroop范例,对多动症和正常儿童的脑电信号进行了研究,首先采用PCA方法对预处理后的脑电信号进行了电极优化选择,然后根据不同刺激模式从所有受试的优化电极中选取出现率90%以上的电极作为共有电极,并提取共有电极潜伏期(200~450 ms)波幅的均值特征,最后用KNN和SVM分类器分类,尝试检测多动症儿童与正常儿童的脑电信号,并研究其差异性以辅助多动症儿童的临床个体化诊断。
1 方法
1.1 受试信息
14名多动症儿童,年龄8~11.4岁,平均年龄8.2岁,其中包括4名女孩,10名男孩,均来自苏州大学第三附属医院;16名正常儿童,年龄7.3~10.1岁,平均年龄8.8岁,其中包括10名女孩,6名男孩,均来自周边小学。多动症儿童均根据心理疾病的标准诊断和统计手册经过门诊专业诊断评估。根据瑞文推理测验和韦氏智力量表中国儿童修订版进行测试,所有受试的IQ≥80,无颅脑损伤、癫痫或其他精神疾病。所有受试视力或矫正视力正常,左右手能正常活动。
1.2 试验范例
本试验选取了经典的干扰控制任务Simon-spatial Stroop范例[16]。试验环境安静舒适,受试头戴电极帽坐在正对17英寸显示屏80 cm处的舒适椅上,水平和垂直视力翻转角均小于3。在详细的指导下,受试需要根据试验图片快速地做出准确、稳定的按键反应,并尽量减少眨眼次数。试验分三个阶段,前两个阶段为试验训练阶段,第三个阶段为正式试验阶段。试验刺激为3.5 cm×4.5 cm的白色向上或向下箭头。第一个训练阶段由15个向上箭头和15个向下的箭头组成。当向上的箭头出现时,要求受试用左手食指点击反应盒左键;当向下的箭头出现时,要求受试用右手食指点击反应盒右键。第二个训练阶段包含32个试验,箭头随机地出现在中心十字的左、右、上、下四个方向,构成四种不同的刺激模式:SmC-箭头的位置与反应按键相一致(如:向上的箭头位于中心十字的左侧,用左手食指点击左键;或向下的箭头位于中心十字的右侧,用右手食指点击右键);SmI-箭头的位置与反应按键相反(如:向上的箭头位于中心十字的右侧,用左手食指点击左键;或向下的箭头位于中心十字的左侧,用右手食指点击右键);StC-箭头的位置与方向一致(如:向上的箭头位于中心十字的上侧);StI-箭头的位置与方向不一致(如:向上的箭头位于中心十字的下侧)。正式试验由288个试验组成,分两个块呈现,每个块包括144个试验,SmC、SmI、StC和StI四种刺激模式等概率随机呈现,每个刺激呈现时间为1 000 ms,每次刺激之间的时间间隔从2 000、2 500、3 000或3 500 ms四个时段随机选取。第一个块呈现结束,受试可休息2 min。
1.3 脑电信号采集和预处理
实验设备为美国EGI公司生产的128导脑电信号采集系统,参考电极为平均参考,采集软件为Net Station,采样频率500 Hz,每个电极阻抗降至100 kΩ以下。脑电信号预处理使用EGI 4.5.6版的Net Station软件,数据重滤波范围是0.3~30 Hz,分段(-200~1 000 ms),基线校准(-200~0 ms)。通过窗口移动算法排除实验中噪声较多的导联和试验、按键不正确的试验、反应时间超出设定时间200~1 500 ms的试验,及眼动、眨眼或坏通道数量过多(> 10)的试验。
1.4 PCA算法
PCA方法考虑了锁定分段时间窗内所有观测信号的变化关系,可去掉脑电信号中的冗余信息[10]。针对预处理后的脑电数据通过PCA方法研究分段时间窗内各导联脑电信号的变化关系从而确定主成分分量,可选取显著信号成分对应的优化电极,实现数据降维[14]。为了不丢失信号的有效成分,本文选取了累积方差贡献率99%的优化电极,其余均被当成噪声成分。
1.5 分类器
1.5.1 KNN分类器
基于欧氏距离的KNN方法计算简单,根据特征空间中接近训练示例的对象进行分类[15]。提取多动症组和正常组儿童的共有电极潜伏期(200~450 ms)振幅的均值特征后,本文选用KNN分类器通过计算测试样本与训练样本的欧氏距离,根据同种刺激任务下单次试验逐一投票的方法判定测试样本所属类别。
1.5.2 SVM分类器
本研究选用SVM作为第二个分类器,尝试对干扰控制任务下多动症儿童和正常儿童的脑电信号分类。SVM是采用监督式的学习方法,其主要思想是将输入向量映射到高维的特征向量空间,并在该特征空间中构造最优分类面[18]。在分类研究过程中,为了建立分类器模型,本文随机选择70%的特征样本作为训练样本,剩下样本用来测试。为了测试分类器的稳定性,本文尝试了多次运算。其具体步骤如下。
步骤一:给出两组受试的脑电信号特征作为输入样本X以及与之对应的期望输出类别Y。其表达式如下:
$ \boldsymbol{X}=\left[ {{x_1}\; \;{x_2}\; \; \cdots \; {x_N}} \right] $ |
$ \boldsymbol{Y}=\left[ {{y_1}\; \;{y_2}\; \; \cdots \; {y_N}} \right]\; \;\; \;{y_i} \in \left\{ { + 1, -1} \right\} $ |
xi(i=1, 2, …, N)为提取的脑电信号特征向量,其中+1表示正常儿童,-1代表多动症儿童。
步骤二:为使分类面尽可能对所有信号样本正确分类并具备分类间隔,需在约束条件c=0和ai≥0 (i=1, 2, …, N)下,求得分类面的最大差值d,从而得到最优解ai*。为了解决该约束最优化问题,可引入Lagrange函数进行约束优化[18]。约束条件和分类面的最大差值表达式如下:
$ c=\sum\limits_{i=1}^N {{y_i} \cdot {a_i}} $ |
$ d=\sum\limits_{i=1}^N {{a_i}}-\frac{1}{2}\sum\limits_{i, j=1}^N {{a_i} \cdot {a_j}} \cdot {y_i} \cdot {y_j} \cdot \left({{x_i} \cdot {x_j}} \right) $ |
步骤三:根据特定的支持向量xN计算出信号的最优权值向量w*和最优偏执向量b*:
$ {\boldsymbol{w}^*}=\sum\limits_{i=1}^N {{a_i}} \cdot {y_i} \cdot {x_i} $ |
$ {\boldsymbol{b}^*}=\frac{1}{{{y_N}}}-{\boldsymbol{w}^*} \cdot {x_N} $ |
步骤四:本文选择径向基核函数K(xi, xj),通过计算求得分类函数f(x)的值,计算式如下:
$ \begin{array}{*{20}{c}} {f\left(x \right)={\mathop{\rm sgn}} \left({\sum\limits_{i=1}^N {{a_i}^*} \cdot {y_i} \cdot K \cdot \left({{x_i}, x} \right) + {b^*}} \right) \cdot \sum\limits_{i, j=1}^N {{a_i} \cdot {a_j}} }\ { \cdot {y_i} \cdot {y_j} \cdot \left({{x_i} \cdot {x_j}} \right)} \end{array} $ |
根据f(x)的值为+1或-1,判断出测试信号样本所属类别,与期望输出类别进行对比,即可求出分类准确率。
2 结果
2.1 行为测试结果
多动症儿童和正常儿童的行为数据结果如表 1所示,与不协调的试验任务相比,在协调一致的任务中所有受试均表现出更高的反应正确率和更短的反应时间;在同种任务中多动症儿童比正常儿童表现出更高的出错率和更长的反应时间,且多动症儿童的稳定性更差。

2.2 电极选择结果
每个受试预处理后的脑电信号为128导,经PCA方法选择累计方差贡献率99%的主成分后,排除了75%左右的导联,减少了电极个数,提高了数据分析的效率。根据不同刺激模式,从所有受试的优化电极中选取出现率90%以上的电极作为共有电极,选取的共有优化电极如表 2所示。

四种刺激模式下的共有电极均位于前额叶脑区和顶枕叶脑区,随着出现率的提高共有电极个数会减少。为了研究不同出现率的共有电极对分类结果的影响,根据潜伏期(200~450 ms)振幅均值特征,本文采用KNN分类器进行了分类。如表 2所示,根据SmI和StI刺激任务所选的共有电极进行分类时,分类正确率相对较高,该两种刺激模式下多动症儿童和正常儿童的前额叶脑区和顶枕叶脑区的脑电信号表现出更明显的差异。
为了进一步研究两组受试前额叶和顶枕叶脑区的事件相关电位,分别对四种刺激模式下优化电极出现率100%的共有电极的脑电信号进行了组内叠加平均。四种刺激模式下两组受试分别叠加平均后的脑电信号时域波形图如图 1所示,可见在四种刺激任务下多动症儿童和正常儿童的前额叶脑区均有N2(200~450 ms),而在顶枕区均有P2出现;在同种任务中多动症儿童的N2和P2振幅峰值比正常儿童低,但其差异显著性有待进一步研究。

2.3 分类结果
由于不同的刺激模式下不同共有电极的分类准确率不同,当选用StI刺激模式优化电极出现率96%的顶枕叶电极进行分类时分类准确率达到最高。因此对SmI和StI两种刺激模式出现率96%以上的共有电极潜伏期振幅均值特征,本文采用了SVM分类器与KNN分类器分类对比,结果如表 3所示。

如表 3所示,两种刺激模式下KNN分类器的分类准确率高于SVM;当选用顶枕叶共有电极进行分类时分类准确率较高,StI刺激模式下KNN分类器的分类准确率最高可达89.29%,而SVM最高分类准确率只有60.50%。
3 讨论
本文尝试采用脑电信号检测方法辅助多动症儿童临床个体化诊断。前人报道了多动症受损的干扰控制能力[6, 8]。因此,本文基于干扰控制任务Simon-spatial Stroop试验范例,采集了30名受试的脑电信号,针对预处理后的脑电数据,首先采用PCA方法筛选了优化电极(累计贡献率≥99%),减少了分析数据的维度,提高了运算效率。研究发现主成分相关电极主要位于前额叶和顶枕叶脑区。四种刺激模式下,多动症儿童与正常儿童前额叶均有N2(200~450 ms),顶枕叶均有P2,且同种刺激模式下两组受试的N2和P2峰值表现出差异性。在研究优化电极出现率的过程中,由于数据集的限制,90%是设定的阈值下限,若阈值小于90%会筛选出更多电极,使得筛选出的这些电极中有部分电极并不属于某些受试的优化电极,从而无法体现分段时间窗内不同电极贡献率高低的差异性。若受试数量较多,可研究分段时间窗内不同累积贡献率所选电极分类结果。
在特征提取方面,本文主要研究脑电信号潜伏期时域特性,结合了两组受试在行为测试中的反应差异,在前人研究报道基础上[16],根据两组受试在干扰控制试验任务中表现出的N2和P2潜伏期特征尝试了试验筛选,有效地排除了受试做出正确按键反应但不满足该特征的试验数据,一定程度上减少了数据运算量。后期的研究可从干扰控制任务组合和特征组合方面展开,也可结合频域特征或其他非线性特征研究多动症儿童和正常儿童的脑电信号差异性。如表 2所示,针对SmI和StI两种试验任务运用SVM分类器和KNN分类器分类对比,KNN取得了较好的结果,在后期的研究中可从优化权重的投票方法深入。基于径向基核函数的SVM分类器分类准确率较低,与Poila等[17]的研究结果一致,但稳定性较好,不失为后期深入研究的基础。
总之,本文研究了干扰控制任务中多动症儿童和正常儿童脑电信号,通过PCA方法实现了脑电信号降维,并运用KNN和SVM分类器进行了分类对比,KNN取得的最高的分类准确率为89.29%。研究初步认为,干扰控制试验中多动症儿童与正常儿童的前额叶及顶枕叶脑电信号存在差异,为多动症儿童临床个体化诊断和脑神经缺陷机制基础研究提供了一定的科学依据。