胎儿心电信号提取对围产期胎儿监护具备重要意义。为提高胎儿心电信号的预测精度,本文提出一种基于遗传算法(GA)优化的长短时记忆(LSTM)网络胎儿心电信号提取方法(GA-LSTM)。首先根据母体腹壁混合心电信号的特征,利用 GA 的全局搜索能力对 LSTM 网络中隐层神经元个数、学习率和训练次数进行寻优,计算参数的最优组合,使网络拓扑结构与母体腹壁混合信号的特征相匹配;然后,使用 GA 求出的最优网络参数构建 LSTM 网络模型,并利用 GA-LSTM 网络模型估计母体胸部心电信号传输到母体腹壁时的非线性变换;最后,利用母体胸部心电信号和 GA-LSTM 网络模型求得的非线性变换,估计腹壁信号中所含的母体心电信号,从腹壁混合信号中减去估计出的母体心电信号,得到纯净的胎儿心电信号。本文实验应用两个数据库的临床心电信号进行实验分析,最终结果表明:与传统归一化最小均方误差(NLMS)方法、支持向量机(SVM)方法、遗传算法支持向量机(GA-SVM)方法和 LSTM 网络方法相比,本文所提出的方法可以提取出更为清晰的胎儿心电信号,其准确率、灵敏度、精确性和总体概率均有较好的提高,表明本文方法可以提取出较为纯净的胎儿心电信号,对围产期胎儿健康监护具有一定的应用价值。
引用本文: 钱龙, 王文波, 陈贵词, 喻敏. 一种基于遗传算法优化的长短时记忆网络胎儿心电信号提取方法. 生物医学工程学杂志, 2021, 38(2): 257-267. doi: 10.7507/1001-5515.202004063 复制
引言
孕妇围产期胎儿监护对了解胎儿在子宫内的生长发育状况十分重要,通常采用胎音听诊、胎心率检测以及观测胎儿心电图的变化来诊断胎儿在母体子宫内的健康状况,后者通过分析心电图波形形态可以更早地发现妊娠期胎儿心脏的各种电生理活动是否异常。检测胎儿心电图中 QRS 波的变化可及时判断胎儿是否存在缺氧、脐带绕颈等妊娠期问题[1]。然而胎儿心电信号通常采用间接法从母亲腹壁获取,因而会包含多种噪声:电极干扰、母体心电信号成分以及基线漂移等[2]。所以,如何消除采集的胎儿心电信号所包含的噪声,从而分离出清晰的胎儿心电信号成为胎儿健康监护的一个重要研究内容[3]。
目前关于胎儿心电信号提取的方式提出了多种检测方法:① 独立成分分析法[4-5](independent component analysis,ICA)假定胎儿心电信号、母体心电信号以及噪声相互统计独立,从而建立 ICA 模型,在模型基础上提取胎儿心电信号,但是此方法不适合处理超高斯和亚高斯信号,而且容易陷入局部最优解。② 盲源提取技术[6-7]在各个源信号未知的条件下,从腹壁混合信号中分离得到胎儿的心电信号,但是在该模型中,胎儿心电信号的相关特征并未得到充分利用,导致提取的胎儿心电信号准确率较低且不能清楚地反映信号的生理学意义,而且该模型的算法对胎儿心电信号的时间延迟周期的依赖性较大,其心电信号提取性能具有局限性。③ 自适应滤波法[8-9]计算简单,但对于非平稳性胎儿心电信号的测量具有局限性。④ 匹配滤波法算法[10-11]对胎儿心电信号识别率低,容易出现误漏诊。⑤ 小波分解法[12-13]对小波基等参数的选择较为困难,不宜实时提取,而且对于母体心电信号和胎儿心电信号重叠的部分很难进行胎儿心电信号提取。⑥ 奇异值分解法[14-15]分解出的分矩阵解释性往往不强且分解矩阵随时间越来越大。⑦ 神经网络[16-18]和支持向量机方法[19]取得了较好的胎儿心电信号提取效果,但存在泛化能力弱、易落入部分最优值、网络结构设计难等问题。
近年来,循环神经网络(recurrent neural network,RNN)因处理时间序列信息功能强大而得到了发展。Hochreater 等[20]对 RNN 的单元结构进行改进提出了长短时记忆(long short term memory networks,LSTM)网络模型,通过设计“门”结构解决了梯度消失和梯度爆炸以及 RNN 信息记忆能力不足的问题,提示可采用远距离的时序信息[21]。LSTM 网络在语音识别[22]、文本处理[23]等领域已得到成功应用,却存在关键超参数,如隐层神经元数、学习率和训练次数等难以确定的缺陷[24]。因为隐含层神经元数对模型的拟合能力起着决定性作用,学习率和训练次数直接影响模型收敛速度和计算时长,所以 LSTM 网络的结构参数直接控制模型拓扑结构,因此采用不同的超参数建立的网络模型其预测性能具有较大差异,如何选择合适参数对于建立模型来说显得至关重要。目前,往往依赖研究者的经验和多次实验结果去选择网络模型的超参数,随机性较大,降低了模型的预测性能。
为了提取出纯净的胎儿心电信号,本文以 LSTM 网络模型为技术基础,研究建立了胎儿心电信号的提取模型。考虑到目前 LSTM 网络的胎儿心电信号提取模型的关键参数难以确定,利用遗传算法(genetic algorithm,GA)对 LSTM 网络的关键超参数进行优化。该模型以单通道母体的胸部心电信号作为神经网络的输入信号,以单通道母体的腹壁混合信号作为提取目标的输出信号,采用 GA 优化的 LSTM 网络来建立 GA-LSTM 网络模型来检测和评算母体胸部的心电信号传输到母体腹壁的最佳心电信号估计;在此基础上实现从母体腹壁混合信号分离出胎儿心电信号,并与目前经典的归一化最小均方误差(normalized least mean square algorithm,NLMS)方法、支持向量机(support vector machines,SVM)方法、GA-SVM、LSTM 双导联网络方法进行对比实验。最终,期望通过实验结果可以验证本文提出的方法能有效克服胎儿心电信号不易提取的难题,为今后围产期和妊娠期胎儿健康的长期监护提供一种可行的方法。
1 胎儿心电信号提取原理
目前普遍使用置电极法采集胎儿心电信号:在时刻 i,由置于孕妇胸部的电极采集孕妇胸部心电信号 mi,且同时刻由置于孕妇腹壁的电极采集孕妇腹壁混合信号 ui。而在孕妇腹壁心电信号 ui 中包含母体心电信号成分 si、胎儿心电信号 di 和噪声 zi 三类信号,三类信号函数关系如式(1)所示:
![]() |
其中,母体心电信号成分 si 是在时刻 i 由母体胸部心电信号 mi 经非线性变换传输到孕妇腹壁所形成的信号,所以腹壁混合信号中的母体心电信号成分 si 的相位和幅度等相关参数都会发生改变[19, 25],非线性变换函数关系如式(2)所示:
![]() |
式(2)中,f(·)表示心电信号的非线性变换函数。假设能求得 f(·)的最佳估计值 ,那么就能够利用 mi 求得 si 的最佳估计值
,因此从腹壁混合信号 ui 中消除母体心电信号成分的最佳估计值
就能得到仅含少量噪声的胎儿心电信号最佳估计值
,函数关系如式(3)所示:
![]() |
因此,对于胎儿心电信号提取,首先使用采集的胎儿心电信号数据集的部分样本作为训练数据集{(Mi,ui),i = 1,2,,l},求得输入信号 Mi 和目标输出信号 ui 之间的非线性变换函数 f(·)的最佳估计值
,其中信号 Mi 由母体胸部心电信号 mi 和它的 J 维时间导数构成[25]。本文选取 GA-LSTM 网络对非线性变换函数 f(·)进行拟合,首先利用训练集数据构建 GA-LSTM 网络模型,然后将测试集数据输入 GA-LSTM 网络模型,最后进行胎儿心电信号的提取。
如图 1 所示为该模型提取胎儿心电信号流程图,采用单导联母体胸部信号作为网络输入,单导联母体腹壁混合信号为目标输出,然后利用 GA-LSTM 网络模型估计母体胸部心电信号传至腹壁的最佳映射,将母体胸部信号的最佳估计从母体腹壁的混合信号中进行分离,即可分离提取得到最佳的胎儿心电信号的估计。

2 基于 GA 优化的 LSTM 网络
2.1 LSTM 网络
LSTM 网络解决了网络单元以链式方式链接的传统递归神经网络梯度消失和爆炸的问题,可有效提高学习时间[21]。在处理有关时间序列的预测和非线性映射问题中,具备记忆能力的 LSTM 网络模型表现出较强的优势[20, 22]。LSTM 网络结构中添加了一种叫做记忆单元(memory cell,mc)的结构来记忆过去的信息,并且增加了输入门(input gate,ig)、输出门(output gate,og)和遗忘门(forget gate,fg)三种门结构来控制历史信息的传递[21]。
LSTM 网络结构如图 2 所示。设网络输入为,隐层状态为
,网络在时刻 t,各个单元和门控的计算如式(4)~(9)所示:

![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
式(4)~(9)中,it、ft、ot 分别为输入门、遗忘门和输出门的计算;其中,输入门主要用来决定保留多少当前时刻的输入信息到当前时刻的单元状态;遗忘门主要用来决定保留多少上一时刻的单元状态 ct − 1 的信息到当前时刻单元状态 ct 中;输出门主要用来决定当前时刻的单元状态有多少输出。ht 为当前时刻网络最终输出,ht − 1 为上一时刻网络的输出, 为当前输入的单元状态;ct 为当前时刻的单元状态;wig、wfg、wcg、wog 分别为三个门控和单元状态的权重矩阵;big、bfg、bcg、bog 分别为各个门控和单元状态的偏置;σ(·)和 tanh(·)为传输函数,· 代表向量内积,符号
表示按元素相乘。
2.2 GA 优化的 LSTM 网络心电信号提取模型
GA 通常是计算机模拟达尔文生物进化论的生物科学研究算法,1977 年由 Holland 等[26]提出。在 GA 中关于种群的遗传演化中发现,以染色体作为种群遗传的主要载体,并且借助多种随机操作:基因选择、基因交叉和基因变异等,不断演化出一种新的解集种群,据个体适应度和选择函数的取值可以选择最优的种群个体,即为 GA 中优化问题的最优解。
本文利用 GA 对 LSTM 网络的关键超参数进行寻优处理,采用 GA 强大的全局随机搜索能力,得到 LSTM 网络中神经元个数、学习率和训练次数的最优组合。基本思路如下:
(1)染色体编码
将 LSTM 网络中的隐藏层神经元数目、学习率和训练次数作为 GA 的初始化对象,通过实数编码形式进行染色体编码。隐藏层神经元的区间范围为[5,40],学习率的区间范围为[0.001,0.1],训练次数的区间范围为[50,500]。
(2)适应度函数
适应度函数的选择直接影响到 GA 优化后网络的性能,进而影响到胎儿心电信号的提取效果。本文主要从母亲心电信号估计值和真实值之间的整体拟合程度出发来构建适应度函数。假设孕妇胸部心电信号为 m,腹壁混合心电信号为 u,而腹壁心电信号 u 中包含母体心电信号成分 s、胎儿心电信号 d 和噪声 z,其数学关系如式(10)所示:
![]() |
式(10)中,母体心电信号成分 s 是由母体胸部心电信号 m 经非线性变换传输到孕妇腹壁所形成的心电信号,如式(11)所示:
![]() |
式(11)中,表示心电信号的非线性变换函数。假设能求得
的最佳估计值
,那么就能够利用
求得
的最佳估计值
(
),因此从腹壁混合信号
中消除母体心电信号成分的最佳估计值
就能得到仅含少量噪声的胎儿心电信号最佳估计值
,如式(12)所示:
![]() |
LSTM 估计出母亲心电信号 后,剩余心电信号
的均方误差如式(13)所示:
![]() |
考虑到胎儿心电信号、噪声信号与母体心电信号之间相互独立,且胎儿心电信号幅值较小[1-2],因此可得如式(14)所示:
![]() |
所以可得剩余心电信号 ,如式(15)所示:
![]() |
由式(15)可以看出,当 时,
达到最小值,此时
,也即通过非线性变换函数
求出了母体心电信号的最佳估计值
。因此,在利用 GA 优化非线性变换 LSTM 时,当均方误差函数达到最小值时,可以认为 LSTM 得到了母体心电信号的最优估计,也即此时对胎儿心电信号进行了最优提取。所以,本文中选择混合心电信号
与非线性估计信号
的均方误差作为 GA 优化时的适应度函数,如式(16)所示:
![]() |
式(16)中,fitness 为适应度函数值,N 为心电数据总量, 为母亲腹壁混合信号中母体心电信号的网络预测值,
为母亲腹壁混合信号的真实值。
(3)选择算子、交叉算子和变异算子
选择算子是在当前种群中选择适应性较好的个体作为亲本,并将遗传信息传递给子代。在这里采用锦标赛选择算法作为 GA 的选择策略。该选择算法具有高效的算法执行率和易于实现的特点,算法复杂度远低于其他选择策略且易于并行化,在选择过程中不易陷入局部个体最优点,并且不需要对所有个体的适应度值排序。
交叉算子使用洗牌交叉算法,在交叉之前在父代中利用随机排序函数进行洗牌运算,然后当在(0,1)之间产生的随机数小于所给的交叉率大小,则进行交叉变换。在变异算子中,当在(0,1)之间产生的随机数小于所给的变异率大小,则进行变异操作。
2.3 GA-LSTM 胎儿心电信号提取模型
本文将 GA 与 LSTM 网络相融合,构建基于 GA-LSTM 的胎儿心电信号提取模型。首先采用 GA 对 LSTM 网络的超参数作寻优处理,得出学习率、隐层神经元数和训练次数的最佳组合,进一步提高模型的非线性映射能力;然后利用寻优的参数组合构建的 GA-LSTM 模型作为母体胸部心电信号与腹壁混合信号之间的非线性变换函数 f(·);在此基础上应用非线性变换函数 f(·)求得母体胸部信号的最佳估计,最后从母体腹壁的混合信号中进行分离,即可分离提取得到最佳的胎儿心电信号的估计。模型具体操作流程如下:
(1)选择训练数据集。为了得到函数 f(·)的最佳拟合效果,GA-LSTM 模型的输入数据由母体心电信号 mi 及其 J 维时间导数构成,本文取 J = 2。GA-LSTM 模型的输入信号用向量 M 表示,目标输出信号用向量 u 表示,如式(17)所示:
![]() |
(2)利用 GA 优化 LSTM 网络参数。
a. 将 LSTM 网络模型中时间窗口大小、批处理大小、隐藏层单元数目作为优化对象,执行种群的初始化以及染色体编码与解码操作。
b. 计算初始种群中各个个体适应度大小;
c. 对染色体进行选择、交叉和变异操作;
d. 对染色体解码、计算种群内个体的适应度,在该算法中适应度越小,则越应保留该个体,否则淘汰该个体;
e. 若不符合遗传终止条件则回到 c 步;若符合遗传终止条件,则将 GA 求出的最优参数作为 LSTM 网络模型的最终参数;
(3)训练 GA-LSTM。将 u 和 M 输入最优参数组合的 GA-LSTM 网络,GA-LSTM 网络模型的输出为腹壁混合信号中的母体心电信号成分 s = f(M)。将目标信号 u 与输出信号 s 之差用误差信号 e 表示,即 e = u-s。GA-LSTM 网络模型根据均方误差最小化拟合误差 E(eTe),最终得到母体胸部心电信号经历非线性变换 f(·)传输到腹壁的最优拟合函数 。
(4)提取胎儿心电信号。将心电信号数据{(mi,ui),i = 1,2,···,N} 送入 GA-LSTM 模型,利用最优拟合函数 计算得到腹壁混合信号 ui 中的母体心电信号成分
。则胎儿心电信号
就可以利用下式计算:
。
3 实验与结果
3.1 模型评价标准
胎儿心电信号提取模型的性能通过灵敏度(sensitivity,Se)(以符号 Se 表示)、精确率(positive predictive value,Ppv)(以符号 Ppv 表示)、整体准确率(accuracy,Acc)(以符号 Acc 表示)和总体概率(F1-measure,F1)(以符号 F1 来表示)四个指标来衡量。每个指标的具体计算方法如式(18)~(21)所示[14]:
![]() |
![]() |
![]() |
![]() |
其中,真阳性(true positive,TP)(符号记为:TP)表示样本本来是阳性,被正确分类的样本个数,即正确检测到的胎儿心电信号个数;假阳性(false positive,FP)(符号记为:FP)表示样本本来是阴性,被错误分类为阳性的样本个数,即错误检测到的胎儿心电信号个数;假阴性(false negative,FN)(符号记为:FN)表示样本本来是阳性,被错误地分类为阴性的样本个数,即漏检的胎儿心电信号个数。
3.2 实验数据和实验方法
3.2.1 数据来源
在本文的研究中使用了两个不同的数据库来进行评估所提出方法的可行性以及提取性能。第一个数据库心电信号选取系统识别数据集(database for the identification of systems,DaISy)(网址:http://homes.esat.kuleuven.be/~smc/daisy/)进行研究,该数据库由鲁汶大学电工工程系的一个研究部门—斯塔迪乌斯(STADIUS)开发、维护和托管,可在 STADIUS 主页进行公开下载。DaISy 数据库由 de Lathauwer 等[16]提供,心电数据采样频率为 250 Hz,记录时长为 10 s,各通道心电数据长度为 2 500,采用电极放置法从孕妇体表获取八导联(chanel,ch)(ch1~ch8)心电信号,其中 ch1~ch5 导联记录孕妇腹部混合信号,ch6~ch8 导联记录孕妇胸部信号。第二个数据库由麻省理工学院计算生理学实验室提供并发布在生理网(PhysioNet)(网址:https://www.physionet.org)上的一个免费公开使用的医学研究数据库,实验选取 PhysioNet 中的无创胎儿心电数据库(non-invasive fetalelectrocardiogramdatabase)(网址:https://www.physionet.org/content/nifecgdb/1.0.0/),该数据库包含一系列 55 个多通道腹部无创胎儿心电信号记录,取自妊娠 21~40 周的单个受试者,每条记录包含 2 个胸部心电信号,3 或 4 个腹部心电信号,采样频率为 1 kHz。相比 DaISy 数据库,无创胎儿心电数据库中的腹部信号信噪比低,胎儿心电信号被严重污染,从中提取胎儿心电信号的难度更大。
3.2.2 实验方法
本文实验综合考虑模型运算复杂度、计算时长和提取性能,选择前 1 500 点数据{(mi,ui),i = 1,2,···,1 500}作为训练数据集,全部 2 500 点数据{(mi,ui),i = 1,2,···,2 500}作为测试数据集。NLMS 方法中,迭代步长设为 0.005,迭代次数设为 1 000。SVM 方法中选择径向基函数 作为核函数,核函数参数 σ 和惩罚系数 C 的取值分别为 C = 50,σ2 = 3。LSTM 网络中隐藏层神经元选为 30 个,迭代次数设为 400,学习率取为 0.01。
3.3 实验结果对比分析
3.3.1 数据预处理
DaIsy 数据集中的心电信号基本上没有基线漂移和其他噪声的影响,且可以明显看出母体和胎儿心电信号 QRS 波的位置,因此该数据在实验中可直接使用。而无创胎儿心电信号数据库包含的数据较多,本文选取组号为 ecgca244 心电信号进行实验,该组心电信号记录 6 个通道心电信号,包含 2 个胸部心电信号和 4 个腹部心电信号,因为该数据库心电信号噪声污染严重,所以对 6 个通道心电信号分别采用 3 阶高通和 3 阶低通巴特沃斯双向滤波器去除高频信号和低频信号。
3.3.2 胎儿心电信号提取在 DaISy 数据库可视化结果对比分析
首先将 ch1 和 ch8 导联心电信号作为两导联系统采集得的 ui 和 mi,然后将 GA-LSTM 方法与 NLMS 方法、SVM 方法、GA-SVM 方法和 LSTM 方法进行胎儿心电信号提取对比实验,实验结果如图 3 所示。

由图 3 可见:① NLMS 方法的胎儿心电信号的 QRS 波提取结果并不理想,在最终提取的胎儿心电信号效果图中仍混合部分母体的心电信号成分,如图 3 中 NLMS 方法子图红圈所示;② 在提取所得的母体心电信号和胎儿心电信号之间存在 QRS 波相互分离或者相互重叠的部分,其中采用 SVM、LSTM、GA-SVM 和 GA-LSTM 方法对胎儿心电信号进行提取可有效抑制母体心电信号成分的干扰。
为了更好地比较 SVM、GA-SVM、LSTM 和 GA-LSTM 四种胎儿心电信号提取方法的优劣,将图 3 的绿色方框处分别放大为如图 4、5 所示。


由图 4、图 5 可见:① 采用 SVM、GA-SVM 和 LSTM 方法对胎儿心电信号的 QRS 波进行提取,所得结果中仍混合部分母体心电信号成分(如图 4、图 5 中绿色方框所示);② 采用 GA-LSTM 方法可有效消除母体腹壁混合信号中关于母体的心电信号成分,原因在于 GA 算法求出了更优的网络参数组合,使得本文方法性能优于基于 SVM、GA-SVM 和 LSTM 的胎儿心电信号提取方法。
3.3.3 DaISy 数据集性能指标对比分析
为了定量研究 GA-LSTM 模型在 DaISy 数据集上的提取效果,采用 Se、Ppv、Acc 和 F1 四个指标来进行定量分析[14]。用 DaISy 数据集中 ch1~ch5 共 5 个通道孕妇腹壁心电信号数据进行统计分析,该数据集中每个通道记录有 22 个胎儿心电信号 QRS 波,本文统计五个通道共 110 个胎儿心电信号 QRS 波。五种方法的统计分析结果如表 1 所示。

由表 1 可知,GA-LSTM 心电信号提取模型在五组腹壁心电数据上的提取性能最好,该模型可以提取到 105 个胎儿心电信号 QRS 波,误检 3 个 QRS 波,漏检 5 个 QRS 波,并且 Acc 为 92.92%,Se 为 95.45%,Ppv 为 97.22%,F1 为 96.33%。NLMS 模型能够提取到 96 个胎儿心电信号 QRS 波,误检 9 个 QRS 波,漏检 14 个 QRS 波,且 Acc 为 80.67%,Se、Ppv 和 F1 分别为 87.27%、91.43% 和 89.30%,四项统计指标都相对较低,原因在于 NLMS 模型对胎儿心电信号适应性不强,尤其在母体心电信号与胎儿心电信号重叠部分,导致对胎儿心电信号的识别率较低。SVM 模型可以提取到 98 个胎儿心电信号 QRS 波,误检 8 个 QRS 波,漏检 12 个 QRS 波,且 Acc 为 83.05%,Se 为 89.09%,Ppv 为 92.45%,F1 为 90.07%,可见 SVM 模型对胎儿心电信号提取的性能并不突出,这是由于 SVM 存在泛化能力弱,易陷入局部极值的原因。GA-SVM 方法可以提取到 102 个胎儿心电信号 QRS 波,误检 6 个 QRS 波,漏检 8 个 QRS 波,且 Acc 为 87.93%,Se 为 92.73%,Ppv 为 94.44%,F1 为 93.58%,可见即使采用 GA 对 SVM 的超参数进行优化,该模型的心电信号提取性能也并不突出。LSTM 模型可以提取到 103 个胎儿心电信号 QRS 波,误检 5 个 QRS 波,漏检 7 个 QRS 波,并且 Acc 为 88.79%,Se 为 93.64%,Ppv 为 94.50%,F1 为 94.06%,该模型在胎儿心电信号提取实验中也表现出较强的优势,但其性能不及本文所提出的方法,这是因为 LSTM 模型的超参数很难人工取到最优值,从而使得模型提取性能低于 GA-LSTM 模型。可见利用 GA 先对 LSTM 网络模型的超参数进行寻优处理,然后利用最优参数组合构建 GA-LSTM 胎儿心电信号提取模型,可以有效提高胎儿心电信号提取的性能。
3.3.4 胎儿心电信号提取在无创胎儿心电信号数据库可视化结果对比分析
在无创胎儿心电信号数据库组号 ecgca244 中选取前 10 000 个数据进行可视化对比分析,实验结果如图 6 所示。

由图 6 可见:① NLMS 方法和 SVM 方法的胎儿心电信号的 QRS 波提取结果较差,在最终提取的胎儿心电信号效果图中仍混合较多的母体心电信号成分(如图 6 中红圈所示);② GA-SVM 模型在该数据集的提取效果也并不突出,其提取结果仍有部分母体心电信号成分;(如图 6 中绿色方框所示);③ 在母体心电信号和胎儿心电信号之间存在 QRS 波相互分离或者相互重叠的部分,其中采用 LSTM 和 GA-LSTM 的对胎儿心电信号进行提取可有效抑制母体心电信号成分的干扰,而 GA-LSTM 方法的提取性能更为突出,可以提取出更为清晰准确的胎儿心电信号。
3.3.5 无创胎儿心电信号数据库性能指标对比分析
在无创胎儿心电信号数据库中,已经明显地标注了胎儿心电信号 QRS 波的位置和个数,实验选取的前 10 000 个数据点中每组腹部通道包含 28 个 QRS 波,四组共 112 个胎儿心电信号 QRS 波。由表 2 可知,虽然该数据集受噪声污染和基线漂移影响严重,但 GA-LSTM 心电信号提取模型依然可以提取出较多的胎儿心电信号 QRS 波,漏检和误检的胎儿心电信号 QRS 波也较少,四项统计指标均优于其他四种方法,进一步证明了本文所提出方法的可行性。

3.3.6 网络实时性和推广性分析
实验采用 Windows 10(Microsoft,美国)系统进行,中央处理器(central processing unit,CPU)使用 2.90 GHz 的 i5 处理器,内存为 16.0 GB,实验软件使用 MATLAB 2019a(MathWorks,美国)的版本进行。在本文的实验中,初始种群数量设置为 40,最大迭代次数为 100 次,采用网络的训练时间和训练后的执行时间两部分来进行网络实时性与推广性方面的对比和讨论,实验结果如表 3 所示。

通过表 3 的对比分析可知,实验所采取的方法在网络构建时均需要消耗一定的时间,而网络结构的差异性使得网络训练时所用的时间也不同。从表 3 可以看出:① 网络训练阶段,NLMS 所需时间最短,SVM 方法和 LSTM 方法训练时间相当。加入了 GA 算法后,网络训练阶段的耗时提高了大约 2 倍,GA-SVM 方法和 GA-LSTM 方法的训练时长仍基本相同,约为 3 min。② 在网络执行阶段,SVM 方法耗时最长,本文方法(GA-LSTM)与其他方法相比,耗时并没有显著增加,而是略有降低。在 MATLAB2019a 环境下,本文方法执行阶段的耗时约为 0.4 s。
可以看出,在实际应用中,除了在程序启动训练阶段需要等待 3 min 左右,其他时间段都可以较快地获得胎儿心电信号提取结果。如果 C 等编译语言将算法写入硬件中运行,会进一步提高运行的速度。因此,本文方法在实时性方面可以满足一定场景下的需求,具有较好的推广性。
4 结论
本文以 LSTM 网络为基础构建 GA-LSTM 胎儿心电信号提取模型,采用 GA 对 LSTM 网络的超参数进行优化处理,有效提高了模型的预测性能,减少了人为确定超参数因素的影响。并选取两个临床实时数据集进行实验,实验表明,相比于传统的 NLMS、SVM、GA-SVM 和 LSTM 网络模型,本文所提出的 GA-LSTM 心电信号提取模型在 DaISy 数据集和无创胎儿心电信号数据集上均表现出更优的提取性能,能够提取出更加清晰的胎儿心电信号 QRS 波,误检和漏检的胎儿心电信号较少,具有很强的抗噪能力和泛化能力,很好地解决了胎儿心电信号不易提取的难题,为围产期和妊娠期胎儿健康监测提供了新方法,具有重要的临床应用价值,在胎儿心电信号提取的研究中具有较好的应用前景。
利益冲突声明:本文全体作者均声明不存在利益冲突。
引言
孕妇围产期胎儿监护对了解胎儿在子宫内的生长发育状况十分重要,通常采用胎音听诊、胎心率检测以及观测胎儿心电图的变化来诊断胎儿在母体子宫内的健康状况,后者通过分析心电图波形形态可以更早地发现妊娠期胎儿心脏的各种电生理活动是否异常。检测胎儿心电图中 QRS 波的变化可及时判断胎儿是否存在缺氧、脐带绕颈等妊娠期问题[1]。然而胎儿心电信号通常采用间接法从母亲腹壁获取,因而会包含多种噪声:电极干扰、母体心电信号成分以及基线漂移等[2]。所以,如何消除采集的胎儿心电信号所包含的噪声,从而分离出清晰的胎儿心电信号成为胎儿健康监护的一个重要研究内容[3]。
目前关于胎儿心电信号提取的方式提出了多种检测方法:① 独立成分分析法[4-5](independent component analysis,ICA)假定胎儿心电信号、母体心电信号以及噪声相互统计独立,从而建立 ICA 模型,在模型基础上提取胎儿心电信号,但是此方法不适合处理超高斯和亚高斯信号,而且容易陷入局部最优解。② 盲源提取技术[6-7]在各个源信号未知的条件下,从腹壁混合信号中分离得到胎儿的心电信号,但是在该模型中,胎儿心电信号的相关特征并未得到充分利用,导致提取的胎儿心电信号准确率较低且不能清楚地反映信号的生理学意义,而且该模型的算法对胎儿心电信号的时间延迟周期的依赖性较大,其心电信号提取性能具有局限性。③ 自适应滤波法[8-9]计算简单,但对于非平稳性胎儿心电信号的测量具有局限性。④ 匹配滤波法算法[10-11]对胎儿心电信号识别率低,容易出现误漏诊。⑤ 小波分解法[12-13]对小波基等参数的选择较为困难,不宜实时提取,而且对于母体心电信号和胎儿心电信号重叠的部分很难进行胎儿心电信号提取。⑥ 奇异值分解法[14-15]分解出的分矩阵解释性往往不强且分解矩阵随时间越来越大。⑦ 神经网络[16-18]和支持向量机方法[19]取得了较好的胎儿心电信号提取效果,但存在泛化能力弱、易落入部分最优值、网络结构设计难等问题。
近年来,循环神经网络(recurrent neural network,RNN)因处理时间序列信息功能强大而得到了发展。Hochreater 等[20]对 RNN 的单元结构进行改进提出了长短时记忆(long short term memory networks,LSTM)网络模型,通过设计“门”结构解决了梯度消失和梯度爆炸以及 RNN 信息记忆能力不足的问题,提示可采用远距离的时序信息[21]。LSTM 网络在语音识别[22]、文本处理[23]等领域已得到成功应用,却存在关键超参数,如隐层神经元数、学习率和训练次数等难以确定的缺陷[24]。因为隐含层神经元数对模型的拟合能力起着决定性作用,学习率和训练次数直接影响模型收敛速度和计算时长,所以 LSTM 网络的结构参数直接控制模型拓扑结构,因此采用不同的超参数建立的网络模型其预测性能具有较大差异,如何选择合适参数对于建立模型来说显得至关重要。目前,往往依赖研究者的经验和多次实验结果去选择网络模型的超参数,随机性较大,降低了模型的预测性能。
为了提取出纯净的胎儿心电信号,本文以 LSTM 网络模型为技术基础,研究建立了胎儿心电信号的提取模型。考虑到目前 LSTM 网络的胎儿心电信号提取模型的关键参数难以确定,利用遗传算法(genetic algorithm,GA)对 LSTM 网络的关键超参数进行优化。该模型以单通道母体的胸部心电信号作为神经网络的输入信号,以单通道母体的腹壁混合信号作为提取目标的输出信号,采用 GA 优化的 LSTM 网络来建立 GA-LSTM 网络模型来检测和评算母体胸部的心电信号传输到母体腹壁的最佳心电信号估计;在此基础上实现从母体腹壁混合信号分离出胎儿心电信号,并与目前经典的归一化最小均方误差(normalized least mean square algorithm,NLMS)方法、支持向量机(support vector machines,SVM)方法、GA-SVM、LSTM 双导联网络方法进行对比实验。最终,期望通过实验结果可以验证本文提出的方法能有效克服胎儿心电信号不易提取的难题,为今后围产期和妊娠期胎儿健康的长期监护提供一种可行的方法。
1 胎儿心电信号提取原理
目前普遍使用置电极法采集胎儿心电信号:在时刻 i,由置于孕妇胸部的电极采集孕妇胸部心电信号 mi,且同时刻由置于孕妇腹壁的电极采集孕妇腹壁混合信号 ui。而在孕妇腹壁心电信号 ui 中包含母体心电信号成分 si、胎儿心电信号 di 和噪声 zi 三类信号,三类信号函数关系如式(1)所示:
![]() |
其中,母体心电信号成分 si 是在时刻 i 由母体胸部心电信号 mi 经非线性变换传输到孕妇腹壁所形成的信号,所以腹壁混合信号中的母体心电信号成分 si 的相位和幅度等相关参数都会发生改变[19, 25],非线性变换函数关系如式(2)所示:
![]() |
式(2)中,f(·)表示心电信号的非线性变换函数。假设能求得 f(·)的最佳估计值 ,那么就能够利用 mi 求得 si 的最佳估计值
,因此从腹壁混合信号 ui 中消除母体心电信号成分的最佳估计值
就能得到仅含少量噪声的胎儿心电信号最佳估计值
,函数关系如式(3)所示:
![]() |
因此,对于胎儿心电信号提取,首先使用采集的胎儿心电信号数据集的部分样本作为训练数据集{(Mi,ui),i = 1,2,,l},求得输入信号 Mi 和目标输出信号 ui 之间的非线性变换函数 f(·)的最佳估计值
,其中信号 Mi 由母体胸部心电信号 mi 和它的 J 维时间导数构成[25]。本文选取 GA-LSTM 网络对非线性变换函数 f(·)进行拟合,首先利用训练集数据构建 GA-LSTM 网络模型,然后将测试集数据输入 GA-LSTM 网络模型,最后进行胎儿心电信号的提取。
如图 1 所示为该模型提取胎儿心电信号流程图,采用单导联母体胸部信号作为网络输入,单导联母体腹壁混合信号为目标输出,然后利用 GA-LSTM 网络模型估计母体胸部心电信号传至腹壁的最佳映射,将母体胸部信号的最佳估计从母体腹壁的混合信号中进行分离,即可分离提取得到最佳的胎儿心电信号的估计。

2 基于 GA 优化的 LSTM 网络
2.1 LSTM 网络
LSTM 网络解决了网络单元以链式方式链接的传统递归神经网络梯度消失和爆炸的问题,可有效提高学习时间[21]。在处理有关时间序列的预测和非线性映射问题中,具备记忆能力的 LSTM 网络模型表现出较强的优势[20, 22]。LSTM 网络结构中添加了一种叫做记忆单元(memory cell,mc)的结构来记忆过去的信息,并且增加了输入门(input gate,ig)、输出门(output gate,og)和遗忘门(forget gate,fg)三种门结构来控制历史信息的传递[21]。
LSTM 网络结构如图 2 所示。设网络输入为,隐层状态为
,网络在时刻 t,各个单元和门控的计算如式(4)~(9)所示:

![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
式(4)~(9)中,it、ft、ot 分别为输入门、遗忘门和输出门的计算;其中,输入门主要用来决定保留多少当前时刻的输入信息到当前时刻的单元状态;遗忘门主要用来决定保留多少上一时刻的单元状态 ct − 1 的信息到当前时刻单元状态 ct 中;输出门主要用来决定当前时刻的单元状态有多少输出。ht 为当前时刻网络最终输出,ht − 1 为上一时刻网络的输出, 为当前输入的单元状态;ct 为当前时刻的单元状态;wig、wfg、wcg、wog 分别为三个门控和单元状态的权重矩阵;big、bfg、bcg、bog 分别为各个门控和单元状态的偏置;σ(·)和 tanh(·)为传输函数,· 代表向量内积,符号
表示按元素相乘。
2.2 GA 优化的 LSTM 网络心电信号提取模型
GA 通常是计算机模拟达尔文生物进化论的生物科学研究算法,1977 年由 Holland 等[26]提出。在 GA 中关于种群的遗传演化中发现,以染色体作为种群遗传的主要载体,并且借助多种随机操作:基因选择、基因交叉和基因变异等,不断演化出一种新的解集种群,据个体适应度和选择函数的取值可以选择最优的种群个体,即为 GA 中优化问题的最优解。
本文利用 GA 对 LSTM 网络的关键超参数进行寻优处理,采用 GA 强大的全局随机搜索能力,得到 LSTM 网络中神经元个数、学习率和训练次数的最优组合。基本思路如下:
(1)染色体编码
将 LSTM 网络中的隐藏层神经元数目、学习率和训练次数作为 GA 的初始化对象,通过实数编码形式进行染色体编码。隐藏层神经元的区间范围为[5,40],学习率的区间范围为[0.001,0.1],训练次数的区间范围为[50,500]。
(2)适应度函数
适应度函数的选择直接影响到 GA 优化后网络的性能,进而影响到胎儿心电信号的提取效果。本文主要从母亲心电信号估计值和真实值之间的整体拟合程度出发来构建适应度函数。假设孕妇胸部心电信号为 m,腹壁混合心电信号为 u,而腹壁心电信号 u 中包含母体心电信号成分 s、胎儿心电信号 d 和噪声 z,其数学关系如式(10)所示:
![]() |
式(10)中,母体心电信号成分 s 是由母体胸部心电信号 m 经非线性变换传输到孕妇腹壁所形成的心电信号,如式(11)所示:
![]() |
式(11)中,表示心电信号的非线性变换函数。假设能求得
的最佳估计值
,那么就能够利用
求得
的最佳估计值
(
),因此从腹壁混合信号
中消除母体心电信号成分的最佳估计值
就能得到仅含少量噪声的胎儿心电信号最佳估计值
,如式(12)所示:
![]() |
LSTM 估计出母亲心电信号 后,剩余心电信号
的均方误差如式(13)所示:
![]() |
考虑到胎儿心电信号、噪声信号与母体心电信号之间相互独立,且胎儿心电信号幅值较小[1-2],因此可得如式(14)所示:
![]() |
所以可得剩余心电信号 ,如式(15)所示:
![]() |
由式(15)可以看出,当 时,
达到最小值,此时
,也即通过非线性变换函数
求出了母体心电信号的最佳估计值
。因此,在利用 GA 优化非线性变换 LSTM 时,当均方误差函数达到最小值时,可以认为 LSTM 得到了母体心电信号的最优估计,也即此时对胎儿心电信号进行了最优提取。所以,本文中选择混合心电信号
与非线性估计信号
的均方误差作为 GA 优化时的适应度函数,如式(16)所示:
![]() |
式(16)中,fitness 为适应度函数值,N 为心电数据总量, 为母亲腹壁混合信号中母体心电信号的网络预测值,
为母亲腹壁混合信号的真实值。
(3)选择算子、交叉算子和变异算子
选择算子是在当前种群中选择适应性较好的个体作为亲本,并将遗传信息传递给子代。在这里采用锦标赛选择算法作为 GA 的选择策略。该选择算法具有高效的算法执行率和易于实现的特点,算法复杂度远低于其他选择策略且易于并行化,在选择过程中不易陷入局部个体最优点,并且不需要对所有个体的适应度值排序。
交叉算子使用洗牌交叉算法,在交叉之前在父代中利用随机排序函数进行洗牌运算,然后当在(0,1)之间产生的随机数小于所给的交叉率大小,则进行交叉变换。在变异算子中,当在(0,1)之间产生的随机数小于所给的变异率大小,则进行变异操作。
2.3 GA-LSTM 胎儿心电信号提取模型
本文将 GA 与 LSTM 网络相融合,构建基于 GA-LSTM 的胎儿心电信号提取模型。首先采用 GA 对 LSTM 网络的超参数作寻优处理,得出学习率、隐层神经元数和训练次数的最佳组合,进一步提高模型的非线性映射能力;然后利用寻优的参数组合构建的 GA-LSTM 模型作为母体胸部心电信号与腹壁混合信号之间的非线性变换函数 f(·);在此基础上应用非线性变换函数 f(·)求得母体胸部信号的最佳估计,最后从母体腹壁的混合信号中进行分离,即可分离提取得到最佳的胎儿心电信号的估计。模型具体操作流程如下:
(1)选择训练数据集。为了得到函数 f(·)的最佳拟合效果,GA-LSTM 模型的输入数据由母体心电信号 mi 及其 J 维时间导数构成,本文取 J = 2。GA-LSTM 模型的输入信号用向量 M 表示,目标输出信号用向量 u 表示,如式(17)所示:
![]() |
(2)利用 GA 优化 LSTM 网络参数。
a. 将 LSTM 网络模型中时间窗口大小、批处理大小、隐藏层单元数目作为优化对象,执行种群的初始化以及染色体编码与解码操作。
b. 计算初始种群中各个个体适应度大小;
c. 对染色体进行选择、交叉和变异操作;
d. 对染色体解码、计算种群内个体的适应度,在该算法中适应度越小,则越应保留该个体,否则淘汰该个体;
e. 若不符合遗传终止条件则回到 c 步;若符合遗传终止条件,则将 GA 求出的最优参数作为 LSTM 网络模型的最终参数;
(3)训练 GA-LSTM。将 u 和 M 输入最优参数组合的 GA-LSTM 网络,GA-LSTM 网络模型的输出为腹壁混合信号中的母体心电信号成分 s = f(M)。将目标信号 u 与输出信号 s 之差用误差信号 e 表示,即 e = u-s。GA-LSTM 网络模型根据均方误差最小化拟合误差 E(eTe),最终得到母体胸部心电信号经历非线性变换 f(·)传输到腹壁的最优拟合函数 。
(4)提取胎儿心电信号。将心电信号数据{(mi,ui),i = 1,2,···,N} 送入 GA-LSTM 模型,利用最优拟合函数 计算得到腹壁混合信号 ui 中的母体心电信号成分
。则胎儿心电信号
就可以利用下式计算:
。
3 实验与结果
3.1 模型评价标准
胎儿心电信号提取模型的性能通过灵敏度(sensitivity,Se)(以符号 Se 表示)、精确率(positive predictive value,Ppv)(以符号 Ppv 表示)、整体准确率(accuracy,Acc)(以符号 Acc 表示)和总体概率(F1-measure,F1)(以符号 F1 来表示)四个指标来衡量。每个指标的具体计算方法如式(18)~(21)所示[14]:
![]() |
![]() |
![]() |
![]() |
其中,真阳性(true positive,TP)(符号记为:TP)表示样本本来是阳性,被正确分类的样本个数,即正确检测到的胎儿心电信号个数;假阳性(false positive,FP)(符号记为:FP)表示样本本来是阴性,被错误分类为阳性的样本个数,即错误检测到的胎儿心电信号个数;假阴性(false negative,FN)(符号记为:FN)表示样本本来是阳性,被错误地分类为阴性的样本个数,即漏检的胎儿心电信号个数。
3.2 实验数据和实验方法
3.2.1 数据来源
在本文的研究中使用了两个不同的数据库来进行评估所提出方法的可行性以及提取性能。第一个数据库心电信号选取系统识别数据集(database for the identification of systems,DaISy)(网址:http://homes.esat.kuleuven.be/~smc/daisy/)进行研究,该数据库由鲁汶大学电工工程系的一个研究部门—斯塔迪乌斯(STADIUS)开发、维护和托管,可在 STADIUS 主页进行公开下载。DaISy 数据库由 de Lathauwer 等[16]提供,心电数据采样频率为 250 Hz,记录时长为 10 s,各通道心电数据长度为 2 500,采用电极放置法从孕妇体表获取八导联(chanel,ch)(ch1~ch8)心电信号,其中 ch1~ch5 导联记录孕妇腹部混合信号,ch6~ch8 导联记录孕妇胸部信号。第二个数据库由麻省理工学院计算生理学实验室提供并发布在生理网(PhysioNet)(网址:https://www.physionet.org)上的一个免费公开使用的医学研究数据库,实验选取 PhysioNet 中的无创胎儿心电数据库(non-invasive fetalelectrocardiogramdatabase)(网址:https://www.physionet.org/content/nifecgdb/1.0.0/),该数据库包含一系列 55 个多通道腹部无创胎儿心电信号记录,取自妊娠 21~40 周的单个受试者,每条记录包含 2 个胸部心电信号,3 或 4 个腹部心电信号,采样频率为 1 kHz。相比 DaISy 数据库,无创胎儿心电数据库中的腹部信号信噪比低,胎儿心电信号被严重污染,从中提取胎儿心电信号的难度更大。
3.2.2 实验方法
本文实验综合考虑模型运算复杂度、计算时长和提取性能,选择前 1 500 点数据{(mi,ui),i = 1,2,···,1 500}作为训练数据集,全部 2 500 点数据{(mi,ui),i = 1,2,···,2 500}作为测试数据集。NLMS 方法中,迭代步长设为 0.005,迭代次数设为 1 000。SVM 方法中选择径向基函数 作为核函数,核函数参数 σ 和惩罚系数 C 的取值分别为 C = 50,σ2 = 3。LSTM 网络中隐藏层神经元选为 30 个,迭代次数设为 400,学习率取为 0.01。
3.3 实验结果对比分析
3.3.1 数据预处理
DaIsy 数据集中的心电信号基本上没有基线漂移和其他噪声的影响,且可以明显看出母体和胎儿心电信号 QRS 波的位置,因此该数据在实验中可直接使用。而无创胎儿心电信号数据库包含的数据较多,本文选取组号为 ecgca244 心电信号进行实验,该组心电信号记录 6 个通道心电信号,包含 2 个胸部心电信号和 4 个腹部心电信号,因为该数据库心电信号噪声污染严重,所以对 6 个通道心电信号分别采用 3 阶高通和 3 阶低通巴特沃斯双向滤波器去除高频信号和低频信号。
3.3.2 胎儿心电信号提取在 DaISy 数据库可视化结果对比分析
首先将 ch1 和 ch8 导联心电信号作为两导联系统采集得的 ui 和 mi,然后将 GA-LSTM 方法与 NLMS 方法、SVM 方法、GA-SVM 方法和 LSTM 方法进行胎儿心电信号提取对比实验,实验结果如图 3 所示。

由图 3 可见:① NLMS 方法的胎儿心电信号的 QRS 波提取结果并不理想,在最终提取的胎儿心电信号效果图中仍混合部分母体的心电信号成分,如图 3 中 NLMS 方法子图红圈所示;② 在提取所得的母体心电信号和胎儿心电信号之间存在 QRS 波相互分离或者相互重叠的部分,其中采用 SVM、LSTM、GA-SVM 和 GA-LSTM 方法对胎儿心电信号进行提取可有效抑制母体心电信号成分的干扰。
为了更好地比较 SVM、GA-SVM、LSTM 和 GA-LSTM 四种胎儿心电信号提取方法的优劣,将图 3 的绿色方框处分别放大为如图 4、5 所示。


由图 4、图 5 可见:① 采用 SVM、GA-SVM 和 LSTM 方法对胎儿心电信号的 QRS 波进行提取,所得结果中仍混合部分母体心电信号成分(如图 4、图 5 中绿色方框所示);② 采用 GA-LSTM 方法可有效消除母体腹壁混合信号中关于母体的心电信号成分,原因在于 GA 算法求出了更优的网络参数组合,使得本文方法性能优于基于 SVM、GA-SVM 和 LSTM 的胎儿心电信号提取方法。
3.3.3 DaISy 数据集性能指标对比分析
为了定量研究 GA-LSTM 模型在 DaISy 数据集上的提取效果,采用 Se、Ppv、Acc 和 F1 四个指标来进行定量分析[14]。用 DaISy 数据集中 ch1~ch5 共 5 个通道孕妇腹壁心电信号数据进行统计分析,该数据集中每个通道记录有 22 个胎儿心电信号 QRS 波,本文统计五个通道共 110 个胎儿心电信号 QRS 波。五种方法的统计分析结果如表 1 所示。

由表 1 可知,GA-LSTM 心电信号提取模型在五组腹壁心电数据上的提取性能最好,该模型可以提取到 105 个胎儿心电信号 QRS 波,误检 3 个 QRS 波,漏检 5 个 QRS 波,并且 Acc 为 92.92%,Se 为 95.45%,Ppv 为 97.22%,F1 为 96.33%。NLMS 模型能够提取到 96 个胎儿心电信号 QRS 波,误检 9 个 QRS 波,漏检 14 个 QRS 波,且 Acc 为 80.67%,Se、Ppv 和 F1 分别为 87.27%、91.43% 和 89.30%,四项统计指标都相对较低,原因在于 NLMS 模型对胎儿心电信号适应性不强,尤其在母体心电信号与胎儿心电信号重叠部分,导致对胎儿心电信号的识别率较低。SVM 模型可以提取到 98 个胎儿心电信号 QRS 波,误检 8 个 QRS 波,漏检 12 个 QRS 波,且 Acc 为 83.05%,Se 为 89.09%,Ppv 为 92.45%,F1 为 90.07%,可见 SVM 模型对胎儿心电信号提取的性能并不突出,这是由于 SVM 存在泛化能力弱,易陷入局部极值的原因。GA-SVM 方法可以提取到 102 个胎儿心电信号 QRS 波,误检 6 个 QRS 波,漏检 8 个 QRS 波,且 Acc 为 87.93%,Se 为 92.73%,Ppv 为 94.44%,F1 为 93.58%,可见即使采用 GA 对 SVM 的超参数进行优化,该模型的心电信号提取性能也并不突出。LSTM 模型可以提取到 103 个胎儿心电信号 QRS 波,误检 5 个 QRS 波,漏检 7 个 QRS 波,并且 Acc 为 88.79%,Se 为 93.64%,Ppv 为 94.50%,F1 为 94.06%,该模型在胎儿心电信号提取实验中也表现出较强的优势,但其性能不及本文所提出的方法,这是因为 LSTM 模型的超参数很难人工取到最优值,从而使得模型提取性能低于 GA-LSTM 模型。可见利用 GA 先对 LSTM 网络模型的超参数进行寻优处理,然后利用最优参数组合构建 GA-LSTM 胎儿心电信号提取模型,可以有效提高胎儿心电信号提取的性能。
3.3.4 胎儿心电信号提取在无创胎儿心电信号数据库可视化结果对比分析
在无创胎儿心电信号数据库组号 ecgca244 中选取前 10 000 个数据进行可视化对比分析,实验结果如图 6 所示。

由图 6 可见:① NLMS 方法和 SVM 方法的胎儿心电信号的 QRS 波提取结果较差,在最终提取的胎儿心电信号效果图中仍混合较多的母体心电信号成分(如图 6 中红圈所示);② GA-SVM 模型在该数据集的提取效果也并不突出,其提取结果仍有部分母体心电信号成分;(如图 6 中绿色方框所示);③ 在母体心电信号和胎儿心电信号之间存在 QRS 波相互分离或者相互重叠的部分,其中采用 LSTM 和 GA-LSTM 的对胎儿心电信号进行提取可有效抑制母体心电信号成分的干扰,而 GA-LSTM 方法的提取性能更为突出,可以提取出更为清晰准确的胎儿心电信号。
3.3.5 无创胎儿心电信号数据库性能指标对比分析
在无创胎儿心电信号数据库中,已经明显地标注了胎儿心电信号 QRS 波的位置和个数,实验选取的前 10 000 个数据点中每组腹部通道包含 28 个 QRS 波,四组共 112 个胎儿心电信号 QRS 波。由表 2 可知,虽然该数据集受噪声污染和基线漂移影响严重,但 GA-LSTM 心电信号提取模型依然可以提取出较多的胎儿心电信号 QRS 波,漏检和误检的胎儿心电信号 QRS 波也较少,四项统计指标均优于其他四种方法,进一步证明了本文所提出方法的可行性。

3.3.6 网络实时性和推广性分析
实验采用 Windows 10(Microsoft,美国)系统进行,中央处理器(central processing unit,CPU)使用 2.90 GHz 的 i5 处理器,内存为 16.0 GB,实验软件使用 MATLAB 2019a(MathWorks,美国)的版本进行。在本文的实验中,初始种群数量设置为 40,最大迭代次数为 100 次,采用网络的训练时间和训练后的执行时间两部分来进行网络实时性与推广性方面的对比和讨论,实验结果如表 3 所示。

通过表 3 的对比分析可知,实验所采取的方法在网络构建时均需要消耗一定的时间,而网络结构的差异性使得网络训练时所用的时间也不同。从表 3 可以看出:① 网络训练阶段,NLMS 所需时间最短,SVM 方法和 LSTM 方法训练时间相当。加入了 GA 算法后,网络训练阶段的耗时提高了大约 2 倍,GA-SVM 方法和 GA-LSTM 方法的训练时长仍基本相同,约为 3 min。② 在网络执行阶段,SVM 方法耗时最长,本文方法(GA-LSTM)与其他方法相比,耗时并没有显著增加,而是略有降低。在 MATLAB2019a 环境下,本文方法执行阶段的耗时约为 0.4 s。
可以看出,在实际应用中,除了在程序启动训练阶段需要等待 3 min 左右,其他时间段都可以较快地获得胎儿心电信号提取结果。如果 C 等编译语言将算法写入硬件中运行,会进一步提高运行的速度。因此,本文方法在实时性方面可以满足一定场景下的需求,具有较好的推广性。
4 结论
本文以 LSTM 网络为基础构建 GA-LSTM 胎儿心电信号提取模型,采用 GA 对 LSTM 网络的超参数进行优化处理,有效提高了模型的预测性能,减少了人为确定超参数因素的影响。并选取两个临床实时数据集进行实验,实验表明,相比于传统的 NLMS、SVM、GA-SVM 和 LSTM 网络模型,本文所提出的 GA-LSTM 心电信号提取模型在 DaISy 数据集和无创胎儿心电信号数据集上均表现出更优的提取性能,能够提取出更加清晰的胎儿心电信号 QRS 波,误检和漏检的胎儿心电信号较少,具有很强的抗噪能力和泛化能力,很好地解决了胎儿心电信号不易提取的难题,为围产期和妊娠期胎儿健康监测提供了新方法,具有重要的临床应用价值,在胎儿心电信号提取的研究中具有较好的应用前景。
利益冲突声明:本文全体作者均声明不存在利益冲突。