心房颤动(房颤)是危及生命的心脏病之一,其早期检测和治疗近年来备受医生关注。传统的房颤检测方式主要依靠医生对心电图的诊断,但长时间的心电信号分析非常耗时。本文设计出一种基于Inception模块的房颤检测模型,构建多分支检测通道来处理房颤时的心电图原始信号、梯度信号和频率信号。该模型利用梯度信号高效地提取QRS波段和RR间期特征,利用频率信号提取P波与f波特征,并使用原始信号补充丢失信息。Inception模块中多尺度卷积核提供多种感受视野,并对多分支结果进行综合分析,从而实现房颤的早期检测。相较于目前的机器学习算法仅利用RR间期和心率变异性等特征,本文提出的算法额外使用频率特征,充分利用信号中的信息;对于使用原始信号和频率信息的深度学习方法,本文提出强化QRS波段的方法,使网络更有效地提取特征,并通过多分支输入模式综合考虑房颤RR间期不规律和P波与f波特征信息。在麻省理工房颤数据集上的检测结果显示,患者间检测的准确率为96.89%,灵敏度为97.72%,特异性为95.88%。该模型表现出色,能够实现房颤的自动检测。
引用本文: 赵思宇, 刘明, 刘名起, 杨晓茹, 熊鹏, 张杰烁. 基于多分支多尺度卷积网络的心房颤动检测模型. 生物医学工程学杂志, 2024, 41(4): 700-707. doi: 10.7507/1001-5515.202303014 复制
0 引言
心房颤动(以下简称房颤)是一种由心房不规则收缩导致的心律失常[1]。根据世界卫生组织的报告,全球超过9 000万人患有房颤,80~89岁的人群中发病率超过10%[2]。超过三分之一的房颤患者无明显症状,这增加了卒中和死亡的风险[3-4]。使用非侵入性的心电图进行房颤诊断是一种实时且有效的方法[5]。因此,基于心电图特征的精准房颤检测是预防高致死率并发症的关键[6]。
目前,针对房颤时RR间期不齐的表现,Andersen等[7]提出结合卷积和递归网络的检测模型,从RR间期中提取特征来区分房颤和正常心律。Ramesh等[8]提出一维深度卷积网络,利用心率变异性对30 s信号进行分类。Liu等[9]设计了结合自注意机制的多尺度分组卷积网络,从RR间期中提取特征并将心电信号分为房颤或非房颤。然而,这些方法主要关注RR间期不齐特征,忽略了P波变为f波等特征。房颤诊断需综合考虑RR间期改变及f波特征,以提高检测的准确性和可靠性。
因此,针对房颤的病理特征,部分研究人员尝试信息融合方案。Rahul等[10]使用4 s心电信号和时频信息,使用长短期记忆网络区分房颤和非房颤。Shen等[11]提出一种结合人工提取的频率特征和网络提取的特征的方案,运用决策树、随机森林、梯度增强决策树等方法以提升模型的检测效果,实现房颤识别。季恒宇[12]提出多分支多尺度卷积网络,通过多尺度多分支网络提取关联性特征,结合极限学习机,提升对噪声和不平衡数据集的处理能力,实现心电信号的分类。Hirsch等[13]提取RR间期和心房活动的特征,利用增强树、随机森林和随机子空间方法进行分类,实现房颤的检测。Pereira等[14]使用RR间期和原始信号通过卷积网络,将信号分类为房颤和非房颤。尽管这些方法同时考虑了RR间期的不规则性、P波转变为f波的频率信息,但仍有遗漏。房颤时心脏表现为不规则且快速的跳动,可能导致f波与QRS段叠加,从而使QRS段的形态和振幅发生变化[15-16],出现的f波振幅也非固定[17-19]。此外,房颤常伴有阿斯曼现象的出现,表现为QRS段后有明显起伏。因此,QRS段的形态及RR间期内的形态变化也包含着诊断房颤的关键信息[20-22]。
针对重点关注RR间期和P波变为f波的信号频率信息而忽略了QRS段形态特征的问题,为了全面提取细节信息,部分研究人员选择直接以心电信号作为输入。Mousavi等[23]提出基于双向递归网络模型并结合注意力机制,将原始信号划分为不同波段进行分析,实现房颤和非房颤的分类。Petmezas等[24]采用单心拍作为输入,通过卷积和长短期记忆网络进行分析,并利用焦点损失函数来处理数据的不平衡问题,实现房颤的识别。Wang[25]使用4 s的原始信号作为输入,结合卷积和改进的Elman网络,有效地进行房颤检测。濮玉等[26]提出使用10 s原始信号作为输入,并在损失函数中增加超参数,以降低房颤检测的假阴性率。然而,这些方法面临一个共同的挑战,就是直接使用心电信号的网络模型在提取特征信息方面的效率并不总是理想的。
为解决使用RR间期丢失QRS段特征及原始信号无法高效提取特征的问题,本文提出基于梯度信息的QRS段信息强化方法。通过对原始心电信号求梯度,增强QRS段的形态特征,同时保留原始信号的振幅和形态,避免丢失QRS段病理信息。考虑到房颤时f波的振幅和形态不规则,以及持续时间不固定[1],算法采用多尺度卷积核和通过计算心电信号频率信息来提取f波特征,有效识别房颤发生时的f波信息。网络设计为多输入模型,同时处理原始信号、梯度信息和频率信息。通过混合损失函数训练网络,充分提取房颤患者心电信号中的病理特征,实现精准检测。
1 方法
本文介绍了一种基于心电信号的房颤检测方法。首先,对原始信号降噪以获取纯净的心电信号,通过计算梯度强化QRS段的形态,使用带窗函数的短时傅里叶变换稳定提取P波和f波的信息。然后,原始信号、梯度信息和频率信息一同输入网络,通过多种卷积核提取不同视野的特征,进行特征融合,最终将信号分类为房颤或非房颤,多分支输入分类网络结构如图1所示。

1.1 数据集介绍
本文利用MIT-BIH数据集测试模型性能。该数据包含23名房颤患者的心电图记录。记录的平均时长为10.19 h,采样频率为250 Hz,包括房颤和健康状态下的数据。每名患者提供两条非固定通道的心电信息,数据集经过专业医生标注[27]。
1.2 数据预处理
本文利用离散小波分解,去除心电信号采集过程中受到的基线漂移和肌电干扰,以获得干净心电信号[28-29](具体降噪过程参见附件1)。然后将干净心电信号分为6 s的心电片段,并对每个片段进行正则化处理,正则化后心电信号记为data,计算如式(1)所示。
![]() |
式中,为干净的6 s心电信号,datamean为
的均值,datastd为
的方差,max为
的最大值,min为
的最小值。正则化后,计算data的梯度信号以实现QRS段增强。梯度信号的计算如式(2)所示。
![]() |
式中,gradi表示心电信号第i点的梯度信息,datai表示心电信号第i点的原始数据信息,t表示采样间隔。窦性心律和房颤信号增强后的结果如图2所示,梯度信息中QRS段相比原始信号更尖锐,并且对比可知房颤信号在增强QRS信息后的RR间期不规则性更明显。

考虑到房颤患者的P波会转变为f波,引起信号频率和RR间期发生变化,因此心电信号的频率信息提取至关重要。为了稳定有效地计算每个时间段的频率信息,本研究采用带窗函数的短时傅里叶变换。采样频率为250 Hz,窗口大小为128,重叠采样点数为64,变换后的信息按时间顺序展开。窦性心律和房颤信号的短时傅里叶变换结果如图3所示,展示图片未展开成一维。正常心电信号P波主要集中在0.5~4 Hz,而房颤时出现的f波主要集中在4~10 Hz。与正常信号相比,房颤信号中明显出现了更多4~10 Hz的频率分量[30]。频率信息的计算如式(3)所示。

![]() |
式中,STFT表示短时傅里叶变换的结果,data表示心电信号,为128个采样点的汉宁窗。
1.3 数据说明
在患者内的验证方案中,本文采用十折交叉验证划分数据集,具体数据分布如表1所示。总数据集包含111 840组数据,划分为十个子集,测试集包含11 184组数据,训练集包含100 656组数据。本文基于15名提供肢导信号的患者展开患者间验证实验,采用五折交叉验证划分数据集,具体数据分布如表2所示。15名患者被随机分为5组,每次训练和验证选择12人,测试3人,确保训练集和测试集中无重叠。


1.4 网络设计
本文网络主要由Inception模块构建[31],Inception模块包括四个并行通道(具体结构图参见附件2)。Inception模块各层参数如表3所示,四个通道提取的特征按比例4∶2∶1∶1分布,经过各通道处理后的特征在特征维度上进行拼接。

本文采用的多分支网络结构如图4所示,包含三个信息输入通道,分别处理原始心电信号、梯度信息和频率信息。网络首先从这些输入中提取特征,然后将这些特征进行融合,最终完成房颤和非房颤的分类。以预处理的心电信号为例,信号首先输入基础网络,通过三个通道提取特征,每个通道结合了Inception模块和传统卷积。提取的特征经拼接后,通过Inception模块进行融合,并使用全连接层进行分类[32]。该基础网络模块能够有效提取心电信号的特征,实现准确分类。

同样的基础网络用于处理梯度信息和频率信息,提取RR间期特征与频率特征,并获得分类结果。心电信号、梯度信号和频率信号提取到的特征在特征维度上拼接后,通过Inception和卷积进行特征融合,最终使用全连接层进行分类。四种分类结果的损失通过交叉熵计算,最后将这四个损失相加得到最终损失值。
考虑到QRS段、P波和f波的持续时间不同,网络使用多种尺寸的卷积核,以适应不同波段并提供多样化的感受视野来提取特征。通过Inception模块的堆叠策略,提供1~95长度范围内的感受视野,相当于0~0.384 s的心电信号长度,覆盖QRS段、ST段、P波和f波等关键波段,从而有效提取关键特征信息。表4详细说明了信号在经过网络各层后的维度变化和感受视野范围。

在房颤患者的心电图中,主要特征是RR间期不规律以及P波消失转变为f波。针对RR间期的不规律性,结合网络梯度传递的特点,使用Grad-CAM算法计算输入层的梯度信息,原始信号与梯度信息敏感度对比如图5所示。梯度信息的反向传播主要集中在心电信号波动较大的区域,这些位置的参数敏感度变化速度较大,使网络能够依赖这些区域进行快速优化。

1.5 网络训练
本文采用混合损失函数进行网络训练。网络使用Adam优化器进行优化,初始学习率设定为0.000 05,随着训练轮数增加逐步降低至0.000 001。从loss1到loss4所有的损失函数都采用交叉熵计算。每一个分支的损失函数lossj(j = 1,2,3,4)采用交叉熵进行计算,如式(4)所示。总损失函数由三个基础网络和特征融合的损失函数相加而成,均为交叉熵形式。总loss由式(5)得到。
![]() |
![]() |
式中,表示不同分支的误差函数,N表示每次训练使用的数据组数,
表示样本i的标签,
表示样本i预测为正类的概率。
2 实验及结果分析
为比较现有模型,本文在患者内和患者间两种验证框架下进行实验。患者内实验评估模型在包含患者历史信息时的性能,有助于开发个性化健康管理方案。患者间实验评估模型的泛化能力,验证它在广泛患者群体中的有效性。实验验证在Ubuntu 22.04.4 LTS下完成,GPU为NVIDIA GeForce RTX
2.1 实验方法与评价指标
本文采用三个性能指标——准确率(ACC)、灵敏度(SE)和特异性(SP)来评估模型性能,如式(6)~(8)所示。灵敏度衡量模型正确检测出房颤的能力;特异性则评估模型检测非房颤状态的能力。
![]() |
![]() |
![]() |
在公式中,TP表示在样本中正确识别为房颤的案例数量,FP表示在样本中错误地识别为房颤的案例数量;TN表示在样本中正确识别为非房颤的案例数量,FN表示在样本中错误地识别为非房颤的案例数量。
2.2 实验结果及分析
考虑到模型的运行性能,本文模型的输入信号选择了6 s的心电片段(具体分析参见附件3)。本文提出的模型性能结果如表5所示。使用基础网络进行特征提取和分类任务中,梯度信息表现最佳,其次是原始信号,频率信息相对较弱。梯度信息之所以优越,是因为QRS段通过梯度处理后更锐化,而网络对快速变化的信息更敏感,可有效提取QRS段和RR间期相关特征。

原始信号的正确率、灵敏度和特异性虽优于频率信息,但不如梯度信息,因为其特征不够明显,增加了特征提取难度。频率信息虽能区分P波和f波的频率差异,但在提取QRS段形态和RR间期特征上有所不足,忽略了RR间期不规律性。通过特征融合,模型性能得到提升,其中原始信号和梯度信息融合表现最优,相互补充了QRS段和RR间期的特征;梯度与频率信息融合次之;而原始信号与频率信息融合虽增加了敏感度,但整体效果一般。
综合三种特征后,房颤检测结果最优,此时模型训练时间为676 min,单片段测试时间为0.48 s(其他条件下模型训练和测试时间参见附件4)。梯度信息可强化QRS段和RR间期特征,原始信号可补充形态信息,频率信息可增加P波和f波特征,多尺度设计则进一步提升了检测效果。可见,特征融合策略全面捕捉了关键性的心电图特征,提高了房颤检测的准确性。
3 讨论
比较本文提出方法与同类研究方法的性能,结果如表6所示。Andersen等[7]、Ramesh等[8]和Liu等[9]的研究主要侧重于使用RR间期和心率变异性作为输入,通过深度学习提取RR间期特征进行房颤分类。而本文方法不仅包括RR间期特征,还额外融合心电信号的频率特征。在同规模数据集的现有方法比较中,本文显示了更优的结果,说明通过综合RR间期和频率特征,能更有效地捕捉房颤关键特征,提高分类准确性。

Shen等[11]、Hirsch等[13]和Pereira等[14]也采用特征融合策略,但各有不足:Shen等[11]使用原始信号和频率信息,但在RR间期特征提取上不足;Hirsch等[13]和Pereira等[14]使用RR间期和心电信号,但未充分利用频率信息;Rahul等[10]则以频率信息为主,未充分提取RR间期信息。本文采用三通道信息输入,综合RR间期不规律性、P波与f波的频率差异及QRS段的形态信息,相较于上述方法取得更好的结果。尽管整体表现略低于Rahul等[10]的研究,但本文的数据量更大,具有更广泛的普适性。在患者间测试中,与Hirsch等[13]的正确率相近,但本文方法具有更好的灵敏度。
与Mousavi等[23]、Petmezas等[24]、Wang[25]和濮玉等[26]的研究比较,他们主要使用原始信号输入提取多种特征,但缺乏针对性。本文针对房颤的典型心电图表现,采用梯度信息提取QRS段和RR间期特征,利用频率信息识别P波和f波差异,同时用原始信号补充形态特征。多尺度卷积核可扩展感受视野,更有效地实现特征提取和融合。采用混合loss计算方法提高了模型的稳定性和计算效率,并在患者间测试中表现出优越性能,验证了方法的有效性。
4 结论
本文基于房颤患者心电信号的基本病理特征——RR间期不规律和P波消失转变为f波,使用基于Inception模块的网络进行研究。Inception模块通过提供更广泛的感受视野,有利于从原始心电信号、梯度信息和频率信息中分别提取不同波段的特征。利用多尺度卷积技术,本研究使用梯度信息来提取QRS段和RR间期的特征,使用频率信息来识别P波消失变为f波的特征,并以原始信号作为补充信息。通过这些融合后的特征进行房颤检测,实现患者间检测的准确率为96.89%,灵敏度为97.72%,特异性为95.88%。本文提出的模型展示出卓越的性能,能够有效地检测房颤。
重要声明
利益冲突声明:本文全体作者均声明不存在利益冲突。
作者贡献声明:赵思宇、刘名起主要负责算法程序设计、实验流程、数据记录与分析、论文撰写;刘明、杨晓茹、熊鹏、张杰烁主要负责提供实验指导、数据分析指导和论文审阅修订。
本文附件见本刊网站的电子版本(biomedeng.cn)。
0 引言
心房颤动(以下简称房颤)是一种由心房不规则收缩导致的心律失常[1]。根据世界卫生组织的报告,全球超过9 000万人患有房颤,80~89岁的人群中发病率超过10%[2]。超过三分之一的房颤患者无明显症状,这增加了卒中和死亡的风险[3-4]。使用非侵入性的心电图进行房颤诊断是一种实时且有效的方法[5]。因此,基于心电图特征的精准房颤检测是预防高致死率并发症的关键[6]。
目前,针对房颤时RR间期不齐的表现,Andersen等[7]提出结合卷积和递归网络的检测模型,从RR间期中提取特征来区分房颤和正常心律。Ramesh等[8]提出一维深度卷积网络,利用心率变异性对30 s信号进行分类。Liu等[9]设计了结合自注意机制的多尺度分组卷积网络,从RR间期中提取特征并将心电信号分为房颤或非房颤。然而,这些方法主要关注RR间期不齐特征,忽略了P波变为f波等特征。房颤诊断需综合考虑RR间期改变及f波特征,以提高检测的准确性和可靠性。
因此,针对房颤的病理特征,部分研究人员尝试信息融合方案。Rahul等[10]使用4 s心电信号和时频信息,使用长短期记忆网络区分房颤和非房颤。Shen等[11]提出一种结合人工提取的频率特征和网络提取的特征的方案,运用决策树、随机森林、梯度增强决策树等方法以提升模型的检测效果,实现房颤识别。季恒宇[12]提出多分支多尺度卷积网络,通过多尺度多分支网络提取关联性特征,结合极限学习机,提升对噪声和不平衡数据集的处理能力,实现心电信号的分类。Hirsch等[13]提取RR间期和心房活动的特征,利用增强树、随机森林和随机子空间方法进行分类,实现房颤的检测。Pereira等[14]使用RR间期和原始信号通过卷积网络,将信号分类为房颤和非房颤。尽管这些方法同时考虑了RR间期的不规则性、P波转变为f波的频率信息,但仍有遗漏。房颤时心脏表现为不规则且快速的跳动,可能导致f波与QRS段叠加,从而使QRS段的形态和振幅发生变化[15-16],出现的f波振幅也非固定[17-19]。此外,房颤常伴有阿斯曼现象的出现,表现为QRS段后有明显起伏。因此,QRS段的形态及RR间期内的形态变化也包含着诊断房颤的关键信息[20-22]。
针对重点关注RR间期和P波变为f波的信号频率信息而忽略了QRS段形态特征的问题,为了全面提取细节信息,部分研究人员选择直接以心电信号作为输入。Mousavi等[23]提出基于双向递归网络模型并结合注意力机制,将原始信号划分为不同波段进行分析,实现房颤和非房颤的分类。Petmezas等[24]采用单心拍作为输入,通过卷积和长短期记忆网络进行分析,并利用焦点损失函数来处理数据的不平衡问题,实现房颤的识别。Wang[25]使用4 s的原始信号作为输入,结合卷积和改进的Elman网络,有效地进行房颤检测。濮玉等[26]提出使用10 s原始信号作为输入,并在损失函数中增加超参数,以降低房颤检测的假阴性率。然而,这些方法面临一个共同的挑战,就是直接使用心电信号的网络模型在提取特征信息方面的效率并不总是理想的。
为解决使用RR间期丢失QRS段特征及原始信号无法高效提取特征的问题,本文提出基于梯度信息的QRS段信息强化方法。通过对原始心电信号求梯度,增强QRS段的形态特征,同时保留原始信号的振幅和形态,避免丢失QRS段病理信息。考虑到房颤时f波的振幅和形态不规则,以及持续时间不固定[1],算法采用多尺度卷积核和通过计算心电信号频率信息来提取f波特征,有效识别房颤发生时的f波信息。网络设计为多输入模型,同时处理原始信号、梯度信息和频率信息。通过混合损失函数训练网络,充分提取房颤患者心电信号中的病理特征,实现精准检测。
1 方法
本文介绍了一种基于心电信号的房颤检测方法。首先,对原始信号降噪以获取纯净的心电信号,通过计算梯度强化QRS段的形态,使用带窗函数的短时傅里叶变换稳定提取P波和f波的信息。然后,原始信号、梯度信息和频率信息一同输入网络,通过多种卷积核提取不同视野的特征,进行特征融合,最终将信号分类为房颤或非房颤,多分支输入分类网络结构如图1所示。

1.1 数据集介绍
本文利用MIT-BIH数据集测试模型性能。该数据包含23名房颤患者的心电图记录。记录的平均时长为10.19 h,采样频率为250 Hz,包括房颤和健康状态下的数据。每名患者提供两条非固定通道的心电信息,数据集经过专业医生标注[27]。
1.2 数据预处理
本文利用离散小波分解,去除心电信号采集过程中受到的基线漂移和肌电干扰,以获得干净心电信号[28-29](具体降噪过程参见附件1)。然后将干净心电信号分为6 s的心电片段,并对每个片段进行正则化处理,正则化后心电信号记为data,计算如式(1)所示。
![]() |
式中,为干净的6 s心电信号,datamean为
的均值,datastd为
的方差,max为
的最大值,min为
的最小值。正则化后,计算data的梯度信号以实现QRS段增强。梯度信号的计算如式(2)所示。
![]() |
式中,gradi表示心电信号第i点的梯度信息,datai表示心电信号第i点的原始数据信息,t表示采样间隔。窦性心律和房颤信号增强后的结果如图2所示,梯度信息中QRS段相比原始信号更尖锐,并且对比可知房颤信号在增强QRS信息后的RR间期不规则性更明显。

考虑到房颤患者的P波会转变为f波,引起信号频率和RR间期发生变化,因此心电信号的频率信息提取至关重要。为了稳定有效地计算每个时间段的频率信息,本研究采用带窗函数的短时傅里叶变换。采样频率为250 Hz,窗口大小为128,重叠采样点数为64,变换后的信息按时间顺序展开。窦性心律和房颤信号的短时傅里叶变换结果如图3所示,展示图片未展开成一维。正常心电信号P波主要集中在0.5~4 Hz,而房颤时出现的f波主要集中在4~10 Hz。与正常信号相比,房颤信号中明显出现了更多4~10 Hz的频率分量[30]。频率信息的计算如式(3)所示。

![]() |
式中,STFT表示短时傅里叶变换的结果,data表示心电信号,为128个采样点的汉宁窗。
1.3 数据说明
在患者内的验证方案中,本文采用十折交叉验证划分数据集,具体数据分布如表1所示。总数据集包含111 840组数据,划分为十个子集,测试集包含11 184组数据,训练集包含100 656组数据。本文基于15名提供肢导信号的患者展开患者间验证实验,采用五折交叉验证划分数据集,具体数据分布如表2所示。15名患者被随机分为5组,每次训练和验证选择12人,测试3人,确保训练集和测试集中无重叠。


1.4 网络设计
本文网络主要由Inception模块构建[31],Inception模块包括四个并行通道(具体结构图参见附件2)。Inception模块各层参数如表3所示,四个通道提取的特征按比例4∶2∶1∶1分布,经过各通道处理后的特征在特征维度上进行拼接。

本文采用的多分支网络结构如图4所示,包含三个信息输入通道,分别处理原始心电信号、梯度信息和频率信息。网络首先从这些输入中提取特征,然后将这些特征进行融合,最终完成房颤和非房颤的分类。以预处理的心电信号为例,信号首先输入基础网络,通过三个通道提取特征,每个通道结合了Inception模块和传统卷积。提取的特征经拼接后,通过Inception模块进行融合,并使用全连接层进行分类[32]。该基础网络模块能够有效提取心电信号的特征,实现准确分类。

同样的基础网络用于处理梯度信息和频率信息,提取RR间期特征与频率特征,并获得分类结果。心电信号、梯度信号和频率信号提取到的特征在特征维度上拼接后,通过Inception和卷积进行特征融合,最终使用全连接层进行分类。四种分类结果的损失通过交叉熵计算,最后将这四个损失相加得到最终损失值。
考虑到QRS段、P波和f波的持续时间不同,网络使用多种尺寸的卷积核,以适应不同波段并提供多样化的感受视野来提取特征。通过Inception模块的堆叠策略,提供1~95长度范围内的感受视野,相当于0~0.384 s的心电信号长度,覆盖QRS段、ST段、P波和f波等关键波段,从而有效提取关键特征信息。表4详细说明了信号在经过网络各层后的维度变化和感受视野范围。

在房颤患者的心电图中,主要特征是RR间期不规律以及P波消失转变为f波。针对RR间期的不规律性,结合网络梯度传递的特点,使用Grad-CAM算法计算输入层的梯度信息,原始信号与梯度信息敏感度对比如图5所示。梯度信息的反向传播主要集中在心电信号波动较大的区域,这些位置的参数敏感度变化速度较大,使网络能够依赖这些区域进行快速优化。

1.5 网络训练
本文采用混合损失函数进行网络训练。网络使用Adam优化器进行优化,初始学习率设定为0.000 05,随着训练轮数增加逐步降低至0.000 001。从loss1到loss4所有的损失函数都采用交叉熵计算。每一个分支的损失函数lossj(j = 1,2,3,4)采用交叉熵进行计算,如式(4)所示。总损失函数由三个基础网络和特征融合的损失函数相加而成,均为交叉熵形式。总loss由式(5)得到。
![]() |
![]() |
式中,表示不同分支的误差函数,N表示每次训练使用的数据组数,
表示样本i的标签,
表示样本i预测为正类的概率。
2 实验及结果分析
为比较现有模型,本文在患者内和患者间两种验证框架下进行实验。患者内实验评估模型在包含患者历史信息时的性能,有助于开发个性化健康管理方案。患者间实验评估模型的泛化能力,验证它在广泛患者群体中的有效性。实验验证在Ubuntu 22.04.4 LTS下完成,GPU为NVIDIA GeForce RTX
2.1 实验方法与评价指标
本文采用三个性能指标——准确率(ACC)、灵敏度(SE)和特异性(SP)来评估模型性能,如式(6)~(8)所示。灵敏度衡量模型正确检测出房颤的能力;特异性则评估模型检测非房颤状态的能力。
![]() |
![]() |
![]() |
在公式中,TP表示在样本中正确识别为房颤的案例数量,FP表示在样本中错误地识别为房颤的案例数量;TN表示在样本中正确识别为非房颤的案例数量,FN表示在样本中错误地识别为非房颤的案例数量。
2.2 实验结果及分析
考虑到模型的运行性能,本文模型的输入信号选择了6 s的心电片段(具体分析参见附件3)。本文提出的模型性能结果如表5所示。使用基础网络进行特征提取和分类任务中,梯度信息表现最佳,其次是原始信号,频率信息相对较弱。梯度信息之所以优越,是因为QRS段通过梯度处理后更锐化,而网络对快速变化的信息更敏感,可有效提取QRS段和RR间期相关特征。

原始信号的正确率、灵敏度和特异性虽优于频率信息,但不如梯度信息,因为其特征不够明显,增加了特征提取难度。频率信息虽能区分P波和f波的频率差异,但在提取QRS段形态和RR间期特征上有所不足,忽略了RR间期不规律性。通过特征融合,模型性能得到提升,其中原始信号和梯度信息融合表现最优,相互补充了QRS段和RR间期的特征;梯度与频率信息融合次之;而原始信号与频率信息融合虽增加了敏感度,但整体效果一般。
综合三种特征后,房颤检测结果最优,此时模型训练时间为676 min,单片段测试时间为0.48 s(其他条件下模型训练和测试时间参见附件4)。梯度信息可强化QRS段和RR间期特征,原始信号可补充形态信息,频率信息可增加P波和f波特征,多尺度设计则进一步提升了检测效果。可见,特征融合策略全面捕捉了关键性的心电图特征,提高了房颤检测的准确性。
3 讨论
比较本文提出方法与同类研究方法的性能,结果如表6所示。Andersen等[7]、Ramesh等[8]和Liu等[9]的研究主要侧重于使用RR间期和心率变异性作为输入,通过深度学习提取RR间期特征进行房颤分类。而本文方法不仅包括RR间期特征,还额外融合心电信号的频率特征。在同规模数据集的现有方法比较中,本文显示了更优的结果,说明通过综合RR间期和频率特征,能更有效地捕捉房颤关键特征,提高分类准确性。

Shen等[11]、Hirsch等[13]和Pereira等[14]也采用特征融合策略,但各有不足:Shen等[11]使用原始信号和频率信息,但在RR间期特征提取上不足;Hirsch等[13]和Pereira等[14]使用RR间期和心电信号,但未充分利用频率信息;Rahul等[10]则以频率信息为主,未充分提取RR间期信息。本文采用三通道信息输入,综合RR间期不规律性、P波与f波的频率差异及QRS段的形态信息,相较于上述方法取得更好的结果。尽管整体表现略低于Rahul等[10]的研究,但本文的数据量更大,具有更广泛的普适性。在患者间测试中,与Hirsch等[13]的正确率相近,但本文方法具有更好的灵敏度。
与Mousavi等[23]、Petmezas等[24]、Wang[25]和濮玉等[26]的研究比较,他们主要使用原始信号输入提取多种特征,但缺乏针对性。本文针对房颤的典型心电图表现,采用梯度信息提取QRS段和RR间期特征,利用频率信息识别P波和f波差异,同时用原始信号补充形态特征。多尺度卷积核可扩展感受视野,更有效地实现特征提取和融合。采用混合loss计算方法提高了模型的稳定性和计算效率,并在患者间测试中表现出优越性能,验证了方法的有效性。
4 结论
本文基于房颤患者心电信号的基本病理特征——RR间期不规律和P波消失转变为f波,使用基于Inception模块的网络进行研究。Inception模块通过提供更广泛的感受视野,有利于从原始心电信号、梯度信息和频率信息中分别提取不同波段的特征。利用多尺度卷积技术,本研究使用梯度信息来提取QRS段和RR间期的特征,使用频率信息来识别P波消失变为f波的特征,并以原始信号作为补充信息。通过这些融合后的特征进行房颤检测,实现患者间检测的准确率为96.89%,灵敏度为97.72%,特异性为95.88%。本文提出的模型展示出卓越的性能,能够有效地检测房颤。
重要声明
利益冲突声明:本文全体作者均声明不存在利益冲突。
作者贡献声明:赵思宇、刘名起主要负责算法程序设计、实验流程、数据记录与分析、论文撰写;刘明、杨晓茹、熊鹏、张杰烁主要负责提供实验指导、数据分析指导和论文审阅修订。
本文附件见本刊网站的电子版本(biomedeng.cn)。