引用本文: 林庄恒, 柴燕玲. 人工智能在结缔组织相关间质性肺疾病的应用及研究进展. 中国呼吸与危重监护杂志, 2024, 23(7): 529-532. doi: 10.7507/1671-6205.202310045 复制
人工智能(artificial intelligence,AI)是指模拟、延伸和扩展人的智能的理论、方法、技术及其应用系统[1]。近年来,AI在医学领域的应用引起了广泛关注,并在临床实践中得到越来越多的应用。随着大数据时代的到来,信息的爆炸性增长和生物医学数据的广泛可用性为AI提供了广阔的发展空间。在呼吸系统领域,AI已在疾病流行预测、协助诊断、慢病管理、预测预后、并发症、疗效和药物不良反应等方面展现了显著的效果[2]。AI正在逐步应用于结缔组织相关间质性肺疾病(connective tissue disease related interstitial lung disease,CTD-ILD)领域。在诊断方面,AI通过深度学习技术分析CT图像上的特征性表现,以鉴别间质性肺病,并自动分析和识别肺音特征,从而辅助医生进行精确的诊断。此外,AI还能预测疾病的发展趋势和可能的并发症,帮助医生制定更个性化的治疗方案。在药物治疗方面,AI能够根据患者的基因信息和疾病特征,预测哪种药物可能对患者更有效,从而避免不必要的试错。在预后评估方面,AI可以通过分析患者的临床数据和疾病进展情况,预测患者的预后情况,帮助医生和患者做出更明智的决策。然而,尽管AI在这一领域取得了重要的进展,但目前仍面临许多挑战和限制。本文将深入探讨AI在CTD-ILD诊断、治疗和预后评估中的应用,并对其未来的发展提出一些建设性的建议。
1 CTD-ILD的定义及AI的应用
间质性肺疾病(interstitial lung disease,ILD)是一组以肺泡单位炎症和间质纤维化为主要病变的肺部疾病,可以使多种结缔组织病(connective tissue disease,CTD)恶化,显著增加CTD患者的发病率和病死率[3-4]。其中,CTD包括系统性硬化症(systemic sclerosis,SSc)、类风湿性关节炎、多发性肌炎/皮肌炎、干燥综合征、系统性红斑狼疮、混合性结缔组织病和未分化结缔组织病[5-6]。其中,AI在CTD-ILD的主要应用包括深度学习和影像组学[1-2]。影像组学利用AI将医学影像转化为大量可挖掘的高通量影像学信息,可以挖掘大量人眼难以识别的定量特征(包括形状特征、灰度特征、纹理特征、小波特征等),并将定量特征与临床特征、蛋白质基因组信息和其他信息相结合[7-8]。不同于影像组学,深度学习的特征是在与临床问题的联合学习中得到的。基于卷积网络(convolutional neural network,CNN)的深度学习已应用于超声、X线片、电子计算机断层扫描、正电子发射计算机断层显像和磁共振成像等[9-10]。不仅如此,深度学习模型能够通过收集大量肺音数据进行训练,学习提取特征并进行分类、诊断。针对CTD-ILD的治疗和预后,利用深度学习技术也可以为病人提供合适的治疗方案、预测生存率等。
2 AI在CTD-ILD诊断中的应用
目前,AI技术已经广泛应用于影像学和临床医学领域,尤其在医学影像和肺音检测方面发挥了重要作用。CTD-ILD患者在疾病早期往往没有明显的症状,而高分辨率计算机断层扫描(high-resolution computed tomography,HRCT)仍是诊断ILD的金标准。然而,由于HRCT的辐射照射和高昂的费用,将其常规用于筛查并不可行[11]。因此,对于CTD-ILD的早期检测以及寻找新的诊断方法显得尤为重要。AI通过分析CT图像中的细微变化和纹理特征,可以检测到人眼无法察觉到的CT特征,这些特征包括正常肺组织、磨玻璃影、纤维化、肺气肿、结节、实变、蜂窝状改变等。通过深度学习算法和模式识别技术,AI可以学习和识别这些细微的特征,并提供更准确和全面的诊断和评估结果。Ohno等[12]利用机器学习的CT纹理分析,根据胸部CT图像对影像学结果进行分类,模型通过挖掘多种影像组学特征信息,能够显著提高观察者间的一致性,并在区分慢性阻塞性肺疾病、ILD或感染性疾病与正常肺部间具有更高的性能,总体区分准确率为94.9%。
据报道,Velcro啰音与肺纤维化之间存在密切相关性,肺音检测结合深度学习技术可以提供一种新的诊断策略。Dianat等[11]利用基于CNN的模型,从受结缔组织疾病影响的患者中获得肺音并分类,设计了三种最佳性能模型InceptionV3、DenseNet201和EfficientNetB3,其受试者操作特征曲线下面积(area under ROC curve,AUC)分别为0.93、0.95和0.96,总体准确率在85%~91%。InceptionV3在三种不同的情景中,即CNN处理原始数据(即没有去噪任务)且没有数据增强,CNN处理原始数据并进行数据增强,以及CNN处理去噪数据且没有数据增强的AUC分别为0.83、0.85和0.79。该技术显示在模型中使用去噪任务和数据增强方法可以显著提高性能。
由于众多AI术前模型均无法保证百分百的预测准确率,因此其主要还是作为一种辅助医生的工具,为医生在疾病诊断中提供参考。
3 AI在CTD-ILD治疗和预后中的应用
ILD严重程度和死亡风险分层的常用方法依赖于肺功能测试和HRCT上肺纤维化程度的测量。然而,有些患者可能无法完成肺功能测试,可能是因为身体状况不适合或无法配合测试要求。这就导致了依从性的缺乏,影响了肺功能测试结果的准确性[13]。CT通常保留给症状加重或肺功能恶化的患者[14]。在这种情况下,影像AI可以作为一种替代方法,通过分析胸部CT图像来评估肺部功能和疾病程度。Feng等[15]从1 029个具有预测价值的特征中选择了11个影像组学特征设计了RF和k-NN模型用于预测糖皮质激素联合或不联合环磷酰胺的治疗反应,在验证集中,RF和k-NN模型的AUC分别为0.66和0.61,当将临床数据整合到RF和k-NN模型中时,AUC分别提高至0.71和0.61。决策曲线分析显示,对于个体来说,如果预测的治疗反应率在50%~60%,糖皮质激素的使用是有益的。另外,高剂量的糖皮质激素和环磷酰胺显示出更好的疗效。
在预后方面,越来越多的研究者使用胸部CT来识别形态学变化,监测疾病进展或发现新的合并症[14]。Li等[16]利用选定的独立危险因素构建临床模型和18F-FDG PET/CT图像影像学模型来预测和早期诊断抗MDA5+DM相关快速进展型间质性肺疾病(rapidly progressive interstitial lung disease,RP-ILD),通过FDG摄取来预测RP-ILD时,受试者操作特征曲线(receiver operator characteristic curve,ROC曲线)分析显示AUC为0.944。当SUVmax≥2.4被用作预测RP-ILD的阈值时,诊断敏感性、特异性和准确性分别为100.0%、87.0%和90.0%。
在临床实践中,通常使用70%的用力肺活量占预计值百分比和HRCT上的20%的纤维化程度作为评估标准。然而,肺功能测试作为一种独立的检查方式在诊断目的上效果不如HRCT。为了弥补这种单一评估方式的局限性,Ley等[17]在2012年提出了一种被称为性别、年龄和肺功能的GAP评分和分期系统,该分期在慢性ILD患者中显示出了强大的预测能力。Jiang等[18]基于胸部CT图像建立了影像组学模型,并根据Rad评分和临床数据建立了列线图模型,用于预测CTD-ILD患者的GAP分期。训练集和测试集中的AUC分别为0.803和0.801。通过结合临床因素和影像组学特征的列线图模型,能够很好地区分GAP Ⅰ和GAP Ⅱ、GAP Ⅲ期,并提高了准确性。Martini等[19]利用基于纹理的影像组学特征检测SSc-ILD患者,并与仅基于HRCT的视觉分析相比较,以区分不同疾病阶段。在模型中结合蜂窝、肺气肿和支气管扩张,达到了最高的性能,AUC为0.86。预测GAP分期和纤维化程度的AUC为0.606。当对粗糙度得分进行ROC分析时,预测GAP阶段的AUC达到0.863。
尽管出现了针对性的治疗方法,但CTD-ILD仍然是SSc的主要死因,这仍是一个重要挑战,原因在于患者特定的疾病轨迹和进展速度的高度差异。在最近的一项研究中,Schniering等[20]提出了无监督聚类的方法,以识别并描述基于图像的患者群体。通过监督分析,他们利用放射组学特征得出了一个临床可应用的预后定量放射组学风险评分qRISSc,用于预测进展无生存期。该研究表明,基于放射组学的风险分层能够利用常规CT图像提供互补的表型、临床和预后信息,对SSc-ILD的临床决策产生了显著影响。
4 对AI辅助结缔组织相关间质性肺疾病今后研究的建议
随着AI技术的不断发展和应用,其在辅助CTD-ILD研究中的潜力逐渐展现出来。然而,目前对于AI在CTD-ILD领域的研究还相对有限,仍有许多值得深入探索的方向。在未来的研究中,我们提出以下几点建议。
4.1 重视高质量数据集的构建和再利用
构建强大且高效的AI模型需要依赖海量且高质量的数据集。然而,由于患者隐私、伦理和法律等问题,临床数据的可用性和共享程度大大受限。再加上不同数据来源的巨大异质性,以及预测模型研究的报告质量不佳,使得获取并利用高质量数据的过程充满挑战[21]。为了解决影像组学方法学的复杂性并简化其流程,2017年Lambin等[22]引入了一个名为(radiomics quality score,RQS)的“质量认证”机制,主要用于评估已发表研究成果的方法学质量[23]。Akinci D'Antonoli等[24]进一步引入了一种名为RadBase的可搜索影像组学研究数据库,以提高影像组学研究的可重复性。他们建议学术期刊采用可重复性标准模型,并对那些愿意分享模型、代码和数据的研究者给予奖励。通过实施这些措施可以推动影像组学研究的可重复性和持续性,从而进一步推动该领域的发展。
4.2 重视AI技术的创新、算法的优化以及AI模型的验证
技术的创新是推动AI技术进步的关键。传统图像分割是非监督学习,不需要标签信息。语义分割将图像分割成不同语义类别区域,实现高级别分析和理解,为图像处理和应用提供更多信息。传统CNN的全连接层会将二维图像特征压扁成一维的特征向量,丢失了空间信息,直接用于分割任务的效果并不理想。2015年,研究者提出了全卷积网络(fully convolutional network,FCN)的概念,以恢复丢失的空间信息为主线实现了更加高效的语义分割[25]。Chassagnon等[26]基于深度学习的方法,通过对SSc患者胸部CT扫描进行弹性配准检测肺萎缩以描绘ILD恶化,在视觉评估中发现具有恶化ILD的患者的Jacobian图显示了后部肺底的肺实质萎缩。TTe分类器在形态和功能恶化的检测中的准确率分别为80%和83%。相比CT,磁共振成像(magnetic resonance imaging,MRI)是一种无辐射的技术,能够评估纤维化的活性,并对肺形态的微小变化或肺功能的变化更敏感。然而,目前还没有研究将深度学习技术应用于MRI检测CTD-ILD[27]。此外,肺血管体积的变化可以作为SSc-ILD严重程度的生物标志物[28]。在肿瘤领域,已有学者利用同一患者不同序列的断层扫描图像提取静态特征,将其量化为新的动态特征以预测治疗效果[29]。能否借鉴该思路,应用于预后和疗效,值得进一步探索。
4.3 将ILD影像AI算法与临床实践相结合
AI算法的最终目标是应用于临床实践中,提高ILD的诊断准确性和治疗效果。为此,需要建立统一的临床实践指南和流程,以确保AI算法的正确应用和临床效果的评估。在应用AI于诊断时,需遵守法律上的严格产品责任标准,并要求临床医生适当地应用和实施。护理义务是临床医生对患者所负有的。患者必须充分了解使用AI的风险、益处和局限性。此外,还可能发生医疗过失,特别是当患者在没有专家指导的情况下使用基于互联网的应用程序或软件时。因此,在决策系统中还应考虑数据隐私和患者对软件的意见[30]。
5 展望
AI在CTD-ILD的应用正在取得显著进展,并展现出巨大的潜力。通过深度学习算法和大量的影像数据,AI可以准确地识别和定量评估肺部纤维化和炎症的程度,为医生提供更准确的诊断和治疗建议。未来,随着技术的不断发展和数据的不断积累, AI在结缔组织相关间质性肺疾病的应用前景广阔。
利益冲突:本文不涉及任何利益冲突。
人工智能(artificial intelligence,AI)是指模拟、延伸和扩展人的智能的理论、方法、技术及其应用系统[1]。近年来,AI在医学领域的应用引起了广泛关注,并在临床实践中得到越来越多的应用。随着大数据时代的到来,信息的爆炸性增长和生物医学数据的广泛可用性为AI提供了广阔的发展空间。在呼吸系统领域,AI已在疾病流行预测、协助诊断、慢病管理、预测预后、并发症、疗效和药物不良反应等方面展现了显著的效果[2]。AI正在逐步应用于结缔组织相关间质性肺疾病(connective tissue disease related interstitial lung disease,CTD-ILD)领域。在诊断方面,AI通过深度学习技术分析CT图像上的特征性表现,以鉴别间质性肺病,并自动分析和识别肺音特征,从而辅助医生进行精确的诊断。此外,AI还能预测疾病的发展趋势和可能的并发症,帮助医生制定更个性化的治疗方案。在药物治疗方面,AI能够根据患者的基因信息和疾病特征,预测哪种药物可能对患者更有效,从而避免不必要的试错。在预后评估方面,AI可以通过分析患者的临床数据和疾病进展情况,预测患者的预后情况,帮助医生和患者做出更明智的决策。然而,尽管AI在这一领域取得了重要的进展,但目前仍面临许多挑战和限制。本文将深入探讨AI在CTD-ILD诊断、治疗和预后评估中的应用,并对其未来的发展提出一些建设性的建议。
1 CTD-ILD的定义及AI的应用
间质性肺疾病(interstitial lung disease,ILD)是一组以肺泡单位炎症和间质纤维化为主要病变的肺部疾病,可以使多种结缔组织病(connective tissue disease,CTD)恶化,显著增加CTD患者的发病率和病死率[3-4]。其中,CTD包括系统性硬化症(systemic sclerosis,SSc)、类风湿性关节炎、多发性肌炎/皮肌炎、干燥综合征、系统性红斑狼疮、混合性结缔组织病和未分化结缔组织病[5-6]。其中,AI在CTD-ILD的主要应用包括深度学习和影像组学[1-2]。影像组学利用AI将医学影像转化为大量可挖掘的高通量影像学信息,可以挖掘大量人眼难以识别的定量特征(包括形状特征、灰度特征、纹理特征、小波特征等),并将定量特征与临床特征、蛋白质基因组信息和其他信息相结合[7-8]。不同于影像组学,深度学习的特征是在与临床问题的联合学习中得到的。基于卷积网络(convolutional neural network,CNN)的深度学习已应用于超声、X线片、电子计算机断层扫描、正电子发射计算机断层显像和磁共振成像等[9-10]。不仅如此,深度学习模型能够通过收集大量肺音数据进行训练,学习提取特征并进行分类、诊断。针对CTD-ILD的治疗和预后,利用深度学习技术也可以为病人提供合适的治疗方案、预测生存率等。
2 AI在CTD-ILD诊断中的应用
目前,AI技术已经广泛应用于影像学和临床医学领域,尤其在医学影像和肺音检测方面发挥了重要作用。CTD-ILD患者在疾病早期往往没有明显的症状,而高分辨率计算机断层扫描(high-resolution computed tomography,HRCT)仍是诊断ILD的金标准。然而,由于HRCT的辐射照射和高昂的费用,将其常规用于筛查并不可行[11]。因此,对于CTD-ILD的早期检测以及寻找新的诊断方法显得尤为重要。AI通过分析CT图像中的细微变化和纹理特征,可以检测到人眼无法察觉到的CT特征,这些特征包括正常肺组织、磨玻璃影、纤维化、肺气肿、结节、实变、蜂窝状改变等。通过深度学习算法和模式识别技术,AI可以学习和识别这些细微的特征,并提供更准确和全面的诊断和评估结果。Ohno等[12]利用机器学习的CT纹理分析,根据胸部CT图像对影像学结果进行分类,模型通过挖掘多种影像组学特征信息,能够显著提高观察者间的一致性,并在区分慢性阻塞性肺疾病、ILD或感染性疾病与正常肺部间具有更高的性能,总体区分准确率为94.9%。
据报道,Velcro啰音与肺纤维化之间存在密切相关性,肺音检测结合深度学习技术可以提供一种新的诊断策略。Dianat等[11]利用基于CNN的模型,从受结缔组织疾病影响的患者中获得肺音并分类,设计了三种最佳性能模型InceptionV3、DenseNet201和EfficientNetB3,其受试者操作特征曲线下面积(area under ROC curve,AUC)分别为0.93、0.95和0.96,总体准确率在85%~91%。InceptionV3在三种不同的情景中,即CNN处理原始数据(即没有去噪任务)且没有数据增强,CNN处理原始数据并进行数据增强,以及CNN处理去噪数据且没有数据增强的AUC分别为0.83、0.85和0.79。该技术显示在模型中使用去噪任务和数据增强方法可以显著提高性能。
由于众多AI术前模型均无法保证百分百的预测准确率,因此其主要还是作为一种辅助医生的工具,为医生在疾病诊断中提供参考。
3 AI在CTD-ILD治疗和预后中的应用
ILD严重程度和死亡风险分层的常用方法依赖于肺功能测试和HRCT上肺纤维化程度的测量。然而,有些患者可能无法完成肺功能测试,可能是因为身体状况不适合或无法配合测试要求。这就导致了依从性的缺乏,影响了肺功能测试结果的准确性[13]。CT通常保留给症状加重或肺功能恶化的患者[14]。在这种情况下,影像AI可以作为一种替代方法,通过分析胸部CT图像来评估肺部功能和疾病程度。Feng等[15]从1 029个具有预测价值的特征中选择了11个影像组学特征设计了RF和k-NN模型用于预测糖皮质激素联合或不联合环磷酰胺的治疗反应,在验证集中,RF和k-NN模型的AUC分别为0.66和0.61,当将临床数据整合到RF和k-NN模型中时,AUC分别提高至0.71和0.61。决策曲线分析显示,对于个体来说,如果预测的治疗反应率在50%~60%,糖皮质激素的使用是有益的。另外,高剂量的糖皮质激素和环磷酰胺显示出更好的疗效。
在预后方面,越来越多的研究者使用胸部CT来识别形态学变化,监测疾病进展或发现新的合并症[14]。Li等[16]利用选定的独立危险因素构建临床模型和18F-FDG PET/CT图像影像学模型来预测和早期诊断抗MDA5+DM相关快速进展型间质性肺疾病(rapidly progressive interstitial lung disease,RP-ILD),通过FDG摄取来预测RP-ILD时,受试者操作特征曲线(receiver operator characteristic curve,ROC曲线)分析显示AUC为0.944。当SUVmax≥2.4被用作预测RP-ILD的阈值时,诊断敏感性、特异性和准确性分别为100.0%、87.0%和90.0%。
在临床实践中,通常使用70%的用力肺活量占预计值百分比和HRCT上的20%的纤维化程度作为评估标准。然而,肺功能测试作为一种独立的检查方式在诊断目的上效果不如HRCT。为了弥补这种单一评估方式的局限性,Ley等[17]在2012年提出了一种被称为性别、年龄和肺功能的GAP评分和分期系统,该分期在慢性ILD患者中显示出了强大的预测能力。Jiang等[18]基于胸部CT图像建立了影像组学模型,并根据Rad评分和临床数据建立了列线图模型,用于预测CTD-ILD患者的GAP分期。训练集和测试集中的AUC分别为0.803和0.801。通过结合临床因素和影像组学特征的列线图模型,能够很好地区分GAP Ⅰ和GAP Ⅱ、GAP Ⅲ期,并提高了准确性。Martini等[19]利用基于纹理的影像组学特征检测SSc-ILD患者,并与仅基于HRCT的视觉分析相比较,以区分不同疾病阶段。在模型中结合蜂窝、肺气肿和支气管扩张,达到了最高的性能,AUC为0.86。预测GAP分期和纤维化程度的AUC为0.606。当对粗糙度得分进行ROC分析时,预测GAP阶段的AUC达到0.863。
尽管出现了针对性的治疗方法,但CTD-ILD仍然是SSc的主要死因,这仍是一个重要挑战,原因在于患者特定的疾病轨迹和进展速度的高度差异。在最近的一项研究中,Schniering等[20]提出了无监督聚类的方法,以识别并描述基于图像的患者群体。通过监督分析,他们利用放射组学特征得出了一个临床可应用的预后定量放射组学风险评分qRISSc,用于预测进展无生存期。该研究表明,基于放射组学的风险分层能够利用常规CT图像提供互补的表型、临床和预后信息,对SSc-ILD的临床决策产生了显著影响。
4 对AI辅助结缔组织相关间质性肺疾病今后研究的建议
随着AI技术的不断发展和应用,其在辅助CTD-ILD研究中的潜力逐渐展现出来。然而,目前对于AI在CTD-ILD领域的研究还相对有限,仍有许多值得深入探索的方向。在未来的研究中,我们提出以下几点建议。
4.1 重视高质量数据集的构建和再利用
构建强大且高效的AI模型需要依赖海量且高质量的数据集。然而,由于患者隐私、伦理和法律等问题,临床数据的可用性和共享程度大大受限。再加上不同数据来源的巨大异质性,以及预测模型研究的报告质量不佳,使得获取并利用高质量数据的过程充满挑战[21]。为了解决影像组学方法学的复杂性并简化其流程,2017年Lambin等[22]引入了一个名为(radiomics quality score,RQS)的“质量认证”机制,主要用于评估已发表研究成果的方法学质量[23]。Akinci D'Antonoli等[24]进一步引入了一种名为RadBase的可搜索影像组学研究数据库,以提高影像组学研究的可重复性。他们建议学术期刊采用可重复性标准模型,并对那些愿意分享模型、代码和数据的研究者给予奖励。通过实施这些措施可以推动影像组学研究的可重复性和持续性,从而进一步推动该领域的发展。
4.2 重视AI技术的创新、算法的优化以及AI模型的验证
技术的创新是推动AI技术进步的关键。传统图像分割是非监督学习,不需要标签信息。语义分割将图像分割成不同语义类别区域,实现高级别分析和理解,为图像处理和应用提供更多信息。传统CNN的全连接层会将二维图像特征压扁成一维的特征向量,丢失了空间信息,直接用于分割任务的效果并不理想。2015年,研究者提出了全卷积网络(fully convolutional network,FCN)的概念,以恢复丢失的空间信息为主线实现了更加高效的语义分割[25]。Chassagnon等[26]基于深度学习的方法,通过对SSc患者胸部CT扫描进行弹性配准检测肺萎缩以描绘ILD恶化,在视觉评估中发现具有恶化ILD的患者的Jacobian图显示了后部肺底的肺实质萎缩。TTe分类器在形态和功能恶化的检测中的准确率分别为80%和83%。相比CT,磁共振成像(magnetic resonance imaging,MRI)是一种无辐射的技术,能够评估纤维化的活性,并对肺形态的微小变化或肺功能的变化更敏感。然而,目前还没有研究将深度学习技术应用于MRI检测CTD-ILD[27]。此外,肺血管体积的变化可以作为SSc-ILD严重程度的生物标志物[28]。在肿瘤领域,已有学者利用同一患者不同序列的断层扫描图像提取静态特征,将其量化为新的动态特征以预测治疗效果[29]。能否借鉴该思路,应用于预后和疗效,值得进一步探索。
4.3 将ILD影像AI算法与临床实践相结合
AI算法的最终目标是应用于临床实践中,提高ILD的诊断准确性和治疗效果。为此,需要建立统一的临床实践指南和流程,以确保AI算法的正确应用和临床效果的评估。在应用AI于诊断时,需遵守法律上的严格产品责任标准,并要求临床医生适当地应用和实施。护理义务是临床医生对患者所负有的。患者必须充分了解使用AI的风险、益处和局限性。此外,还可能发生医疗过失,特别是当患者在没有专家指导的情况下使用基于互联网的应用程序或软件时。因此,在决策系统中还应考虑数据隐私和患者对软件的意见[30]。
5 展望
AI在CTD-ILD的应用正在取得显著进展,并展现出巨大的潜力。通过深度学习算法和大量的影像数据,AI可以准确地识别和定量评估肺部纤维化和炎症的程度,为医生提供更准确的诊断和治疗建议。未来,随着技术的不断发展和数据的不断积累, AI在结缔组织相关间质性肺疾病的应用前景广阔。
利益冲突:本文不涉及任何利益冲突。