食管癌是一种侵袭性恶性肿瘤,发病率高,预后差。食管癌早期症状隐匿难以发现,中晚期食管梗阻、病灶浸润和转移严重影响患者生活质量,早期发现和治疗有助于增加患者的生存机会。近年来,人工智能(artificial intelligence,AI)在辅助诊断食管癌方面取得了卓越成果,突显了新型AI辅助诊断模式的巨大应用潜能。本文将综述AI在食管癌诊断中的应用进展,并对其临床应用前景进行展望。
引用本文: 唐川君, 袁湘蕾, 张琼英, 胡兵. 人工智能在食管癌诊断中的应用进展. 中国胸心血管外科临床杂志, 2024, 31(1): 153-159. doi: 10.7507/1007-4848.202306032 复制
食管癌是全球最常见的10种新发癌症之一,2020年全球新发病例为60.4万例,死亡病例为54.4万例。其中我国新发病例为32.4万例,死亡病例为30.1万例,分别占全球的53.70%和55.35%[1-2]。食管癌主要分为食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)和食管腺癌(esophageal adenocarcinoma,EAC)两种组织学类型,其中ESCC的占比高达90%[3]。近年来,由于筛查及诊疗技术的不断提高,我国食管癌患者术后3年及5年总生存率已分别提升至61.6%及52.9%[4],但总体仍然偏低。食管癌患者的生存时间与其临床分期密切相关,早期食管癌患者在接受治疗后5年生存率可达90%以上[5]。因此,早诊断、早治疗对改善食管癌患者的预后尤为重要。
食管癌的诊断方法主要包括消化内镜、影像学检查和病理学检查等。消化内镜广泛应用于食管癌的诊断、治疗及预后评估中,为食管癌的早发现、早诊断和早治疗提供了有力保障,是提高食管癌患者生存率的重要方法[6]。消化内镜检查方法包括白光内镜(white-light imaging,WLI)、窄带光谱成像技术(narrow-band imaging,NBI)、碘染色和放大内镜(magnification endoscopy,ME)等。影像学检查高效、便捷,且可清晰展示组织结构的改变情况,在食管癌的诊断、分期及疗效评估中具有重要价值,是发现癌症的重要技术[7]。病理学检查被认为是癌症诊断的“金标准”,常见的组织学方法有苏木精-伊红染色和免疫组织化学染色。早期食管癌患者的症状不典型,据文献[8]报道,我国早期食管癌的检出率不足10%,远低于日本等发达国家水平。因此,开发一种辅助医生发现食管癌的诊断系统对提高我国早期食管癌的检出率具有重要意义。
随着深度学习和计算机视觉技术的快速发展,越来越多的学者开始探索利用人工智能(artificial intelligence,AI)辅助诊断食管癌的方法。AI旨在模拟人类的思维过程、学习能力和知识存储,并设计出一些类似人智能的自动机[9]。机器学习是实现AI的重要途径,它可分为传统学习方法与深度学习方法(deep learning,DL)。DL通过数据转换层来识别给定数据集的特征,以便对数据进行分类。卷积神经网络(convolutional neural network,CNN)是DL在图像识别领域中常用的方法之一,它模拟了基于大脑视觉皮层神经元对某些视觉刺激的特定反应[10-11],对大量的医学图像进行学习和训练,分析图像与病变之间的关联,帮助医生快速、精准地完成诊断[12]。目前,已经有多种多模态和多功能AI辅助诊断食管癌的研究被报道。本文将综述这些研究进展,并对未来的发展趋势进行探讨,旨在为相关研究提供参考和借鉴,以期为食管癌的早期诊断提供更加高效和精准的解决方案。
1 人工智能辅助内镜诊断食管鳞状细胞癌
病变检出是内镜诊断ESCC的基础,在WLI下,即使使用高清内镜,浅表ESCC也容易被漏诊。Feng等[13]构建了一个AI系统,1283例患者的5892张WLI图像用于训练AI系统,1224例患者的4529张图像用于验证该AI系统。该AI系统开发了一个CNN模型,用于WLI下浅表ESCC病变的识别和定位,其在内部验证集中检测ESCC的敏感性、特异性和准确性分别为96.64%、95.35%和91.75%,在外部验证集中分别为90.17%、94.34%和88.38%。在识别癌性病变影像特征方面,AI系统的诊断性能与内镜专家相当,显著优于中级和初级内镜医师。在AI系统辅助下,内镜医师整体人工诊断的准确性(75.12% vs. 84.95%,P=0.008)、特异性(63.29% vs. 76.59%,P=0.017)显著提高。Tajiri等[14]用25048张浅表ESCC内镜图像和4746张正常内镜图像构建了一个AI系统,用147个模拟临床应用的视频作为验证数据集。该AI系统采用BigTransfer(BiT)的方法来训练数据集和图像标注,此方法是计算机视觉领域最先进的迁移学习模型。结果显示,AI系统对ESCC分类的准确性、敏感性和特异性分别为80.9%、85.5%和75.0%,内镜医生分别为69.2%、67.5%和71.5%。在病变大小和病变浸润深度亚组分析中,该AI系统正确分类了所有侵犯黏膜肌层或黏膜下层的ESCC。以上研究结果提示,AI系统在内镜图像及视频中诊断ESCC具有出色性能,具有与专家级内镜医生相当的诊断能力,可以作为内镜医师在日常内镜检查中检测浅表ESCC的辅助方法。
ESCC浸润深度与肿瘤分期密切相关,准确判断病变浸润深度可以指导选择手术方式。2002年内镜专家将食管鳞状上皮乳头内毛细血管袢(intraepithelial papillary capillary loop,IPCL)的状态作为诊断组织异型性的唯一可靠征象[15]。日本食管学会[16]提出简单易行的IPCL分型,将食管黏膜浅表血管分为A型和B型,B型又分B1型、B2型和B3型,根据IPCL分型间接诊断ESCC的浸润深度。Yuan等[17]构建了首个相对较全面地涵盖ESCC中IPCL分类(A型、B1型、B2型和B3型血管)的AI系统,使用一种称为HRNet+OCR的DCNN算法来训练AI系统。该AI系统回顾性收集了3家医院的ME-NBI食管内镜图像,使用内部和外部验证数据集评估该AI系统的性能,结果内部测试集和外部测试集中诊断IPCL的总体准确性分别为91.3%和89.8%,优于资深内镜医生(87.1%)和初级内镜医生(78.2%),表明其具有极强的泛化能力。在与训练集数据同源的IPCL亚型的个体准确性、敏感性和特异性方面,除B3型外,AI系统对其他3种IPCL亚型的诊断性能显著优于资深和初级内镜医生,显示出AI系统辅助内镜医生诊断的潜在能力。Shimamoto等[18]使用常规及放大内镜视频训练AI系统,虽然有些图像清晰度欠佳,AI系统判断ESCC浸润深度的准确性仍然优于内镜专家(87%~89% vs. 84%~85%)。AI系统在诊断IPCL亚型和预测浸润深度方面表现出了比内镜医生更好的性能。
病变的侧边范围与内镜治疗后食管狭窄的发生率密切相关,准确判断病灶范围对选择活检部位和指导手术过程意义重大。Guo等[19]构建的AI系统可以诊断食管黏膜病变性质并判断病变范围。当AI系统检测到任何癌前病变或浅表ESCC时,病变区域将被不同颜色覆盖,黄色代表癌性病变的可能性高,蓝色代表非癌性病变。该研究显示出AI判断ESCC病变范围的可行性。Liu等[20]报道了可在WLI下检测ESCC并勾画病变边界的AI系统。选用了1239例患者的13083张内镜图片,其中4885张浅表ESCC图片和5582张WLI图像用于训练该AI系统,另外2616张图片用作内部验证,该AI系统用绿色的多边形显示病灶,其在内部和外部验证中检测病变的准确性分别为85.7%和84.5%;在勾画病变边界方面,其在内部和外部验证中的准确性分别为93.4%和95.7%。该AI系统勾画病变边界的准确性与专家相似(98.1% vs. 95.3%),显著优于年轻内镜医生(98.1% vs. 78.6%)。Yuan等[21]研发的AI系统用于在NBI下检测浅表ESCC和癌前病变,并描绘病变范围。在静态图像测试中,AI系统在内部和外部测试集中检测病灶的准确性分别为92.4%和89.9%,勾画病变范围的准确性分别为88.9%和87.0%。该AI系统勾画病变边界的性能优于初级内镜医生,与高级内镜医生相当。在前瞻性临床评价中,该AI系统表现出令人满意的性能,检出病灶的准确性为91.4%,勾画病变范围的准确性为85.9%。AI系统在检测和描绘浅表ESCC边缘方面具有良好的准确性,有助于浅表ESCC病变的圈定,辅助制定合理的治疗方案。
不久前日本学者Tani等[22]进行了一项评估AI系统在临床环境中实时诊断ESCC的研究,采用单中心前瞻性设计,共纳入380例ESCC高危患者,将AI系统实时诊断疑似ESCC病变的结果与内镜医师进行比较。结果AI系统的准确性为80.6%,敏感性为68.2%,特异性为83.4%。内镜医师的准确性、敏感性和特异性分别为85.7%、61.4%和91.2%,两者差异无统计学意义。主要原因可能是训练AI系统用的是压缩图像,而临床环境中获得的是原始图像,两者差异不能避免。未来可以通过使用未压缩格式保存的内镜图像进行训练来提高AI系统的诊断性能。
AI系统在浅表ESCC的临床应用尚处于起步阶段,绝大多数研究都是回顾性研究,研究方法主要在AI算法、训练和验证等方面,并与不同年资内镜医生的敏感性、准确性和特异性进行比较。目前还没有大规模的AI临床监测和检测,将AI系统真正应用于临床还有很长一段路要走。
2 人工智能辅助内镜诊断食管腺癌
EAC是北美和欧洲主要的食管癌[23],Barrett食管(Barrett's esophagus,BE)是EAC的一种癌前病变[24],在BE中检测病灶区域的不典型增生或早期EAC具有挑战性,当发现局灶性病变时,进一步区分非发育不良或炎症、低级别发育不良、高级别发育不良和腺癌更为困难。Madabhushi等[25]研制了一个光谱内窥镜,用来识别BE不同类别新生血管的变化(包括非异型增生BE、异型增生BE和黏膜内EAC),该AI系统的诊断准确性可达84.4%。Struyvenberg等[26]采用前瞻性多中心来源的数据构建AI系统,由前22例患者的172个靶点组成训练集,由随后的25例患者的146个靶点组成单独的测试集,总共得到16218张WLI图像。该AI系统检测BE的准确性、敏感性和特异性分别为92%、95%和92%,而10位内镜医生分别为77%、70%和81%,该AI系统的性能优于内镜医生。Tan等[27]的系统综述基于1361例患者的50多万张图像,发现AI系统可以准确地检测早期BE病变,受试者工作特征曲线下面积为0.94,合并敏感性为90.3%,合并特异性为84.4%。AI系统有助于发现早期EAC病变,食管肿瘤早期可采用微创内镜治疗,其并发症、患者体验及医疗费用明显优于外科手术。
上述AI系统检测BE及EAC是在内镜图像上完成的,这可能不能充分反映现实临床的情况,为了将AI系统无缝应用到临床工作中,一系列实时检测BE及EAC的研究接踵而至。de Groof等[28]开发了一种用于实时检测BE瘤变的AI系统,该AI系统前瞻性收集了40例肿瘤性BE食管和20例非发育不良BE食管患者的WLI全景图像,训练和验证其在WLI图像上检测和定位早期BE肿瘤的性能,结果显示该AI系统的准确性、敏感性和特异性分别为92%、95%和85%。Hashimoto等[29]使用T1期癌患者的916张图像和BE患者的919张图像研发了一个AI系统,采用Inception-ResNet-v2算法,通过在实时视频中测试,发现AI检测病变的敏感性为96.4%,特异性为94.2%,准确性为95.4%。该AI系统还能在图像中快速、准确地定位出病变区域。Ebigbo等[30]探究了AI在实时多模态成像内镜检查中辅助检测和分割BE相关肿瘤的可行性,发现AI可以准确地检测并描绘出小病变的边界。Ebigbo等[31]将AI系统用于诊断早期EAC,这是DL-AI系统首次在真实临床环境中的实时应用,该AI系统诊断的敏感性为83.7%,特异性为100.0%,准确性为89.9%,其性能与经验丰富的内镜医生相当。
在临床实践中准确判断BE的化生程度具有一定难度。Ali等[32]使用AI系统模拟BE的布拉格C&M分类,在内镜检查期间自动提取这些测量值,结果发现该AI系统的准确性超过97%。Pan等[33]开发的AI系统可自动识别内镜静态图像中的BE化生,该AI系统在内镜图像中分割BE范围的精度与人工评估的范围一致,这种自动识别方法有助于辅助临床医生在内镜检查中定位和识别BE的范围。
EAC浸润深度的识别具有挑战性,需要内镜医师高水平的专业知识来保证准确性[34]。病变浸润深度的识别对手术方式的选择意义重大,特别是在区分黏膜和黏膜下浸润时,内镜切除方法的区别是内镜下黏膜切除术(endoscopic mucosal resection,EMR)和内镜黏膜下剥离术(endoscopic submucosal dissection,ESD)。Ebigbo等[35]回顾性收集了116例多中心来源的EAC患者的数据构建AI系统,用230张(108张T1a期和122张T1b期)WLI图像训练并测试系统,结果发现该AI系统区分T1a/T1b期癌症的敏感性、特异性、F1评分和准确性分别为0.77%、0.64%、0.74%和0.71%,得分与内镜专家相当。
对BE及EAC病变范围的确认可以指导活检及手术,Ebigbo等[36]从2个数据库(Augsburg和MICCAI)中挑选图像研发AI系统,在Augsburg数据中AI系统诊断EAC的敏感性和特异性分别为97%和88%;在MICCAI数据中AI系统在WLI下的敏感性和特异性分别为92%和100%,在NBI下分别为94%和80%。除诊断病变外,AI系统还可对BE和EAC病变区域进行粗略分割。计算AI系统分割区域与专家分割区域的重叠程度Dice系数(D),结果发现在Augsburg数据中D=0.72,MICCAI数据中D=0.56,该AI系统具有良好的自动分割病变区域的能力。Hussein等[37]构建了两种AI系统:一种用于检测BE,另一种用于描绘BE区域。该AI系统通过热图来呈现检测和分割结果,即不同病变区域显示不同颜色,其中红色区域表示异常病变区域,是进行靶向活检的最佳位置。经过测试发现AI系统检测BE的敏感性和特异性分别为91%和79%,AI系统与内镜专家描绘BE区域的重叠率可高达98%。
然而,大多数关于EAC的研究是在西方国家进行的。西方和亚洲地区EAC的特征不同[38],使用基于西方病例的训练集开发的AI系统是否适用于亚洲的临床实践是值得考虑的,在亚洲开发一个经过EAC病例数据训练的AI系统势在必行。日本Iwagami等[39]用食管胃交界处腺癌患者的内镜图像来构建AI系统,发现该AI系统的诊断敏感性、特异性和准确性分别为94%、42%和66%,内镜医生则分别为88%、43%和63%。
3 人工智能辅助影像学诊断食管癌
医学影像学在临床诊断和治疗中发挥着重大的作用,是发现癌症的重要技术,在过去10年中,计算机化工具的发展越来越多,这些工具可以将图像转换为定量的可挖掘数据(放射组学),并随后使用AI进行分析。这些工具正在提高早期病变诊断的准确性,以确定风险并将恶性疾病与良性疾病区分开来。许多研究和证据[40-43]综合表明,放射组学具有识别各种癌症原发肿瘤和淋巴结异质性的潜力,可用于临床诊断和预后。AI系统在CT图像上对术前临床、影像及病理特征进行筛选,可预测食管癌淋巴结转移风险[44-48]和根治性放化疗疗效[49-50]。
Ypsilantis等[51]基于107例食管癌患者的试验结果构建AI系统,采用MSGD(stochastic gradient-descent algorithm with mini batches)算法,从治疗前的正电子发射计算机断层显像(positron emission tomography-computed tomography,PET-CT)中自动提取关键特征,用于预测食管癌新辅助化疗疗效,该AI系统的敏感性和特异性分别为80.7%和81.6%,优于基于手工提取影像特征的传统机器学习算法。与仅使用临床特征相比,Van Rossum等[52]的研究添加全面的PET特征可提高模型的预测能力。Foley等[53]建立的结合PET-CT结构分析食管癌患者的预后模型,可对食管癌患者进行风险分层。
磁共振成像(magnetic resonance imaging,MRI)对软组织的分辨率更高,适用于食管肿瘤及纵隔淋巴结的评估。Qu等[54]用181例食管癌患者治疗前的MRI构建AI系统,使用Matlab自制程序计算放射学特征,发现基于MRI的影像组学诊断淋巴结转移的受试者工作特征曲线下面积值可达0.82,MRI放射特征可以预测食管癌患者术前淋巴结转移。Hou等[55]对68例根治性放化疗的ESCC患者进行疗效预测,采用两种方法即支持向量机和人工神经网络构建AI模型,发现两者均有较高的预测准确性,MRI放射组学可以预测ESCC放化疗的治疗反应。
4 人工智能辅助病理学诊断食管癌
食管癌的病理学形态[56]及免疫组织化学特征[57]被证实与患者预后密切相关。Tomita等[58]在123张组织学图像上进行评估,该AI系统准确识别显微镜图像上的癌性和癌前食管病变的平均准确率为0.83%,该AI系统是第1个使用DL方法自动检测组织病理学载玻片上的BE和EAC的模型。Kouzu等[59]从222例手术切除的ESCC病例中随机选择31例患者的切片用于训练和开发AI系统,切片采用苏木精-伊红数字化整片切片。结果显示该AI系统Dice系数得分为0.81。使用AI系统可以客观定量地评估ESCC中的纤维组织增生反应(desmoplastic reaction,DR),AI辅助的DR分类比手动DR分类对疾病特异性生存有更高的预后意义,且AI辅助的DR分类优于金标准因素肿瘤深度和淋巴结转移的预后准确性。
5 总结与展望
尽管近年来AI在诊断食管癌领域中的研究成果颇多,展现出AI在辅助医生诊断食管癌方面的巨大潜力,但其真正临床应用和推广仍面临许多挑战。(1)样本量少,没有独立的训练集和测试集,应建立大的图像数据库,训练AI软件程序。(2)样本多为清晰的高质量图像,不能完全模拟真实的临床情况,应研发实时AI诊断系统,多模态数据融合,将不同类型的医学图像数据(如内镜图像、CT、MRI等)综合分析和诊断,提高AI系统的准确性。(3)纳入的研究多为单中心回顾性研究,稳健性及普适性仍需要在多中心、真实世界大数据中进行前瞻性临床试验验证。(4)采集设备、采集参数和重建算法的差异,导致数据信号和质量的差异,数据应规范化和标准化。(5)AI系统辅助诊断过程中的医疗责任尚不明确,应制定有关伦理安全、数据所有权和AI系统诊断性能外部验证的共识指南。期望在不久的将来AI可以真正落地应用于临床实践,提升医疗效率,服务广大医生和患者。
利益冲突:无。
作者贡献:唐川君参与选题和设计,数据整理与分析,文章初稿撰写及修改;袁湘蕾参与选题和设计,起草、修改文章;张琼英、胡兵参与选题和设计,修改文章。
食管癌是全球最常见的10种新发癌症之一,2020年全球新发病例为60.4万例,死亡病例为54.4万例。其中我国新发病例为32.4万例,死亡病例为30.1万例,分别占全球的53.70%和55.35%[1-2]。食管癌主要分为食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)和食管腺癌(esophageal adenocarcinoma,EAC)两种组织学类型,其中ESCC的占比高达90%[3]。近年来,由于筛查及诊疗技术的不断提高,我国食管癌患者术后3年及5年总生存率已分别提升至61.6%及52.9%[4],但总体仍然偏低。食管癌患者的生存时间与其临床分期密切相关,早期食管癌患者在接受治疗后5年生存率可达90%以上[5]。因此,早诊断、早治疗对改善食管癌患者的预后尤为重要。
食管癌的诊断方法主要包括消化内镜、影像学检查和病理学检查等。消化内镜广泛应用于食管癌的诊断、治疗及预后评估中,为食管癌的早发现、早诊断和早治疗提供了有力保障,是提高食管癌患者生存率的重要方法[6]。消化内镜检查方法包括白光内镜(white-light imaging,WLI)、窄带光谱成像技术(narrow-band imaging,NBI)、碘染色和放大内镜(magnification endoscopy,ME)等。影像学检查高效、便捷,且可清晰展示组织结构的改变情况,在食管癌的诊断、分期及疗效评估中具有重要价值,是发现癌症的重要技术[7]。病理学检查被认为是癌症诊断的“金标准”,常见的组织学方法有苏木精-伊红染色和免疫组织化学染色。早期食管癌患者的症状不典型,据文献[8]报道,我国早期食管癌的检出率不足10%,远低于日本等发达国家水平。因此,开发一种辅助医生发现食管癌的诊断系统对提高我国早期食管癌的检出率具有重要意义。
随着深度学习和计算机视觉技术的快速发展,越来越多的学者开始探索利用人工智能(artificial intelligence,AI)辅助诊断食管癌的方法。AI旨在模拟人类的思维过程、学习能力和知识存储,并设计出一些类似人智能的自动机[9]。机器学习是实现AI的重要途径,它可分为传统学习方法与深度学习方法(deep learning,DL)。DL通过数据转换层来识别给定数据集的特征,以便对数据进行分类。卷积神经网络(convolutional neural network,CNN)是DL在图像识别领域中常用的方法之一,它模拟了基于大脑视觉皮层神经元对某些视觉刺激的特定反应[10-11],对大量的医学图像进行学习和训练,分析图像与病变之间的关联,帮助医生快速、精准地完成诊断[12]。目前,已经有多种多模态和多功能AI辅助诊断食管癌的研究被报道。本文将综述这些研究进展,并对未来的发展趋势进行探讨,旨在为相关研究提供参考和借鉴,以期为食管癌的早期诊断提供更加高效和精准的解决方案。
1 人工智能辅助内镜诊断食管鳞状细胞癌
病变检出是内镜诊断ESCC的基础,在WLI下,即使使用高清内镜,浅表ESCC也容易被漏诊。Feng等[13]构建了一个AI系统,1283例患者的5892张WLI图像用于训练AI系统,1224例患者的4529张图像用于验证该AI系统。该AI系统开发了一个CNN模型,用于WLI下浅表ESCC病变的识别和定位,其在内部验证集中检测ESCC的敏感性、特异性和准确性分别为96.64%、95.35%和91.75%,在外部验证集中分别为90.17%、94.34%和88.38%。在识别癌性病变影像特征方面,AI系统的诊断性能与内镜专家相当,显著优于中级和初级内镜医师。在AI系统辅助下,内镜医师整体人工诊断的准确性(75.12% vs. 84.95%,P=0.008)、特异性(63.29% vs. 76.59%,P=0.017)显著提高。Tajiri等[14]用25048张浅表ESCC内镜图像和4746张正常内镜图像构建了一个AI系统,用147个模拟临床应用的视频作为验证数据集。该AI系统采用BigTransfer(BiT)的方法来训练数据集和图像标注,此方法是计算机视觉领域最先进的迁移学习模型。结果显示,AI系统对ESCC分类的准确性、敏感性和特异性分别为80.9%、85.5%和75.0%,内镜医生分别为69.2%、67.5%和71.5%。在病变大小和病变浸润深度亚组分析中,该AI系统正确分类了所有侵犯黏膜肌层或黏膜下层的ESCC。以上研究结果提示,AI系统在内镜图像及视频中诊断ESCC具有出色性能,具有与专家级内镜医生相当的诊断能力,可以作为内镜医师在日常内镜检查中检测浅表ESCC的辅助方法。
ESCC浸润深度与肿瘤分期密切相关,准确判断病变浸润深度可以指导选择手术方式。2002年内镜专家将食管鳞状上皮乳头内毛细血管袢(intraepithelial papillary capillary loop,IPCL)的状态作为诊断组织异型性的唯一可靠征象[15]。日本食管学会[16]提出简单易行的IPCL分型,将食管黏膜浅表血管分为A型和B型,B型又分B1型、B2型和B3型,根据IPCL分型间接诊断ESCC的浸润深度。Yuan等[17]构建了首个相对较全面地涵盖ESCC中IPCL分类(A型、B1型、B2型和B3型血管)的AI系统,使用一种称为HRNet+OCR的DCNN算法来训练AI系统。该AI系统回顾性收集了3家医院的ME-NBI食管内镜图像,使用内部和外部验证数据集评估该AI系统的性能,结果内部测试集和外部测试集中诊断IPCL的总体准确性分别为91.3%和89.8%,优于资深内镜医生(87.1%)和初级内镜医生(78.2%),表明其具有极强的泛化能力。在与训练集数据同源的IPCL亚型的个体准确性、敏感性和特异性方面,除B3型外,AI系统对其他3种IPCL亚型的诊断性能显著优于资深和初级内镜医生,显示出AI系统辅助内镜医生诊断的潜在能力。Shimamoto等[18]使用常规及放大内镜视频训练AI系统,虽然有些图像清晰度欠佳,AI系统判断ESCC浸润深度的准确性仍然优于内镜专家(87%~89% vs. 84%~85%)。AI系统在诊断IPCL亚型和预测浸润深度方面表现出了比内镜医生更好的性能。
病变的侧边范围与内镜治疗后食管狭窄的发生率密切相关,准确判断病灶范围对选择活检部位和指导手术过程意义重大。Guo等[19]构建的AI系统可以诊断食管黏膜病变性质并判断病变范围。当AI系统检测到任何癌前病变或浅表ESCC时,病变区域将被不同颜色覆盖,黄色代表癌性病变的可能性高,蓝色代表非癌性病变。该研究显示出AI判断ESCC病变范围的可行性。Liu等[20]报道了可在WLI下检测ESCC并勾画病变边界的AI系统。选用了1239例患者的13083张内镜图片,其中4885张浅表ESCC图片和5582张WLI图像用于训练该AI系统,另外2616张图片用作内部验证,该AI系统用绿色的多边形显示病灶,其在内部和外部验证中检测病变的准确性分别为85.7%和84.5%;在勾画病变边界方面,其在内部和外部验证中的准确性分别为93.4%和95.7%。该AI系统勾画病变边界的准确性与专家相似(98.1% vs. 95.3%),显著优于年轻内镜医生(98.1% vs. 78.6%)。Yuan等[21]研发的AI系统用于在NBI下检测浅表ESCC和癌前病变,并描绘病变范围。在静态图像测试中,AI系统在内部和外部测试集中检测病灶的准确性分别为92.4%和89.9%,勾画病变范围的准确性分别为88.9%和87.0%。该AI系统勾画病变边界的性能优于初级内镜医生,与高级内镜医生相当。在前瞻性临床评价中,该AI系统表现出令人满意的性能,检出病灶的准确性为91.4%,勾画病变范围的准确性为85.9%。AI系统在检测和描绘浅表ESCC边缘方面具有良好的准确性,有助于浅表ESCC病变的圈定,辅助制定合理的治疗方案。
不久前日本学者Tani等[22]进行了一项评估AI系统在临床环境中实时诊断ESCC的研究,采用单中心前瞻性设计,共纳入380例ESCC高危患者,将AI系统实时诊断疑似ESCC病变的结果与内镜医师进行比较。结果AI系统的准确性为80.6%,敏感性为68.2%,特异性为83.4%。内镜医师的准确性、敏感性和特异性分别为85.7%、61.4%和91.2%,两者差异无统计学意义。主要原因可能是训练AI系统用的是压缩图像,而临床环境中获得的是原始图像,两者差异不能避免。未来可以通过使用未压缩格式保存的内镜图像进行训练来提高AI系统的诊断性能。
AI系统在浅表ESCC的临床应用尚处于起步阶段,绝大多数研究都是回顾性研究,研究方法主要在AI算法、训练和验证等方面,并与不同年资内镜医生的敏感性、准确性和特异性进行比较。目前还没有大规模的AI临床监测和检测,将AI系统真正应用于临床还有很长一段路要走。
2 人工智能辅助内镜诊断食管腺癌
EAC是北美和欧洲主要的食管癌[23],Barrett食管(Barrett's esophagus,BE)是EAC的一种癌前病变[24],在BE中检测病灶区域的不典型增生或早期EAC具有挑战性,当发现局灶性病变时,进一步区分非发育不良或炎症、低级别发育不良、高级别发育不良和腺癌更为困难。Madabhushi等[25]研制了一个光谱内窥镜,用来识别BE不同类别新生血管的变化(包括非异型增生BE、异型增生BE和黏膜内EAC),该AI系统的诊断准确性可达84.4%。Struyvenberg等[26]采用前瞻性多中心来源的数据构建AI系统,由前22例患者的172个靶点组成训练集,由随后的25例患者的146个靶点组成单独的测试集,总共得到16218张WLI图像。该AI系统检测BE的准确性、敏感性和特异性分别为92%、95%和92%,而10位内镜医生分别为77%、70%和81%,该AI系统的性能优于内镜医生。Tan等[27]的系统综述基于1361例患者的50多万张图像,发现AI系统可以准确地检测早期BE病变,受试者工作特征曲线下面积为0.94,合并敏感性为90.3%,合并特异性为84.4%。AI系统有助于发现早期EAC病变,食管肿瘤早期可采用微创内镜治疗,其并发症、患者体验及医疗费用明显优于外科手术。
上述AI系统检测BE及EAC是在内镜图像上完成的,这可能不能充分反映现实临床的情况,为了将AI系统无缝应用到临床工作中,一系列实时检测BE及EAC的研究接踵而至。de Groof等[28]开发了一种用于实时检测BE瘤变的AI系统,该AI系统前瞻性收集了40例肿瘤性BE食管和20例非发育不良BE食管患者的WLI全景图像,训练和验证其在WLI图像上检测和定位早期BE肿瘤的性能,结果显示该AI系统的准确性、敏感性和特异性分别为92%、95%和85%。Hashimoto等[29]使用T1期癌患者的916张图像和BE患者的919张图像研发了一个AI系统,采用Inception-ResNet-v2算法,通过在实时视频中测试,发现AI检测病变的敏感性为96.4%,特异性为94.2%,准确性为95.4%。该AI系统还能在图像中快速、准确地定位出病变区域。Ebigbo等[30]探究了AI在实时多模态成像内镜检查中辅助检测和分割BE相关肿瘤的可行性,发现AI可以准确地检测并描绘出小病变的边界。Ebigbo等[31]将AI系统用于诊断早期EAC,这是DL-AI系统首次在真实临床环境中的实时应用,该AI系统诊断的敏感性为83.7%,特异性为100.0%,准确性为89.9%,其性能与经验丰富的内镜医生相当。
在临床实践中准确判断BE的化生程度具有一定难度。Ali等[32]使用AI系统模拟BE的布拉格C&M分类,在内镜检查期间自动提取这些测量值,结果发现该AI系统的准确性超过97%。Pan等[33]开发的AI系统可自动识别内镜静态图像中的BE化生,该AI系统在内镜图像中分割BE范围的精度与人工评估的范围一致,这种自动识别方法有助于辅助临床医生在内镜检查中定位和识别BE的范围。
EAC浸润深度的识别具有挑战性,需要内镜医师高水平的专业知识来保证准确性[34]。病变浸润深度的识别对手术方式的选择意义重大,特别是在区分黏膜和黏膜下浸润时,内镜切除方法的区别是内镜下黏膜切除术(endoscopic mucosal resection,EMR)和内镜黏膜下剥离术(endoscopic submucosal dissection,ESD)。Ebigbo等[35]回顾性收集了116例多中心来源的EAC患者的数据构建AI系统,用230张(108张T1a期和122张T1b期)WLI图像训练并测试系统,结果发现该AI系统区分T1a/T1b期癌症的敏感性、特异性、F1评分和准确性分别为0.77%、0.64%、0.74%和0.71%,得分与内镜专家相当。
对BE及EAC病变范围的确认可以指导活检及手术,Ebigbo等[36]从2个数据库(Augsburg和MICCAI)中挑选图像研发AI系统,在Augsburg数据中AI系统诊断EAC的敏感性和特异性分别为97%和88%;在MICCAI数据中AI系统在WLI下的敏感性和特异性分别为92%和100%,在NBI下分别为94%和80%。除诊断病变外,AI系统还可对BE和EAC病变区域进行粗略分割。计算AI系统分割区域与专家分割区域的重叠程度Dice系数(D),结果发现在Augsburg数据中D=0.72,MICCAI数据中D=0.56,该AI系统具有良好的自动分割病变区域的能力。Hussein等[37]构建了两种AI系统:一种用于检测BE,另一种用于描绘BE区域。该AI系统通过热图来呈现检测和分割结果,即不同病变区域显示不同颜色,其中红色区域表示异常病变区域,是进行靶向活检的最佳位置。经过测试发现AI系统检测BE的敏感性和特异性分别为91%和79%,AI系统与内镜专家描绘BE区域的重叠率可高达98%。
然而,大多数关于EAC的研究是在西方国家进行的。西方和亚洲地区EAC的特征不同[38],使用基于西方病例的训练集开发的AI系统是否适用于亚洲的临床实践是值得考虑的,在亚洲开发一个经过EAC病例数据训练的AI系统势在必行。日本Iwagami等[39]用食管胃交界处腺癌患者的内镜图像来构建AI系统,发现该AI系统的诊断敏感性、特异性和准确性分别为94%、42%和66%,内镜医生则分别为88%、43%和63%。
3 人工智能辅助影像学诊断食管癌
医学影像学在临床诊断和治疗中发挥着重大的作用,是发现癌症的重要技术,在过去10年中,计算机化工具的发展越来越多,这些工具可以将图像转换为定量的可挖掘数据(放射组学),并随后使用AI进行分析。这些工具正在提高早期病变诊断的准确性,以确定风险并将恶性疾病与良性疾病区分开来。许多研究和证据[40-43]综合表明,放射组学具有识别各种癌症原发肿瘤和淋巴结异质性的潜力,可用于临床诊断和预后。AI系统在CT图像上对术前临床、影像及病理特征进行筛选,可预测食管癌淋巴结转移风险[44-48]和根治性放化疗疗效[49-50]。
Ypsilantis等[51]基于107例食管癌患者的试验结果构建AI系统,采用MSGD(stochastic gradient-descent algorithm with mini batches)算法,从治疗前的正电子发射计算机断层显像(positron emission tomography-computed tomography,PET-CT)中自动提取关键特征,用于预测食管癌新辅助化疗疗效,该AI系统的敏感性和特异性分别为80.7%和81.6%,优于基于手工提取影像特征的传统机器学习算法。与仅使用临床特征相比,Van Rossum等[52]的研究添加全面的PET特征可提高模型的预测能力。Foley等[53]建立的结合PET-CT结构分析食管癌患者的预后模型,可对食管癌患者进行风险分层。
磁共振成像(magnetic resonance imaging,MRI)对软组织的分辨率更高,适用于食管肿瘤及纵隔淋巴结的评估。Qu等[54]用181例食管癌患者治疗前的MRI构建AI系统,使用Matlab自制程序计算放射学特征,发现基于MRI的影像组学诊断淋巴结转移的受试者工作特征曲线下面积值可达0.82,MRI放射特征可以预测食管癌患者术前淋巴结转移。Hou等[55]对68例根治性放化疗的ESCC患者进行疗效预测,采用两种方法即支持向量机和人工神经网络构建AI模型,发现两者均有较高的预测准确性,MRI放射组学可以预测ESCC放化疗的治疗反应。
4 人工智能辅助病理学诊断食管癌
食管癌的病理学形态[56]及免疫组织化学特征[57]被证实与患者预后密切相关。Tomita等[58]在123张组织学图像上进行评估,该AI系统准确识别显微镜图像上的癌性和癌前食管病变的平均准确率为0.83%,该AI系统是第1个使用DL方法自动检测组织病理学载玻片上的BE和EAC的模型。Kouzu等[59]从222例手术切除的ESCC病例中随机选择31例患者的切片用于训练和开发AI系统,切片采用苏木精-伊红数字化整片切片。结果显示该AI系统Dice系数得分为0.81。使用AI系统可以客观定量地评估ESCC中的纤维组织增生反应(desmoplastic reaction,DR),AI辅助的DR分类比手动DR分类对疾病特异性生存有更高的预后意义,且AI辅助的DR分类优于金标准因素肿瘤深度和淋巴结转移的预后准确性。
5 总结与展望
尽管近年来AI在诊断食管癌领域中的研究成果颇多,展现出AI在辅助医生诊断食管癌方面的巨大潜力,但其真正临床应用和推广仍面临许多挑战。(1)样本量少,没有独立的训练集和测试集,应建立大的图像数据库,训练AI软件程序。(2)样本多为清晰的高质量图像,不能完全模拟真实的临床情况,应研发实时AI诊断系统,多模态数据融合,将不同类型的医学图像数据(如内镜图像、CT、MRI等)综合分析和诊断,提高AI系统的准确性。(3)纳入的研究多为单中心回顾性研究,稳健性及普适性仍需要在多中心、真实世界大数据中进行前瞻性临床试验验证。(4)采集设备、采集参数和重建算法的差异,导致数据信号和质量的差异,数据应规范化和标准化。(5)AI系统辅助诊断过程中的医疗责任尚不明确,应制定有关伦理安全、数据所有权和AI系统诊断性能外部验证的共识指南。期望在不久的将来AI可以真正落地应用于临床实践,提升医疗效率,服务广大医生和患者。
利益冲突:无。
作者贡献:唐川君参与选题和设计,数据整理与分析,文章初稿撰写及修改;袁湘蕾参与选题和设计,起草、修改文章;张琼英、胡兵参与选题和设计,修改文章。