我国是世界上食管癌的高发国家之一。食管癌的早期发现与准确诊疗对提高患者的预后与生存具有重要意义。随着医学影像的积累和人工智能技术的进步,机器学习技术在癌症中被广泛应用。本文归纳了目前机器学习技术在食管癌基础研究和临床诊断中所用到的学习模型、图像类型、数据类型与应用效率;探讨了目前食管癌医学图像机器学习的主要困境和解决方法;讨论了未来机器学习在食管癌诊疗中可能的方向,特别是建立医学图像与分子机制间联系的可能。在此基础上,对机器学习在医学领域应用的一般规律进行了总结与展望。通过借鉴机器学习在其它癌症中的先进成果,注重多学科交叉合作,将有效促进食管癌研究的发展。
引用本文: 吴越峰, 王琪, 吴明. 机器学习技术在食管癌研究领域中应用的现状与展望. 中国胸心血管外科临床杂志, 2022, 29(6): 770-776. doi: 10.7507/1007-4848.202203015 复制
癌症的早期诊断与筛查是提高癌症治愈率、延长患者生存时间、减轻患者经济和精神负担的重要方法。通过各种方法提高早期诊断与筛查的准确性是医学影像学的重要研究内容。目前常见的用于各种癌症诊断的医学影像学手段主要有胸部 X线片、电子计算机断层成像(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)等[1]。影像学手段多用于判断癌症的存在与否和发病位置。然而,在病灶较小时难以进行准确判断。除影像学检查之外,穿刺取样后进行病理学检查具有重要的地位。病理学检查被认为是癌症诊断的“金标准”。常见的组织学方法有苏木精-伊红染色和针对特定癌症标志物的免疫组织化学染色。病理学手段可在影像学诊断的基础上明确癌症的性质,进行评级分类。传统的病理学研究主要集中在通过提升医师职业技能和制定诊断标准来提高疾病诊断的准确性上[2]。准确度上,前述方法受制于医师个人经验;效率上,认读图片需要耗费执业医师较长时间和较多精力。与此同时,人类大脑难以完整处理影像检查或病理切片产生的海量数据,更难以通过观察医学影像,总结出普适规律。这对于过去积累的海量医学数据是一种巨大浪费。随着计算机技术的发展,利用计算机技术处理和分析医学数据已经成为了一种必然。利用人工智能参与治疗辅助的系统可大致分为两类,即完全由人类设计的系统和计算机使用提取特征向量的示例数据进行训练的系统[3]。图像特征向量提取与运用可以由医师完成,也可以由深度学习算法完成。卷积神经网络(convolutional neural networks,CNN)就是一个目前被广泛应用的深度学习算法。如今,深度学习已经被广泛运用在病变分类、病变组织检测、器官与组织分割、器官配准和其它任务中[4]。
1 机器学习在癌症研究领域的应用
在过去10年中,人工智能技术已经广泛被使用在癌症的早期筛查、临床辅助诊断和机理研究等方面。杨文静等[5]通过文献可视化计量等方式发现,过去10年发表的文献集中在对于乳腺癌和肺癌的研究中。通过对高频词统计,其发现研究核心关注点在于对癌症的分类和生存的预测。利用材料主要是X射线、CT、MRI和病理切片图像等。在过去10年发表的成果中机器学习模型U-Net和支持向量机(support vector machines, SVM)被广泛使用。基于这些模型,针对医学图像特征而改造的网络模型也不断涌现。然而,目前利用人工智能揭示分子和细胞生物学机理的研究成果较少。主要原因在于,深度学习模型难以进行合理解释,常常被认为是“黑箱模型”。因此,构建可解释的深度学习模型非常关键[6]。
影像学方面,目前已经实现对肺部结节的切分与良性恶性的分类[7],亦可以检测肺癌与肺癌的分期[8]。相似的许多工作都建立了图像与癌症分期的模型。引人关注的是,基于CT图像,表皮生长因子受体(epidermal growth factor receptor,EGFR)基因的突变和细胞程式死亡-配体1(programmed cell death-ligand 1,PD-L1)的表达情况亦可被预测。这是建立图像与分子关系的重要工作[9],但不排除是此类关键基因突变造成了器官重大组织形态变化的可能。这些工作并不意味着深度学习模型可被用来预测所有基因的表达。
病理学方面,目前已经实现基于苏木精-伊红染色组织切片的突变分类[10]。根据基因组或转录组测序数据构建组织形态与基因表达关系的工作是当前研究的热点。然而,目前大部分工作停留在对已有表型和基因之间的回顾性验证,没有发现新的机制。对所发现验证机制也均停留在公开数据集层面,没有收集新的数据,更罕有生物化学层面的验证。这些模型存在缺乏普适性和应用前景的缺点。
2 食管癌诊疗的现状和困境
食管癌是指来源于食管黏膜上皮细胞的恶性肿瘤。组织学上,食管癌大致可分为鳞状细胞癌和腺癌两种。我国食管癌患者大多表现为鳞状细胞癌。随着癌症的发生与发展,深度上,食管癌从早期的局限于黏膜层的食管浸润性癌逐步向黏膜下层甚至更深肌层转移;广度上,从局限于食管,向胃部转移扩散[11]。通过组织切片可直观观察到癌变细胞的侵犯区域和癌症的进展状态。
食管癌在中国的发病率和死亡率居高不下。食管癌在中国恶性肿瘤发病率中位列第六,死亡率位列第四[12]。每年新增食管癌患者占全世界食管癌新增患者人数总和的50%左右[13]。其分布在中国存在明显的地域特征和城乡差异。食管癌发病率与地域饮食差异、生活习性、地方习俗和环境因素等存在密切联系。目前已经证明饮酒、吸烟、喜烫食、好辣食与食管癌发病存在密切联系[14]。
确诊食管癌之后,手术是主要的治疗手段。早期患者可采用内镜下的微创治疗(endoscopic mucosal resection,EMR),中晚期可切除患者可采用以手术为主的治疗方式。对于不可切除的患者,采用以放射治疗为主的综合治疗。早期食管癌手术治疗效果佳[15],但是中晚期食管癌手术治疗效果差强人意[16]。因此,食管癌的早期筛查和对应生物标记物的寻找对提升食管癌治疗效果具有重要作用。
对高危人群和有吞咽异物感患者,往往采用影像学方式做初步的食管癌筛查。X射线气钡双重对比造影、CT、MRI、超声检查、正电子发射计算机断层显像(positron emission computed tomography,PET-CT)检查等影像学方法被列入国家卫生健康委员会制定的《食管癌诊疗规范》。 X射线与CT是两种较为常用、经济的影像学诊断方式。食管癌患者X射线影像可见食管壁僵硬及黏膜破坏。但是,X射线图像对食管外侵诊断正确率较低,也不能对纵隔淋巴结转移作出诊断。CT图像可见食管壁增厚、软组织肿块等,可为探明周围组织器官浸润情况、淋巴结转移情况以及后续治疗方式提供参考。但是,CT图像组织分辨率还不够高,评估不够准确,对癌症的原发灶-淋巴结-远处转移(tumor-node-metastasis,TNM)分期无法进行精准判断。而癌症的准确分期恰是癌症精准治疗的重要环节[17]。
目前的局限在于,大多数肿瘤发生发展的分子机制研究和生物标记物的确定均集中在转录组测序技术(RNA-sequencing,RNA-seq)、全基因组测序(whole genome sequencing,WGS)和免疫组织化学(immunohistochemistry,IHC)层面。医学影像学与肿瘤分子机制间存在的关系及规律尚未阐明。
3 当前机器学习在食管癌诊疗中的应用
为了全面总结当前机器学习在食管癌诊疗中的应用,本文系统梳理了近20年来被CNKI与PubMed检索的关键词为“食管癌” AND “机器学习”或“esophageal cancer”AND “machine learning”的非综述类文献。近年来,以CNN为代表的机器学习模式—深度学习被广泛运用于食管癌诊疗中。传统机器学习模型建立在大量的 “如果-就”(If-Then)规则之上,本质是概率论和事件处理方式。神经网络(neural network)建立在对大脑神经元的模拟之上,本质是通过卷积层(convolution)从海量不同点中提取出信息,利用池化层(pooling)获取有预测能力的特征,激活层可以建立输入与输出之间的联系,通过不断调整迭代(iteration)增加预测精度。
3.1 机器学习用于食管癌患者的早期诊断
早期诊断是改善食管癌预后的重要途径。由于早期食管癌的隐蔽性,普通白光内镜(white light endoscopy,WLI)、窄带成像(narrow-band imaging,NBI)、激光共聚焦显微内镜(confocal laser microendoscopy,CLE)的结果存在较大的主观性和不准确性[18]。随着计算机视觉和图像模式识别技术的发展,基于深度学习模型的各种图像分类系统已经达到了令人惊叹的准确度。四川大学华西医院胡兵教授团队开发了一个基于深度学习模型的食管癌诊断系统,利用6 473张经过专业医师标记了癌前病变和食管鳞状细胞癌NBI图像,通过CNN模型(SegNet)提取图像特征,构建了敏感性和特异性均超过90%的早期筛查模型 [19]。
Gehrung等[20]利用经典CNN模型VGG-16,基于来自2 331例食管癌患者的4 662个cytosponge-TFF3检测样本,构建优先级分类模型。这一模型极大降低了病理学家的工作量。目前,在其它癌种如肺癌等癌症中,已经有利用组织切片的人工智能模型。食管癌在组织切片层面亦存在明显形态特征,但目前尚未有此方面研究,这可能是未来机器学习在食管癌诊疗中应用的重要方向。
3.2 机器学习用于食管癌患者生存、分期、分级、疗效预测
癌症预后受到众多因素影响。传统的卡普兰-梅尔估计量(Kaplan-Meier estimator)难以对多个因子进行联合分析,logistic回归等模型也不够准确。因此,建立准确的预测模型,是临床诊疗亟需解决的问题。
人工神经网络(artificial neural network,ANN)早在2005年就被Sato等[21]利用在食管癌患者的生存预测中。Sato等[21]根据来自418例食管癌患者的临床数据、TNM分期等信息创建了模型。但是,预测1年、5年生存率模型的精确度并不高。随后, Mofidi等[22]利用216例食管癌患者的临床信息、体重指数和病理数据集建立了预测食管癌和食管-胃连接部手术切除患者生存率的模型。获得了接近90%的预测准确率,超过国际癌症联合会建立的TNM分类系统的准确率。可见,除患者数量之外,单一患者的数据维度和对数据的预处理方法都对模型准确性有影响。近期,Liu等[23]从523例患者的28个临床变量中,筛选出了肿瘤浸润深度、肿瘤长度、吞咽情况、肿瘤分化程度和淋巴血管浸润程度这5个变量,进而用ANN建立了基于上述5个变量预测淋巴结扩散的模型。
最小分类误差法(minimum classification error,MCE)方面,基于患者年龄、居住地、吸烟史、口腔健康等食管癌常见危险因素构建的风险预测模型,获得了接近90%的准确率,超过了传统的logistic回归模型[24]。
SVM方面,Hayashida等[25]通过从27份血清样本中获得的蛋白质谱数据训练了预测食管癌患者化学治疗和放射治疗疗效模型。近期,Wang等[26]亦通过SVM模型利用1 200例CT扫描食管壁厚度数据,预测原发性胸段食管鳞状细胞癌的T分期,得到可用于区分食管鳞状细胞癌患者不同T期病变的最佳食管壁厚度阈值。值得注意的是,所用患者数据均经过了严格的CT和病理检查,为数据的准确性和后期临床应用的安全性提供了保证。
在CNN方面,Yeh等[27]收集了798例食管鳞状细胞癌患者的PET图像,278例接受食管切除术患者的PET图像和309例Ⅰ期肺癌患者的PET图像。首先,他们利用ResNet实现了基于PET图像的食管鳞状细胞癌与肺癌的区分。随后,他们实现了食管癌患者淋巴血管浸润(lymphovascular infiltration,LVI)和神经周围浸润(perineural infiltration,PNI)的分类和预测。
3.3 机器学习用于食管癌分子生物信息学解析
相比于医学影像,随着下一代测序技术和纳米孔测序技术的发展,海量的基因组和转录组数据被生产出来。通过生物信息学分析差异基因和高突变基因,并结合逆转录定量聚合酶链反应、蛋白免疫印迹(Western blotting,WB)和基因编辑等方式在细胞水平或小鼠模型水平进行验证,已经成为过去几十年中极为重要的癌生物学研究方式。在整个生物信息学分析中最重要的内容可用“降维”二字来概括。通俗地讲,就是如何从数量巨大的在统计学上有差异的基因中找出最有可能与疾病有关的基因。在基因组高度不稳定和具有异质性的癌症中,这项工作更为困难,而食管癌就是这样的一种癌症。因为传统生物信息学分析所得到的差异可能是由于肿瘤异质性得到的假阳性(false positive, type 2 error)结果。Mourikis等[28]通过机器学习算法实现了对每例患者中所有突变基因危害的整合描述。这一研究,发现除了公认癌基因(oncogene)之外的许多促癌基因(oncogenic promoter)并用实验加以验证。这一研究改变了传统正向遗传学(forward genetics)或反向遗传学(reverse genetics)关注单一基因和信号通路的局限,为后续测序数据整合分析提供了良好范式。
针对转录组数据,亦有较多机器学习模型提出。比如利用SVM反卷积,通过RNA-seq数据推测免疫细胞组分和免疫浸润状态的CIBERSORT工具[29]。这项工具的开发,给本来已经被挖掘殆尽的转录组公共数据提供了新的挖掘途径,并为单细胞测序提供佐证与对照。Pratama等[30]通过挖掘TCGA数据库中口腔鳞癌的转录组数据,并通过CNN识别标志性基因,对口腔鳞癌的分子机制研究做出贡献。Li等[31]整合5种机器学习模型(LR、SVM、ANN、RF、XGBoost),利用癌症基因组图谱计划(the cancer genome atlas,TCGA)和基因表达数据库(gene expression omnibus,GEO)公开转录组数据对食管癌中与预后有关的分子进行筛选,证明上皮分层蛋白(stratifin)是一个理想的预后标记物。
4 当前深度学习在食管癌诊疗中的困境
综合上述,以ANN、SVM、MCE等为代表的传统机器学习方法,学习内容简单,并且需要人类注释和设计。同时,学习内容也以数字记录为主,图像信息较少,难以进一步转化利用。而以CNN为代表的深度学习技术可以依靠模型自主提取特征,不仅节省了人类注释和设计的繁琐工作;同时计算机视觉识别得出的特征亦可以促进人类对疾病特点的认识。故而,深度学习在智能医学中的应用被寄予厚望。
4.1 深度学习模型运用的医学伦理问题
临床应用的深度学习模型在应用过程中存在伦理问题。首先是责任划分问题,智能诊断系统并非完全准确的系统。对于误诊产生的后果,患者、医院和制造商都是难以承受的。况且目前尚无有关法律法规出台,责任界限难以划分。其次是隐私保护问题,职业医师被要求不能泄露患者隐私,但储存在电脑中的人工智能程序可能被人为入侵,亦可能被有关人员故意泄露。这对于患者的隐私权是一种侵犯,并会对国家的生物安全造成影响[32]。基于以上问题,对策主要从制造、监管与使用3个层面展开。制造商应该遵守基本的伦理原则,同时做到数据来源透明,故障可被追溯。有关监管部门应该严格市场准入机制并根据人工智能医疗产品的迭代速度及时更新有关规定。使用时应该加强对患者和医生的教育,避免对人工智能技术的片面理解,在人工智能发展初期坚持人类的全过程介入[33]。
4.2 深度学习需要的巨大算力与海量数据量问题
前文中已经提到,巨大的数据量是深度学习模型准确的必要条件,算力需要巨大。而大部分医院储存数据用服务器并不会用到深度学习所必须的图形处理器(graphics processing unit,GPU),使用服务器供应商提供的算力支持又存在着患者数据泄露的问题。
在获取到的海量数据中,也并非所有数据均可用于深度学习。这可能是各个医院数据收集和数据标注的不统一导致的。部分采集设备市场保有率不高,通过这些采集设备获得的数据可能存在批次效应(batch effect)。同时,对于数据的标注不同医院精度相差很大。一方面,这是由不同医院医师的年资和经验不同导致;另一方面,这是由医院数据管理规范不严格导致。例如,CT图像需要标注出食管肿瘤边缘和食管结构,内镜数据需要画出病灶位置,病理切片需要区分出不同类型组织和癌症浸润区域。
4.3 深度学习应当推陈出新和服务理论研究与患者
目前基于深度学习或机器学习模型进行食管癌诊疗研究的论文层出不穷。但在真实世界诊疗过程中却少见深度学习的运用。首先,这是由于论文探索目的大多具有同质性特征。目前深度学习的论文大多集中在对生存情况的预测,因为训练所需数据量小且训练算力需求少。这类重复发表的生存预测模型难以有实际的作用和对未来研究方向的指导。其次,基于深度学习的图像预测模型,在训练中,研究人员为了获得较高的准确率,往往对数据进行了过度的处理和筛选,训练集和验证集来自同一数据集,在真实世界测试中无法满足临床要求。
在机制研究方面,由于食管癌深度学习缺少基于组织切片的模型,难以获得肿瘤细胞形态与组织结构上的认识,深度学习难以对食管癌发生发展的机制研究有所启示。同时,大多深度学习模型探索图像类型单一,没有建立CT与内镜,内镜与MRI或多特征整合分析模型,更缺乏RNA-seq、图像数据及组织切片间的联系。
5 未来深度学习在食管癌研究领域中可能的方向
5.1 建立医学影像或组织切片与测序数据之间联系的深度学习模型
目前绝大部分肿瘤学研究均基于中心法则进行,在脱氧核糖核酸、信使核糖核酸和蛋白质3个层面,通过基因组测序、转录组测序、荧光实时定量PCR等技术逐步阐明机制。同时,目前大多的正向遗传学研究,阐明的表型仅仅在肿瘤大小和组织化学特征上,少有阐述其与医学影像特征和转录组整体特征间的关系。这是因为人类在认知过程中无法同时关注医学影像和转录组中的海量数据特征,且对特征的选择和评价人与人之间存在差异。然而,拓展正向遗传学研究边界对遗传学成果临床运用具有重要理论与实践价值。例如,Hippo信号通路已经被证明在调节器官大小和器官发育过程中具有重要作用,Hippo信号通路中的关键基因,如Yes1相关转录调节因子被认为是重要的生物标记物[34],但是其表达强度和影像学中器官大小与形态关系无定量表述。定量判断作为精准医疗的重要步骤,深度学习模型的建立对其发展将产生深远影响,因为神经网络中的卷积和池化过程能够对特征进行有效提取和总结。深度学习模型可用于药物用量判定、手术方案指导等。同时,在此过程中由于强烈的理论研究特性和全过程的人类参与流程,规避了潜在的医学伦理问题,创造了识错纠错的可能。
5.2 通过总结深度学习识别的特征,构建可解释的机器学习模型进而深化对食管癌的认识
可解释性被定义为“用可理解的语言向人解释或表达的能力”[35]。构建可解释的学习模型被认为是深度学习未来发展的重要方向。首先,面对复杂的医学数据和患者个体特征,人类无法模拟所有的输入情况来测试程序的稳定性,而获取程序运算的逻辑有助于人类判断程序的合理性并根据可视化中呈现出的错误有针对地改进算法[36]。其次,对于医生而言,只能看到深度学习模型的输入值和输出值,无法知道运算的过程。这是医生无法信任深度学习工具的重要原因。提高医学深度学习模型的可解释性有助于消除医生与计算机模型之间的隔阂。更重要的是,作为知识发现的重要手段,可解释的模型可以助力疾病机制的探究,人类有可能通过神经网络总结出的联系发现潜在的疾病影响因素。Rajpurkar等[37]通过可视化肺炎患者胸部X线片中病变区域,为临床诊断提供重要辅助。Chen等[38]建立了上皮间质转化(epithelial-mesenchymal transition,EMT)与苏木精-伊红染色切片的深度学习模型,并可视化了细胞形态,这为转分化研究提供了重要线索。目前,尚未有可解释的机器学习模型在食管癌研究中得到运用。然而,目前食管癌的发病机理尚未阐明。传统的影像学、病理学、细胞和分子生物学等方法并不能完全满足科研及临床需求,比如病理切片中癌细胞侵犯区域特征和组织形态变化规律等。因此构建可解释的机器学习模型在食管癌研究中至关重要。
6 总结与展望
综上,机器学习技术在癌症领域研究中存在巨大的理论研究价值和临床应用价值。目前,该领域已经取得了许多令人瞩目的成果。然而,当下的生物信息学研究工作已出现模式化趋势,深度学习成果内容大同小异,使用同一模型对多个已知功能基因进行重复研究或对已有模型进行重复计算和模仿难以产生有效成果[39]。在尚有许多关键问题未被解决的今天,应该用好深度学习这一工具,探索未知癌症发展机理,设法提高诊断准确率。 同时,目前食管癌领域的机器学习研究和其它癌症相比处于滞后的状态。部分原因是缺乏高质量的食管癌数据。一方面,应该加强数据的搜集与管理;另一方面,对于类似的小样本癌症与其它罕见病,建立可迁移学习模型。总体上来讲,人工智能是未来医学发展的重要方向之一,应该用积极的心态和辩证的眼光去看待它。医学研究承载着造福人类健康的使命,将深度学习技术用于医学研究,是计算机科学发展提供的机遇,也是历史进程赋予的使命。
利益冲突:无。
作者贡献:吴明负责论文主题构思;吴越峰负责文献检索、论文撰写;王琪负责论文修改。
癌症的早期诊断与筛查是提高癌症治愈率、延长患者生存时间、减轻患者经济和精神负担的重要方法。通过各种方法提高早期诊断与筛查的准确性是医学影像学的重要研究内容。目前常见的用于各种癌症诊断的医学影像学手段主要有胸部 X线片、电子计算机断层成像(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)等[1]。影像学手段多用于判断癌症的存在与否和发病位置。然而,在病灶较小时难以进行准确判断。除影像学检查之外,穿刺取样后进行病理学检查具有重要的地位。病理学检查被认为是癌症诊断的“金标准”。常见的组织学方法有苏木精-伊红染色和针对特定癌症标志物的免疫组织化学染色。病理学手段可在影像学诊断的基础上明确癌症的性质,进行评级分类。传统的病理学研究主要集中在通过提升医师职业技能和制定诊断标准来提高疾病诊断的准确性上[2]。准确度上,前述方法受制于医师个人经验;效率上,认读图片需要耗费执业医师较长时间和较多精力。与此同时,人类大脑难以完整处理影像检查或病理切片产生的海量数据,更难以通过观察医学影像,总结出普适规律。这对于过去积累的海量医学数据是一种巨大浪费。随着计算机技术的发展,利用计算机技术处理和分析医学数据已经成为了一种必然。利用人工智能参与治疗辅助的系统可大致分为两类,即完全由人类设计的系统和计算机使用提取特征向量的示例数据进行训练的系统[3]。图像特征向量提取与运用可以由医师完成,也可以由深度学习算法完成。卷积神经网络(convolutional neural networks,CNN)就是一个目前被广泛应用的深度学习算法。如今,深度学习已经被广泛运用在病变分类、病变组织检测、器官与组织分割、器官配准和其它任务中[4]。
1 机器学习在癌症研究领域的应用
在过去10年中,人工智能技术已经广泛被使用在癌症的早期筛查、临床辅助诊断和机理研究等方面。杨文静等[5]通过文献可视化计量等方式发现,过去10年发表的文献集中在对于乳腺癌和肺癌的研究中。通过对高频词统计,其发现研究核心关注点在于对癌症的分类和生存的预测。利用材料主要是X射线、CT、MRI和病理切片图像等。在过去10年发表的成果中机器学习模型U-Net和支持向量机(support vector machines, SVM)被广泛使用。基于这些模型,针对医学图像特征而改造的网络模型也不断涌现。然而,目前利用人工智能揭示分子和细胞生物学机理的研究成果较少。主要原因在于,深度学习模型难以进行合理解释,常常被认为是“黑箱模型”。因此,构建可解释的深度学习模型非常关键[6]。
影像学方面,目前已经实现对肺部结节的切分与良性恶性的分类[7],亦可以检测肺癌与肺癌的分期[8]。相似的许多工作都建立了图像与癌症分期的模型。引人关注的是,基于CT图像,表皮生长因子受体(epidermal growth factor receptor,EGFR)基因的突变和细胞程式死亡-配体1(programmed cell death-ligand 1,PD-L1)的表达情况亦可被预测。这是建立图像与分子关系的重要工作[9],但不排除是此类关键基因突变造成了器官重大组织形态变化的可能。这些工作并不意味着深度学习模型可被用来预测所有基因的表达。
病理学方面,目前已经实现基于苏木精-伊红染色组织切片的突变分类[10]。根据基因组或转录组测序数据构建组织形态与基因表达关系的工作是当前研究的热点。然而,目前大部分工作停留在对已有表型和基因之间的回顾性验证,没有发现新的机制。对所发现验证机制也均停留在公开数据集层面,没有收集新的数据,更罕有生物化学层面的验证。这些模型存在缺乏普适性和应用前景的缺点。
2 食管癌诊疗的现状和困境
食管癌是指来源于食管黏膜上皮细胞的恶性肿瘤。组织学上,食管癌大致可分为鳞状细胞癌和腺癌两种。我国食管癌患者大多表现为鳞状细胞癌。随着癌症的发生与发展,深度上,食管癌从早期的局限于黏膜层的食管浸润性癌逐步向黏膜下层甚至更深肌层转移;广度上,从局限于食管,向胃部转移扩散[11]。通过组织切片可直观观察到癌变细胞的侵犯区域和癌症的进展状态。
食管癌在中国的发病率和死亡率居高不下。食管癌在中国恶性肿瘤发病率中位列第六,死亡率位列第四[12]。每年新增食管癌患者占全世界食管癌新增患者人数总和的50%左右[13]。其分布在中国存在明显的地域特征和城乡差异。食管癌发病率与地域饮食差异、生活习性、地方习俗和环境因素等存在密切联系。目前已经证明饮酒、吸烟、喜烫食、好辣食与食管癌发病存在密切联系[14]。
确诊食管癌之后,手术是主要的治疗手段。早期患者可采用内镜下的微创治疗(endoscopic mucosal resection,EMR),中晚期可切除患者可采用以手术为主的治疗方式。对于不可切除的患者,采用以放射治疗为主的综合治疗。早期食管癌手术治疗效果佳[15],但是中晚期食管癌手术治疗效果差强人意[16]。因此,食管癌的早期筛查和对应生物标记物的寻找对提升食管癌治疗效果具有重要作用。
对高危人群和有吞咽异物感患者,往往采用影像学方式做初步的食管癌筛查。X射线气钡双重对比造影、CT、MRI、超声检查、正电子发射计算机断层显像(positron emission computed tomography,PET-CT)检查等影像学方法被列入国家卫生健康委员会制定的《食管癌诊疗规范》。 X射线与CT是两种较为常用、经济的影像学诊断方式。食管癌患者X射线影像可见食管壁僵硬及黏膜破坏。但是,X射线图像对食管外侵诊断正确率较低,也不能对纵隔淋巴结转移作出诊断。CT图像可见食管壁增厚、软组织肿块等,可为探明周围组织器官浸润情况、淋巴结转移情况以及后续治疗方式提供参考。但是,CT图像组织分辨率还不够高,评估不够准确,对癌症的原发灶-淋巴结-远处转移(tumor-node-metastasis,TNM)分期无法进行精准判断。而癌症的准确分期恰是癌症精准治疗的重要环节[17]。
目前的局限在于,大多数肿瘤发生发展的分子机制研究和生物标记物的确定均集中在转录组测序技术(RNA-sequencing,RNA-seq)、全基因组测序(whole genome sequencing,WGS)和免疫组织化学(immunohistochemistry,IHC)层面。医学影像学与肿瘤分子机制间存在的关系及规律尚未阐明。
3 当前机器学习在食管癌诊疗中的应用
为了全面总结当前机器学习在食管癌诊疗中的应用,本文系统梳理了近20年来被CNKI与PubMed检索的关键词为“食管癌” AND “机器学习”或“esophageal cancer”AND “machine learning”的非综述类文献。近年来,以CNN为代表的机器学习模式—深度学习被广泛运用于食管癌诊疗中。传统机器学习模型建立在大量的 “如果-就”(If-Then)规则之上,本质是概率论和事件处理方式。神经网络(neural network)建立在对大脑神经元的模拟之上,本质是通过卷积层(convolution)从海量不同点中提取出信息,利用池化层(pooling)获取有预测能力的特征,激活层可以建立输入与输出之间的联系,通过不断调整迭代(iteration)增加预测精度。
3.1 机器学习用于食管癌患者的早期诊断
早期诊断是改善食管癌预后的重要途径。由于早期食管癌的隐蔽性,普通白光内镜(white light endoscopy,WLI)、窄带成像(narrow-band imaging,NBI)、激光共聚焦显微内镜(confocal laser microendoscopy,CLE)的结果存在较大的主观性和不准确性[18]。随着计算机视觉和图像模式识别技术的发展,基于深度学习模型的各种图像分类系统已经达到了令人惊叹的准确度。四川大学华西医院胡兵教授团队开发了一个基于深度学习模型的食管癌诊断系统,利用6 473张经过专业医师标记了癌前病变和食管鳞状细胞癌NBI图像,通过CNN模型(SegNet)提取图像特征,构建了敏感性和特异性均超过90%的早期筛查模型 [19]。
Gehrung等[20]利用经典CNN模型VGG-16,基于来自2 331例食管癌患者的4 662个cytosponge-TFF3检测样本,构建优先级分类模型。这一模型极大降低了病理学家的工作量。目前,在其它癌种如肺癌等癌症中,已经有利用组织切片的人工智能模型。食管癌在组织切片层面亦存在明显形态特征,但目前尚未有此方面研究,这可能是未来机器学习在食管癌诊疗中应用的重要方向。
3.2 机器学习用于食管癌患者生存、分期、分级、疗效预测
癌症预后受到众多因素影响。传统的卡普兰-梅尔估计量(Kaplan-Meier estimator)难以对多个因子进行联合分析,logistic回归等模型也不够准确。因此,建立准确的预测模型,是临床诊疗亟需解决的问题。
人工神经网络(artificial neural network,ANN)早在2005年就被Sato等[21]利用在食管癌患者的生存预测中。Sato等[21]根据来自418例食管癌患者的临床数据、TNM分期等信息创建了模型。但是,预测1年、5年生存率模型的精确度并不高。随后, Mofidi等[22]利用216例食管癌患者的临床信息、体重指数和病理数据集建立了预测食管癌和食管-胃连接部手术切除患者生存率的模型。获得了接近90%的预测准确率,超过国际癌症联合会建立的TNM分类系统的准确率。可见,除患者数量之外,单一患者的数据维度和对数据的预处理方法都对模型准确性有影响。近期,Liu等[23]从523例患者的28个临床变量中,筛选出了肿瘤浸润深度、肿瘤长度、吞咽情况、肿瘤分化程度和淋巴血管浸润程度这5个变量,进而用ANN建立了基于上述5个变量预测淋巴结扩散的模型。
最小分类误差法(minimum classification error,MCE)方面,基于患者年龄、居住地、吸烟史、口腔健康等食管癌常见危险因素构建的风险预测模型,获得了接近90%的准确率,超过了传统的logistic回归模型[24]。
SVM方面,Hayashida等[25]通过从27份血清样本中获得的蛋白质谱数据训练了预测食管癌患者化学治疗和放射治疗疗效模型。近期,Wang等[26]亦通过SVM模型利用1 200例CT扫描食管壁厚度数据,预测原发性胸段食管鳞状细胞癌的T分期,得到可用于区分食管鳞状细胞癌患者不同T期病变的最佳食管壁厚度阈值。值得注意的是,所用患者数据均经过了严格的CT和病理检查,为数据的准确性和后期临床应用的安全性提供了保证。
在CNN方面,Yeh等[27]收集了798例食管鳞状细胞癌患者的PET图像,278例接受食管切除术患者的PET图像和309例Ⅰ期肺癌患者的PET图像。首先,他们利用ResNet实现了基于PET图像的食管鳞状细胞癌与肺癌的区分。随后,他们实现了食管癌患者淋巴血管浸润(lymphovascular infiltration,LVI)和神经周围浸润(perineural infiltration,PNI)的分类和预测。
3.3 机器学习用于食管癌分子生物信息学解析
相比于医学影像,随着下一代测序技术和纳米孔测序技术的发展,海量的基因组和转录组数据被生产出来。通过生物信息学分析差异基因和高突变基因,并结合逆转录定量聚合酶链反应、蛋白免疫印迹(Western blotting,WB)和基因编辑等方式在细胞水平或小鼠模型水平进行验证,已经成为过去几十年中极为重要的癌生物学研究方式。在整个生物信息学分析中最重要的内容可用“降维”二字来概括。通俗地讲,就是如何从数量巨大的在统计学上有差异的基因中找出最有可能与疾病有关的基因。在基因组高度不稳定和具有异质性的癌症中,这项工作更为困难,而食管癌就是这样的一种癌症。因为传统生物信息学分析所得到的差异可能是由于肿瘤异质性得到的假阳性(false positive, type 2 error)结果。Mourikis等[28]通过机器学习算法实现了对每例患者中所有突变基因危害的整合描述。这一研究,发现除了公认癌基因(oncogene)之外的许多促癌基因(oncogenic promoter)并用实验加以验证。这一研究改变了传统正向遗传学(forward genetics)或反向遗传学(reverse genetics)关注单一基因和信号通路的局限,为后续测序数据整合分析提供了良好范式。
针对转录组数据,亦有较多机器学习模型提出。比如利用SVM反卷积,通过RNA-seq数据推测免疫细胞组分和免疫浸润状态的CIBERSORT工具[29]。这项工具的开发,给本来已经被挖掘殆尽的转录组公共数据提供了新的挖掘途径,并为单细胞测序提供佐证与对照。Pratama等[30]通过挖掘TCGA数据库中口腔鳞癌的转录组数据,并通过CNN识别标志性基因,对口腔鳞癌的分子机制研究做出贡献。Li等[31]整合5种机器学习模型(LR、SVM、ANN、RF、XGBoost),利用癌症基因组图谱计划(the cancer genome atlas,TCGA)和基因表达数据库(gene expression omnibus,GEO)公开转录组数据对食管癌中与预后有关的分子进行筛选,证明上皮分层蛋白(stratifin)是一个理想的预后标记物。
4 当前深度学习在食管癌诊疗中的困境
综合上述,以ANN、SVM、MCE等为代表的传统机器学习方法,学习内容简单,并且需要人类注释和设计。同时,学习内容也以数字记录为主,图像信息较少,难以进一步转化利用。而以CNN为代表的深度学习技术可以依靠模型自主提取特征,不仅节省了人类注释和设计的繁琐工作;同时计算机视觉识别得出的特征亦可以促进人类对疾病特点的认识。故而,深度学习在智能医学中的应用被寄予厚望。
4.1 深度学习模型运用的医学伦理问题
临床应用的深度学习模型在应用过程中存在伦理问题。首先是责任划分问题,智能诊断系统并非完全准确的系统。对于误诊产生的后果,患者、医院和制造商都是难以承受的。况且目前尚无有关法律法规出台,责任界限难以划分。其次是隐私保护问题,职业医师被要求不能泄露患者隐私,但储存在电脑中的人工智能程序可能被人为入侵,亦可能被有关人员故意泄露。这对于患者的隐私权是一种侵犯,并会对国家的生物安全造成影响[32]。基于以上问题,对策主要从制造、监管与使用3个层面展开。制造商应该遵守基本的伦理原则,同时做到数据来源透明,故障可被追溯。有关监管部门应该严格市场准入机制并根据人工智能医疗产品的迭代速度及时更新有关规定。使用时应该加强对患者和医生的教育,避免对人工智能技术的片面理解,在人工智能发展初期坚持人类的全过程介入[33]。
4.2 深度学习需要的巨大算力与海量数据量问题
前文中已经提到,巨大的数据量是深度学习模型准确的必要条件,算力需要巨大。而大部分医院储存数据用服务器并不会用到深度学习所必须的图形处理器(graphics processing unit,GPU),使用服务器供应商提供的算力支持又存在着患者数据泄露的问题。
在获取到的海量数据中,也并非所有数据均可用于深度学习。这可能是各个医院数据收集和数据标注的不统一导致的。部分采集设备市场保有率不高,通过这些采集设备获得的数据可能存在批次效应(batch effect)。同时,对于数据的标注不同医院精度相差很大。一方面,这是由不同医院医师的年资和经验不同导致;另一方面,这是由医院数据管理规范不严格导致。例如,CT图像需要标注出食管肿瘤边缘和食管结构,内镜数据需要画出病灶位置,病理切片需要区分出不同类型组织和癌症浸润区域。
4.3 深度学习应当推陈出新和服务理论研究与患者
目前基于深度学习或机器学习模型进行食管癌诊疗研究的论文层出不穷。但在真实世界诊疗过程中却少见深度学习的运用。首先,这是由于论文探索目的大多具有同质性特征。目前深度学习的论文大多集中在对生存情况的预测,因为训练所需数据量小且训练算力需求少。这类重复发表的生存预测模型难以有实际的作用和对未来研究方向的指导。其次,基于深度学习的图像预测模型,在训练中,研究人员为了获得较高的准确率,往往对数据进行了过度的处理和筛选,训练集和验证集来自同一数据集,在真实世界测试中无法满足临床要求。
在机制研究方面,由于食管癌深度学习缺少基于组织切片的模型,难以获得肿瘤细胞形态与组织结构上的认识,深度学习难以对食管癌发生发展的机制研究有所启示。同时,大多深度学习模型探索图像类型单一,没有建立CT与内镜,内镜与MRI或多特征整合分析模型,更缺乏RNA-seq、图像数据及组织切片间的联系。
5 未来深度学习在食管癌研究领域中可能的方向
5.1 建立医学影像或组织切片与测序数据之间联系的深度学习模型
目前绝大部分肿瘤学研究均基于中心法则进行,在脱氧核糖核酸、信使核糖核酸和蛋白质3个层面,通过基因组测序、转录组测序、荧光实时定量PCR等技术逐步阐明机制。同时,目前大多的正向遗传学研究,阐明的表型仅仅在肿瘤大小和组织化学特征上,少有阐述其与医学影像特征和转录组整体特征间的关系。这是因为人类在认知过程中无法同时关注医学影像和转录组中的海量数据特征,且对特征的选择和评价人与人之间存在差异。然而,拓展正向遗传学研究边界对遗传学成果临床运用具有重要理论与实践价值。例如,Hippo信号通路已经被证明在调节器官大小和器官发育过程中具有重要作用,Hippo信号通路中的关键基因,如Yes1相关转录调节因子被认为是重要的生物标记物[34],但是其表达强度和影像学中器官大小与形态关系无定量表述。定量判断作为精准医疗的重要步骤,深度学习模型的建立对其发展将产生深远影响,因为神经网络中的卷积和池化过程能够对特征进行有效提取和总结。深度学习模型可用于药物用量判定、手术方案指导等。同时,在此过程中由于强烈的理论研究特性和全过程的人类参与流程,规避了潜在的医学伦理问题,创造了识错纠错的可能。
5.2 通过总结深度学习识别的特征,构建可解释的机器学习模型进而深化对食管癌的认识
可解释性被定义为“用可理解的语言向人解释或表达的能力”[35]。构建可解释的学习模型被认为是深度学习未来发展的重要方向。首先,面对复杂的医学数据和患者个体特征,人类无法模拟所有的输入情况来测试程序的稳定性,而获取程序运算的逻辑有助于人类判断程序的合理性并根据可视化中呈现出的错误有针对地改进算法[36]。其次,对于医生而言,只能看到深度学习模型的输入值和输出值,无法知道运算的过程。这是医生无法信任深度学习工具的重要原因。提高医学深度学习模型的可解释性有助于消除医生与计算机模型之间的隔阂。更重要的是,作为知识发现的重要手段,可解释的模型可以助力疾病机制的探究,人类有可能通过神经网络总结出的联系发现潜在的疾病影响因素。Rajpurkar等[37]通过可视化肺炎患者胸部X线片中病变区域,为临床诊断提供重要辅助。Chen等[38]建立了上皮间质转化(epithelial-mesenchymal transition,EMT)与苏木精-伊红染色切片的深度学习模型,并可视化了细胞形态,这为转分化研究提供了重要线索。目前,尚未有可解释的机器学习模型在食管癌研究中得到运用。然而,目前食管癌的发病机理尚未阐明。传统的影像学、病理学、细胞和分子生物学等方法并不能完全满足科研及临床需求,比如病理切片中癌细胞侵犯区域特征和组织形态变化规律等。因此构建可解释的机器学习模型在食管癌研究中至关重要。
6 总结与展望
综上,机器学习技术在癌症领域研究中存在巨大的理论研究价值和临床应用价值。目前,该领域已经取得了许多令人瞩目的成果。然而,当下的生物信息学研究工作已出现模式化趋势,深度学习成果内容大同小异,使用同一模型对多个已知功能基因进行重复研究或对已有模型进行重复计算和模仿难以产生有效成果[39]。在尚有许多关键问题未被解决的今天,应该用好深度学习这一工具,探索未知癌症发展机理,设法提高诊断准确率。 同时,目前食管癌领域的机器学习研究和其它癌症相比处于滞后的状态。部分原因是缺乏高质量的食管癌数据。一方面,应该加强数据的搜集与管理;另一方面,对于类似的小样本癌症与其它罕见病,建立可迁移学习模型。总体上来讲,人工智能是未来医学发展的重要方向之一,应该用积极的心态和辩证的眼光去看待它。医学研究承载着造福人类健康的使命,将深度学习技术用于医学研究,是计算机科学发展提供的机遇,也是历史进程赋予的使命。
利益冲突:无。
作者贡献:吴明负责论文主题构思;吴越峰负责文献检索、论文撰写;王琪负责论文修改。