引用本文: 孔德志, 刘傲, 崔健, 冷晓亮, 沃杨, 董燕亭, 矫文捷. 临床Ⅰ期非小细胞肺癌诊断模型构建:基于临床影像学特征联合叶酸受体阳性循环肿瘤细胞检测的研究. 中国胸心血管外科临床杂志, 2021, 28(10): 1192-1201. doi: 10.7507/1007-4848.202101072 复制
在全球范围内,肺癌是对人类健康和生命威胁最大的恶性肿瘤之一,2018 年估计有 210 万肺癌新发病例和 180 万死亡病例,占与癌症相关死亡人数的近 1/5(18.4%)[1]。我国约 75% 的肺癌患者在诊断时已属晚期,5 年生存率为 15.6%,而早期肺癌患者的 5 年生存率为 80%[2]。这一现状不但与缺乏筛查有关,更与缺乏科学鉴别肺结节的方法有关。
目前针对肺癌高发人群筛查常通过低剂量螺旋计算机断层扫描(low-dose computed tomography,LDCT)。然而,有研究[3]表明,LDCT 假阳性率较高(18.5%),且存在辐射暴露、随访成本高以及发现中央型病灶肺癌患者的效果较差等问题,并不能完全达到有效地早期诊断和预防的目的[4]。传统的肿瘤相关抗原在肺癌早期诊断中的敏感性和特异性均不理想。其它侵入性诊断方法,如针吸活检或支气管镜刷检,并发症发生率高,给患者带来极大的不适[5]。
随着精准医学的发展和技术的进步,液体活检凭借其无创性、敏感性、动态性等特质,被寄予厚望[6-7]。外周血标本易获得、侵入性小、可反复采集,是临床上常规检测较为理想的标本来源。循环肿瘤细胞(circulating tumor cell,CTC)是指从原发或转移病灶脱落到血液循环中的肿瘤细胞。CTC 作为新一代的肿瘤标志物,大量研究[8-10]已经证实 CTC 检测将有助于肿瘤早期诊断、复发转移监测、判断患者预后及指导术后辅助治疗。叶酸受体(folate receptor,FR)是一种细胞表面受体糖蛋白,在许多上皮来源的恶性肿瘤细胞中高度表达,在 75.7% 的非小细胞肺癌(NSCLC)患者中显著上调[11]。
因此,我们致力于研究分析叶酸受体阳性循环肿瘤细胞(folate receptor-positive circulating tumor cells,FR+CTC)在临床Ⅰ期 NSCLC 患者中的表达,并建立一个基于 FR+CTC 的临床Ⅰ期 NSCLC 诊断模型,为可疑肺结节的早期诊断提供新的依据。
1 资料与方法
1.1 临床资料和分组
回顾性分析青岛大学附属医院 2018 年 9 月至 2019 年 12 月入院的 1 520 例进行了 CTC 检测的患者的临床资料。这些患者均接受了胸部 CT 扫描和手术治疗,并进行了病理检查。筛选出临床Ⅰ期 NSCLC 患者及肺部良性疾病患者 1 277 例,其中男 518 例、女 759 例,中位年龄为 57(29~85)岁。纳入标准:(1)NSCLC 或良性疾病患者术前胸部 CT 检查有肺结节。检查无淋巴结、区域或远处转移;(2)术前采集血液样本进行 FR+CTC 检测;(3)CT 上病灶直径≤4 cm;(4)病理组织学检查有明确的病理诊断结果;(5)患者有完整的临床病例资料。随后,为保证有足够数量的患者建立准确的模型,将符合标准的 1 277 例患者采用随机数字表法按 4∶1 的比例随机分为两组,其中试验组 1038 例、验证组 239 例。
1.2 血液样本中 FR+CTC 的定量检测
临床检测样本为全血样本,每次采血时用加有 EDTA 抗凝剂的真空采血管抽取患者静脉血 3 mL,上下颠倒 7~8 次。样本采用“叶酸受体细胞检测试剂盒”检测样本中 FR+CTC 的数量。根据试剂盒说明书,CTC 是通过红细胞的裂解和血液中白细胞的免疫磁性去除(通过抗 CD45 和抗 CD14 涂层的磁珠)来富集的。然后用肿瘤特异性配体叶酸和人工合成的寡核苷酸的结合物标记它,收集 CTC 进行定量 PCR 分析。免疫荧光染色后,CTC 被定义为表达叶酸配体和细胞角蛋白(8、18 和 19)的细胞。在本研究中,我们定义 1 个 CTC 单位为在 3 mL 血液中检测到的 CTC 数量[12]。
样本一经采集,则尽快送至检测实验室。如若不能马上送检样本,则于 4℃~8℃ 暂存,并在 24 h 之内进行检测。如超出保存时间,则丢弃该血样,重新采集。样本如需运输,用 4℃~8℃ 冰袋保持低温运输。FR+CTC 值>8.7 FU/3 mL 定义为阳性。
1.3 数据收集
收集患者的临床资料、FR+CTC 值、影像学特征及肿瘤标志物。其中,临床资料包括年龄、性别、吸烟史、临床症状。影像学特征包括结节位置、结节直径、结节中实性成分直径比值(consolidation/tumor ratio,CTR)、胸膜牵拉征、毛刺征、肺气肿。肿瘤标志物包括癌胚抗原(carcinoembryonic antigen,CEA)、鳞状上皮细胞癌抗原(squamous cell carcinoma antigen,SCC)、神经元特异性烯醇化酶(neuron-specific enolase,NSE)、糖类抗原 199(carbohydrate antigen 199,CA199)和糖类抗原 125(carbohydrate antigen 125,CA125)。
1.4 统计学分析
正态分布的连续变量采用均数±标准差(±s)表示,非正态分布的连续变量采用中位数(上下四分位数)[M(P25,P75)]表示,组间比较采用t检验、Mann-Whitney U检验或 Kruskal-Wallis 检验。分类变量以例(%)表示,组间比较采用χ2检验和 Fisher 确切概率法。将数据进行单因素分析,将单因素分析结果中有统计学意义的因素进行 logistic 回归分析,找出独立危险因素,建立预测模型,绘制列线图(Nomogram),对模型进行内部及外部验证,检测模型的预测性能。绘制受试者工作特征(receiver operating characteristic,ROC)曲线,计算曲线下面积(area under the curve,AUC)检验模型的区分度,校准曲线检验模型的一致性。在所有分析中,双侧P≤0.05 为差异有统计学意义。采用 SPSS 25.0 软件、Med-Calc 19.1 软件、GraphPad Prism 8 软件和 R 3.6.1 软件及 RMS 包执行所有分析。
1.5 伦理审查
本研究已通过青岛大学附属医院伦理委员会批准,批准号为:QYFYWZLL 26169。
2 结果
2.1 研究人群的临床特征及 FR+CTC 分布
共 925 例经病理证实的 NSCLC 患者和 113 例良性结节患者纳入试验组。其中,907 例 NSCLC 患者病理证实为腺癌,良性结节包括 50 例错构瘤、27 例炎性假瘤、25 例结核、11 例硬化性肺泡细胞瘤。试验组患者的平均年龄为 59.15 岁,其中 NSCLC 患者的平均年龄为 60.00 岁,良性结节患者的平均年龄为 57.00 岁;验证组 NSCLC 患者 219 例,良性结节患者 20 例,患者的平均年龄为 59.29 岁,其中 NSCLC 患者的平均年龄为 59.71 岁,良性结节患者的平均年龄为 54.35 岁。
试验组中,NSCLC 的女性患者比例明显高于男性(62.1% vs. 37.9%),没有吸烟史的患者占大多数(77.2%),有症状患者多于没有症状(多为查体发现)患者(63.9% vs. 36.1%);见表 1;外周血中 FR+CTC 阳性(>8.7 FU/3 mL)的 NSCLC 患者显著多于 FR+CTC 阴性患者(78.8% vs. 21.2%,P<0.001);同时,在肺良性结节的患者中,FR+CTC 阴性患者比例则明显高于 FR+CTC 阳性患者(76.1% vs. 23.9%)。影像学特征方面,恶性结节位于右肺的比例明显高于左肺(60.4% vs. 39.6%)。肺恶性结节直径的中位值为 17 mm,良性结节直径的中位值为 13 mm,良恶性结节直径大小多为 10~<20 mm(45.2% vs. 54.9%),恶性结节其次为 20~<30 mm(25.9%),而良性结节其次为 <10 mm(27.4%)。胸部 CT 中恶性结节胸膜牵拉征和毛刺征出现的频率显著高于良性结节,分别为 40.2% vs. 19.5%,62.9% vs. 23.9%。根据结节的 CTR 值,将结节分为实性结节、亚实性结节和纯磨玻璃样结节(pure-ground glass opacity,pGGO),良性结节多数为实性结节(78.8%),而超过一半的恶性结节含有磨玻璃结节成分(53.2%)。CEA 在肺恶性结节的阳性率高于良性结节(23.1% vs. 14.2%),其余的肿瘤标志物如 SCC、CA 199、NSE 则没有太大差异。以上结果在验证组也得到了近似的分布趋势。

另外,我们也对全组患者的 FR+CTC 值进行了分析;见表 2。NSCLC 患者组的 FR+CTC 值中位数为 11.50 个单位,而肺良性结节患者组的 FR+CTC 值中位数为 7.60 个单位,Mann-Whitney U检验结果显示,差异有统计学意义(P<0.001);见图 1;而 FR+CTC 值在年龄、性别、吸烟史的分布上,差异均无统计学意义。值得注意的是,虽然结节直径没有检验出差异,但是可以看出,随着结节直径逐渐增大,FR+CTC 值表现出来逐渐增多的趋势。


2.2 试验组的单因素和多因素分析
将试验组上述因素进行 logistic 单因素分析,结果显示,试验组患者中,NSCLC 患者和肺良性结节患者在年龄(P<0.001)、性别(P<0.001)、结节直径(P<0.001)、临床症状(P=0.030)、FR+CTC 值(P<0.001)、胸膜牵拉征(P<0.001)、毛刺征(P<0.001)、CTR(P<0.001)及 CEA(P=0.032)方面差异均有统计学意义;见表 3。

将年龄、性别、结节直径、临床症状、FR+CTC 值、胸膜牵拉征、毛刺征、CTR 及 CEA 共 9 项因素纳入 logistic 多因素分析,结果显示,年龄≥60 岁(OR=1.700,95%CI 1.002~2.884,P=0.049)、女性(OR=2.617,95%CI 1.541~4.442,P<0.001)、FR+CTC 值>8.7 FU/3 mL(OR=16.992,95%CI 9.728~29.682,P<0.001)、胸膜牵拉征阳性(OR=2.199,95%CI 1.195~4.405,P=0.011)、结节直径(OR=1.728,95%CI 1.244~2.402,P=0.001)、毛刺征阳性(OR=6.322,95%CI 3.561~11.225,P<0.001)、CTR<1(OR=3.172,95%CI 2.264~4.446,P<0.001)是病灶直径≤4 cm 肺部肿物良恶性病变的独立危险因素;见表 3。
2.3 建立 Nomogram 预测模型
将 logistic 回归分析的结果纳入 Nomogram 预测模型,即与病灶直径≤4 cm 肺部肿物良恶性病变的独立危险因素年龄、性别、结节直径、胸膜牵拉征、毛刺征、CTR、FR+CTC 值纳入预测模型,绘出 Nomogram;见图 2。

2.4 Nomogram 预测模型的内部验证和外部验证
首先,对建立的 Nomogram 预测模型进行内部验证,ROC 曲线用于验证模型的区分度,试验组 AUC 值为 0.918(95%CI 0.900~0.934)。当截断点 T=0.6955 时,约登指数最大,此时模型敏感性为 86.36%,特异性为 83.19%;见图 3a。校准曲线用于验证 Nomogram 模型的预测一致性,显示了肺结节良恶性的预测精度;见图 3b。预测概率的校准曲线图表明,Nomogram 预测模型估计的预测值与实际观测结果有很大的一致性。

a:试验组 ROC 曲线评价 Nomogram 模型的诊断价值;b:内部验证 Nomogram 模型的校准曲线;c:验证组 ROC 曲线评价 Nomogram 模型的诊断价值;d:外部验证 Nomogram 模型的校准曲线
同时,我们在验证队列评估了包括年龄、性别、结节直径、胸膜牵拉征、毛刺征、CTR、FR+CTC 值在内的 Nomogram 预测模型的预测价值,即 Nomogram 预测模型的外部验证。在验证队列中,同样通过 ROC 曲线验证模型的区分度,验证组 AUC 值为 0.903(95%CI 0.859~0.938),模型敏感性为 79.45%,特异性为 90.00%;见图 3c。校准曲线验证 Nomogram 预测模型的预测一致性,预测肺结节良恶性的校准曲线表明 Nomogram 预测模型一致性良好;见图 3d。
3 讨论
我国肺恶性肿瘤发病率和死亡率高居全国首位,其中 NSCLC 约占 85%。与之前相比,肺腺癌发病率显著升高,女性发病率和死亡率上升,青年发病率显著上升[13]。NSCLC 患者的预后主要取决于病理分期,Ⅰ/Ⅱ期患者的 5 年生存率为 68%~92%,而晚期患者的 5 年生存率只有 1%~13%。然而,由于缺乏有效的方法,只有 16% 的肺癌患者在早期被诊断出来[8]。目前一般应用 LDCT 进行早期肺癌的筛查,但是存在诊断小结节的假阳性率较高等缺陷,对 LDCT 在肺癌筛查及指导治疗中的有效性存在一些争议[14]。目前世界上常用对肺结节进行良恶性预测的模型,包括 Mayo 模型[15]、VA 模型[16]和 Brock 模型[17]等,都包括一定时效性、地域性、人群分布等局限,且大多只纳入了可疑肺结节的影像学特征,并未将肿瘤标记物等资料纳入联合诊断模型。随着近年来高分辨率 CT 的发展,越来越多的肺结节,特别是磨玻璃结节被发现,毛刺征、胸膜牵拉征等影像学特征也较 LDCT 更为清晰。因此,迫切需要寻找新的联合诊断因素,结合新的技术,建立 NSCLC 的早期诊断预测模型,以提高总体生存率。
1869 年,澳大利亚医生 Thomas Ashworth 解剖了 1 例晚期癌症患者,意外地在他的外周血液中发现了与原发肿瘤大小和形状相似的细胞,随后提出了 CTC 的概念[18]。基于 Ashworth 的发现,英国病理学家 Stephen Paget 于 1889 年提出了著名的种子和土壤假说,成功地解释了肿瘤复发和转移的机制[19]。2010 年,CTC 分析被写入美国癌症联合委员会(AJCC)癌症分期手册,作为补充病理分期的新指标,作为 cM0(i+)出现在 M0 和 M1 之间[20],CTC 和循环肿瘤 DNA(CtDNA)是主要的候选标志物[9]。在先前的研究[21]中,CTC 和血清标志物被用作早期 NSCLC 的预后和预测生物标志物。CTC 在肺癌进展和预后中的作用,以及评估疗效、开发靶向药物和个体化治疗也是一个普遍的研究方向[22-24]。FR 是一种跨膜单链糖蛋白,含有 α、β 和 γ 三种亚型,在人体大部分的肿瘤细胞中都有特异性的高表达,如卵巢癌、肺癌和泌尿系统癌,而在正常器官中很少表达。研究[25]发现 72%~83%的肺肿瘤细胞表面高表达 FR,因此 FR 被选为一种理想的肺肿瘤细胞筛选靶标。FR 还可用于识别活的 CTC,其丰度不受上皮间质转化(epithelial-mesenchymal transition,EMT)的影响[25-26],因此被选为 CTC 特异性标记物。一项“叶酸受体细胞检测试剂盒”多中心、随机、单盲上市前临床验证试验结果证明试剂盒检测的 FR+CTC 作为肺癌的辅助诊断手段具有高敏感性(79.6%)和特异性(88.2%),对肺癌的诊断效能优于目前临床常用的其它血液标志物[12, 27-28]。综上所述,我们选择纳入 FR+CTC 值,探讨结合临床资料和影像学特征,构建临床Ⅰ期 NSCLC 的诊断预测模型的可能性。
本研究结果显示,年龄(≥60 岁)、性别(女)、FR+CTC 值(>8.7 FU/3 mL)、胸膜牵拉征(阳性)、病灶直径(越大)、毛刺征(阳性)、CTR(<1)是判断≤4 cm 肺病灶良恶性的独立危险因素。与之前的研究[12, 29]结果一致,我们发现早期 NSCLC 患者的外周血中 CTC 数量明显高于肺部良性疾病患者。其原因可能是尽管高分辨率 CT 未见明显异常,但早期肺癌可能存在肿瘤细胞从病灶中脱落并进入血液循环。在逃避免疫清除的情况下,肿瘤细胞通常通过外周血聚集并定植于其它器官,形成转移灶(12~15 个)。研究[30]表明,即使是从原发灶脱落的少量 CTC 在没有被免疫系统识别和清除的情况下存活下来,也可能在某个时间或其它时候发生远处转移。此外,FR+CTC 在年龄较高的人群中也稍高,这可能是因为老年人长期叶酸缺乏导致肿瘤组织中 FR 的过度表达,从而促使 FR+CTC 水平升高[31]。结节直径的大小与 CTC 值关系密切,这与之前 Ding 等[32]的研究结果一致,需要我们进一步挖掘 CTC 与肺癌诊断、预后的关系[33]。考虑到亚洲地区空气污染状况、亚洲非吸烟女性腺癌的高患病率[34],与基于欧美人群为样本研究建立 Mayo 模型、VA 模型和 Brock 模型等相比,我们的预测模型更适用于我国患者可疑肺部肿物良恶性的诊断。
至于此 Nomogram 诊断模型的应用,假如胸部 CT 上有 1 个 15 mm 可疑肺结节的 55 岁男性患者,胸部 CT 显示结节有胸膜牵拉征,无毛刺征,CTR 为 0.5,外周血中 FR+CTC 值为阳性,则利用 Nomogram 诊断模型计算该患者的肺结节恶性概率是 95%,如图 2 所示,Nomogram 图中计算如下:年龄<60 岁、男性、无毛刺征,对应于 0 分;结节直径位于 10~20 区间,对应于 22 分;存在胸膜牵拉,对应于 27 分;CTR=0.5,相当于 41 分;外周血中 FR+CTC 值为阳性,相当于 100 分;最后总分等于 190 分,对应肺结节恶性概率为 95%。模型区分度由 ROC 曲线来检验。在试验队列中,Nomogram 诊断模型的 ROC 曲线的 AUC 值为 0.918(95%CI 0.900~0.934),而验证队列的 AUC 值为 0.903(95%CI 0.859~0.938)。这表明,此 Nomogram 诊断模型可以从没有事件发生的患者中分辨出有事件发生的患者,其诊断效能大约是 91.9%。因此,我们可以认为,包含年龄、性别、结节直径、胸膜牵拉征、毛刺征、CTR、FR+CTC 值的诊断模型可以诊断临床Ⅰ期 NSCLC。
我们的预测模型的敏感性为 82.91%(86.36% vs. 79.45%),特异性为 86.60%(83.19% vs. 90.00%),均高于或者近似于此前应用 CTC 诊断肺癌的模型的结果[12, 32, 35-36]。Moon 等[35]建立了一个基于 CTC 和 CtDNA 的肺癌联合诊断模型,敏感性为 95%,特异性为 16.7%,与之相比我们纳入了影像学特征及其它临床因素,尽可能地提高了模型的稳定性,较其模型的特异性显著提高。Chen 等[12]建立了一个基于 FR+CTC 联合 CEA、NSE 和 Cyfra21-1 诊断肺癌的预测模型,AUC 值为 0.883(0.841~0.925),敏感性为 84.21%,特异性为 83.91%。与之相比,我们的研究对象为早期肺癌患者,且绝大多数为肺腺癌[37],CEA 在单因素分析中被认为与 NSCLC 有关,其它肿瘤标志物在分析中没有被验证为独立危险因素,有必要进一步研究 FR+CTC 与肿瘤标志物表达在肺癌联合诊断中的作用。
本研究应用了 FR+CTC 联合影像学特征诊断临床Ⅰ期 NSCLC,并开发了 Nomogram 模型。目前这项研究的优势在于,它专门调查了早期 NSCLC 患者,并验证了结合 CTC 和影像学特征的诊断准确性。结合液体活检的非侵入性等特点,可以更好地优化个人的预测准确性,帮助临床医生诊断肺结节,有助于减少低危疾病的误诊和过度治疗。一些不能进行病理活检的患者,将直接从本研究中获益。
本研究存在一些局限性。首先,本研究为单中心、回顾性研究,样本量较少,模型需经过前瞻性、多中心、大样本研究进一步检验;其次,在本研究中,研究对象人群为可疑恶性结节且有外科手术治疗倾向的患者,存在一定的选择偏倚。同时,经本模型诊断的恶性概率低的结节同样需要随访,尤其是 CEA 高的患者,要根据结节的动态变化由有经验的胸外科医师制定下一步诊疗计划[38]。
综上所述,我们研究了 FR+CTC 在临床Ⅰ期 NSCLC 患者和肺良性结节患者血液中表达的差异,发现 NSCLC 患者外周血中 FR+CTC 明显高于肺部良性疾病患者,年龄、性别、结节直径、胸膜牵拉征、毛刺征、CTR、FR+CTC 值是临床Ⅰ期 NSCLC 的独立危险因素,并建立了一个由此组成的新的可疑肺部肿物诊断预测模型,并且我们证实此预测模型是有意义的,可以为临床诊断提供依据。
利益冲突:无。
作者贡献:孔德志完善研究设计、查阅资料、数据整理与分析及论文初稿撰写与修改等;刘傲指导数据的统计学分析等;崔健、冷晓亮负责细化写作思路、对文章中图表进一步完善加工;沃杨、董燕亭负责收集数据、文章润色;矫文捷负责论文设计、指导、审阅与修改等。
在全球范围内,肺癌是对人类健康和生命威胁最大的恶性肿瘤之一,2018 年估计有 210 万肺癌新发病例和 180 万死亡病例,占与癌症相关死亡人数的近 1/5(18.4%)[1]。我国约 75% 的肺癌患者在诊断时已属晚期,5 年生存率为 15.6%,而早期肺癌患者的 5 年生存率为 80%[2]。这一现状不但与缺乏筛查有关,更与缺乏科学鉴别肺结节的方法有关。
目前针对肺癌高发人群筛查常通过低剂量螺旋计算机断层扫描(low-dose computed tomography,LDCT)。然而,有研究[3]表明,LDCT 假阳性率较高(18.5%),且存在辐射暴露、随访成本高以及发现中央型病灶肺癌患者的效果较差等问题,并不能完全达到有效地早期诊断和预防的目的[4]。传统的肿瘤相关抗原在肺癌早期诊断中的敏感性和特异性均不理想。其它侵入性诊断方法,如针吸活检或支气管镜刷检,并发症发生率高,给患者带来极大的不适[5]。
随着精准医学的发展和技术的进步,液体活检凭借其无创性、敏感性、动态性等特质,被寄予厚望[6-7]。外周血标本易获得、侵入性小、可反复采集,是临床上常规检测较为理想的标本来源。循环肿瘤细胞(circulating tumor cell,CTC)是指从原发或转移病灶脱落到血液循环中的肿瘤细胞。CTC 作为新一代的肿瘤标志物,大量研究[8-10]已经证实 CTC 检测将有助于肿瘤早期诊断、复发转移监测、判断患者预后及指导术后辅助治疗。叶酸受体(folate receptor,FR)是一种细胞表面受体糖蛋白,在许多上皮来源的恶性肿瘤细胞中高度表达,在 75.7% 的非小细胞肺癌(NSCLC)患者中显著上调[11]。
因此,我们致力于研究分析叶酸受体阳性循环肿瘤细胞(folate receptor-positive circulating tumor cells,FR+CTC)在临床Ⅰ期 NSCLC 患者中的表达,并建立一个基于 FR+CTC 的临床Ⅰ期 NSCLC 诊断模型,为可疑肺结节的早期诊断提供新的依据。
1 资料与方法
1.1 临床资料和分组
回顾性分析青岛大学附属医院 2018 年 9 月至 2019 年 12 月入院的 1 520 例进行了 CTC 检测的患者的临床资料。这些患者均接受了胸部 CT 扫描和手术治疗,并进行了病理检查。筛选出临床Ⅰ期 NSCLC 患者及肺部良性疾病患者 1 277 例,其中男 518 例、女 759 例,中位年龄为 57(29~85)岁。纳入标准:(1)NSCLC 或良性疾病患者术前胸部 CT 检查有肺结节。检查无淋巴结、区域或远处转移;(2)术前采集血液样本进行 FR+CTC 检测;(3)CT 上病灶直径≤4 cm;(4)病理组织学检查有明确的病理诊断结果;(5)患者有完整的临床病例资料。随后,为保证有足够数量的患者建立准确的模型,将符合标准的 1 277 例患者采用随机数字表法按 4∶1 的比例随机分为两组,其中试验组 1038 例、验证组 239 例。
1.2 血液样本中 FR+CTC 的定量检测
临床检测样本为全血样本,每次采血时用加有 EDTA 抗凝剂的真空采血管抽取患者静脉血 3 mL,上下颠倒 7~8 次。样本采用“叶酸受体细胞检测试剂盒”检测样本中 FR+CTC 的数量。根据试剂盒说明书,CTC 是通过红细胞的裂解和血液中白细胞的免疫磁性去除(通过抗 CD45 和抗 CD14 涂层的磁珠)来富集的。然后用肿瘤特异性配体叶酸和人工合成的寡核苷酸的结合物标记它,收集 CTC 进行定量 PCR 分析。免疫荧光染色后,CTC 被定义为表达叶酸配体和细胞角蛋白(8、18 和 19)的细胞。在本研究中,我们定义 1 个 CTC 单位为在 3 mL 血液中检测到的 CTC 数量[12]。
样本一经采集,则尽快送至检测实验室。如若不能马上送检样本,则于 4℃~8℃ 暂存,并在 24 h 之内进行检测。如超出保存时间,则丢弃该血样,重新采集。样本如需运输,用 4℃~8℃ 冰袋保持低温运输。FR+CTC 值>8.7 FU/3 mL 定义为阳性。
1.3 数据收集
收集患者的临床资料、FR+CTC 值、影像学特征及肿瘤标志物。其中,临床资料包括年龄、性别、吸烟史、临床症状。影像学特征包括结节位置、结节直径、结节中实性成分直径比值(consolidation/tumor ratio,CTR)、胸膜牵拉征、毛刺征、肺气肿。肿瘤标志物包括癌胚抗原(carcinoembryonic antigen,CEA)、鳞状上皮细胞癌抗原(squamous cell carcinoma antigen,SCC)、神经元特异性烯醇化酶(neuron-specific enolase,NSE)、糖类抗原 199(carbohydrate antigen 199,CA199)和糖类抗原 125(carbohydrate antigen 125,CA125)。
1.4 统计学分析
正态分布的连续变量采用均数±标准差(±s)表示,非正态分布的连续变量采用中位数(上下四分位数)[M(P25,P75)]表示,组间比较采用t检验、Mann-Whitney U检验或 Kruskal-Wallis 检验。分类变量以例(%)表示,组间比较采用χ2检验和 Fisher 确切概率法。将数据进行单因素分析,将单因素分析结果中有统计学意义的因素进行 logistic 回归分析,找出独立危险因素,建立预测模型,绘制列线图(Nomogram),对模型进行内部及外部验证,检测模型的预测性能。绘制受试者工作特征(receiver operating characteristic,ROC)曲线,计算曲线下面积(area under the curve,AUC)检验模型的区分度,校准曲线检验模型的一致性。在所有分析中,双侧P≤0.05 为差异有统计学意义。采用 SPSS 25.0 软件、Med-Calc 19.1 软件、GraphPad Prism 8 软件和 R 3.6.1 软件及 RMS 包执行所有分析。
1.5 伦理审查
本研究已通过青岛大学附属医院伦理委员会批准,批准号为:QYFYWZLL 26169。
2 结果
2.1 研究人群的临床特征及 FR+CTC 分布
共 925 例经病理证实的 NSCLC 患者和 113 例良性结节患者纳入试验组。其中,907 例 NSCLC 患者病理证实为腺癌,良性结节包括 50 例错构瘤、27 例炎性假瘤、25 例结核、11 例硬化性肺泡细胞瘤。试验组患者的平均年龄为 59.15 岁,其中 NSCLC 患者的平均年龄为 60.00 岁,良性结节患者的平均年龄为 57.00 岁;验证组 NSCLC 患者 219 例,良性结节患者 20 例,患者的平均年龄为 59.29 岁,其中 NSCLC 患者的平均年龄为 59.71 岁,良性结节患者的平均年龄为 54.35 岁。
试验组中,NSCLC 的女性患者比例明显高于男性(62.1% vs. 37.9%),没有吸烟史的患者占大多数(77.2%),有症状患者多于没有症状(多为查体发现)患者(63.9% vs. 36.1%);见表 1;外周血中 FR+CTC 阳性(>8.7 FU/3 mL)的 NSCLC 患者显著多于 FR+CTC 阴性患者(78.8% vs. 21.2%,P<0.001);同时,在肺良性结节的患者中,FR+CTC 阴性患者比例则明显高于 FR+CTC 阳性患者(76.1% vs. 23.9%)。影像学特征方面,恶性结节位于右肺的比例明显高于左肺(60.4% vs. 39.6%)。肺恶性结节直径的中位值为 17 mm,良性结节直径的中位值为 13 mm,良恶性结节直径大小多为 10~<20 mm(45.2% vs. 54.9%),恶性结节其次为 20~<30 mm(25.9%),而良性结节其次为 <10 mm(27.4%)。胸部 CT 中恶性结节胸膜牵拉征和毛刺征出现的频率显著高于良性结节,分别为 40.2% vs. 19.5%,62.9% vs. 23.9%。根据结节的 CTR 值,将结节分为实性结节、亚实性结节和纯磨玻璃样结节(pure-ground glass opacity,pGGO),良性结节多数为实性结节(78.8%),而超过一半的恶性结节含有磨玻璃结节成分(53.2%)。CEA 在肺恶性结节的阳性率高于良性结节(23.1% vs. 14.2%),其余的肿瘤标志物如 SCC、CA 199、NSE 则没有太大差异。以上结果在验证组也得到了近似的分布趋势。

另外,我们也对全组患者的 FR+CTC 值进行了分析;见表 2。NSCLC 患者组的 FR+CTC 值中位数为 11.50 个单位,而肺良性结节患者组的 FR+CTC 值中位数为 7.60 个单位,Mann-Whitney U检验结果显示,差异有统计学意义(P<0.001);见图 1;而 FR+CTC 值在年龄、性别、吸烟史的分布上,差异均无统计学意义。值得注意的是,虽然结节直径没有检验出差异,但是可以看出,随着结节直径逐渐增大,FR+CTC 值表现出来逐渐增多的趋势。


2.2 试验组的单因素和多因素分析
将试验组上述因素进行 logistic 单因素分析,结果显示,试验组患者中,NSCLC 患者和肺良性结节患者在年龄(P<0.001)、性别(P<0.001)、结节直径(P<0.001)、临床症状(P=0.030)、FR+CTC 值(P<0.001)、胸膜牵拉征(P<0.001)、毛刺征(P<0.001)、CTR(P<0.001)及 CEA(P=0.032)方面差异均有统计学意义;见表 3。

将年龄、性别、结节直径、临床症状、FR+CTC 值、胸膜牵拉征、毛刺征、CTR 及 CEA 共 9 项因素纳入 logistic 多因素分析,结果显示,年龄≥60 岁(OR=1.700,95%CI 1.002~2.884,P=0.049)、女性(OR=2.617,95%CI 1.541~4.442,P<0.001)、FR+CTC 值>8.7 FU/3 mL(OR=16.992,95%CI 9.728~29.682,P<0.001)、胸膜牵拉征阳性(OR=2.199,95%CI 1.195~4.405,P=0.011)、结节直径(OR=1.728,95%CI 1.244~2.402,P=0.001)、毛刺征阳性(OR=6.322,95%CI 3.561~11.225,P<0.001)、CTR<1(OR=3.172,95%CI 2.264~4.446,P<0.001)是病灶直径≤4 cm 肺部肿物良恶性病变的独立危险因素;见表 3。
2.3 建立 Nomogram 预测模型
将 logistic 回归分析的结果纳入 Nomogram 预测模型,即与病灶直径≤4 cm 肺部肿物良恶性病变的独立危险因素年龄、性别、结节直径、胸膜牵拉征、毛刺征、CTR、FR+CTC 值纳入预测模型,绘出 Nomogram;见图 2。

2.4 Nomogram 预测模型的内部验证和外部验证
首先,对建立的 Nomogram 预测模型进行内部验证,ROC 曲线用于验证模型的区分度,试验组 AUC 值为 0.918(95%CI 0.900~0.934)。当截断点 T=0.6955 时,约登指数最大,此时模型敏感性为 86.36%,特异性为 83.19%;见图 3a。校准曲线用于验证 Nomogram 模型的预测一致性,显示了肺结节良恶性的预测精度;见图 3b。预测概率的校准曲线图表明,Nomogram 预测模型估计的预测值与实际观测结果有很大的一致性。

a:试验组 ROC 曲线评价 Nomogram 模型的诊断价值;b:内部验证 Nomogram 模型的校准曲线;c:验证组 ROC 曲线评价 Nomogram 模型的诊断价值;d:外部验证 Nomogram 模型的校准曲线
同时,我们在验证队列评估了包括年龄、性别、结节直径、胸膜牵拉征、毛刺征、CTR、FR+CTC 值在内的 Nomogram 预测模型的预测价值,即 Nomogram 预测模型的外部验证。在验证队列中,同样通过 ROC 曲线验证模型的区分度,验证组 AUC 值为 0.903(95%CI 0.859~0.938),模型敏感性为 79.45%,特异性为 90.00%;见图 3c。校准曲线验证 Nomogram 预测模型的预测一致性,预测肺结节良恶性的校准曲线表明 Nomogram 预测模型一致性良好;见图 3d。
3 讨论
我国肺恶性肿瘤发病率和死亡率高居全国首位,其中 NSCLC 约占 85%。与之前相比,肺腺癌发病率显著升高,女性发病率和死亡率上升,青年发病率显著上升[13]。NSCLC 患者的预后主要取决于病理分期,Ⅰ/Ⅱ期患者的 5 年生存率为 68%~92%,而晚期患者的 5 年生存率只有 1%~13%。然而,由于缺乏有效的方法,只有 16% 的肺癌患者在早期被诊断出来[8]。目前一般应用 LDCT 进行早期肺癌的筛查,但是存在诊断小结节的假阳性率较高等缺陷,对 LDCT 在肺癌筛查及指导治疗中的有效性存在一些争议[14]。目前世界上常用对肺结节进行良恶性预测的模型,包括 Mayo 模型[15]、VA 模型[16]和 Brock 模型[17]等,都包括一定时效性、地域性、人群分布等局限,且大多只纳入了可疑肺结节的影像学特征,并未将肿瘤标记物等资料纳入联合诊断模型。随着近年来高分辨率 CT 的发展,越来越多的肺结节,特别是磨玻璃结节被发现,毛刺征、胸膜牵拉征等影像学特征也较 LDCT 更为清晰。因此,迫切需要寻找新的联合诊断因素,结合新的技术,建立 NSCLC 的早期诊断预测模型,以提高总体生存率。
1869 年,澳大利亚医生 Thomas Ashworth 解剖了 1 例晚期癌症患者,意外地在他的外周血液中发现了与原发肿瘤大小和形状相似的细胞,随后提出了 CTC 的概念[18]。基于 Ashworth 的发现,英国病理学家 Stephen Paget 于 1889 年提出了著名的种子和土壤假说,成功地解释了肿瘤复发和转移的机制[19]。2010 年,CTC 分析被写入美国癌症联合委员会(AJCC)癌症分期手册,作为补充病理分期的新指标,作为 cM0(i+)出现在 M0 和 M1 之间[20],CTC 和循环肿瘤 DNA(CtDNA)是主要的候选标志物[9]。在先前的研究[21]中,CTC 和血清标志物被用作早期 NSCLC 的预后和预测生物标志物。CTC 在肺癌进展和预后中的作用,以及评估疗效、开发靶向药物和个体化治疗也是一个普遍的研究方向[22-24]。FR 是一种跨膜单链糖蛋白,含有 α、β 和 γ 三种亚型,在人体大部分的肿瘤细胞中都有特异性的高表达,如卵巢癌、肺癌和泌尿系统癌,而在正常器官中很少表达。研究[25]发现 72%~83%的肺肿瘤细胞表面高表达 FR,因此 FR 被选为一种理想的肺肿瘤细胞筛选靶标。FR 还可用于识别活的 CTC,其丰度不受上皮间质转化(epithelial-mesenchymal transition,EMT)的影响[25-26],因此被选为 CTC 特异性标记物。一项“叶酸受体细胞检测试剂盒”多中心、随机、单盲上市前临床验证试验结果证明试剂盒检测的 FR+CTC 作为肺癌的辅助诊断手段具有高敏感性(79.6%)和特异性(88.2%),对肺癌的诊断效能优于目前临床常用的其它血液标志物[12, 27-28]。综上所述,我们选择纳入 FR+CTC 值,探讨结合临床资料和影像学特征,构建临床Ⅰ期 NSCLC 的诊断预测模型的可能性。
本研究结果显示,年龄(≥60 岁)、性别(女)、FR+CTC 值(>8.7 FU/3 mL)、胸膜牵拉征(阳性)、病灶直径(越大)、毛刺征(阳性)、CTR(<1)是判断≤4 cm 肺病灶良恶性的独立危险因素。与之前的研究[12, 29]结果一致,我们发现早期 NSCLC 患者的外周血中 CTC 数量明显高于肺部良性疾病患者。其原因可能是尽管高分辨率 CT 未见明显异常,但早期肺癌可能存在肿瘤细胞从病灶中脱落并进入血液循环。在逃避免疫清除的情况下,肿瘤细胞通常通过外周血聚集并定植于其它器官,形成转移灶(12~15 个)。研究[30]表明,即使是从原发灶脱落的少量 CTC 在没有被免疫系统识别和清除的情况下存活下来,也可能在某个时间或其它时候发生远处转移。此外,FR+CTC 在年龄较高的人群中也稍高,这可能是因为老年人长期叶酸缺乏导致肿瘤组织中 FR 的过度表达,从而促使 FR+CTC 水平升高[31]。结节直径的大小与 CTC 值关系密切,这与之前 Ding 等[32]的研究结果一致,需要我们进一步挖掘 CTC 与肺癌诊断、预后的关系[33]。考虑到亚洲地区空气污染状况、亚洲非吸烟女性腺癌的高患病率[34],与基于欧美人群为样本研究建立 Mayo 模型、VA 模型和 Brock 模型等相比,我们的预测模型更适用于我国患者可疑肺部肿物良恶性的诊断。
至于此 Nomogram 诊断模型的应用,假如胸部 CT 上有 1 个 15 mm 可疑肺结节的 55 岁男性患者,胸部 CT 显示结节有胸膜牵拉征,无毛刺征,CTR 为 0.5,外周血中 FR+CTC 值为阳性,则利用 Nomogram 诊断模型计算该患者的肺结节恶性概率是 95%,如图 2 所示,Nomogram 图中计算如下:年龄<60 岁、男性、无毛刺征,对应于 0 分;结节直径位于 10~20 区间,对应于 22 分;存在胸膜牵拉,对应于 27 分;CTR=0.5,相当于 41 分;外周血中 FR+CTC 值为阳性,相当于 100 分;最后总分等于 190 分,对应肺结节恶性概率为 95%。模型区分度由 ROC 曲线来检验。在试验队列中,Nomogram 诊断模型的 ROC 曲线的 AUC 值为 0.918(95%CI 0.900~0.934),而验证队列的 AUC 值为 0.903(95%CI 0.859~0.938)。这表明,此 Nomogram 诊断模型可以从没有事件发生的患者中分辨出有事件发生的患者,其诊断效能大约是 91.9%。因此,我们可以认为,包含年龄、性别、结节直径、胸膜牵拉征、毛刺征、CTR、FR+CTC 值的诊断模型可以诊断临床Ⅰ期 NSCLC。
我们的预测模型的敏感性为 82.91%(86.36% vs. 79.45%),特异性为 86.60%(83.19% vs. 90.00%),均高于或者近似于此前应用 CTC 诊断肺癌的模型的结果[12, 32, 35-36]。Moon 等[35]建立了一个基于 CTC 和 CtDNA 的肺癌联合诊断模型,敏感性为 95%,特异性为 16.7%,与之相比我们纳入了影像学特征及其它临床因素,尽可能地提高了模型的稳定性,较其模型的特异性显著提高。Chen 等[12]建立了一个基于 FR+CTC 联合 CEA、NSE 和 Cyfra21-1 诊断肺癌的预测模型,AUC 值为 0.883(0.841~0.925),敏感性为 84.21%,特异性为 83.91%。与之相比,我们的研究对象为早期肺癌患者,且绝大多数为肺腺癌[37],CEA 在单因素分析中被认为与 NSCLC 有关,其它肿瘤标志物在分析中没有被验证为独立危险因素,有必要进一步研究 FR+CTC 与肿瘤标志物表达在肺癌联合诊断中的作用。
本研究应用了 FR+CTC 联合影像学特征诊断临床Ⅰ期 NSCLC,并开发了 Nomogram 模型。目前这项研究的优势在于,它专门调查了早期 NSCLC 患者,并验证了结合 CTC 和影像学特征的诊断准确性。结合液体活检的非侵入性等特点,可以更好地优化个人的预测准确性,帮助临床医生诊断肺结节,有助于减少低危疾病的误诊和过度治疗。一些不能进行病理活检的患者,将直接从本研究中获益。
本研究存在一些局限性。首先,本研究为单中心、回顾性研究,样本量较少,模型需经过前瞻性、多中心、大样本研究进一步检验;其次,在本研究中,研究对象人群为可疑恶性结节且有外科手术治疗倾向的患者,存在一定的选择偏倚。同时,经本模型诊断的恶性概率低的结节同样需要随访,尤其是 CEA 高的患者,要根据结节的动态变化由有经验的胸外科医师制定下一步诊疗计划[38]。
综上所述,我们研究了 FR+CTC 在临床Ⅰ期 NSCLC 患者和肺良性结节患者血液中表达的差异,发现 NSCLC 患者外周血中 FR+CTC 明显高于肺部良性疾病患者,年龄、性别、结节直径、胸膜牵拉征、毛刺征、CTR、FR+CTC 值是临床Ⅰ期 NSCLC 的独立危险因素,并建立了一个由此组成的新的可疑肺部肿物诊断预测模型,并且我们证实此预测模型是有意义的,可以为临床诊断提供依据。
利益冲突:无。
作者贡献:孔德志完善研究设计、查阅资料、数据整理与分析及论文初稿撰写与修改等;刘傲指导数据的统计学分析等;崔健、冷晓亮负责细化写作思路、对文章中图表进一步完善加工;沃杨、董燕亭负责收集数据、文章润色;矫文捷负责论文设计、指导、审阅与修改等。