引用本文: 陈鑫容, 李希, 汪晓东, 李卡. 结直肠癌风险在线预测计算器的临床应用进展. 中国普外基础与临床杂志, 2019, 26(1): 106-109. doi: 10.7507/1007-9424.201805081 复制
基于人群的早期筛查已被显示能有效降低结直肠癌(colorectal cancer,CRC)的发病率和死亡率[1-3],而准确的风险预测可以提高筛查的效率[4-5],其方法是将高风险患者作为目标进行早期或更频繁的筛查,比如粪便潜血试验、粪便脱落细胞检测、断层扫描成像、肿瘤生物标志物检测、肠镜检查等[6-9],并对极低风险个体进行延迟或前瞻性筛查。通过将筛查强度和预防措施调整到预测的风险水平,从而提高筛查的效率[10]。鉴于 CRC 的高发病率、高致死率[11]、高经济负担率[12]以及筛查试验的可行性[13],设计预测 CRC 风险的评估模型或评分系统,来估计个体发展成为 CRC 的可能性,能用于帮助医生和患者确定筛选方案,同时可用于设计预防和干预策略,这是一项非常值得探索的研究。CRC-PRO(Colorectal Cancer Predicted Risk Online)计算器则是由 Wells 等[14]于 2014 年为预测个体 CRC 风险而新开发的工具。笔者将就此工具的概况和应用现状作一综述,以分析其在我国可能具有的实用价值。
1 CRC-PRO 的开发背景
研究[15-18]发现,目前用于 CRC 筛查的策略有一定的局限性,由于卫生资源的短缺、检查费用的负担、潜在的风险因素以及较低的依从性,国家筛查指南[19]考虑在进行筛查程序之前预测未来无症状个体原发 CRC 的风险。一项系统评价[20]分析了 52 种风险模型和 6 项外部验证研究,共考虑了 87 项不同的风险因素,其结果表明,有多种风险模型可用于预测无症状人群发生 CRC 的风险,并且有可能鉴定出患有高风险疾病的个体。此时如果我们能利用风险评估模型准确区分个体患 CRC 的可能性,进而将筛查和预防策略靶向最有可能获益的人群,同时使疾病低风险的人群免于不必要的直接或间接的筛查程序,这可能会提高 CRC 筛查的成本效益[21],并可减轻对资源需求、结肠镜检查能力及依从性的担忧,在一定程度上缓解了当前的困境。
目前常见的几种经过独立人群验证的 CRC 的风险评估模型有:哈佛癌症风险指数模型[22]、Freedman’s 模型[4]、亚太 CRC 筛查风险评分系统[23]、MMR 风险评估模型(MMRpro)[24]、Imperiale’s 模型[25]等,此外又基于前两种模型进一步开发了 CRC 风险计算器。利用哈佛癌症风险指数模型创建的计算器在一定程度上纠正了其直接使用产生的误判,但它仅预测结肠癌的风险,这限制了它在临床上的使用[26]。美国国家癌症研究所(National Cancer Institute,NCI)利用 Freedman’s 模型创建的计算器[27],可以估计男性和女性患 CRC 的风险,但需要 5~8 min 才能回答所有问题以获得风险评估。哈佛癌症风险指数模型和 Freedman’s 模型都是采用病例对照研究的数据创建的,这些研究在实际中很容易出现明显的偏倚,可能会使计算器在将来应用于无症状患者时出现偏差;同时两者依据的病例对照研究的大多数研究参与者都是白人,故无法估计其他种族或族裔群体的风险[4, 22]。NCI[28]于 2004 年在华盛顿召开的癌症风险预测模型研讨会上建议,风险预测模型应纳入更多的少数民族患者,并鼓励建立新的风险模型,且新模型应简单易用,所以我们需要一种更精准及更简易的适用于多民族人群的风险预测工具。CRC-PRO 则是利用来自多民族队列研究(the multiethnic cohort study,MEC)的数据创建的 10 年 CRC 风险预测计算器,其目的不是评估个体变量和 CRC 风险之间的关系,而是为定制筛选和预防策略而开发的最准确的总体风险预测工具,旨在让临床医生更准确地识别高风险人群,更好地预测 CRC 的风险,从而能够改善预防策略。
2 CRC-PRO 的建立
2.1 数据的获取与选择
MEC 为创建 CRC-PRO 提供了潜在的数据源。Kolonel 等[29]为研究美国少数民族饮食和癌症的关系,纳入了包括 215 251 名生活在夏威夷和加利福尼亚州的成年男性和女性(基线年龄 45~75 岁)人群,其人口分布包括非裔美国人、拉丁裔、日裔美国人、夏威夷原住民、白人和其他民族;患者的随访时间长达 11.5 年,失访率<1%。Wells 等[14]利用此数据源,排除了具有 CRC 或腺瘤性息肉病史的患者,最终样本量为 180 630 例患者,其中 2 762 例患有 CRC。以下危险因素在 MEC 基线时进行了测量,并作为最终模型中的候选变量:年龄、性别、个人的癌症史、体质量指数、定期使用阿司匹林、结肠癌家族史、雌激素使用、每日饮酒量、定期使用多种维生素、每天中等或剧烈活动的小时数、种族、糖尿病史、受教育年限、吸烟年限、定期使用非甾体类抗炎药物(non-steroidal anti-inflammatory drugs,NSAIDs)、每天摄入红肉量和偏好熟肉。连续变量使用限制性立方样条建模,并用微积分来描述预测变量与结果之间的非线性关系。由于男性和女性之间潜在的风险差异,研究者[14]决定为他们分别创建单独的风险计算器。
2.2 数据的统计分析
采用 logistic 向前逐步回归方法进行变量选择,发现以下因素与 CRC 的风险显著相关:年龄、种族、吸烟年限、每日饮酒量、结肠癌家族史、定期使用多种维生素、糖尿病史和定期使用 NSAIDs。只有在针对男性患者的未经校准的分析中,受教育年限和每天中等或剧烈活动的小时数与 CRC 有关,而每天摄入红肉量、偏好熟肉和雌激素使用仅与女性患有 CRC 有关[14]。
2.3 CRC-PRO 的验证和校准[5 ]
使用十折交叉验证对模型进行内部验证,以评估区分能力(c 统计量)和校准(以图表评估),结果显示,对于男性和女性来说,年龄对模型准确性的影响最大;种族/民族是两性的第二重要变量,而其他变量对于男性和女性的相对重要性不同。最终男性模型包含 12 个变量(年龄、种族、吸烟年限、每日饮酒量、体质量指数、受教育年限、定期使用阿司匹林、结肠癌家族史、定期使用多种维生素、每天摄入红肉量、糖尿病史和每天中等或剧烈活动的小时数),女性模型包含 11 个变量(年龄、种族、受教育年限、雌激素使用、糖尿病史、吸烟年限、结肠癌家族史、定期使用多种维生素、体质量指数、定期使用 NSAIDs 和每日饮酒量)。基于对建立模型的内部验证(诺模图)来确定最终模型的变量系数。
3 CRC-PRO 的特点
3.1 探讨 CRC-PRO 的变量选择
CRC-PRO 模型纳入的变量包括已确定的 CRC 危险因素、尚未确立的其他危险因素以及几种可能的 CRC 保护因素,然后进行合并分析,确立最终模型变量;MEC 的初步调查并没有询问结直肠镜的检查史,因为在此之前所有人的基线信息是未知的,故此模型也未包括;MEC 不包含有关炎症性肠病(inflammatory bowel disease,IBD)的信息,虽然这是已知的 CRC 风险因素,但由于其高发病率和特异性,IBD 患者应该接受更积极的筛查和预防策略,并需为此类人群单独建立指南,将 IBD 患者排除在创建风险计算器之外是理想的选择;没有包括详细的饮食问题,因为某些因素的效用还未证实;在之前的研究中,连续变量经常被分类[30],这会导致信息丢失和预测精度下降,而使用基于计算机的计算器界面则不再需要将其分类[31],保证了其完整性;模型复杂性和预测精确性之间需要达到一定的平衡,该模型仅限于 11 或 12 个变量,因为超出此模型规模的准确性增益微乎其微。
3.2 CRC-PRO 应用的优劣势
CRC-PRO 计算器简单易操作,具有很好的预测准确性。且它分别建立男性和女性模型,消除了隐藏的交互效应,纳入了多个变量比仅凭单变量的预测模型更准确。由于数据集和变量定义的差异,CRC-PRO 计算器的准确性未能与 NCI 计算器进行比较。理论上,由于 CRC-PRO 计算器依据的样本量大,进行了前瞻性数据分析以及避免对连续变量进行分类,从 CRC-PRO 计算器获得的预测值应该比 NCI 模型更准确。MEC 男性患者中 CRC 预计 10 年风险低于 1% 的比例为 29.5%,而女性患者中该比例>48%[14],这表明在临床上推迟或放弃一些极低风险患者的结肠镜检查可能是合理的。对于女性来说更是如此,因为 1 475 例女性患者的预测风险<1% 时至少需达到 65 岁[14]。一些专家已经建议,对于低风险患者,一生一次的结肠镜筛查可能具有成本效益[32]。
CRC-PRO 计算器是利用来自 MEC 的数据创建的,此前瞻性队列在种族构成方面是独一无二的;其次是它对社会阶层具有广泛的代表性,允许跨不同人群进行有效比较,且采用队列研究避免了回忆偏倚。但是现在还尚未有其他使用 CRC-PRO 工具的研究,对于此计算器的可行性、有效性、实用性、临床效果、成本效益等积极影响和负面作用还未确定。此工具旨在能够帮助改善个体患 CRC 风险的评估,并鼓励使用绝对风险阈值进行决策,但对于这种改进的预测还未确定其确切的影响。
4 CRC-PRO 的推广与展望
在中国使用的 CRC 风险预测工具大多数是筛查评分系统[33-35],根据某些危险因素评分后对患者进行风险分级,再对不同风险级别的患者采取相应的策略,这种方式在处理时会忽略一部分信息,且不能明确给出风险概率值,其精准度似乎还不能达到满意的效果。CRC-PRO 在中国进行试用可能具有一定的实用价值,此工具不仅能具体给出风险概率值,而且简单易操作,但是基于地域的差异,在 CRC-PRO 的推广中,需要开展多中心研究,以在更多不同的人群中进行更广泛的临床分析验证,进一步扩展此工具的应用范围。
基于人群的早期筛查已被显示能有效降低结直肠癌(colorectal cancer,CRC)的发病率和死亡率[1-3],而准确的风险预测可以提高筛查的效率[4-5],其方法是将高风险患者作为目标进行早期或更频繁的筛查,比如粪便潜血试验、粪便脱落细胞检测、断层扫描成像、肿瘤生物标志物检测、肠镜检查等[6-9],并对极低风险个体进行延迟或前瞻性筛查。通过将筛查强度和预防措施调整到预测的风险水平,从而提高筛查的效率[10]。鉴于 CRC 的高发病率、高致死率[11]、高经济负担率[12]以及筛查试验的可行性[13],设计预测 CRC 风险的评估模型或评分系统,来估计个体发展成为 CRC 的可能性,能用于帮助医生和患者确定筛选方案,同时可用于设计预防和干预策略,这是一项非常值得探索的研究。CRC-PRO(Colorectal Cancer Predicted Risk Online)计算器则是由 Wells 等[14]于 2014 年为预测个体 CRC 风险而新开发的工具。笔者将就此工具的概况和应用现状作一综述,以分析其在我国可能具有的实用价值。
1 CRC-PRO 的开发背景
研究[15-18]发现,目前用于 CRC 筛查的策略有一定的局限性,由于卫生资源的短缺、检查费用的负担、潜在的风险因素以及较低的依从性,国家筛查指南[19]考虑在进行筛查程序之前预测未来无症状个体原发 CRC 的风险。一项系统评价[20]分析了 52 种风险模型和 6 项外部验证研究,共考虑了 87 项不同的风险因素,其结果表明,有多种风险模型可用于预测无症状人群发生 CRC 的风险,并且有可能鉴定出患有高风险疾病的个体。此时如果我们能利用风险评估模型准确区分个体患 CRC 的可能性,进而将筛查和预防策略靶向最有可能获益的人群,同时使疾病低风险的人群免于不必要的直接或间接的筛查程序,这可能会提高 CRC 筛查的成本效益[21],并可减轻对资源需求、结肠镜检查能力及依从性的担忧,在一定程度上缓解了当前的困境。
目前常见的几种经过独立人群验证的 CRC 的风险评估模型有:哈佛癌症风险指数模型[22]、Freedman’s 模型[4]、亚太 CRC 筛查风险评分系统[23]、MMR 风险评估模型(MMRpro)[24]、Imperiale’s 模型[25]等,此外又基于前两种模型进一步开发了 CRC 风险计算器。利用哈佛癌症风险指数模型创建的计算器在一定程度上纠正了其直接使用产生的误判,但它仅预测结肠癌的风险,这限制了它在临床上的使用[26]。美国国家癌症研究所(National Cancer Institute,NCI)利用 Freedman’s 模型创建的计算器[27],可以估计男性和女性患 CRC 的风险,但需要 5~8 min 才能回答所有问题以获得风险评估。哈佛癌症风险指数模型和 Freedman’s 模型都是采用病例对照研究的数据创建的,这些研究在实际中很容易出现明显的偏倚,可能会使计算器在将来应用于无症状患者时出现偏差;同时两者依据的病例对照研究的大多数研究参与者都是白人,故无法估计其他种族或族裔群体的风险[4, 22]。NCI[28]于 2004 年在华盛顿召开的癌症风险预测模型研讨会上建议,风险预测模型应纳入更多的少数民族患者,并鼓励建立新的风险模型,且新模型应简单易用,所以我们需要一种更精准及更简易的适用于多民族人群的风险预测工具。CRC-PRO 则是利用来自多民族队列研究(the multiethnic cohort study,MEC)的数据创建的 10 年 CRC 风险预测计算器,其目的不是评估个体变量和 CRC 风险之间的关系,而是为定制筛选和预防策略而开发的最准确的总体风险预测工具,旨在让临床医生更准确地识别高风险人群,更好地预测 CRC 的风险,从而能够改善预防策略。
2 CRC-PRO 的建立
2.1 数据的获取与选择
MEC 为创建 CRC-PRO 提供了潜在的数据源。Kolonel 等[29]为研究美国少数民族饮食和癌症的关系,纳入了包括 215 251 名生活在夏威夷和加利福尼亚州的成年男性和女性(基线年龄 45~75 岁)人群,其人口分布包括非裔美国人、拉丁裔、日裔美国人、夏威夷原住民、白人和其他民族;患者的随访时间长达 11.5 年,失访率<1%。Wells 等[14]利用此数据源,排除了具有 CRC 或腺瘤性息肉病史的患者,最终样本量为 180 630 例患者,其中 2 762 例患有 CRC。以下危险因素在 MEC 基线时进行了测量,并作为最终模型中的候选变量:年龄、性别、个人的癌症史、体质量指数、定期使用阿司匹林、结肠癌家族史、雌激素使用、每日饮酒量、定期使用多种维生素、每天中等或剧烈活动的小时数、种族、糖尿病史、受教育年限、吸烟年限、定期使用非甾体类抗炎药物(non-steroidal anti-inflammatory drugs,NSAIDs)、每天摄入红肉量和偏好熟肉。连续变量使用限制性立方样条建模,并用微积分来描述预测变量与结果之间的非线性关系。由于男性和女性之间潜在的风险差异,研究者[14]决定为他们分别创建单独的风险计算器。
2.2 数据的统计分析
采用 logistic 向前逐步回归方法进行变量选择,发现以下因素与 CRC 的风险显著相关:年龄、种族、吸烟年限、每日饮酒量、结肠癌家族史、定期使用多种维生素、糖尿病史和定期使用 NSAIDs。只有在针对男性患者的未经校准的分析中,受教育年限和每天中等或剧烈活动的小时数与 CRC 有关,而每天摄入红肉量、偏好熟肉和雌激素使用仅与女性患有 CRC 有关[14]。
2.3 CRC-PRO 的验证和校准[5 ]
使用十折交叉验证对模型进行内部验证,以评估区分能力(c 统计量)和校准(以图表评估),结果显示,对于男性和女性来说,年龄对模型准确性的影响最大;种族/民族是两性的第二重要变量,而其他变量对于男性和女性的相对重要性不同。最终男性模型包含 12 个变量(年龄、种族、吸烟年限、每日饮酒量、体质量指数、受教育年限、定期使用阿司匹林、结肠癌家族史、定期使用多种维生素、每天摄入红肉量、糖尿病史和每天中等或剧烈活动的小时数),女性模型包含 11 个变量(年龄、种族、受教育年限、雌激素使用、糖尿病史、吸烟年限、结肠癌家族史、定期使用多种维生素、体质量指数、定期使用 NSAIDs 和每日饮酒量)。基于对建立模型的内部验证(诺模图)来确定最终模型的变量系数。
3 CRC-PRO 的特点
3.1 探讨 CRC-PRO 的变量选择
CRC-PRO 模型纳入的变量包括已确定的 CRC 危险因素、尚未确立的其他危险因素以及几种可能的 CRC 保护因素,然后进行合并分析,确立最终模型变量;MEC 的初步调查并没有询问结直肠镜的检查史,因为在此之前所有人的基线信息是未知的,故此模型也未包括;MEC 不包含有关炎症性肠病(inflammatory bowel disease,IBD)的信息,虽然这是已知的 CRC 风险因素,但由于其高发病率和特异性,IBD 患者应该接受更积极的筛查和预防策略,并需为此类人群单独建立指南,将 IBD 患者排除在创建风险计算器之外是理想的选择;没有包括详细的饮食问题,因为某些因素的效用还未证实;在之前的研究中,连续变量经常被分类[30],这会导致信息丢失和预测精度下降,而使用基于计算机的计算器界面则不再需要将其分类[31],保证了其完整性;模型复杂性和预测精确性之间需要达到一定的平衡,该模型仅限于 11 或 12 个变量,因为超出此模型规模的准确性增益微乎其微。
3.2 CRC-PRO 应用的优劣势
CRC-PRO 计算器简单易操作,具有很好的预测准确性。且它分别建立男性和女性模型,消除了隐藏的交互效应,纳入了多个变量比仅凭单变量的预测模型更准确。由于数据集和变量定义的差异,CRC-PRO 计算器的准确性未能与 NCI 计算器进行比较。理论上,由于 CRC-PRO 计算器依据的样本量大,进行了前瞻性数据分析以及避免对连续变量进行分类,从 CRC-PRO 计算器获得的预测值应该比 NCI 模型更准确。MEC 男性患者中 CRC 预计 10 年风险低于 1% 的比例为 29.5%,而女性患者中该比例>48%[14],这表明在临床上推迟或放弃一些极低风险患者的结肠镜检查可能是合理的。对于女性来说更是如此,因为 1 475 例女性患者的预测风险<1% 时至少需达到 65 岁[14]。一些专家已经建议,对于低风险患者,一生一次的结肠镜筛查可能具有成本效益[32]。
CRC-PRO 计算器是利用来自 MEC 的数据创建的,此前瞻性队列在种族构成方面是独一无二的;其次是它对社会阶层具有广泛的代表性,允许跨不同人群进行有效比较,且采用队列研究避免了回忆偏倚。但是现在还尚未有其他使用 CRC-PRO 工具的研究,对于此计算器的可行性、有效性、实用性、临床效果、成本效益等积极影响和负面作用还未确定。此工具旨在能够帮助改善个体患 CRC 风险的评估,并鼓励使用绝对风险阈值进行决策,但对于这种改进的预测还未确定其确切的影响。
4 CRC-PRO 的推广与展望
在中国使用的 CRC 风险预测工具大多数是筛查评分系统[33-35],根据某些危险因素评分后对患者进行风险分级,再对不同风险级别的患者采取相应的策略,这种方式在处理时会忽略一部分信息,且不能明确给出风险概率值,其精准度似乎还不能达到满意的效果。CRC-PRO 在中国进行试用可能具有一定的实用价值,此工具不仅能具体给出风险概率值,而且简单易操作,但是基于地域的差异,在 CRC-PRO 的推广中,需要开展多中心研究,以在更多不同的人群中进行更广泛的临床分析验证,进一步扩展此工具的应用范围。