结直肠息肉是源于黏膜及黏膜下层的隆起性病变[1]。病理上可将其分为腺瘤性息肉及非腺瘤性息肉。腺瘤性息肉是当前公认的最重要的结直肠肿瘤的癌前病变,与结直肠癌密切相关[2],因此及时切除息肉可以有效预防结直肠癌。结肠镜检查可以早期发现腺瘤及息肉的存在,从而有效预防结直肠癌。Corley等[3]研究显示腺瘤检出率每增加1%,结直肠癌风险会下降3%。但大量研究[4-6]表明结肠镜检查普遍存在息肉腺瘤漏诊的情况,且漏诊率可达近26%,漏诊原因主要与病变本身易被忽视、医师识别失败及黏膜暴露不完全有关。其中息肉识别失败是漏诊的主要决定因素。目前每次结肠镜检查影像由大约50 000帧图片构成,意味着需要以每秒25~30帧速度进行息肉识别,而一个息肉可能仅能在几帧内被识别出来,这就导致了无论内镜设置如何,息肉识别失败都可能发生。
近10年来,人工智能技术迅速发展,深度学习的理论和技术进步推动了计算机辅助检测(CADe)系统的发展。基于回顾性图像分析建立的不同CADe诊断模型在训练集和验证集中均显示了高特异度和敏感度,可有效提高腺瘤及息肉检出率,降低漏诊率[8-11]。但基于回顾性影像建立的CADe诊断模型普遍存在诊断曲线过拟合等问题,其在真实世界环境中的外推性能不如理想状态,可能出现假阳性率(误诊率)上升,导致医生需要反复核查腺瘤和息肉真伪,内镜退出时间增加或误切除率上升;同时受黏膜暴露程度、内镜医生技能、结直肠清洁水平、退出时间的速度等其他因素影响,腺瘤和息肉假阴性率(漏诊率)上升;均可导致使用与不使用CADe系统的结肠镜检查结果没有差异,甚至增加退镜时间和医生工作负担。针对以上临床质疑,部分研究者在已经建立和验证CADe诊断模型的基础上,前瞻性开展了诊断性试验的随机对照试验(randomized controlled trials,RCT),比较使用CADe系统的结肠镜与不使用CADe系统的标准结肠镜进行腺瘤和息肉识别结果的差异。从2020年来,基于不同深度学习模型的CADe系统与标准结肠镜检查比较的RCTs不断涌现,因此有必要采用Meta分析方法,系统评价CADe对不同大小、形态、位置或组织学息肉识别效果,为临床医生更好使用CADe系统提供证据参考。
1 资料与方法
1.1 纳入与排除标准
1.1.1 研究类型
RCT。
1.1.2 研究对象
① 年龄≥18岁;② 行结直肠肿瘤筛查、息肉切除术后监测、粪便免疫化学监测阳性、具有疑似结直肠肿瘤体征或症状的患者。排除有CRC或IBD的个人病史,既往结肠切除、在息肉切除后进行抗血栓治疗的受试者。
1.1.3 干预措施
试验组:CADe辅助肠镜检测;对照组:无CADe辅助的常规肠镜检测。
1.1.4 结局指标
① 腺瘤检出率(adenoma detection rate,ADR);② 息肉检出率(polyp detection rate,PDR);③ 腺瘤漏诊率(adenoma miss rate,AMR);④ 息肉漏诊率(polyp detection rate,PMR);⑤ 退镜时间。
1.1.5 排除标准
① 非中、英文文献;② 无法获取全文或重复发表的文献;③ 关键数据信息不完整或有误的文献。
1.2 文献检索策略
计算机检索PubMed、Cochrane Library、Web of Science、Embase、CNKI、WanFang Data和VIP数据库,检索时间为2014年1月至2023年4月。以主题词和自由词相结合进行检索,英文检索词包括:artificial intelligence、deep learning、artificial neural network、computer-aided diagnosis、adenomatous polyps、colonic polyps、colorectal neoplasms、endoscopes等;中文检索词包括:人工智能、深度学习、神经网络,计算机、诊断,计算机辅助、肠息肉、结肠息肉、腺瘤性息肉、结直肠肿瘤、结肠镜等。根据各数据库特点进行调整。同时检索纳入研究的参考文献,以补充获取相关资料。以PubMed为例,其具体检索策略见附件框1。
1.3 文献筛选及资料提取
由2名研究者独立筛选文献、提取资料并交叉核对。如有分歧,则通过讨论或与第三方协商解决。资料提取内容包括:① 研究的基本信息(第一作者、发表年份、国家、多中心、研究类型、研究人群、性别、平均年龄、样本量、诊断金标准、患者基线情况);② 主要结局指标或可估计效应值的数据(包括腺瘤检出率、息肉检出率、腺瘤漏诊率、息肉漏诊率、退镜时间等);③ RCT偏倚风险相关内容。
1.4 纳入研究的偏倚风险评价
由2名研究者独立评价纳入研究的偏倚风险,并交叉核对结果,如有分歧,讨论或与第三人讨论解决。偏倚风险评价使用Cochrane协作网RCT偏倚风险评价工具(RoB)进行,每个条目判断可分为高偏倚风险、低偏倚风险和不清楚。
1.5 统计分析
采用RevMan5.3软件进行Meta分析。计数资料采用相对危险度(relative risk,RR)及95%CI为分析统计量;连续性变量采用加权平均数(WMD)及95%CI为分析统计量。首先采用卡方检验进行异质性检验,当P≥0.1,I2<50%时,表明研究间统计学异质性较小,使用固定效应模型合并效应量。当P<0.1,I2≥50%时,表明研究间统计学异质性较大,但如纳入研究间无临床异质性,考虑使用随机效应模型合并效应量;如存在明显临床异质性,则需分析异质性来源,行亚组分析或仅行描述性分析。按照息肉和腺瘤检出和漏诊的影响因素(息肉位置、大小、形态及退镜时间等)进行亚组分析。因本文最终纳入文献数量少于10篇,因此未进行发表偏倚检测。为了评估Meta分析结果的稳健性及可靠性,采用逐一剔除法进行敏感性分析。设定P<0.05为差异有统计学意义。
2 结果
2.1 文献检索结果
初检出相关文献768篇,包括PubMed(n=31)、Web of Science(n=41)、Cochrane Library(n=99)、Embase(n=449)、CNKI(n=12)、VIP(n=8)、WanFang Data(n=148)。经逐层筛选后,最终纳入9篇RCT。文献筛选流程及结果见附件图1。
2.2 纳入研究的基本特征
本文共纳入9个RCT,包含6 393例受试者,纳入研究的基本特征见表1。

2.3 偏倚风险评价结果
7个研究[12-16,18-20]采用计算机数字表法进行随机分组,6个研究[12-14,16,18,20]报告采用了随机分层方法,7个研究[12-16,18,20]进行了分配隐藏,5个研究[12-14,16,20]文献采用了结局测量者盲法。纳入RCT的偏倚风险评价结果见表2。

2.4 Meta分析结果
2.4.1 腺瘤检出率
有8个[12, 13, 15-20]RCT报道了腺瘤检出率,随机效应模型分析结果显示,CADe组的腺瘤检出率比常规肠镜组更高[RR=1.22,95%CI(1.10,1.35),P<0.01]。按照腺瘤的位置、大小、性质进行亚组分析,结果显示,CADe组在≤5 mm、非息肉样的腺瘤的检出率比常规肠镜组更高,差异具有统计学意义[RR=1.06,95%CI(1.00,1.11),P=0.04;RR=1.12,95%CI(1.00,1.26),P=0.05],见表3。

2.4.2 腺瘤漏诊率
有3个[13,14,16]RCT报道了腺瘤漏诊率,随机效应模型分析结果显示,CADe组的腺瘤漏诊率低于常规肠镜组[RR=0.48,95%CI(0.34,0.67),P<0.01]。按照腺瘤的大小、位置进行亚组分析,结果显示,CADe组在盲肠、横结肠、降结肠、乙状结肠的腺瘤漏诊率更低,见表3。
2.4.3 息肉检出率
有6个[13,15-19]RCT报道了息肉检出率,随机效应模型分析结果显示,CADe组的息肉检出率比常规肠镜组更高[RR=1.19,95%CI(1.04,1.36),P<0.01]。按照息肉的位置、大小、形态进行亚组分析,结果显示,CADe组在近端、≤5 mm、无蒂息肉的检出率比常规肠镜组更高,差异具有统计学意义[RR=1.27,95%CI(1.19,1.35),P<0.01;RR=1.07,95%CI(1.02,1.11),P<0.01;RR=1.05,95%CI(0.99,1.11),P=0.01],见表4。

2.4.4 息肉漏诊率
有3个[13,14,16]RCT报道了息肉漏诊率,随机效应模型分析结果显示,CADe组的息肉漏诊率比常规肠镜组更低[RR=0.39,95%CI(0.25,0.59),P<0.01]。
2.4.5 退镜时间
有5个[12,15-18]RCT报道了两组退镜时间,随机效应模型分析结果显示,CADe组与常规肠镜组的退镜时间无差别[RR=0.07,95%CI(−0.26,0.39),P=0.68]。
2.4.6 敏感性分析
我们对腺瘤检出率、腺瘤漏诊率、息肉检出率、息肉漏诊率、退镜时间5个指标均采用逐一删除每篇纳入研究的方法进行了敏感性分析。敏感性分析结果显示,
大多数指标的敏感性分析结果未发生方向性改变,说明Meta分析结果的一致性较好。但在>10 mm息肉检出率中,从4篇研究中剔除1篇研究[18]后,两组息肉检出率由有差异[RR=0.7,95%CI(0.55,0.89),P<0.01]变为无差异[RR=0.82,95%CI(0.6,1.12),P=0.2]。
3 讨论
目前,标准结肠镜检查已成为早期筛查腺瘤及息肉最常见的临床操作,但是由于结肠镜检查在很大程度上受经验水平、肠道准备度、息肉的形态及其暴露程度等方面的影响,因此腺瘤和息肉识别失败成为临床上结肠镜检查最常见的问题,也是结直肠肿瘤漏诊的主要因素[7,12,13]。随着人工智能及深度学习理论和技术的进步,计算机辅助息肉检测(CADe)系统主要通过卷积神经网络(CNN)对图像分类[21],通过一系列图像及视频的病变数据集的训练与验证形成,能够增加结肠镜检查识别病变的能力[22]。近十年来,不同国家和地区的研究者基于不同人种、医院的回顾性结肠镜检查图像,训练和验证了具有高灵敏度和特异度(均在90%以上)的CADe系统诊断模型[23,24]。现有研究显示,CADe系统在腺瘤及息肉检出率方面表现良好[25],但可能整体上不足以评估其与病变特征(如息肉大小、形态、位置或组织学)识别之间的关系,而且部分医生对CADe系统的实际应用于临床的效果仍抱有怀疑态度(如内镜医师操作经验不足导致使用或不使用CADe的结肠镜检查结果无差异、或由于假阳性结果而浪费检查时间)[26,27]。为解决以上临床问题,从5年前开始,在完成了CADe系统诊断模型训练和验证的基础上,部分研究者开始开展前瞻性RCT来比较使用CADe系统的结肠镜与使用标准结肠镜检查的结果差异。CADe系统的临床研究热点逐步从模型建立向临床真实效果评价进行转移,因此有必要对RCT评价结果进行Meta分析。
本研究结果显示,与常规肠镜检查相比,CADe系统明显提高了腺瘤检出率和息肉检出率,降低了腺瘤漏诊率及息肉漏诊率,这与Thomas等[28]的定性系统评价结果一致,也在其他研究中得以证实[29],说明CADe系统相对于标准结肠镜检查,能够更早、更准确地诊断腺瘤和息肉,从而阻碍结肠癌发生进程,降低结肠癌发生风险。此外,CADe系统在≤5 mm息肉的检出率比标准结肠镜组更高,这一研究结果也与传统观点[30,31]相符,即相比较大的息肉,小息肉更有可能在视野内被遗漏,CADe系统在小息肉检出方面更具优势。同时,本次Meta分析的敏感性分析结果显示,从4篇研究中剔除1篇研究[18]后,>10 mm的息肉检出率由有差异[RR=0.7,95%CI(0.55,0.89),P<0.01]变为无差异[RR=0.82,95%CI(0.6,1.12),P=0.20],说明CADe系统可能在较大息肉检测方面并不优于标准结肠镜检查,这一结果也与Deliwala等[30]的报道一致,未来可能需要针对>10 mm的息肉来建立优化后的CADe系统诊断模型。在不同形态息肉检出率方面,由于仅纳入2个研究,且原始研究结果矛盾,也需要更多研究验证。本次Meta分析结果显示,两组在退镜时间上差异无统计学.意义,表明临床上使用CADe系统并不会增加假阳性结果,从而额外增加检查时间。既往研究也已证明无论内镜医师的操作及经验水平如何,CADe系统均可以显著增加腺瘤息肉检出率,降低漏诊率[32]。由此可见,CADe系统有可能通过降低息肉漏诊率,部分消除医生操作/经验水平等方面的差异,成为医生的得力助手,并随着AI技术的发展,达到更好的识别能力,从而提高结肠镜早期筛查的水平。
本系统评价共纳入9个RCT,其中大多数研究采用了计算机数字表法进行随机分组,报告了分配隐藏情况,并采用了结局测量者盲法。6个研究为了尽量让重要的混杂因素在两组间一致,额外采用了随机分层方法,总体而言,纳入研究的潜在偏倚风险较小,Meta分析结果的可信度较高,绝大部分结局指标的敏感性分析结果稳定,未出现方向性改变。
本研究的局限性:① 虽然本研究对各大数据库进行了系统检索,但因为研究发表时间较新,最后仅纳入英文文献,可能存在语言和发表偏倚;② 纳入RCT的偏倚风险评价结果显示,大多数研究报告了采用的具体随机方法并进行了随机分层,但有部分研究未采用结局测量者盲法,可能存在测量偏倚风险,此外,大多数研究存在失访但未进行ITT分析,可能导致高估CADe系统检测结果的有效性;③ 由于纳入研究来自不同国家、不同人群和不同类型医院,且采用的CADe系统不同,导致研究间具有高度异质性,我们虽然进行了亚组分析,但并未发现异质性的确切来源,这可能影响结果的准确性,未来应对多中心不同人群进行更多研究。
综上所述,计算机辅助检测系统可以增加腺瘤及息肉检出率,并降低漏诊率,息肉检出率与其位置、大小及形态相关,腺瘤漏诊率与其位置相关。受纳入研究数量和质量限制,未来需要更多中心、更大样本的研究验证。
结直肠息肉是源于黏膜及黏膜下层的隆起性病变[1]。病理上可将其分为腺瘤性息肉及非腺瘤性息肉。腺瘤性息肉是当前公认的最重要的结直肠肿瘤的癌前病变,与结直肠癌密切相关[2],因此及时切除息肉可以有效预防结直肠癌。结肠镜检查可以早期发现腺瘤及息肉的存在,从而有效预防结直肠癌。Corley等[3]研究显示腺瘤检出率每增加1%,结直肠癌风险会下降3%。但大量研究[4-6]表明结肠镜检查普遍存在息肉腺瘤漏诊的情况,且漏诊率可达近26%,漏诊原因主要与病变本身易被忽视、医师识别失败及黏膜暴露不完全有关。其中息肉识别失败是漏诊的主要决定因素。目前每次结肠镜检查影像由大约50 000帧图片构成,意味着需要以每秒25~30帧速度进行息肉识别,而一个息肉可能仅能在几帧内被识别出来,这就导致了无论内镜设置如何,息肉识别失败都可能发生。
近10年来,人工智能技术迅速发展,深度学习的理论和技术进步推动了计算机辅助检测(CADe)系统的发展。基于回顾性图像分析建立的不同CADe诊断模型在训练集和验证集中均显示了高特异度和敏感度,可有效提高腺瘤及息肉检出率,降低漏诊率[8-11]。但基于回顾性影像建立的CADe诊断模型普遍存在诊断曲线过拟合等问题,其在真实世界环境中的外推性能不如理想状态,可能出现假阳性率(误诊率)上升,导致医生需要反复核查腺瘤和息肉真伪,内镜退出时间增加或误切除率上升;同时受黏膜暴露程度、内镜医生技能、结直肠清洁水平、退出时间的速度等其他因素影响,腺瘤和息肉假阴性率(漏诊率)上升;均可导致使用与不使用CADe系统的结肠镜检查结果没有差异,甚至增加退镜时间和医生工作负担。针对以上临床质疑,部分研究者在已经建立和验证CADe诊断模型的基础上,前瞻性开展了诊断性试验的随机对照试验(randomized controlled trials,RCT),比较使用CADe系统的结肠镜与不使用CADe系统的标准结肠镜进行腺瘤和息肉识别结果的差异。从2020年来,基于不同深度学习模型的CADe系统与标准结肠镜检查比较的RCTs不断涌现,因此有必要采用Meta分析方法,系统评价CADe对不同大小、形态、位置或组织学息肉识别效果,为临床医生更好使用CADe系统提供证据参考。
1 资料与方法
1.1 纳入与排除标准
1.1.1 研究类型
RCT。
1.1.2 研究对象
① 年龄≥18岁;② 行结直肠肿瘤筛查、息肉切除术后监测、粪便免疫化学监测阳性、具有疑似结直肠肿瘤体征或症状的患者。排除有CRC或IBD的个人病史,既往结肠切除、在息肉切除后进行抗血栓治疗的受试者。
1.1.3 干预措施
试验组:CADe辅助肠镜检测;对照组:无CADe辅助的常规肠镜检测。
1.1.4 结局指标
① 腺瘤检出率(adenoma detection rate,ADR);② 息肉检出率(polyp detection rate,PDR);③ 腺瘤漏诊率(adenoma miss rate,AMR);④ 息肉漏诊率(polyp detection rate,PMR);⑤ 退镜时间。
1.1.5 排除标准
① 非中、英文文献;② 无法获取全文或重复发表的文献;③ 关键数据信息不完整或有误的文献。
1.2 文献检索策略
计算机检索PubMed、Cochrane Library、Web of Science、Embase、CNKI、WanFang Data和VIP数据库,检索时间为2014年1月至2023年4月。以主题词和自由词相结合进行检索,英文检索词包括:artificial intelligence、deep learning、artificial neural network、computer-aided diagnosis、adenomatous polyps、colonic polyps、colorectal neoplasms、endoscopes等;中文检索词包括:人工智能、深度学习、神经网络,计算机、诊断,计算机辅助、肠息肉、结肠息肉、腺瘤性息肉、结直肠肿瘤、结肠镜等。根据各数据库特点进行调整。同时检索纳入研究的参考文献,以补充获取相关资料。以PubMed为例,其具体检索策略见附件框1。
1.3 文献筛选及资料提取
由2名研究者独立筛选文献、提取资料并交叉核对。如有分歧,则通过讨论或与第三方协商解决。资料提取内容包括:① 研究的基本信息(第一作者、发表年份、国家、多中心、研究类型、研究人群、性别、平均年龄、样本量、诊断金标准、患者基线情况);② 主要结局指标或可估计效应值的数据(包括腺瘤检出率、息肉检出率、腺瘤漏诊率、息肉漏诊率、退镜时间等);③ RCT偏倚风险相关内容。
1.4 纳入研究的偏倚风险评价
由2名研究者独立评价纳入研究的偏倚风险,并交叉核对结果,如有分歧,讨论或与第三人讨论解决。偏倚风险评价使用Cochrane协作网RCT偏倚风险评价工具(RoB)进行,每个条目判断可分为高偏倚风险、低偏倚风险和不清楚。
1.5 统计分析
采用RevMan5.3软件进行Meta分析。计数资料采用相对危险度(relative risk,RR)及95%CI为分析统计量;连续性变量采用加权平均数(WMD)及95%CI为分析统计量。首先采用卡方检验进行异质性检验,当P≥0.1,I2<50%时,表明研究间统计学异质性较小,使用固定效应模型合并效应量。当P<0.1,I2≥50%时,表明研究间统计学异质性较大,但如纳入研究间无临床异质性,考虑使用随机效应模型合并效应量;如存在明显临床异质性,则需分析异质性来源,行亚组分析或仅行描述性分析。按照息肉和腺瘤检出和漏诊的影响因素(息肉位置、大小、形态及退镜时间等)进行亚组分析。因本文最终纳入文献数量少于10篇,因此未进行发表偏倚检测。为了评估Meta分析结果的稳健性及可靠性,采用逐一剔除法进行敏感性分析。设定P<0.05为差异有统计学意义。
2 结果
2.1 文献检索结果
初检出相关文献768篇,包括PubMed(n=31)、Web of Science(n=41)、Cochrane Library(n=99)、Embase(n=449)、CNKI(n=12)、VIP(n=8)、WanFang Data(n=148)。经逐层筛选后,最终纳入9篇RCT。文献筛选流程及结果见附件图1。
2.2 纳入研究的基本特征
本文共纳入9个RCT,包含6 393例受试者,纳入研究的基本特征见表1。

2.3 偏倚风险评价结果
7个研究[12-16,18-20]采用计算机数字表法进行随机分组,6个研究[12-14,16,18,20]报告采用了随机分层方法,7个研究[12-16,18,20]进行了分配隐藏,5个研究[12-14,16,20]文献采用了结局测量者盲法。纳入RCT的偏倚风险评价结果见表2。

2.4 Meta分析结果
2.4.1 腺瘤检出率
有8个[12, 13, 15-20]RCT报道了腺瘤检出率,随机效应模型分析结果显示,CADe组的腺瘤检出率比常规肠镜组更高[RR=1.22,95%CI(1.10,1.35),P<0.01]。按照腺瘤的位置、大小、性质进行亚组分析,结果显示,CADe组在≤5 mm、非息肉样的腺瘤的检出率比常规肠镜组更高,差异具有统计学意义[RR=1.06,95%CI(1.00,1.11),P=0.04;RR=1.12,95%CI(1.00,1.26),P=0.05],见表3。

2.4.2 腺瘤漏诊率
有3个[13,14,16]RCT报道了腺瘤漏诊率,随机效应模型分析结果显示,CADe组的腺瘤漏诊率低于常规肠镜组[RR=0.48,95%CI(0.34,0.67),P<0.01]。按照腺瘤的大小、位置进行亚组分析,结果显示,CADe组在盲肠、横结肠、降结肠、乙状结肠的腺瘤漏诊率更低,见表3。
2.4.3 息肉检出率
有6个[13,15-19]RCT报道了息肉检出率,随机效应模型分析结果显示,CADe组的息肉检出率比常规肠镜组更高[RR=1.19,95%CI(1.04,1.36),P<0.01]。按照息肉的位置、大小、形态进行亚组分析,结果显示,CADe组在近端、≤5 mm、无蒂息肉的检出率比常规肠镜组更高,差异具有统计学意义[RR=1.27,95%CI(1.19,1.35),P<0.01;RR=1.07,95%CI(1.02,1.11),P<0.01;RR=1.05,95%CI(0.99,1.11),P=0.01],见表4。

2.4.4 息肉漏诊率
有3个[13,14,16]RCT报道了息肉漏诊率,随机效应模型分析结果显示,CADe组的息肉漏诊率比常规肠镜组更低[RR=0.39,95%CI(0.25,0.59),P<0.01]。
2.4.5 退镜时间
有5个[12,15-18]RCT报道了两组退镜时间,随机效应模型分析结果显示,CADe组与常规肠镜组的退镜时间无差别[RR=0.07,95%CI(−0.26,0.39),P=0.68]。
2.4.6 敏感性分析
我们对腺瘤检出率、腺瘤漏诊率、息肉检出率、息肉漏诊率、退镜时间5个指标均采用逐一删除每篇纳入研究的方法进行了敏感性分析。敏感性分析结果显示,
大多数指标的敏感性分析结果未发生方向性改变,说明Meta分析结果的一致性较好。但在>10 mm息肉检出率中,从4篇研究中剔除1篇研究[18]后,两组息肉检出率由有差异[RR=0.7,95%CI(0.55,0.89),P<0.01]变为无差异[RR=0.82,95%CI(0.6,1.12),P=0.2]。
3 讨论
目前,标准结肠镜检查已成为早期筛查腺瘤及息肉最常见的临床操作,但是由于结肠镜检查在很大程度上受经验水平、肠道准备度、息肉的形态及其暴露程度等方面的影响,因此腺瘤和息肉识别失败成为临床上结肠镜检查最常见的问题,也是结直肠肿瘤漏诊的主要因素[7,12,13]。随着人工智能及深度学习理论和技术的进步,计算机辅助息肉检测(CADe)系统主要通过卷积神经网络(CNN)对图像分类[21],通过一系列图像及视频的病变数据集的训练与验证形成,能够增加结肠镜检查识别病变的能力[22]。近十年来,不同国家和地区的研究者基于不同人种、医院的回顾性结肠镜检查图像,训练和验证了具有高灵敏度和特异度(均在90%以上)的CADe系统诊断模型[23,24]。现有研究显示,CADe系统在腺瘤及息肉检出率方面表现良好[25],但可能整体上不足以评估其与病变特征(如息肉大小、形态、位置或组织学)识别之间的关系,而且部分医生对CADe系统的实际应用于临床的效果仍抱有怀疑态度(如内镜医师操作经验不足导致使用或不使用CADe的结肠镜检查结果无差异、或由于假阳性结果而浪费检查时间)[26,27]。为解决以上临床问题,从5年前开始,在完成了CADe系统诊断模型训练和验证的基础上,部分研究者开始开展前瞻性RCT来比较使用CADe系统的结肠镜与使用标准结肠镜检查的结果差异。CADe系统的临床研究热点逐步从模型建立向临床真实效果评价进行转移,因此有必要对RCT评价结果进行Meta分析。
本研究结果显示,与常规肠镜检查相比,CADe系统明显提高了腺瘤检出率和息肉检出率,降低了腺瘤漏诊率及息肉漏诊率,这与Thomas等[28]的定性系统评价结果一致,也在其他研究中得以证实[29],说明CADe系统相对于标准结肠镜检查,能够更早、更准确地诊断腺瘤和息肉,从而阻碍结肠癌发生进程,降低结肠癌发生风险。此外,CADe系统在≤5 mm息肉的检出率比标准结肠镜组更高,这一研究结果也与传统观点[30,31]相符,即相比较大的息肉,小息肉更有可能在视野内被遗漏,CADe系统在小息肉检出方面更具优势。同时,本次Meta分析的敏感性分析结果显示,从4篇研究中剔除1篇研究[18]后,>10 mm的息肉检出率由有差异[RR=0.7,95%CI(0.55,0.89),P<0.01]变为无差异[RR=0.82,95%CI(0.6,1.12),P=0.20],说明CADe系统可能在较大息肉检测方面并不优于标准结肠镜检查,这一结果也与Deliwala等[30]的报道一致,未来可能需要针对>10 mm的息肉来建立优化后的CADe系统诊断模型。在不同形态息肉检出率方面,由于仅纳入2个研究,且原始研究结果矛盾,也需要更多研究验证。本次Meta分析结果显示,两组在退镜时间上差异无统计学.意义,表明临床上使用CADe系统并不会增加假阳性结果,从而额外增加检查时间。既往研究也已证明无论内镜医师的操作及经验水平如何,CADe系统均可以显著增加腺瘤息肉检出率,降低漏诊率[32]。由此可见,CADe系统有可能通过降低息肉漏诊率,部分消除医生操作/经验水平等方面的差异,成为医生的得力助手,并随着AI技术的发展,达到更好的识别能力,从而提高结肠镜早期筛查的水平。
本系统评价共纳入9个RCT,其中大多数研究采用了计算机数字表法进行随机分组,报告了分配隐藏情况,并采用了结局测量者盲法。6个研究为了尽量让重要的混杂因素在两组间一致,额外采用了随机分层方法,总体而言,纳入研究的潜在偏倚风险较小,Meta分析结果的可信度较高,绝大部分结局指标的敏感性分析结果稳定,未出现方向性改变。
本研究的局限性:① 虽然本研究对各大数据库进行了系统检索,但因为研究发表时间较新,最后仅纳入英文文献,可能存在语言和发表偏倚;② 纳入RCT的偏倚风险评价结果显示,大多数研究报告了采用的具体随机方法并进行了随机分层,但有部分研究未采用结局测量者盲法,可能存在测量偏倚风险,此外,大多数研究存在失访但未进行ITT分析,可能导致高估CADe系统检测结果的有效性;③ 由于纳入研究来自不同国家、不同人群和不同类型医院,且采用的CADe系统不同,导致研究间具有高度异质性,我们虽然进行了亚组分析,但并未发现异质性的确切来源,这可能影响结果的准确性,未来应对多中心不同人群进行更多研究。
综上所述,计算机辅助检测系统可以增加腺瘤及息肉检出率,并降低漏诊率,息肉检出率与其位置、大小及形态相关,腺瘤漏诊率与其位置相关。受纳入研究数量和质量限制,未来需要更多中心、更大样本的研究验证。