本文基于影像组学预测胰腺囊性肿瘤(PCN)的 Ki67 分子标记物表达情况。首先手动分割患者术前多排螺旋断层扫描(MDCT)图像中的肿瘤区域,然后根据肿瘤特点设计并提取 409 个高通量特征,再利用最小化的绝对收缩与选择算子(LASSO)回归模型进行多因素分析筛选特征,最后将筛选后的特征输入支持向量机(SVM)实现分类判别。通过重复 200 次 LASSO 筛选,记录每次被选择的特征,并将特征按照被选择的次数从高到低排序。使用十折交叉验证的 SVM,测试不同的特征数量下的分类效果,重复 200 次并将结果取平均值以降低误差。实验结果表明,被选择次数最多的前 20 个特征构成最优特征子集,预测的 AUC 达到 91.54%,准确率达到 85.29%,敏感度为 81.88%,特异性为 86.75%。实验结果证明了通过影像组学方法预测 Ki67 分子标记物的可行性。
引用本文: 魏然, 林侃如, 郭翌, 李骥, 汪源源. 基于影像组学预测胰腺囊性肿瘤 Ki67 分子标记物的可行性研究. 生物医学工程学杂志, 2019, 36(1): 1-6. doi: 10.7507/1001-5515.201805014 复制
引言
胰腺癌是世界上最致命的恶性肿瘤之一,其五年生存率仅为 8%[1]。常见的胰腺肿瘤中有一类为胰腺囊性肿瘤(pancreas cystic neoplasm,PCN), 包括了导管内乳头状黏液瘤(intraductal papillary mucinous neoplasm,IPMN)、黏液性囊腺瘤(mucinous cystic neoplasm,MCN)、实性假乳头状肿瘤(solid-pseudopapillary neoplasm,SPN)、浆液性囊腺瘤(serous cystic neoplasm,SCN)等不同类型。其中 SCN 在绝大多数情况下为良性,最近的一项研究发现 2 622 例 SCN 患者中恶变的仅有 3 例[2-3]。而 IPMN 和 MCN 这两种黏液型肿瘤为恶性或潜在恶性,绝大多数情况下需要手术切除治疗,其恶性程度的判断和预后情况的预测对于制定合理的临床治疗方案至关重要[4]。
研究发现,Ki67 分子标记物的表达情况可以为临床医生了解肿瘤增殖活性以及判断其生物学行为的恶性倾向、预测患者预后情况提供重要依据。Ki67 是一种肿瘤细胞增殖标记物,被广泛应用于肿瘤疾病的研究和临床诊断之中[5]。Ki67 使用 100 个细胞中的阳性细胞个数来表示,其数值在 0~100 之间。一般认为 Ki67 小于或等于某阈值的即为 Ki67 阴性表达,而高于该阈值的则为 Ki67 阳性表达,阳性表达通常提示肿瘤的增殖活性高、生物学行为恶性倾向高、复发率高以及预后差[6-7]。胰腺肿瘤的术前 Ki67 检测一般是通过超声内窥镜引导下的细针穿刺(endoscopic ultrasonography-guided fine needle aspiration,EUS-FNA)提取组织切片,再通过免疫组织化学方法得到其指标数值。这种方式得到的结果不如术后肿瘤标本的组织切片所得到的结果准确,且对患者身体有一定的损伤。
胰腺肿瘤的常用影像检查方法包括超声内窥镜成像(endoscopic ultrasonography imaging,EUI)、腹部电子计算机断层扫描(computed tomography,CT)和磁共振成像(magnetic resonance imaging,MRI)等,这些影像数据在临床诊断和治疗决策中能够提供非常重要的辅助信息。其中腹部多排螺旋断层扫描(multi-detector CT,MDCT)是 PCN 早期诊断的首选方法,具有较高的时空分辨率和肿瘤识别准确率[8]。
影像组学(radiomics)是一个新兴的研究领域,专注于挖掘医学图像中肉眼无法发现的潜在信息[9]。在图像获取或重建、分割感兴趣区域、提取高通量图像特征等步骤之后,使用机器学习算法建立数据模型,以实现良恶性诊断、生存期预测以及分子标记物预测等,为医生的诊断提供辅助参考意见。影像组学提供了一种基于医学影像预测 Ki67 等分子标记物的思路。目前已有的类似研究多集中在乳腺、前列腺、肺癌等器官,在胰腺肿瘤方面未见相关报道[10-13]。
本文使用影像组学的方法,基于腹部 MDCT 图像预测 Ki67 分子标记物表达情况。从临床的需求考虑,选取 PCN 中的 IPMN 和 MCN 两类黏液型肿瘤,为临床上初步了解肿瘤的增殖活性、判断其生物学行为的良恶性倾向、预测患者预后和制定治疗方案等提供重要参考信息。通过手工勾勒肿瘤区域、设计并提取针对性的图像特征以及选用合适的特征筛选算法和机器学习分类器,搭建高效、鲁棒的影像组学框架,实现分类预测判别。
1 材料与方法
本文使用影像组学方法,研究基于腹部 MDCT 图像对胰腺 IPMN 和 MCN 这两类黏液型肿瘤的 Ki67 分子标记物指数实现术前预测。图 1 为系统框架,包括 MDCT 图像输入、手动分割、特征提取、特征筛选和分类判别。

1.1 数据获取与图像预处理
本文的数据采集于复旦大学附属华山医院胰腺外科,包括了从 2007 年 3 月至 2016 年 9 月接受手术的 87 例患者。其中 IPMN 患者 59 例,MCN 患者 28 例,年龄在 18 到 86 岁之间。详细的患者信息如表 1 所示。本文的研究经华山医院伦理委员会通过,全部患者在接受术前 MDCT 检查和肿瘤切除手术时签署了知情同意书。

所有患者在手术前都进行了腹部 64 排 MDCT 扫描检查,拥有平扫、动脉期、静脉期三个阶段的扫描图像。由于静脉期图像中肿瘤与背景区域的对比度更好,故本文的实验中使用了静脉期图像来提取图像特征[14]。对于每位患者的静脉期扫描图像,由一名影像科医生挑选出一幅肿瘤截面最大的图像作为后续处理的对象,并手工勾勒出肿瘤的边界。另外一名影像科医生则一一检查了这些图像以保证肿瘤区域分割的准确性。所有手术中切除的肿瘤标本均由经验丰富的病理科医生制作石蜡切片,通过免疫组织化学染色和计数获得其 Ki67 等分子标记物的数值,并做出明确的病理诊断。
1.2 特征提取
影像组学的核心在于定量地设计和提取有针对性的高通量特征。本文根据国际上通用的 PCN 诊断指南,设计影像组学特征对肿瘤图像特征实现量化评估[15]。此外,还加入了由影像科医生记录的肿瘤位置信息(位于胰头、胰颈、胰体或胰尾)和从图像存储与传输系统(picture archiving and communication system,PACS)中获得的患者的年龄、性别等临床信息。最终,每个患者图像中提取的高通量特征数为 409 个,包括临床信息特征、形态特征、纹理特征、小波特征等几大类,不同类别的特征及其含义或典型特征如表 2 所示,完整的特征信息见网络版附录(www.biomedeng.cn/article/10.7507/1001-5515.201805014)。

除了影像组学常用的纹理和小波特征外,我们在形态特征部分自动设计并提取肿瘤内部囊数量、内部囊平均面积、肿瘤形状(椭圆/分叶)、囊壁厚度、钙化区域、中央瘢痕等 PCN 专用特征。首先,给定肿瘤区域轮廓,计算肿瘤面积周长比、肿瘤与凸包的面积比、矩差等参数衡量其形状;其次,通过自适应阈值分割算法,得到囊壁、钙化区域、中央瘢痕的信息并且计算囊壁厚度、钙化区域位置/方差/数量、中央瘢痕面积等各类评价参数特征;然后,肿瘤内部囊相关特征的提取则先去除钙化点干扰,使用 Canny 算子提取内部边缘信息,再使用形态学运算填充囊的区域,最后通过计算各点到边缘的距离确定各囊的中心点,从而提取囊的数量、平均面积、面积的方差等定量特征。在已有的胰腺囊性肿瘤相关研究中,这些特征都是依靠影像科医生人工辨认和记录,且只能定性地记录有无。与之相比,本文的自动定量提取方法更加高效可靠[16-18]。
1.3 特征筛选
影像组学的思想是通过大量特征来深度挖掘图像信息,因此提取得到的特征向量维度往往很高,甚至远高于样本数量。在这种情况下,机器学习算法的训练时间会大大延长,且容易发生过拟合现象,分类效果通常不理想。特征筛选正是一种寻找特征最佳子集的方法,可以降低特征的维度,提高分类识别的准确率。
特征筛选有基于单变量分析和多变量组合分析等不同的方法。单变量分析的特征筛选方法指对每一个特征计算其与目标值之间的某类指标来衡量相关性,再对指标数值设定某一阈值,筛选出高相关性的特征。这类方法中常见的有相关系数法、卡方检验法、互信息法等。该方法原理简单且易于实现,但无法分析多个特征变量组合后的效果。
多变量组合分析的特征筛选方法着重分析不同特征变量组合与目标值之间的关系,较为常见的是使用带惩罚项的回归模型。本文使用了最小绝对收缩选择算子(the least absolute shrinkage selection operator,LASSO)回归模型来选择效果最优的特征组合。LASSO 回归又称为 L1 正则化模型,其损失函数可以表示为:
![]() |
其中X为特征矩阵,y为目标值,w为系数向量,为惩罚系数。与线性回归相比,LASSO 回归模型在损失函数中添加了额外的惩罚项,从而使较弱特征所对应的系数收缩到零[19]。此外,LASSO 回归还可以将几个高度相关的特征仅保留一个,其他的收缩为零,从而最终选择出最优的特征子集。
1.4 分类判别
在特征选择之后需要对 Ki67 的表达情况做分类判别预测。分类问题是机器学习中最常见的问题之一,常用的有朴素贝叶斯、Logistic 回归、随机森林、支持向量机(support vector machine,SVM)等算法。本文使用 SVM 分类器来得到分类预测结果。
SVM 是机器学习领域中最受欢迎的有监督学习算法之一,具有收敛速度快、准确率高的优点,在处理二分类问题时有非常好的效果。其核心思想是通过核函数将数据映射到高维空间,使其线性可分;再寻找一个将两类数据点分开的最优超平面,而支持向量就是到该超平面距离最小的数据点。这样在计算过程中就可以忽略支持向量以外的样本点,仅根据为数不多的支持向量就可以求出分类超平面,计算复杂度大为降低。
1.5 Bootstrap 抽样与重复
本文通过 Bootstrap 抽样与重复的方法提高特征筛选的效果,降低分类判别的误差和偶然性。Bootstrap 是现代统计学中常用的估计方法,对于小样本数据效果很好。从原 87 例样本的数据集中,随机抽取一定数量(本文选取样本总数 90%)的样本构建样本集,使用 LASSO 回归筛选特征,记录下被选择的特征。重复随机抽样和特征筛选步骤 200 次,以被选择次数的多少衡量特征的重要程度,将全部特征根据被选择的次数从多到少排序。
在分类判别实验中,我们使用基于 Bootstrap 抽样的十折交叉验证法。将 87 例样本随机抽样并分成数量接近的 10 个部分。每次使用其中的 9 个部分作为训练集来训练 SVM 模型,并用剩下的 1 个部分作为测试集来评估模型的性能,循环 10 次直到每个部分的数据都被测试过。随机抽样和十折交叉验证分类的过程同样也重复了 200 次。
本文还将特征筛选与分类判别的过程相结合。对于排序之后的全部特征,依次选取前 k 个最重要的特征(k=1, 2, 3, )作为特征子集,计算其分类判别实验的效果,并比较使用不同数量特征时的结果好坏,从而选取最优的特征子集。
以上方法均使用 Mathworks 公司 Matlab 软件(R2015b)实现。
2 实验与结果
2.1 实验设计
本文对 87 例胰腺 IPMN 和 MCN 患者数据进行分析研究。数据库中完整地收集了每位患者的性别、年龄、腹部 MDCT 检查图像、手术切除肿瘤后病理科医生作出的类型诊断以及免疫组织化学得到的 Ki67 分子标记物数值。本文将 Ki67 分子标记物预测问题转变为分类问题,预测判断其阳性或阴性表达情况。学界内对于 Ki67 阳性阈值的选取未有统一意见,本文使用了 2 和 5 这两个较常用的阈值分别进行实验,探讨通过影像组学方法预测 Ki67 表达情况的可行性[6-7]。
实验按照本文之前所陈述的方法,首先手动分割 MDCT 图像中的肿瘤区域,然后从图像中提取 409 个高通量特征,最终通过重复循环特征筛选和分类判别。为客观地评价特征子集的分类性能,本文计算了多种量化指标。绘制分类器的受试者操作特性(receiver operating characteristic,ROC)曲线,并计算其曲线下面积(area under the ROC curve,AUC)来评价分类性能。此外,还计算了准确度(accuracy,ACC)、灵敏度(sensitivity,SENS)和特异度(specificity,SPEC)来评估模型的分类性能。这些值都选取 200 次重复计算的平均值,还计算了 AUC 指标的 95% 置信区间(confidence interval,CI)。
2.2 结果分析与讨论
首先对 87 例患者腹部 MDCT 图像完成了肿瘤区域的手动分割。作为示例,图 2 为两例分割后的图像,分别来自一位 55 岁的男性 IPMN 患者和一位 82 岁的女性 MCN 患者。

接着,将分割后的肿瘤区域图像和患者的信息输入特征提取程序,得到了 87 例患者各自的 409 个高通量特征。使用 LASSO 回归重复进行 200 次特征选择之后,将这些特征按照被选择的次数从多到少排序,并且依次选取前 k 个特征(k=1, 2, 3, )作为特征子集输入分类器。根据分类的各项评价指标随特征个数 k 的变化情况,来选取最合适的特征个数 k。图 3 所示为当 Ki67 的划分阈值为 2 时的实验结果。

由图中可以看出选取出现频次最高的前 20 个特征时,获得了最优的分类效果。此时的 AUC 达到 0.915 4(95%CI,0.913 6~0.917 2),准确率为 0.852 9,敏感度为 0.818 8,特异性为 0.867 5。这些指标表明,本文的分类预测模型可以准确有效地预测 Ki67 处于较低或较高的表达水平。而当特征数由 20 个继续增加时,各项指标均有下降,说明无关特征和冗余特征带来了维数灾难,导致分类预测效果变差。
为论证本文方法的有效性,我们将结果对比了 Li 等[17]关于胰腺囊性肿瘤计算机辅助诊断的研究。在他们的研究中,共收集了 43 例胰腺囊性肿瘤患者的数据,并且由医生人工录入了性别、年龄、肿瘤位置、是否有钙化、是否有结节以及轮廓形状等定性特征,并通过 SVM 分类器进行分类判别,最终获得了 88.37% 的准确率。尽管本文针对的问题与他们的研究有一定差异,但是对特征提取环节进行比较,我们的特征均为自动提取的定量化特征,且多出了纹理和小波特征,提取特征更加高效便捷,研究所包含的患者数量也更大,并且准确率也能达到 85.29%。这充分说明了本文方法自动提取和筛选特征的有效性,以及判别预测 Ki67 分子标记物表达情况的可行性。
此外,我们还比较了 Ki67 的不同阈值划分所得到的最优实验结果,各项评价指标的数值如表 3 所示。可以发现在不同阈值划分下,分类预测结果都比较理想,但有一定差异。两次实验的结果中,AUC 均在 0.84 以上,准确率均在 0.77 以上,敏感度均在 0.78 以上,特异性均在 0.77 以上。当划分阈值为 2 时,达到最佳性能所选取的特征数更少,各指标显示的性能更好。我们也分析了两个实验中所选出的最优特征子集的情况。Ki67 阈值为 2 时,最优特征子集的 20 个特征主要包含 18 个纹理特征和小波纹理特征,以及患者性别和肿瘤位置特征;Ki67 阈值为 5 时,最优特征子集的 26 个特征主要包含 23 个纹理特征和小波纹理特征,以及 3 个形态特征(径向距离极值点数、圆形度、肿瘤位置)。纹理和小波特征都是通过各类灰度矩阵计算,提取人类肉眼无法捕捉的图像深度信息,在两个子集中这些特征所起作用基本相似,但是效果略有差异。而患者性别、径向距离极值点数、圆形度这三个特征在两次实验中都仅出现了一次,说明目前的特征筛选效果还有待改进,随机性较大,受数据分布的影响较大。

我们还回顾并比较了本文所研究的 87 例患者的术前临床诊断与病理诊断金标准的符合情况。结果显示术前正确诊断其肿瘤类型(IPMN/MCN)的准确率为 40.23%(35/87);如果将评判标准放宽到正确诊断其良恶性类型,忽略大概率恶性的 IPMN、MCN、导管腺癌之间的差别,则准确率也仅有 55.17%(48/87)。因此,本文使用影像组学方法在术前预测 IPMN 和 MCN 的 Ki67 表达情况并辅助诊断肿瘤良恶性倾向具有较大的临床意义,并初步论证了其可行性。对于何种阈值在临床实际中划分阴性和阳性表达更有效,学术界尚未达成统一意见,我们也将根据临床医学的最新学术成果继续深入研究,努力将成果用于临床实践中。
本文也存在两方面不足需要在日后的研究中进一步完善。第一,目前图像中的肿瘤区域均为手工划定,未来可以设计自动分割肿瘤区域的算法,从而实现全部分析流程的自动化。第二,目前本研究中的 87 例患者数据均来自华山医院胰腺外科,数据量不足导致特征筛选和分类判别过程中存在一定的偶然性,少数特例患者对整体的结果有较大的干扰。下一步可以收集其他医院的数据,建立多中心数据库,从而进一步提升研究的准确率和可靠性。
3 结论
本文论证了基于影像组学思路预测 Ki67 分子标记物表达情况的可行性。在 MDCT 术前影像中,首先手动分割肿瘤区域,然后自动提取 409 个高通量特征,使用 LASSO 回归实现特征筛选,最终通过 SVM 分类器完成分类预测。通过 200 次重复实验降低误差并减少过拟合,最优的结果选择了 20 个最具统计意义的特征,预测的 AUC 达到 91.54%,准确率达到 85.29%。该结果表明通过影像组学方法挖掘 MDCT 图像信息并预测 Ki67 分子标记物的可行性,对于用影像组学的方法开展相关肿瘤疾病可重复的术前预测研究有较强的指导意义。

引言
胰腺癌是世界上最致命的恶性肿瘤之一,其五年生存率仅为 8%[1]。常见的胰腺肿瘤中有一类为胰腺囊性肿瘤(pancreas cystic neoplasm,PCN), 包括了导管内乳头状黏液瘤(intraductal papillary mucinous neoplasm,IPMN)、黏液性囊腺瘤(mucinous cystic neoplasm,MCN)、实性假乳头状肿瘤(solid-pseudopapillary neoplasm,SPN)、浆液性囊腺瘤(serous cystic neoplasm,SCN)等不同类型。其中 SCN 在绝大多数情况下为良性,最近的一项研究发现 2 622 例 SCN 患者中恶变的仅有 3 例[2-3]。而 IPMN 和 MCN 这两种黏液型肿瘤为恶性或潜在恶性,绝大多数情况下需要手术切除治疗,其恶性程度的判断和预后情况的预测对于制定合理的临床治疗方案至关重要[4]。
研究发现,Ki67 分子标记物的表达情况可以为临床医生了解肿瘤增殖活性以及判断其生物学行为的恶性倾向、预测患者预后情况提供重要依据。Ki67 是一种肿瘤细胞增殖标记物,被广泛应用于肿瘤疾病的研究和临床诊断之中[5]。Ki67 使用 100 个细胞中的阳性细胞个数来表示,其数值在 0~100 之间。一般认为 Ki67 小于或等于某阈值的即为 Ki67 阴性表达,而高于该阈值的则为 Ki67 阳性表达,阳性表达通常提示肿瘤的增殖活性高、生物学行为恶性倾向高、复发率高以及预后差[6-7]。胰腺肿瘤的术前 Ki67 检测一般是通过超声内窥镜引导下的细针穿刺(endoscopic ultrasonography-guided fine needle aspiration,EUS-FNA)提取组织切片,再通过免疫组织化学方法得到其指标数值。这种方式得到的结果不如术后肿瘤标本的组织切片所得到的结果准确,且对患者身体有一定的损伤。
胰腺肿瘤的常用影像检查方法包括超声内窥镜成像(endoscopic ultrasonography imaging,EUI)、腹部电子计算机断层扫描(computed tomography,CT)和磁共振成像(magnetic resonance imaging,MRI)等,这些影像数据在临床诊断和治疗决策中能够提供非常重要的辅助信息。其中腹部多排螺旋断层扫描(multi-detector CT,MDCT)是 PCN 早期诊断的首选方法,具有较高的时空分辨率和肿瘤识别准确率[8]。
影像组学(radiomics)是一个新兴的研究领域,专注于挖掘医学图像中肉眼无法发现的潜在信息[9]。在图像获取或重建、分割感兴趣区域、提取高通量图像特征等步骤之后,使用机器学习算法建立数据模型,以实现良恶性诊断、生存期预测以及分子标记物预测等,为医生的诊断提供辅助参考意见。影像组学提供了一种基于医学影像预测 Ki67 等分子标记物的思路。目前已有的类似研究多集中在乳腺、前列腺、肺癌等器官,在胰腺肿瘤方面未见相关报道[10-13]。
本文使用影像组学的方法,基于腹部 MDCT 图像预测 Ki67 分子标记物表达情况。从临床的需求考虑,选取 PCN 中的 IPMN 和 MCN 两类黏液型肿瘤,为临床上初步了解肿瘤的增殖活性、判断其生物学行为的良恶性倾向、预测患者预后和制定治疗方案等提供重要参考信息。通过手工勾勒肿瘤区域、设计并提取针对性的图像特征以及选用合适的特征筛选算法和机器学习分类器,搭建高效、鲁棒的影像组学框架,实现分类预测判别。
1 材料与方法
本文使用影像组学方法,研究基于腹部 MDCT 图像对胰腺 IPMN 和 MCN 这两类黏液型肿瘤的 Ki67 分子标记物指数实现术前预测。图 1 为系统框架,包括 MDCT 图像输入、手动分割、特征提取、特征筛选和分类判别。

1.1 数据获取与图像预处理
本文的数据采集于复旦大学附属华山医院胰腺外科,包括了从 2007 年 3 月至 2016 年 9 月接受手术的 87 例患者。其中 IPMN 患者 59 例,MCN 患者 28 例,年龄在 18 到 86 岁之间。详细的患者信息如表 1 所示。本文的研究经华山医院伦理委员会通过,全部患者在接受术前 MDCT 检查和肿瘤切除手术时签署了知情同意书。

所有患者在手术前都进行了腹部 64 排 MDCT 扫描检查,拥有平扫、动脉期、静脉期三个阶段的扫描图像。由于静脉期图像中肿瘤与背景区域的对比度更好,故本文的实验中使用了静脉期图像来提取图像特征[14]。对于每位患者的静脉期扫描图像,由一名影像科医生挑选出一幅肿瘤截面最大的图像作为后续处理的对象,并手工勾勒出肿瘤的边界。另外一名影像科医生则一一检查了这些图像以保证肿瘤区域分割的准确性。所有手术中切除的肿瘤标本均由经验丰富的病理科医生制作石蜡切片,通过免疫组织化学染色和计数获得其 Ki67 等分子标记物的数值,并做出明确的病理诊断。
1.2 特征提取
影像组学的核心在于定量地设计和提取有针对性的高通量特征。本文根据国际上通用的 PCN 诊断指南,设计影像组学特征对肿瘤图像特征实现量化评估[15]。此外,还加入了由影像科医生记录的肿瘤位置信息(位于胰头、胰颈、胰体或胰尾)和从图像存储与传输系统(picture archiving and communication system,PACS)中获得的患者的年龄、性别等临床信息。最终,每个患者图像中提取的高通量特征数为 409 个,包括临床信息特征、形态特征、纹理特征、小波特征等几大类,不同类别的特征及其含义或典型特征如表 2 所示,完整的特征信息见网络版附录(www.biomedeng.cn/article/10.7507/1001-5515.201805014)。

除了影像组学常用的纹理和小波特征外,我们在形态特征部分自动设计并提取肿瘤内部囊数量、内部囊平均面积、肿瘤形状(椭圆/分叶)、囊壁厚度、钙化区域、中央瘢痕等 PCN 专用特征。首先,给定肿瘤区域轮廓,计算肿瘤面积周长比、肿瘤与凸包的面积比、矩差等参数衡量其形状;其次,通过自适应阈值分割算法,得到囊壁、钙化区域、中央瘢痕的信息并且计算囊壁厚度、钙化区域位置/方差/数量、中央瘢痕面积等各类评价参数特征;然后,肿瘤内部囊相关特征的提取则先去除钙化点干扰,使用 Canny 算子提取内部边缘信息,再使用形态学运算填充囊的区域,最后通过计算各点到边缘的距离确定各囊的中心点,从而提取囊的数量、平均面积、面积的方差等定量特征。在已有的胰腺囊性肿瘤相关研究中,这些特征都是依靠影像科医生人工辨认和记录,且只能定性地记录有无。与之相比,本文的自动定量提取方法更加高效可靠[16-18]。
1.3 特征筛选
影像组学的思想是通过大量特征来深度挖掘图像信息,因此提取得到的特征向量维度往往很高,甚至远高于样本数量。在这种情况下,机器学习算法的训练时间会大大延长,且容易发生过拟合现象,分类效果通常不理想。特征筛选正是一种寻找特征最佳子集的方法,可以降低特征的维度,提高分类识别的准确率。
特征筛选有基于单变量分析和多变量组合分析等不同的方法。单变量分析的特征筛选方法指对每一个特征计算其与目标值之间的某类指标来衡量相关性,再对指标数值设定某一阈值,筛选出高相关性的特征。这类方法中常见的有相关系数法、卡方检验法、互信息法等。该方法原理简单且易于实现,但无法分析多个特征变量组合后的效果。
多变量组合分析的特征筛选方法着重分析不同特征变量组合与目标值之间的关系,较为常见的是使用带惩罚项的回归模型。本文使用了最小绝对收缩选择算子(the least absolute shrinkage selection operator,LASSO)回归模型来选择效果最优的特征组合。LASSO 回归又称为 L1 正则化模型,其损失函数可以表示为:
![]() |
其中X为特征矩阵,y为目标值,w为系数向量,为惩罚系数。与线性回归相比,LASSO 回归模型在损失函数中添加了额外的惩罚项,从而使较弱特征所对应的系数收缩到零[19]。此外,LASSO 回归还可以将几个高度相关的特征仅保留一个,其他的收缩为零,从而最终选择出最优的特征子集。
1.4 分类判别
在特征选择之后需要对 Ki67 的表达情况做分类判别预测。分类问题是机器学习中最常见的问题之一,常用的有朴素贝叶斯、Logistic 回归、随机森林、支持向量机(support vector machine,SVM)等算法。本文使用 SVM 分类器来得到分类预测结果。
SVM 是机器学习领域中最受欢迎的有监督学习算法之一,具有收敛速度快、准确率高的优点,在处理二分类问题时有非常好的效果。其核心思想是通过核函数将数据映射到高维空间,使其线性可分;再寻找一个将两类数据点分开的最优超平面,而支持向量就是到该超平面距离最小的数据点。这样在计算过程中就可以忽略支持向量以外的样本点,仅根据为数不多的支持向量就可以求出分类超平面,计算复杂度大为降低。
1.5 Bootstrap 抽样与重复
本文通过 Bootstrap 抽样与重复的方法提高特征筛选的效果,降低分类判别的误差和偶然性。Bootstrap 是现代统计学中常用的估计方法,对于小样本数据效果很好。从原 87 例样本的数据集中,随机抽取一定数量(本文选取样本总数 90%)的样本构建样本集,使用 LASSO 回归筛选特征,记录下被选择的特征。重复随机抽样和特征筛选步骤 200 次,以被选择次数的多少衡量特征的重要程度,将全部特征根据被选择的次数从多到少排序。
在分类判别实验中,我们使用基于 Bootstrap 抽样的十折交叉验证法。将 87 例样本随机抽样并分成数量接近的 10 个部分。每次使用其中的 9 个部分作为训练集来训练 SVM 模型,并用剩下的 1 个部分作为测试集来评估模型的性能,循环 10 次直到每个部分的数据都被测试过。随机抽样和十折交叉验证分类的过程同样也重复了 200 次。
本文还将特征筛选与分类判别的过程相结合。对于排序之后的全部特征,依次选取前 k 个最重要的特征(k=1, 2, 3, )作为特征子集,计算其分类判别实验的效果,并比较使用不同数量特征时的结果好坏,从而选取最优的特征子集。
以上方法均使用 Mathworks 公司 Matlab 软件(R2015b)实现。
2 实验与结果
2.1 实验设计
本文对 87 例胰腺 IPMN 和 MCN 患者数据进行分析研究。数据库中完整地收集了每位患者的性别、年龄、腹部 MDCT 检查图像、手术切除肿瘤后病理科医生作出的类型诊断以及免疫组织化学得到的 Ki67 分子标记物数值。本文将 Ki67 分子标记物预测问题转变为分类问题,预测判断其阳性或阴性表达情况。学界内对于 Ki67 阳性阈值的选取未有统一意见,本文使用了 2 和 5 这两个较常用的阈值分别进行实验,探讨通过影像组学方法预测 Ki67 表达情况的可行性[6-7]。
实验按照本文之前所陈述的方法,首先手动分割 MDCT 图像中的肿瘤区域,然后从图像中提取 409 个高通量特征,最终通过重复循环特征筛选和分类判别。为客观地评价特征子集的分类性能,本文计算了多种量化指标。绘制分类器的受试者操作特性(receiver operating characteristic,ROC)曲线,并计算其曲线下面积(area under the ROC curve,AUC)来评价分类性能。此外,还计算了准确度(accuracy,ACC)、灵敏度(sensitivity,SENS)和特异度(specificity,SPEC)来评估模型的分类性能。这些值都选取 200 次重复计算的平均值,还计算了 AUC 指标的 95% 置信区间(confidence interval,CI)。
2.2 结果分析与讨论
首先对 87 例患者腹部 MDCT 图像完成了肿瘤区域的手动分割。作为示例,图 2 为两例分割后的图像,分别来自一位 55 岁的男性 IPMN 患者和一位 82 岁的女性 MCN 患者。

接着,将分割后的肿瘤区域图像和患者的信息输入特征提取程序,得到了 87 例患者各自的 409 个高通量特征。使用 LASSO 回归重复进行 200 次特征选择之后,将这些特征按照被选择的次数从多到少排序,并且依次选取前 k 个特征(k=1, 2, 3, )作为特征子集输入分类器。根据分类的各项评价指标随特征个数 k 的变化情况,来选取最合适的特征个数 k。图 3 所示为当 Ki67 的划分阈值为 2 时的实验结果。

由图中可以看出选取出现频次最高的前 20 个特征时,获得了最优的分类效果。此时的 AUC 达到 0.915 4(95%CI,0.913 6~0.917 2),准确率为 0.852 9,敏感度为 0.818 8,特异性为 0.867 5。这些指标表明,本文的分类预测模型可以准确有效地预测 Ki67 处于较低或较高的表达水平。而当特征数由 20 个继续增加时,各项指标均有下降,说明无关特征和冗余特征带来了维数灾难,导致分类预测效果变差。
为论证本文方法的有效性,我们将结果对比了 Li 等[17]关于胰腺囊性肿瘤计算机辅助诊断的研究。在他们的研究中,共收集了 43 例胰腺囊性肿瘤患者的数据,并且由医生人工录入了性别、年龄、肿瘤位置、是否有钙化、是否有结节以及轮廓形状等定性特征,并通过 SVM 分类器进行分类判别,最终获得了 88.37% 的准确率。尽管本文针对的问题与他们的研究有一定差异,但是对特征提取环节进行比较,我们的特征均为自动提取的定量化特征,且多出了纹理和小波特征,提取特征更加高效便捷,研究所包含的患者数量也更大,并且准确率也能达到 85.29%。这充分说明了本文方法自动提取和筛选特征的有效性,以及判别预测 Ki67 分子标记物表达情况的可行性。
此外,我们还比较了 Ki67 的不同阈值划分所得到的最优实验结果,各项评价指标的数值如表 3 所示。可以发现在不同阈值划分下,分类预测结果都比较理想,但有一定差异。两次实验的结果中,AUC 均在 0.84 以上,准确率均在 0.77 以上,敏感度均在 0.78 以上,特异性均在 0.77 以上。当划分阈值为 2 时,达到最佳性能所选取的特征数更少,各指标显示的性能更好。我们也分析了两个实验中所选出的最优特征子集的情况。Ki67 阈值为 2 时,最优特征子集的 20 个特征主要包含 18 个纹理特征和小波纹理特征,以及患者性别和肿瘤位置特征;Ki67 阈值为 5 时,最优特征子集的 26 个特征主要包含 23 个纹理特征和小波纹理特征,以及 3 个形态特征(径向距离极值点数、圆形度、肿瘤位置)。纹理和小波特征都是通过各类灰度矩阵计算,提取人类肉眼无法捕捉的图像深度信息,在两个子集中这些特征所起作用基本相似,但是效果略有差异。而患者性别、径向距离极值点数、圆形度这三个特征在两次实验中都仅出现了一次,说明目前的特征筛选效果还有待改进,随机性较大,受数据分布的影响较大。

我们还回顾并比较了本文所研究的 87 例患者的术前临床诊断与病理诊断金标准的符合情况。结果显示术前正确诊断其肿瘤类型(IPMN/MCN)的准确率为 40.23%(35/87);如果将评判标准放宽到正确诊断其良恶性类型,忽略大概率恶性的 IPMN、MCN、导管腺癌之间的差别,则准确率也仅有 55.17%(48/87)。因此,本文使用影像组学方法在术前预测 IPMN 和 MCN 的 Ki67 表达情况并辅助诊断肿瘤良恶性倾向具有较大的临床意义,并初步论证了其可行性。对于何种阈值在临床实际中划分阴性和阳性表达更有效,学术界尚未达成统一意见,我们也将根据临床医学的最新学术成果继续深入研究,努力将成果用于临床实践中。
本文也存在两方面不足需要在日后的研究中进一步完善。第一,目前图像中的肿瘤区域均为手工划定,未来可以设计自动分割肿瘤区域的算法,从而实现全部分析流程的自动化。第二,目前本研究中的 87 例患者数据均来自华山医院胰腺外科,数据量不足导致特征筛选和分类判别过程中存在一定的偶然性,少数特例患者对整体的结果有较大的干扰。下一步可以收集其他医院的数据,建立多中心数据库,从而进一步提升研究的准确率和可靠性。
3 结论
本文论证了基于影像组学思路预测 Ki67 分子标记物表达情况的可行性。在 MDCT 术前影像中,首先手动分割肿瘤区域,然后自动提取 409 个高通量特征,使用 LASSO 回归实现特征筛选,最终通过 SVM 分类器完成分类预测。通过 200 次重复实验降低误差并减少过拟合,最优的结果选择了 20 个最具统计意义的特征,预测的 AUC 达到 91.54%,准确率达到 85.29%。该结果表明通过影像组学方法挖掘 MDCT 图像信息并预测 Ki67 分子标记物的可行性,对于用影像组学的方法开展相关肿瘤疾病可重复的术前预测研究有较强的指导意义。
