引用本文: 龙斌斌, 张超, 王玲玲, 王耕. DNMT1 基因 rs16999593 位点的多态性与乳腺癌易感性关系的 meta 分析. 中国普外基础与临床杂志, 2018, 25(6): 721-727. doi: 10.7507/1007-9424.201711041 复制
乳腺癌(breast cancer)是女性最为常见的恶性肿瘤之一,国际癌症研究所(International Agency for Research on Cancer,IARC)发布的 2012 年全球癌症报告数据[1]显示:乳腺癌占女性癌症发病的首位,全球每年新发乳腺癌病例约 167.1 万例,每年约 52.2 万例死于乳腺癌。发达国家的乳腺癌发病率相对发展中国家更高[2-3]。Chen 等[4]发表的《2015 年中国肿瘤登记年报》显示:乳腺癌的发病率为 268.1/10 万,居我国女性恶性肿瘤发病率的首位,其死亡率高达 69.5/10 万。乳腺癌的发病机制复杂,遗传易感因素与乳腺癌的发病密切相关。抑癌基因甲基化导致相应抑癌基因的蛋白表达下调,从而导致肿瘤的发生[5]。DNA 甲基化是在 DNA 甲基转移酶(DNA methyltransferase,DNMT)的催化作用下完成的。DNMT1 是组织中含量最多的 DNMT,它的主要功能是维持 DNA 甲基化状态,参与 DNA 复制后新生链的甲基化,从而保证亲代与子代间甲基化的正确传递。有研究[6]报道,DNMT1 单核苷酸多态性可能改变基因的转录,从而影响其编码酶的表达与活性。DNMT1 基因 rs16999593 位点的多态性与乳腺癌易感性的关系已有多篇报道,但结论尚不一致。Ye 等[7]的研究显示,DNMT1 基因 rs16999593 位点的多态性与乳腺癌的发病无相关性;Xiang 等[8]研究发现,病例组的 rs16999593 位点的 C 碱基和 CT 基因型频率低于对照组;然而 Sun 等[9]的研究显示,CT 基因型会增加乳腺癌发病的风险。因此,本研究旨在利用 meta 分析的方法,对国内外公开发表的乳腺癌与 DNMT1 基因 rs16999593 位点多态性关系的研究进行客观评价,以探讨 DNMT1 基因 rs16999593 位点的多态性检测应用于乳腺癌筛查与诊断中的意义。
1 资料与方法
1.1 文献纳入和排除标准
1.1.1 研究类型
国内外公开发表的有关 DNMT1 基因多态性与乳腺癌易感性关系的病例对照研究(文献中提供基因型数据分布,直接或间接提供综合的统计指标如 OR 值等),语种为汉语和英语。
1.1.2 研究对象
病例组为经组织学检查确认为乳腺癌的患者,对照组为与患者无血缘关系的健康人群。
1.1.3 暴露因素
DNMT1 基因 rs16999593 位点的多态性。
1.1.4 结局指标
rs16999593 C/T 等位基因及各基因型在 2 组(乳腺癌病例组和对照组)中分布差异的 OR 值及其 95% 置信区间(confidence interval,CI)。
1.1.5 排除标准
① 综述类文献;② 重要研究数据缺失的文献;③ 同一研究重复发表的文献。
1.2 检索策略
计算机检索 PubMed、EMbase、Web of Science、中国知网、万方、中国生物医学文献数据库及维普数据库,检索时间均为建库至 2017 年 3 月。检索采用主题词与自由词相结合的方式。中文检索词包括:乳腺癌、DNA 甲基转移酶及基因多态性;英文检索词包括:breast cancer/breast carcinomas、DNMT/DNA methytransferases 及 polymorphism/single nucleotide polymorphism/SNP(single nucleotide polymorphism 的英文简称)/variants。同时手工检索纳入文献的参考文献。以 PubMed 为例,其具体检索策略见框 1。

1.3 文献筛选和资料提取
由两名研究者独立进行文献检索、标题阅读及摘要阅读,对可能符合纳入标准的文献阅读全文并提取资料,如有分歧通过讨论或由第三位研究者协助解决。纳入文献的提取资料包括:第一作者、文献发表年份、样本量、种族、病例组和对照组的基因型分布及 Hardy-Weinberg 平衡(HWE)检验结果。
1.4 质量评价
采用 Nwecastle-Ottawa Scale(NOS)量表对纳入文献进行偏倚风险评价[10]。依照 Cochrane Reviewer’s Handbook 5.0 系统评价员手册推荐的质量评价标准[11]对纳入的参考文献进行质量评价,包括以下几个方面:诊断标准是否明确;病例组与对照组的可比性;样本量是否充足;统计学方法是否恰当。
1.5 统计学方法
采用 RevMan 5.3 软件进行 meta 分析。对纳入研究的对照组基因型进行 HWE 平衡检验,P>0.01 为满足 HWE 平衡。然后分别计算 5 种遗传模型(显性遗传模型:TT+TCvs. CC;隐性遗传模型:TT vs. TC+CC;纯合子模型:TT vs. CC;杂合子模型:TC vs. CC;等位基因模型:T vs. C)下的遗传效应,合并效应量采用 OR 值及其 95% CI 表示。纳入研究间的异质性采用 χ2检验进行分析(检验水准 α=0.10),并结合 I2定量判断异质性的大小[12]。若 P<0.10 且I2>50% 则认为各研究数据的异质性存在统计学意义,采用随机效应模型进行 meta 分析,否则采用固定效应模型。明显的临床异质性采用亚组分析或敏感性分析等方法处理,或只进行描述性分析。结局指标的检验水准α=0.05。
2 结果
2.1 文献筛选流程及检索结果
初步检索获得相关文献 431 篇,经逐层筛选后,最终 5 篇病例对照研究[8-9, 13-15]纳入 meta 分析,共计 1 741 例乳腺癌患者和 1 917 位健康对照,研究对象均为亚洲人种。其中包括 3 篇英文文献[8-9, 13],2 篇中文文献[14-15]。文献筛选流程及结果见图 1。

2.2 纳入研究的基本特征及方法学质量评价
5 篇文献的研究对象均为亚洲人种,发表年份为 2010–2015 年。5 篇文献均符合 HWE 平衡。纳入研究的基本特征和方法学质量评价结果见表 1。由表 1 可见,本 meta 分析纳入研究的质量较高,NOS 评分均≥6 分。

2.3 meta 分析结果
2.3.1 显性遗传模型 以 TT+TC 基因型为暴露因素,CC 基因型为非暴露因素,进行 meta 分析。异质性检验结果表明,各研究间的异质性有统计学意义(I2=59%,P=0.04),故用随机效应模型进行分析。结果显示,显性遗传模型与乳腺癌的发病无相关性[OR=0.63,95% CI 为(0.30,1.30),P=0.21],具体见图 2。

2.3.2 隐性遗传模型
以 TT 基因型为暴露因素,TC+CC 基因型为非暴露因素,进行 meta 分析。异质性检验结果表明,各研究间的异质性有统计学意义(I2=93%,P<0.000 01),故采用随机效应模型进行分析。结果显示,与 TC+CC 基因型相比较,TT 基因型在对照组中有较高的频率,该基因型能降低乳腺癌的发病风险 [OR=1.74,95% CI 为(1.01,3.00),P=0.04],具体见图 3。

2.3.3 纯合子模型
以 TT 基因型为暴露因素,CC 基因型为非暴露因素,进行 meta 分析。异质性检验结果表明,各研究间的异质性无统计学意义(I2=28%,P=0.95),故采用固定效应模型进行分析。结果显示,该基因模型与乳腺癌的发病无相关性 [OR=1.01,95% CI 为(0.70,1.47),P=0.95],具体见图 4。

2.3.4 杂合子模型
以 TC 基因型为暴露因素,CC 基因型为非暴露因素,进行 meta 分析。异质性检验结果表明,各研究间的异质性有统计学意义(I2=69%,P=0.01),故采用随机效应模型进行分析。结果显示,该基因模型与乳腺癌的发病无相关性 [OR=0.44,95% CI 为(0.18,1.04),P=0.06],具体见图 5。

2.3.5 等位基因模型
以 T 基因型为暴露因素,C 基因型为非暴露因素,进行 meta 分析。异质性检验结果表明,各研究间的异质性有统计学意义(I2=89%,P<0.000 01),故采用随机效应模型进行分析。结果显示,该基因模型与乳腺癌的发病无相关性 [OR=1.29,95% CI 为(0.90,1.86),P=0.16],具体见图 6。

2.4 发表偏倚评价
本 meta 分析纳入的 5 篇文献的 NOS 质量评分均较高,研究结果包含阴性和阳性结果,文献质量较高。但由于文献数量较少,绘制漏斗图意义不大,因此本 meta 分析未绘制漏斗图。
2.5 敏感性分析
对 5 篇纳入文献采取逐一排除法进行敏感性分析。结果显示,任一纳入的研究被排除在相应的效应模型后,各模型的 OR 值均比较接近,且与剔除前模型的总体 OR 值无较大差异,提示纳入 meta 分析的各文献对合并效应量估计值的影响不大,研究结果较为可靠。具体见表 2。

3 讨论
乳腺癌的发病机制复杂,基因多态性与乳腺癌发病风险之间的关系已引起了广泛关注,如主要组织相容性复合体Ⅰ类链相关蛋白A(MICA)[16]、簇分化抗原 24(CD24)[17]、细胞色素 P450(CYP)家族[18]、Fas/FasL[19]等基因。由于研究结论的不一致性,近年来,关于多种基因多态性与乳腺癌发病风险的 meta 分析也越来越多。邱秀娟等[20]的 meta 分析结果显示,成纤维细胞生长因子受体 2(FGFR2)基因的 rs2981582、rs1219648 和 rs2420946 位点多态性与中国人群乳腺癌的发生有关。李卿等[21]发现,白介素-10(IL-10)基因的-1082A/G 的 GG 等位基因和A 等位基因相比,可能增加乳腺癌的发生风险。魏晓东等[22]的研究结果显示,在亚洲人群患者中,携带 MDM2SNP309 不会提高乳腺癌的发病风险。李琳琳等[23]的 meta 分析结果表明,X 射线修复交叉互补基因 1(XRCC1) Arg399Gln 位点的 Gln/Gln突变型可能与亚洲人群的乳腺癌易感性相关。
DNMT1 是 DNMTs 家族的重要成员之一,其主要功能是使双链 DNA 由半甲基化状态转变为完全甲基化,是维持 DNA 甲基化持续状态的关键酶[24]。DNMT1 功能发生紊乱可使 DNA 异常甲基化,尤其是抑癌基因的高甲基化,从而引起抑癌基因表达沉默,失去抑癌作用,导致肿瘤发生[25]。有研究表明,DNMT1 基因多态性与胃癌[26]、宫颈癌[27]、前列腺癌[28]等恶性肿瘤的发生相关。DNMT1 基因多态性与乳腺癌发病的关系已有报道,但其结论不尽相同。目前,有相关的基础研究[1, 29]显示,DNMT1 基因突变增加乳腺癌的发病风险。rs16999593 位点的等位基因 C 和 TC 基因型在病例组的频率明显高于对照组[9, 15]。本次 meta 分析结果显示,C 等位基因和 TC 基因型均与乳腺癌的发病无相关性。DNMT1 基因 rs16999593 TT 基因型相对于 TC+CC 基因型,在乳腺癌病例组中的频率低于对照组,说明 TT 基因型是乳腺癌发病的保护因素,能显著降低乳腺癌的发病风险。
但本 meta 分析存在一定的局限性:① 文献数量较少,且均为亚洲人种,无高加索人种的相关研究;② 纳入文献均为已经正式发表的文献,未纳入其他未发表文献,不能排除潜在发表偏倚的影响;③ 未考虑基因与环境相互作用的影响,以及其他乳腺癌发病因素如个体激素水平、月经状态、家族史等的影响。
总之,本 meta 分析评价了目前公开发表的关于 DNMT1 基因 rs16999593 位点 C/T 多态性与乳腺癌易感性关系的研究,研究结果显示,DNMT1 基因 rs16999593 位点的 TT 基因型在对照组中的频率更高,是乳腺癌发病的保护因素,能降低乳腺癌的发病风险,C 等位基因与 TC 基因型与乳腺癌的发病无明显相关性。受纳入文献数量和质量限制,以上结论尚需要更多大样本、高质量的研究加以证实。
乳腺癌(breast cancer)是女性最为常见的恶性肿瘤之一,国际癌症研究所(International Agency for Research on Cancer,IARC)发布的 2012 年全球癌症报告数据[1]显示:乳腺癌占女性癌症发病的首位,全球每年新发乳腺癌病例约 167.1 万例,每年约 52.2 万例死于乳腺癌。发达国家的乳腺癌发病率相对发展中国家更高[2-3]。Chen 等[4]发表的《2015 年中国肿瘤登记年报》显示:乳腺癌的发病率为 268.1/10 万,居我国女性恶性肿瘤发病率的首位,其死亡率高达 69.5/10 万。乳腺癌的发病机制复杂,遗传易感因素与乳腺癌的发病密切相关。抑癌基因甲基化导致相应抑癌基因的蛋白表达下调,从而导致肿瘤的发生[5]。DNA 甲基化是在 DNA 甲基转移酶(DNA methyltransferase,DNMT)的催化作用下完成的。DNMT1 是组织中含量最多的 DNMT,它的主要功能是维持 DNA 甲基化状态,参与 DNA 复制后新生链的甲基化,从而保证亲代与子代间甲基化的正确传递。有研究[6]报道,DNMT1 单核苷酸多态性可能改变基因的转录,从而影响其编码酶的表达与活性。DNMT1 基因 rs16999593 位点的多态性与乳腺癌易感性的关系已有多篇报道,但结论尚不一致。Ye 等[7]的研究显示,DNMT1 基因 rs16999593 位点的多态性与乳腺癌的发病无相关性;Xiang 等[8]研究发现,病例组的 rs16999593 位点的 C 碱基和 CT 基因型频率低于对照组;然而 Sun 等[9]的研究显示,CT 基因型会增加乳腺癌发病的风险。因此,本研究旨在利用 meta 分析的方法,对国内外公开发表的乳腺癌与 DNMT1 基因 rs16999593 位点多态性关系的研究进行客观评价,以探讨 DNMT1 基因 rs16999593 位点的多态性检测应用于乳腺癌筛查与诊断中的意义。
1 资料与方法
1.1 文献纳入和排除标准
1.1.1 研究类型
国内外公开发表的有关 DNMT1 基因多态性与乳腺癌易感性关系的病例对照研究(文献中提供基因型数据分布,直接或间接提供综合的统计指标如 OR 值等),语种为汉语和英语。
1.1.2 研究对象
病例组为经组织学检查确认为乳腺癌的患者,对照组为与患者无血缘关系的健康人群。
1.1.3 暴露因素
DNMT1 基因 rs16999593 位点的多态性。
1.1.4 结局指标
rs16999593 C/T 等位基因及各基因型在 2 组(乳腺癌病例组和对照组)中分布差异的 OR 值及其 95% 置信区间(confidence interval,CI)。
1.1.5 排除标准
① 综述类文献;② 重要研究数据缺失的文献;③ 同一研究重复发表的文献。
1.2 检索策略
计算机检索 PubMed、EMbase、Web of Science、中国知网、万方、中国生物医学文献数据库及维普数据库,检索时间均为建库至 2017 年 3 月。检索采用主题词与自由词相结合的方式。中文检索词包括:乳腺癌、DNA 甲基转移酶及基因多态性;英文检索词包括:breast cancer/breast carcinomas、DNMT/DNA methytransferases 及 polymorphism/single nucleotide polymorphism/SNP(single nucleotide polymorphism 的英文简称)/variants。同时手工检索纳入文献的参考文献。以 PubMed 为例,其具体检索策略见框 1。

1.3 文献筛选和资料提取
由两名研究者独立进行文献检索、标题阅读及摘要阅读,对可能符合纳入标准的文献阅读全文并提取资料,如有分歧通过讨论或由第三位研究者协助解决。纳入文献的提取资料包括:第一作者、文献发表年份、样本量、种族、病例组和对照组的基因型分布及 Hardy-Weinberg 平衡(HWE)检验结果。
1.4 质量评价
采用 Nwecastle-Ottawa Scale(NOS)量表对纳入文献进行偏倚风险评价[10]。依照 Cochrane Reviewer’s Handbook 5.0 系统评价员手册推荐的质量评价标准[11]对纳入的参考文献进行质量评价,包括以下几个方面:诊断标准是否明确;病例组与对照组的可比性;样本量是否充足;统计学方法是否恰当。
1.5 统计学方法
采用 RevMan 5.3 软件进行 meta 分析。对纳入研究的对照组基因型进行 HWE 平衡检验,P>0.01 为满足 HWE 平衡。然后分别计算 5 种遗传模型(显性遗传模型:TT+TCvs. CC;隐性遗传模型:TT vs. TC+CC;纯合子模型:TT vs. CC;杂合子模型:TC vs. CC;等位基因模型:T vs. C)下的遗传效应,合并效应量采用 OR 值及其 95% CI 表示。纳入研究间的异质性采用 χ2检验进行分析(检验水准 α=0.10),并结合 I2定量判断异质性的大小[12]。若 P<0.10 且I2>50% 则认为各研究数据的异质性存在统计学意义,采用随机效应模型进行 meta 分析,否则采用固定效应模型。明显的临床异质性采用亚组分析或敏感性分析等方法处理,或只进行描述性分析。结局指标的检验水准α=0.05。
2 结果
2.1 文献筛选流程及检索结果
初步检索获得相关文献 431 篇,经逐层筛选后,最终 5 篇病例对照研究[8-9, 13-15]纳入 meta 分析,共计 1 741 例乳腺癌患者和 1 917 位健康对照,研究对象均为亚洲人种。其中包括 3 篇英文文献[8-9, 13],2 篇中文文献[14-15]。文献筛选流程及结果见图 1。

2.2 纳入研究的基本特征及方法学质量评价
5 篇文献的研究对象均为亚洲人种,发表年份为 2010–2015 年。5 篇文献均符合 HWE 平衡。纳入研究的基本特征和方法学质量评价结果见表 1。由表 1 可见,本 meta 分析纳入研究的质量较高,NOS 评分均≥6 分。

2.3 meta 分析结果
2.3.1 显性遗传模型 以 TT+TC 基因型为暴露因素,CC 基因型为非暴露因素,进行 meta 分析。异质性检验结果表明,各研究间的异质性有统计学意义(I2=59%,P=0.04),故用随机效应模型进行分析。结果显示,显性遗传模型与乳腺癌的发病无相关性[OR=0.63,95% CI 为(0.30,1.30),P=0.21],具体见图 2。

2.3.2 隐性遗传模型
以 TT 基因型为暴露因素,TC+CC 基因型为非暴露因素,进行 meta 分析。异质性检验结果表明,各研究间的异质性有统计学意义(I2=93%,P<0.000 01),故采用随机效应模型进行分析。结果显示,与 TC+CC 基因型相比较,TT 基因型在对照组中有较高的频率,该基因型能降低乳腺癌的发病风险 [OR=1.74,95% CI 为(1.01,3.00),P=0.04],具体见图 3。

2.3.3 纯合子模型
以 TT 基因型为暴露因素,CC 基因型为非暴露因素,进行 meta 分析。异质性检验结果表明,各研究间的异质性无统计学意义(I2=28%,P=0.95),故采用固定效应模型进行分析。结果显示,该基因模型与乳腺癌的发病无相关性 [OR=1.01,95% CI 为(0.70,1.47),P=0.95],具体见图 4。

2.3.4 杂合子模型
以 TC 基因型为暴露因素,CC 基因型为非暴露因素,进行 meta 分析。异质性检验结果表明,各研究间的异质性有统计学意义(I2=69%,P=0.01),故采用随机效应模型进行分析。结果显示,该基因模型与乳腺癌的发病无相关性 [OR=0.44,95% CI 为(0.18,1.04),P=0.06],具体见图 5。

2.3.5 等位基因模型
以 T 基因型为暴露因素,C 基因型为非暴露因素,进行 meta 分析。异质性检验结果表明,各研究间的异质性有统计学意义(I2=89%,P<0.000 01),故采用随机效应模型进行分析。结果显示,该基因模型与乳腺癌的发病无相关性 [OR=1.29,95% CI 为(0.90,1.86),P=0.16],具体见图 6。

2.4 发表偏倚评价
本 meta 分析纳入的 5 篇文献的 NOS 质量评分均较高,研究结果包含阴性和阳性结果,文献质量较高。但由于文献数量较少,绘制漏斗图意义不大,因此本 meta 分析未绘制漏斗图。
2.5 敏感性分析
对 5 篇纳入文献采取逐一排除法进行敏感性分析。结果显示,任一纳入的研究被排除在相应的效应模型后,各模型的 OR 值均比较接近,且与剔除前模型的总体 OR 值无较大差异,提示纳入 meta 分析的各文献对合并效应量估计值的影响不大,研究结果较为可靠。具体见表 2。

3 讨论
乳腺癌的发病机制复杂,基因多态性与乳腺癌发病风险之间的关系已引起了广泛关注,如主要组织相容性复合体Ⅰ类链相关蛋白A(MICA)[16]、簇分化抗原 24(CD24)[17]、细胞色素 P450(CYP)家族[18]、Fas/FasL[19]等基因。由于研究结论的不一致性,近年来,关于多种基因多态性与乳腺癌发病风险的 meta 分析也越来越多。邱秀娟等[20]的 meta 分析结果显示,成纤维细胞生长因子受体 2(FGFR2)基因的 rs2981582、rs1219648 和 rs2420946 位点多态性与中国人群乳腺癌的发生有关。李卿等[21]发现,白介素-10(IL-10)基因的-1082A/G 的 GG 等位基因和A 等位基因相比,可能增加乳腺癌的发生风险。魏晓东等[22]的研究结果显示,在亚洲人群患者中,携带 MDM2SNP309 不会提高乳腺癌的发病风险。李琳琳等[23]的 meta 分析结果表明,X 射线修复交叉互补基因 1(XRCC1) Arg399Gln 位点的 Gln/Gln突变型可能与亚洲人群的乳腺癌易感性相关。
DNMT1 是 DNMTs 家族的重要成员之一,其主要功能是使双链 DNA 由半甲基化状态转变为完全甲基化,是维持 DNA 甲基化持续状态的关键酶[24]。DNMT1 功能发生紊乱可使 DNA 异常甲基化,尤其是抑癌基因的高甲基化,从而引起抑癌基因表达沉默,失去抑癌作用,导致肿瘤发生[25]。有研究表明,DNMT1 基因多态性与胃癌[26]、宫颈癌[27]、前列腺癌[28]等恶性肿瘤的发生相关。DNMT1 基因多态性与乳腺癌发病的关系已有报道,但其结论不尽相同。目前,有相关的基础研究[1, 29]显示,DNMT1 基因突变增加乳腺癌的发病风险。rs16999593 位点的等位基因 C 和 TC 基因型在病例组的频率明显高于对照组[9, 15]。本次 meta 分析结果显示,C 等位基因和 TC 基因型均与乳腺癌的发病无相关性。DNMT1 基因 rs16999593 TT 基因型相对于 TC+CC 基因型,在乳腺癌病例组中的频率低于对照组,说明 TT 基因型是乳腺癌发病的保护因素,能显著降低乳腺癌的发病风险。
但本 meta 分析存在一定的局限性:① 文献数量较少,且均为亚洲人种,无高加索人种的相关研究;② 纳入文献均为已经正式发表的文献,未纳入其他未发表文献,不能排除潜在发表偏倚的影响;③ 未考虑基因与环境相互作用的影响,以及其他乳腺癌发病因素如个体激素水平、月经状态、家族史等的影响。
总之,本 meta 分析评价了目前公开发表的关于 DNMT1 基因 rs16999593 位点 C/T 多态性与乳腺癌易感性关系的研究,研究结果显示,DNMT1 基因 rs16999593 位点的 TT 基因型在对照组中的频率更高,是乳腺癌发病的保护因素,能降低乳腺癌的发病风险,C 等位基因与 TC 基因型与乳腺癌的发病无明显相关性。受纳入文献数量和质量限制,以上结论尚需要更多大样本、高质量的研究加以证实。