引用本文: 王一晨, 王瑾, 杨文山, 刘屏, 董宪喆, 胡园. 胃癌基因芯片测序与异常基因差异表达. 中国普外基础与临床杂志, 2020, 27(7): 790-800. doi: 10.7507/1007-9424.201910023 复制
胃癌是威胁人类健康的恶性肿瘤之一。胃癌的发生与环境、遗传等因素有关。近年来,关于内源非编码基因调控胃肿瘤组织发生发展过程的研究越来越受到人们的关注,与其关联的可变剪切技术也作为当下热点为人所关注。可变剪切系指一个前体 mRNA 通过不同的剪接方式产生多样 mRNA 剪接异构体的过程,是产生高等真核生物蛋白质的重要分子调控机制之一。不少学者发现,可变剪接在个体发育、组织分化、肿瘤形成等过程中都发挥着十分重要的作用[1]。
本研究从胃癌样本组织中提取相关基因产物,使用高通量基因芯片等分子技术检测胃癌基因差异表达的可变剪接事件[2],并对结果做探讨分析。
1 资料与方法
1.1 临床资料
回顾性收集 2015 年 7 月至 2016 年 12 月期间中国人民解放军总医院普外科标本库的 3 例胃癌住院患者的癌组织及癌旁组织标本,样本经中国人民解放军总医院病理科检查确证。癌旁组织取自距离肿瘤以远 4 cm 的组织,经鉴定组织内无明显的肿瘤细胞。所有患者术前未行放化疗。所有组织标本均用 10% 中性甲醛固定,在低温条件下做冻存处理。试验已经过中国人民解放军总医院伦理委员会审批,受试患者均已签署知情同意书。
1.2 主要试剂和设备
GeneChip WT cDNA 合成和扩增试剂盒(Affymetrix 公司,美国),GeneChip WT 终端标记试剂盒(P/N 703174 Rev 1,Affymetrix 公司,Santa Clara,CA),TRIzol 试剂(美国 Invitrogen 公司)。Agilent 2100 生物分析仪(Agilent Technologies Inc,Palo Alto,CA),Affymetrix Fluidics Station 450 和 GeneChip2 Scanner 3000 7G 微阵列扫描仪(Affymetrix 公司,美国)。
1.3 DNA 和 RNA 的提取
使用标准的氯仿程序从冷冻的肿瘤样品中提取 DNA。使用 TRIzol 试剂从冷冻的肿瘤样品中分离出总 RNA,并依据 Affymetrix 的建议方法,使用 GeneChip WT cDNA 合成和扩增试剂盒生成 cDNA,并在 Agilent 2100 生物分析仪上进行了质量评估。本研究总 RNA 的完整性值在 7.7 和 9.0 之间(平均值 8.65),满足测试标准。通过 PCR 扩增基因组 DNA,对产物进行测序。
1.4 阵列杂交
使用 GeneChip WT 终端标记试剂盒对 cDNA 进行片段化和末端标记。将约 5.5 mg 标记的 DNA 靶标在 45 ℃ 下与 Affymetrix GeneChip Human Exon 1.0 ST 阵列杂交 16 h。将杂交的阵列洗涤并在 GeneChip Fluidics Station 450 上染色,之后在 GeneChip2 Scanner 3000 7G 上进行扫描。使用 140 万个探针集的一个子集对所得的探针信号强度进行了草图分位数归一化。使用稳健的多阵列平均值(RMA)总结基因表达水平。为使方差稳定,增加了一个常数 16,并对汇总信号进行 log2 转换。为避免混淆基因表达变异的解释,本研究在总结表达前从外显子中删除了数据,这些外显子的探针组包含两个或多个带有单核苷酸多态性(SNP)的探针。所有原始外显子阵列数据均已保存到 Gene Expression Omnibus(GEO)中。
1.5 微阵列数据分析
本研究进行了未配对的 Student t 检验以比较癌组织和癌旁组织的基因强度。当倍数变化≥1.5 或 P≤0.05 时,基因表达的差异被认为存在统计学意义。首先在拼接水平上进行分析,仅考虑外显子探针(即“EXON 分析”)。SPLICING PATTERN 分析中,未调整的 P≤0.05 和倍数变化≥1.5 时表明有统计学意义;EXON 分析中,未调整的 P≤0.05 和倍数变化≥2.0 被认为具有统计学意义[3]。对微阵列数据进行生物信息学分析后,使用 GenoSplice EASANA 界面进行手动检查,以选择高置信度事件。
1.6 RNA-Seq 分析
对组织样品的 RNA 进行测序。采用 Tophat 对读数进行比对。使用 DEXseq 对癌组织(n=3)和癌旁组织(n=3)样品之间的差异剪接进行分析,错误发现率(FDR)界定值是确定事件重要性的衡量标准。GO 分析中:P<0.05 表示 GO 差异有统计学意义,以评估 GO 的显著性水平;误判率 FDR<0.2 是对P值准确率的判断以及对 GO 显著性水平的再判断。KEGG 分析中:P<0.05 表示 pathway 差异具有统计学意义,以评估 pathway 的显著性水平;误判率 FDR<0.40 是对 P 值准确率的判断和对 pathway 显著性水平的再判断。
1.7 统计学方法
采用 SPSS 25.0 统计学软件进行统计学分析。采用 sigmaplot(13.0)作图软件做图,P 值取负对数,–(lgP)值越大表明 P 值越小,即 GO 或 pathway 的显著性水平越高。分类资料用百分比表示,统计方法采用配对 χ2 检验或 Fisher 检验用于确定变量之间的关联;等级变量之间的相关性采用 Spearman 秩相关分析。检验水准 α=0.05。
2 结果
2.1 样本中筛选差异基因
将癌组织与癌旁组织的基因差异水平和转录本差异水平比较后发现,胃癌组织存在转录非调控(unchanged)基因、转录上调(up)基因和转录下调(down)基因。在非调控基因信息中,总共检测出与 ENSEMBL 数据库基因标识一致的基因 411 个,经过整理得出可变剪接基因有 20 个:溶质载体家族 23 成员 2(SLC23A2)、周期蛋白 K(CCNK)、钾通道亚家族 K 成员 10(KCNK10)、负伸长因子复合体 C/D(NELFCD)、结构维持染色体 4(SMC4)、视黄醇结合蛋白 2(RBP2)、核受体亚家族 5 组 A 成员 2(NR5A2)、捻同源物 1(TWIST1)、蛋白原转化酶枯草杆菌蛋白酶(PCSK2)、Sciellin 蛋白(SCEL)、磷脂酶 CE1(PLCE1)、S100 钙结合蛋白 A8(S100A8)、SH3 结构域激酶结合蛋白 1(SH3KBP1)、溶质载体家族 25 成员 37(SLC25A37)、钙蛋白酶抑制蛋白(CAST)、含山梨糖和 SH3 域 2(SORBS2)、肌纤维膜关联蛋白(SLMAP)、靠停蛋白 2(CLDN2)、鸟嘌呤核苷酸结合蛋白(G 蛋白)γ4(GNG4)和 LIM 域激酶 2(LIMK2)。在上调基因信息中,总共检测出与ENSEMBL 数据库的基因标识一致的差异基因 119 个,经过整理得出可变剪接基因有 33 个:含 V-set 和免疫球蛋白域 2(VSIG2)、乳腺癌扩增顺序 1(BCAS1)、羟基类固醇(17β)脱氢酶 2(HSD17B2)、含 FXYD 域离子运输调控因子 3(FXYD3)、质膜蛋白脂质(PLLP)、脂肪酸 2 羟化酶(FA2H)、TMC5(transmembrane channel-like 5)、细胞壁合成蛋白 43(CWH43)、缩胆囊肽 B 受体(CCKBR)、GDP 甘露糖 4,6 脱水酶(GMDS)、再生胰岛衍生1α(REG1A)、UDP 半乳糖 4 差向异构酶(GALE)、ATP 结合家族亚家族 D 成员 3(ABCD3)、溶质载体家族 35 成员 A3(SLC35A3)、桥粒胶蛋白 2(DSC2)、高尔基膜蛋白 1(GOLM1)、绒毛蛋白样蛋白(VILL)、泛素关联蛋白 2(UBAP2)、膜联蛋白 A3(ANXA3)、磷酸肌醇 3 激酶类 2 γ 肽(PIK3C2G)、双氧化酶成熟因子 2(DUOXA2)、GATA 结合蛋白 6(GATA6)、脂钙蛋白 2(LCN2)、趋化因子(C-C 基元)配体 28(CCL28)、G 蛋白偶联受体 110(GPR110)、F 框和亮氨酸丰富重复蛋白 13(FBXL13)、羟基前列腺素脱氢酶 15(HPGD)、含 RAS 和 EF 手性结构(RASEF)、丝氨酸蛋白酶抑制剂 B7(SERPINB7)、纤维蛋白原 γ 链(FGG)、纤维蛋白原 α 链(FGA)、胃蛋白酶 2(GKN2)和序列相似家族 3 成员 B(FAM3B)。在下调基因信息中,总共检测出与 ENSEMBL 数据库的基因标识一致的差异基因 75 个,经过整理得出可变剪接基因有 16 个:人分泌型卷曲相关蛋白 1(SFRP1)、人纤维蛋白 A 相互作用蛋白 1(FILIP1)、同源 3 结构域生长因子受体与内啡肽相互作用蛋白 1(SGIP1)、羧肽酶 X(M14 家族)成员 2(CPXM2)、SSPN、胶原X,α1(COL10A1)、富含亮氨酸重复 G 蛋白偶联受体 5(LGR5)、Ⅷ 型胶原 Α1 重组蛋白(COL8A1)、ADP 核糖基化因子 GTP 酶活化蛋白 1(ASAP1)、基质改变关联 8(MXRA8)、WW 域结合蛋白 1-like 转录变体 1(WBP1L)、人激肽释放酶-7 重组蛋白(KLK7)、钙调蛋白 2(RCAN2)、人桥粒联结蛋白 2(AHNAK2)、胶原蛋白 α-1(Ⅳ)链(COL4A1)和非典型趋化因子受体 1(ACKR1)。
2.2 上调差异表达基因结果
2.2.1 GO 分析
在 801 个上调基因 GO 分类条目中具有统计学意义的有 192 个。801 个条目对应1 176 个上调基因,具有统计学意义的 192 个条目对应 407 个上调基因。结合富集度值从 192 个具有统计学意义的分类条目中筛选出与 Gene Ontology 数据库的 GO 索引号一致的胃癌差异表达基因条目 24 个,主要涉及小分子代谢进程、蛋白质磷酸化、蛋白质水解、细胞迁移、包含碱基的代谢过程、RNA 聚合酶 Ⅱ 催化的正性转录调控、细胞增殖调控、细胞迁移的正性调控、细胞蛋白质代谢过程、O-聚糖处理、细胞凋亡、自我吞噬、DNA 依赖的转录调控、活性氧代谢过程正性调控、紧密连接组件、翻译后蛋白质修饰、氧化还原过程、黏多糖生物合成过程、血管生成、蛋白质靶向、黏多糖代谢过程、蛋白质去磷酸化、信号转导和细胞黏附方面(表 1)。sigmaplot 图结果显示,小分子代谢进程、蛋白质磷酸化、蛋白质水解和细胞转移几项生物功能的显著性最突出(图 1a)。随后又分析了 GO 差异基因所对应的蛋白通路,总共发现关联性蛋白通路 14 条(图 1b)。


a: GO 分析的sigmaplot 图表明小分子代谢进程、蛋白质磷酸化、蛋白质水解和细胞转移的差异性最为显著;b:GO 分析的Strings 图表明存在关联性蛋白通路 14 条,其中 2 个蛋白关联 6 条,3 个蛋白关联 3 条,多个蛋白关联 5 条;c:passway 分析的 sigmaplot 图表明代谢途径及补体和凝血级联的差异性最为显著;d:passway 分析的 Strings 图表明存在关联性蛋白通路 5 条,其中 2 个蛋白关联 4 条,3 个蛋白关联 1 条

a:GO 分析的 sigmaplot 图表明细胞基质黏附、小分子代谢进程、信号转导、凋亡进程负调控和血管生生成的差异性最为显著;b:GO 分析的 Strings 图表明存在多条关联性蛋白通路,其中包括 2 个关联蛋白 7 条,3 个关联蛋白 1 条及若干蛋白合成的通路网路;c:passway分析的 sigmaplot 图表明黏合连接、内质网蛋白加工和癌症通路的差异性最为显著;d:passway 分析的Strings 图表明存在多条关联性蛋白通路,其中 2 个蛋白关联 1 条,3 个蛋白关联 1 条及 1 条由若干蛋白合成的网络通路
2.2.2 pathway 分析
在 130 条 pathway 上调通路中具有统计学性意义的有 12 条,从中筛选出与胃癌相关性强的通路有 6 条,主要涉及代谢途径、补体系统、脂肪细胞因子信号通路、过氧化物酶体、蛋白质消化和吸收以及自我吞噬调控方面(表 2)。结果显示,代谢途径和补体系统生物功能的显著性最突出(图 1c)。随后又分析了 passway 显著性差异基因所对应的蛋白通路,总共发现关联性蛋白通路 5 条(图 1d)。

经上述两种上调基因的富集分析结果发现,生物学功能与代谢通路出现吻合的基因有鞘磷脂合酶 1(SGMS1)、长链酰基辅酶 A 合成酶 3(ACSL3)、对氧磷酶 3(PON3)、琥珀酸脱氢酶复合体亚基 C 融入膜蛋白(SDHC)、脱氢酶/还原酶(SDR 家族)成员 9(DHRS9)、胞苷酸激酶 1(CMPK1)、3´(2´),5´二磷酸核苷酸酶 1(BPNT1)、NAD 激酶(NADK)、腺苷甲硫氨酸脱羧酶 1 人类重组蛋白(AMD1)、FGA 等,主要作用于代谢进程、脂肪细胞因子信号通路、碱基生物合成、凝固机制、脂质运输等方面。Strings 图所示的 GO 分析和 pathway 分析相吻合的通路有:NADK-CMPK1、2´,5´寡聚腺苷酸合成酶 1(OAS1)-S-腺苷甲硫氨酸基区域蛋白 2(RSAD2)和精脒/精胺 N1-乙酰基转移酶 1(SAT1)-AMD1,与胃癌进程的发生发展相关联。
2.3 下调差异表达基因结果
2.3.1 GO 分析
在 984 个下调基因的 GO 分类条目中具有统计学意义的基因有 211 个,主要与细胞粘着、血液凝固、细胞基质黏附、小分子代谢进程、信号转导、细胞凋亡负性调控、血管再生、血小板激活、转变生长因子受体复杂集合、细胞外基质集合等相关。984 个条目对应 1 591 个下调基因,具有统计学意义的 211 个条目对应 627 个下调基因。结合富集度值从 211 个具有统计学意义的分类条目中筛选出与 Gene Ontology 数据库的 GO 索引号一致的胃癌差异表达基因条目 43 个(表 3)。sigmaplot 图结果显示,细胞基质黏附、小分子代谢进程、信号转导、凋亡进程负调控和血管生成几项生物功能的显著性最突出(图 2a)。随后又分析了 GO 显著性差异基因所对应的蛋白通路,发现了关联性蛋白通路 8 条,并发现了由关键性蛋白形成的关联性通路网络(图 2b)。

2.3.2 pathway 分析
在 161 条 pathway 下调通路中具有统计学意义者 37 条,主要与黏合连接、白细胞游出迁移、内质网蛋白加工、癌症通路、转化生长因子(TGF)信号通路、黏着斑、矿物质吸收、结直肠癌、胰腺癌、轴突导向、细胞周期、微丝骨架调控等有关。从 37 条具有统计学意义的下调通路中筛选出与胃癌相关性强的通路共有 19 条(表 4)。sigmaplot 图结果显示,黏合连接、内质网蛋白加工、癌症通路等生物功能的显著性最突出(图 2c)。随后又分析了 passway 显著性差异基因所对应的蛋白通路,总共发现关联性蛋白通路 2 条及 1 条由若干蛋白合成的通路网络(图 2d)。

通过样本检测,本研究发现,在上述两种下调富集分析中出现吻合的基因有:Ras 相关的 C3 肉毒素底物 1(RAC1)、5´-核苷酸酶 (NT5E)、磷酸肌醇 3 激酶调控亚基 1(PIK3R1)、胰岛素样生长因子 1(IGF1)、基质细胞衍生因子-1(CXCL12)、促分裂原活化蛋白激酶 10(MAPK10)、蜗牛同源物 2(SNAI2)、成纤维细胞生长因子受体 1(FGFR1)、母亲 DPP 同源物 4(SMAD4)、SEMA6D、鸟嘌呤核苷酸结合蛋白(G 蛋白)α 抑制活性肽 2(GNAI2)等,主要参与轴突导向、Wnt 信号通路和磷酯酰肌醇-3 激酶-丝氨酸/苏氨酸激酶(PI3K-Akt)信号通路,猜测它们与胃癌的发生机制关系密切。Strings 图所示的下调蛋白通路中,GO 和 pathway 分析相吻合的通路有:连接黏附分子 2(JAM2)-连接黏附分子 3(JAM3)通路,和以 GLI-Kruppel 家族成员 GLI3、SMAD4、SNAI2、IGF1、FGFR1、MAPK10、GNAI2、PIK3R1、RAC1、CXCL12 以及黏着斑蛋白(VCL)为主的通路网络,进一步证明了显著性基因之间及其与胃癌发生的关联性。
3 讨论
胃癌是世界上第 4 常见的癌症,每年大概有 100 万新发病例[4]。尽管在过去的 5 年中,胃癌的发病率和死亡率在全球范围内均有所下降,但胃癌仍是癌症相关死亡的第 3 大主要原因,位列于肺癌和结直肠癌之后[5]。肿瘤发生的直接原因是基因改变,如典型的胃癌相关基因 myc、ras、erb、hst 等突变,这些基因异常表达就会导致胃癌的发生。RNA 是基因转录产物,前体 mRNA 去除内含子后,外显子以不同方式拼接形成转录体,这种差异性剪接过程被称为可变剪接[6]。人类基因可变剪接的发生可能会造成蛋白质结构和功能的改变,进而造成相关疾病。许多研究者认为,真核基因的剪接调节在胃癌的发生发展中起重要作用[7]。本研究以此为切入点,通过临床胃癌患者的组织样本,将胃癌组和癌旁组织进行对比,检测差异基因和可变剪接的结果,以探讨胃癌的发生机制,具备一定的创新性及一定的临床意义。
可变剪接有 5 种基本剪切形式:① 内含子保留;② 可变 5´端;③ 可变 3´端;④ 外显子盒;⑤ 互斥外显子[8]。剪接过程中各种影响因素高度协调,在不改变基因组序列的前提下使蛋白质表达的复杂程度极大增加[9],它对于转录本的多样性具有重要的意义。剪接样本会有 3 种结果:① 外显子保留产物的表达量高于外显子被剪接产物的表达量;② 外显子保留产物的表达量低于外显子被剪接产物的表达量;③ 外显子保留产物的表达量与外显子被剪接产物的表达量几乎相同。剪接过程任意关键因素的突变都可能改变正常的剪接模式而得到差异转录体,编码出异常蛋白[10-11]。本试验将胃癌组织和癌旁组织做比较,分别检测 6 个样本的转录本浓度和基因信号值(取 log2),得出转录水平的差异倍数和置信水平。在非调控基因、上调基因和下调基因 3 种类型中分别有 20、33 和 16 个基因出现多转录本而并非出现单一转录本量值结果,则证明该基因在转录 RNA 时发生可变剪接。
信号通路参与癌症的作用机制,常见的有 Wnt 信号通路、PI3K-Akt 信号通路和 Notch 信号通路。PI3K-AKT-哺乳动物雷帕霉素靶点(mTOR)信号通路在人肿瘤细胞中经常性下调,而使基因改变其组成或使细胞表面受体的上游激活[12],而 PIK3R1-AKT 通路调控多重生物进程的信号,例如细胞凋亡、代谢、增殖和发育,与胃癌相关[13-14]。有学者[13, 15]利用 RNA 干扰(RNAi)技术敲低 PIK3R1 和 AKT1 的表达后证实,其对胃腺癌 SGC7901 细胞的侵袭具有抑制作用。PI3K 与致癌基因 ras 的结合对 ras 的转化特性至关重要[16-17]。AKT 为人第 10 号染色体缺失的磷酸酶及张力蛋白同源的基因(PTEN)-PI3K 的下游效应因子,p-AKT 是 AKT 的活化形式,其在细胞的增殖、分化和存活中扮演着重要的角色[18]。PTEN 由于其脂质磷酸酶活性而负向调节 PI3K 信号通路,从而抑制下游成分(如 AKT 和NF-κB)的激活,刺激癌细胞增殖和生长[19-20],PTEN 的失活将导致 AKT 的异常活化。有研究[21-23]证实,核苷酸还原酶(RRM1)与 PI3K-Akt 通路的 PTEN 下调相关,进而引发代谢抑制。mTOR 位于 PI3K-AKT-mTOR 信号通路的下游,活化后通过介导下游重要信号分子而影响细胞增殖并抑制细胞凋亡,在多种恶性肿瘤中发现 mTOR 呈高表达。Wnt 信号通路是一组由蛋白质组成的信号转导通路,通过细胞表面受体将信号传递到细胞中[24],最初用来描述脊椎动物和非脊椎动物的胚胎发育,随后发现,非正常的 Wnt/β-catenin 通路的激活涉及到各种人类的多种不同类型的肿瘤发展[25-26]。Wnt 家族蛋白成员,如 Wnt1、Wnt2 和 Wnt2B 被发现在胃癌组织中呈表达上调状态。关于该信号通路参与胃癌发生的机制可能是,通路过度表达破坏了正常胃黏膜的增殖、干细胞维持和稳态,导致胃肠上皮细胞的细胞增殖、细胞周期阻滞和细胞迁移之间出现失平衡,RAC1 作为中间环节也在其中发挥作用[27-28]。Notch 信号通路参与细胞增殖、分化、凋亡、干细胞维持等多个过程,在胃癌发生中 Notch 信号通路的激活不仅可以促进胃癌细胞增殖,抑制胃癌细胞凋亡,还能增加胃癌细胞的迁移性和侵袭性,在一定程度上加速了胃癌的进展[29]。
本研究检测结果发现,主要上调通路有 3 条:NADK-CMPK1、OAS1-RSAD2 和 SAT1-AMD1。其中,SAT1-AMD1 通路中的 AMD1 基因主要通过催化S-腺苷甲硫氨酸脱羧产生脱羧 S-腺苷甲硫氨酸。与癌旁组织相比,AMD1 在胃癌组织中的表达明显上调且 AMD1 高表达与肿瘤直径和肿瘤浸润深度密切相关(P<0.05),提示 AMD1 与胃癌的发生和发展密切相关[30]。而经证实,CMPK1 在非小细胞肺癌(NSCLC)进展中产生作用,可作为 NSCLC 治疗的靶点之一[31]。OAS 是 IFN 或病毒诱导的蛋白质家族之一,它能调节巨噬细胞中宿主的先天免疫信号,从而在病毒感染过程的信号通路中发挥作用,比如抵抗黄病毒、西尼罗河病毒、登革热病毒等[32]。RSAD2 在三阴性乳腺癌中表达上调,并且被用作预后预测因子[33]。
本研究检测结果还发现,主要下调通路有 JAM2-JAM3,和以 GLI3、SMAD4、SNAI2、IGF1、FGFR1、MAPK10、GNAI2、PIK3R1、RAC1、CXCL12 和 VCL 为主的关系网络。其中,IGF1 介导的信号传导控制着胃癌中的许多生物学过程。IGF1-IGF1R 途径参与了胃癌中干扰素引导跨膜蛋白 2(IFITM2)表达的上调。转录的信号转导活化蛋白质 3(STAT3)是由 IGF1-IGF1R 信号传导激活的转录因子。磷酸化 STAT3 促进细胞存活和增殖、细胞周期进程、血管生成和转移,在胃癌启动和进展中承担重要作用[34]。IGF1R 是受体酪氨酸激酶的胰岛素受体家族的成员,它与底物途径蛋白例如 mTOR 的上调与胃癌期间对化学疗法的不良反应和不良预后密切相关,并且 IGF1R 信号传导途径的异常与胃癌期间耐药性和化疗反应差也有紧密关联[35]。FGFR1 属于受体酪氨酸激酶,参与多种生物学功能,如细胞增殖、存活、迁移和分化。FGFR1 在许多不同的细胞类型中表达,它的扩增与食管癌、乳腺癌和鳞状细胞肺癌的生存率低有关[36]。与正常 GES-1 细胞相比,所有胃癌细胞系中 FGFR1 mRNA 及其蛋白的表达水平均显著上调[37],并且它们的表达与不良的生存预后、转移和 TNM 分期相关,表明 FGFR1 在胃癌的发生中起关键作用。SNAI2 位于 8 号染色体,又被称作 slug 基因,经实验证明,SNAI2 mRNA 的表达量在分化越低的胃癌组织中越高,不同分化胃癌组织的阳性表达率随着分化程度降低而增加,癌组织的阳性表达率要高于正常胃黏膜[38]。在人类中,Rho GTP 酶(Rho GTPase)家族包含 20 个 Rho 小 G 蛋白,可分为 Cdc42 亚组、Rac 亚组、Rho 亚组和其他不太具备特征的亚组[39]。Rho GTP 酶所属的 RAC1 功能十分复杂,参与肿瘤血管生成、细胞骨架组建和恶性细胞的多样功能当中,它过度活化和过度表达似乎与侵袭性生长和其他恶性特征相关[40],还涉及到 PI3K-Akt、JNK/SAPK 信号通路活化的多种相关生物功能链[41-43]。CXCL 是一类能够趋化细胞定向移动的分泌蛋白,它可以在结肠癌、肝癌、宫颈癌等恶性肿瘤中高表达,由癌相关成纤维细胞(CAFs)激活趋化因子 CXCL12/CXCL12 的特异受体(CXCR4)后,介导整合素 b1 聚集在细胞表面并促进胃癌细胞的侵袭[44],高表达 CXCL12 与 IGF1 的胃癌组织生长速度更高、转移能力更强且肿瘤发展更快[45-46]。此外,CXCL12 还在癌细胞或微环境细胞上过度表达,通过 CXCR4 诱导巨噬细胞在瘤内微环境的迁移,也与肿瘤组织缺氧条件下的血管生成有关[47],说明 CXCL12 对这些肿瘤的增殖和转移具有促进作用。SMAD4 是转化生长因子 β(TGF-β)信号通路中的一个重要分子。有研究[48]证实,SMAD4 能够提高胰腺癌细胞的迁移以及侵袭能力,表明它在胰腺肿瘤形成过程中能发挥作用。在胃癌方面,SMAD4 的高甲基化相对罕见,但 SMAD4 作为肿瘤抑制蛋白在细胞核中发挥的作用却不容忽视[49-50],它是关键的预后因素。各种机制包括:核质穿梭的失调、杂合性缺失(LOH)的下调、高甲基化或蛋白酶体降解,都参与了胃癌中 SMAD4 的缺失。GLI3 是3 种 GLI 转录因子(GLI1、GLI2 和 GLI3)中的一种,在经典 Hedgehog(HH)信号通路中起重要作用。人 GLI3 由 15 个外显子构建,编码由 1 580 个氨基酸组成的蛋白质。GLI3 功能结构域包含 N 末端转录抑制因子、5 个锌指(介导 DNA 结合)、蛋白酶切割位点、CBP 结合区、两个 C 末端转录激活区和 α-螺旋区域[51],可以作为转录激活因子或抑制剂起作用[52]。GLI3 不仅在肝纤维化中发挥作用[53],而且在 NSCLC 癌组织中其蛋白表达水平高于癌旁组织,它对 NSCLC 病情的发展具有重要的促进作用[54]。多种致癌途径增加 GLI 功能(非经典激活),包括 K-ras、PI3K/Akt 和 TGF-β,有助于肿瘤的发展和形成。MAPK10 是 MAPK 基因家族的成员,已经发现,MAPK 信号传导途径参与细胞发育、应激反应和其他细胞过程[55]。有研究[56]发现,MAPK10 可能受 miR-21 调控,从而调节乳腺癌的增殖和迁移并抑制乳腺癌细胞的凋亡。GNAI2 在免疫细胞中大量表达,参与 G 蛋白偶联受体(GPCR)和非 GPCR 信号通路[57]。细胞环境可以使得 GNAI2 作为肿瘤抑制剂起作用,它也被证明是卵巢癌的诊断指标[58]。PI3K 信号传导是几种人类癌症(包括结直肠癌)中最常被下调的途径之一,也是最为有吸引力的治疗靶点[59]。PIK3CA 和 AKT1 热点突变是肛门生殖器区域的良性疾病—鞘膜炎(HP)中最常见的遗传畸变,已鉴定 PIK3CA 和 PIK3R1 突变导致组成型激活的 PI3K/AKT 信号转导[60]。磷酸肌醇-3-激酶调节亚基 1(PIK3R1)是 PI3K 信号传导的组分,有研究发现,PIK3R1 轴能被下调的 circAKT3 靶向从而有效地增强 GC 细胞对小剂量顺铂(CDDP)的敏感性[61],另外 PIK3R1 在 CDDP 抗性卵巢癌细胞中高表达,它还是胰腺癌预后的临床生物标志物[62]。VCL 被称为肌动蛋白丝结合蛋白,参与细胞-基质黏附和细胞-细胞黏附,它调节细胞表面的 E 钙黏蛋白表达,并通过 E 钙黏蛋白复合物增强机械传感[63]。VCL 也可能在细胞形态和运动中发挥重要作用。由 VCL 组成的复合物可用于将肌动蛋白丝锚定到膜上。VCL 在前列腺癌(PCa)细胞中高表达,在 PCa 细胞迁移中起关键作用[64]。这些基因表达蛋白被证实参与不同肿瘤的形成与发展,从获得的实验结果推测它们也参与胃癌发生的进程。
综上,本研究运用基因芯片技术证实,提取的临床胃癌样本组织中存在着大量差异可变剪接转录本,它们的存在可能与原癌基因的激活、抑癌基因的突变、缺失以及细胞凋亡机制紊乱相关。利用基因富集分析,本研究筛选出来 NADK-CMPK1、OAS1-RSAD2、SAT1-AMD1 和 JAM2-JAM3 基因通路,以及以 GLI3、SMAD4、SNAI2、IGF1、FGFR1、MAPK10、GNAI2、PIK3R1、RAC1、CXCL12 和 VCL 为主的基因通路网络,这些经检测有显著差异性的基因,与胃肿瘤代谢密切关联。基因在转录过程中可能涉及到 RNA 可变剪接,从而导致蛋白质异常表达。对于个别基因的具体研究还应结合它所可能联系的相关生物学功能、信号通路等一并分析,以作出全面系统的概括。长链非编码 RNA(LncRNA)作为 ncRNA 的重要组成部分,参与人体生理功能的调节;miRNA 作为复杂调控系统中必不可少的信号分子,与 LncRNA 相互作用并参与到可变剪接过程中。探索剪接体在肿瘤组织的变化模式并在癌前良性病变阶段研发能对特定基因结构与功能进行检测的生物标志物,从而为胃癌高危患者进行预警,继而提供确凿诊断依据,是今后胃癌相关诊治的一个前景,也需要我们开展更深层次的研究来进一步证实。
重要声明
利益冲突声明:本文全体作者阅读并理解了《中国普外基础与临床杂志》的政策声明,我们没有相互竞争的利益。
作者贡献声明:王一晨,数据统计分析和文章撰写;王瑾,样本收集和质检;杨文山,协助分析;刘屏,技术指导和质控;董宪喆,研究方案设计和文章修校;胡园,文章修校。
伦理声明:本研究已通过中国人民解放军总医院的伦理审核批准(批准文号:总 2015006)。
胃癌是威胁人类健康的恶性肿瘤之一。胃癌的发生与环境、遗传等因素有关。近年来,关于内源非编码基因调控胃肿瘤组织发生发展过程的研究越来越受到人们的关注,与其关联的可变剪切技术也作为当下热点为人所关注。可变剪切系指一个前体 mRNA 通过不同的剪接方式产生多样 mRNA 剪接异构体的过程,是产生高等真核生物蛋白质的重要分子调控机制之一。不少学者发现,可变剪接在个体发育、组织分化、肿瘤形成等过程中都发挥着十分重要的作用[1]。
本研究从胃癌样本组织中提取相关基因产物,使用高通量基因芯片等分子技术检测胃癌基因差异表达的可变剪接事件[2],并对结果做探讨分析。
1 资料与方法
1.1 临床资料
回顾性收集 2015 年 7 月至 2016 年 12 月期间中国人民解放军总医院普外科标本库的 3 例胃癌住院患者的癌组织及癌旁组织标本,样本经中国人民解放军总医院病理科检查确证。癌旁组织取自距离肿瘤以远 4 cm 的组织,经鉴定组织内无明显的肿瘤细胞。所有患者术前未行放化疗。所有组织标本均用 10% 中性甲醛固定,在低温条件下做冻存处理。试验已经过中国人民解放军总医院伦理委员会审批,受试患者均已签署知情同意书。
1.2 主要试剂和设备
GeneChip WT cDNA 合成和扩增试剂盒(Affymetrix 公司,美国),GeneChip WT 终端标记试剂盒(P/N 703174 Rev 1,Affymetrix 公司,Santa Clara,CA),TRIzol 试剂(美国 Invitrogen 公司)。Agilent 2100 生物分析仪(Agilent Technologies Inc,Palo Alto,CA),Affymetrix Fluidics Station 450 和 GeneChip2 Scanner 3000 7G 微阵列扫描仪(Affymetrix 公司,美国)。
1.3 DNA 和 RNA 的提取
使用标准的氯仿程序从冷冻的肿瘤样品中提取 DNA。使用 TRIzol 试剂从冷冻的肿瘤样品中分离出总 RNA,并依据 Affymetrix 的建议方法,使用 GeneChip WT cDNA 合成和扩增试剂盒生成 cDNA,并在 Agilent 2100 生物分析仪上进行了质量评估。本研究总 RNA 的完整性值在 7.7 和 9.0 之间(平均值 8.65),满足测试标准。通过 PCR 扩增基因组 DNA,对产物进行测序。
1.4 阵列杂交
使用 GeneChip WT 终端标记试剂盒对 cDNA 进行片段化和末端标记。将约 5.5 mg 标记的 DNA 靶标在 45 ℃ 下与 Affymetrix GeneChip Human Exon 1.0 ST 阵列杂交 16 h。将杂交的阵列洗涤并在 GeneChip Fluidics Station 450 上染色,之后在 GeneChip2 Scanner 3000 7G 上进行扫描。使用 140 万个探针集的一个子集对所得的探针信号强度进行了草图分位数归一化。使用稳健的多阵列平均值(RMA)总结基因表达水平。为使方差稳定,增加了一个常数 16,并对汇总信号进行 log2 转换。为避免混淆基因表达变异的解释,本研究在总结表达前从外显子中删除了数据,这些外显子的探针组包含两个或多个带有单核苷酸多态性(SNP)的探针。所有原始外显子阵列数据均已保存到 Gene Expression Omnibus(GEO)中。
1.5 微阵列数据分析
本研究进行了未配对的 Student t 检验以比较癌组织和癌旁组织的基因强度。当倍数变化≥1.5 或 P≤0.05 时,基因表达的差异被认为存在统计学意义。首先在拼接水平上进行分析,仅考虑外显子探针(即“EXON 分析”)。SPLICING PATTERN 分析中,未调整的 P≤0.05 和倍数变化≥1.5 时表明有统计学意义;EXON 分析中,未调整的 P≤0.05 和倍数变化≥2.0 被认为具有统计学意义[3]。对微阵列数据进行生物信息学分析后,使用 GenoSplice EASANA 界面进行手动检查,以选择高置信度事件。
1.6 RNA-Seq 分析
对组织样品的 RNA 进行测序。采用 Tophat 对读数进行比对。使用 DEXseq 对癌组织(n=3)和癌旁组织(n=3)样品之间的差异剪接进行分析,错误发现率(FDR)界定值是确定事件重要性的衡量标准。GO 分析中:P<0.05 表示 GO 差异有统计学意义,以评估 GO 的显著性水平;误判率 FDR<0.2 是对P值准确率的判断以及对 GO 显著性水平的再判断。KEGG 分析中:P<0.05 表示 pathway 差异具有统计学意义,以评估 pathway 的显著性水平;误判率 FDR<0.40 是对 P 值准确率的判断和对 pathway 显著性水平的再判断。
1.7 统计学方法
采用 SPSS 25.0 统计学软件进行统计学分析。采用 sigmaplot(13.0)作图软件做图,P 值取负对数,–(lgP)值越大表明 P 值越小,即 GO 或 pathway 的显著性水平越高。分类资料用百分比表示,统计方法采用配对 χ2 检验或 Fisher 检验用于确定变量之间的关联;等级变量之间的相关性采用 Spearman 秩相关分析。检验水准 α=0.05。
2 结果
2.1 样本中筛选差异基因
将癌组织与癌旁组织的基因差异水平和转录本差异水平比较后发现,胃癌组织存在转录非调控(unchanged)基因、转录上调(up)基因和转录下调(down)基因。在非调控基因信息中,总共检测出与 ENSEMBL 数据库基因标识一致的基因 411 个,经过整理得出可变剪接基因有 20 个:溶质载体家族 23 成员 2(SLC23A2)、周期蛋白 K(CCNK)、钾通道亚家族 K 成员 10(KCNK10)、负伸长因子复合体 C/D(NELFCD)、结构维持染色体 4(SMC4)、视黄醇结合蛋白 2(RBP2)、核受体亚家族 5 组 A 成员 2(NR5A2)、捻同源物 1(TWIST1)、蛋白原转化酶枯草杆菌蛋白酶(PCSK2)、Sciellin 蛋白(SCEL)、磷脂酶 CE1(PLCE1)、S100 钙结合蛋白 A8(S100A8)、SH3 结构域激酶结合蛋白 1(SH3KBP1)、溶质载体家族 25 成员 37(SLC25A37)、钙蛋白酶抑制蛋白(CAST)、含山梨糖和 SH3 域 2(SORBS2)、肌纤维膜关联蛋白(SLMAP)、靠停蛋白 2(CLDN2)、鸟嘌呤核苷酸结合蛋白(G 蛋白)γ4(GNG4)和 LIM 域激酶 2(LIMK2)。在上调基因信息中,总共检测出与ENSEMBL 数据库的基因标识一致的差异基因 119 个,经过整理得出可变剪接基因有 33 个:含 V-set 和免疫球蛋白域 2(VSIG2)、乳腺癌扩增顺序 1(BCAS1)、羟基类固醇(17β)脱氢酶 2(HSD17B2)、含 FXYD 域离子运输调控因子 3(FXYD3)、质膜蛋白脂质(PLLP)、脂肪酸 2 羟化酶(FA2H)、TMC5(transmembrane channel-like 5)、细胞壁合成蛋白 43(CWH43)、缩胆囊肽 B 受体(CCKBR)、GDP 甘露糖 4,6 脱水酶(GMDS)、再生胰岛衍生1α(REG1A)、UDP 半乳糖 4 差向异构酶(GALE)、ATP 结合家族亚家族 D 成员 3(ABCD3)、溶质载体家族 35 成员 A3(SLC35A3)、桥粒胶蛋白 2(DSC2)、高尔基膜蛋白 1(GOLM1)、绒毛蛋白样蛋白(VILL)、泛素关联蛋白 2(UBAP2)、膜联蛋白 A3(ANXA3)、磷酸肌醇 3 激酶类 2 γ 肽(PIK3C2G)、双氧化酶成熟因子 2(DUOXA2)、GATA 结合蛋白 6(GATA6)、脂钙蛋白 2(LCN2)、趋化因子(C-C 基元)配体 28(CCL28)、G 蛋白偶联受体 110(GPR110)、F 框和亮氨酸丰富重复蛋白 13(FBXL13)、羟基前列腺素脱氢酶 15(HPGD)、含 RAS 和 EF 手性结构(RASEF)、丝氨酸蛋白酶抑制剂 B7(SERPINB7)、纤维蛋白原 γ 链(FGG)、纤维蛋白原 α 链(FGA)、胃蛋白酶 2(GKN2)和序列相似家族 3 成员 B(FAM3B)。在下调基因信息中,总共检测出与 ENSEMBL 数据库的基因标识一致的差异基因 75 个,经过整理得出可变剪接基因有 16 个:人分泌型卷曲相关蛋白 1(SFRP1)、人纤维蛋白 A 相互作用蛋白 1(FILIP1)、同源 3 结构域生长因子受体与内啡肽相互作用蛋白 1(SGIP1)、羧肽酶 X(M14 家族)成员 2(CPXM2)、SSPN、胶原X,α1(COL10A1)、富含亮氨酸重复 G 蛋白偶联受体 5(LGR5)、Ⅷ 型胶原 Α1 重组蛋白(COL8A1)、ADP 核糖基化因子 GTP 酶活化蛋白 1(ASAP1)、基质改变关联 8(MXRA8)、WW 域结合蛋白 1-like 转录变体 1(WBP1L)、人激肽释放酶-7 重组蛋白(KLK7)、钙调蛋白 2(RCAN2)、人桥粒联结蛋白 2(AHNAK2)、胶原蛋白 α-1(Ⅳ)链(COL4A1)和非典型趋化因子受体 1(ACKR1)。
2.2 上调差异表达基因结果
2.2.1 GO 分析
在 801 个上调基因 GO 分类条目中具有统计学意义的有 192 个。801 个条目对应1 176 个上调基因,具有统计学意义的 192 个条目对应 407 个上调基因。结合富集度值从 192 个具有统计学意义的分类条目中筛选出与 Gene Ontology 数据库的 GO 索引号一致的胃癌差异表达基因条目 24 个,主要涉及小分子代谢进程、蛋白质磷酸化、蛋白质水解、细胞迁移、包含碱基的代谢过程、RNA 聚合酶 Ⅱ 催化的正性转录调控、细胞增殖调控、细胞迁移的正性调控、细胞蛋白质代谢过程、O-聚糖处理、细胞凋亡、自我吞噬、DNA 依赖的转录调控、活性氧代谢过程正性调控、紧密连接组件、翻译后蛋白质修饰、氧化还原过程、黏多糖生物合成过程、血管生成、蛋白质靶向、黏多糖代谢过程、蛋白质去磷酸化、信号转导和细胞黏附方面(表 1)。sigmaplot 图结果显示,小分子代谢进程、蛋白质磷酸化、蛋白质水解和细胞转移几项生物功能的显著性最突出(图 1a)。随后又分析了 GO 差异基因所对应的蛋白通路,总共发现关联性蛋白通路 14 条(图 1b)。


a: GO 分析的sigmaplot 图表明小分子代谢进程、蛋白质磷酸化、蛋白质水解和细胞转移的差异性最为显著;b:GO 分析的Strings 图表明存在关联性蛋白通路 14 条,其中 2 个蛋白关联 6 条,3 个蛋白关联 3 条,多个蛋白关联 5 条;c:passway 分析的 sigmaplot 图表明代谢途径及补体和凝血级联的差异性最为显著;d:passway 分析的 Strings 图表明存在关联性蛋白通路 5 条,其中 2 个蛋白关联 4 条,3 个蛋白关联 1 条

a:GO 分析的 sigmaplot 图表明细胞基质黏附、小分子代谢进程、信号转导、凋亡进程负调控和血管生生成的差异性最为显著;b:GO 分析的 Strings 图表明存在多条关联性蛋白通路,其中包括 2 个关联蛋白 7 条,3 个关联蛋白 1 条及若干蛋白合成的通路网路;c:passway分析的 sigmaplot 图表明黏合连接、内质网蛋白加工和癌症通路的差异性最为显著;d:passway 分析的Strings 图表明存在多条关联性蛋白通路,其中 2 个蛋白关联 1 条,3 个蛋白关联 1 条及 1 条由若干蛋白合成的网络通路
2.2.2 pathway 分析
在 130 条 pathway 上调通路中具有统计学性意义的有 12 条,从中筛选出与胃癌相关性强的通路有 6 条,主要涉及代谢途径、补体系统、脂肪细胞因子信号通路、过氧化物酶体、蛋白质消化和吸收以及自我吞噬调控方面(表 2)。结果显示,代谢途径和补体系统生物功能的显著性最突出(图 1c)。随后又分析了 passway 显著性差异基因所对应的蛋白通路,总共发现关联性蛋白通路 5 条(图 1d)。

经上述两种上调基因的富集分析结果发现,生物学功能与代谢通路出现吻合的基因有鞘磷脂合酶 1(SGMS1)、长链酰基辅酶 A 合成酶 3(ACSL3)、对氧磷酶 3(PON3)、琥珀酸脱氢酶复合体亚基 C 融入膜蛋白(SDHC)、脱氢酶/还原酶(SDR 家族)成员 9(DHRS9)、胞苷酸激酶 1(CMPK1)、3´(2´),5´二磷酸核苷酸酶 1(BPNT1)、NAD 激酶(NADK)、腺苷甲硫氨酸脱羧酶 1 人类重组蛋白(AMD1)、FGA 等,主要作用于代谢进程、脂肪细胞因子信号通路、碱基生物合成、凝固机制、脂质运输等方面。Strings 图所示的 GO 分析和 pathway 分析相吻合的通路有:NADK-CMPK1、2´,5´寡聚腺苷酸合成酶 1(OAS1)-S-腺苷甲硫氨酸基区域蛋白 2(RSAD2)和精脒/精胺 N1-乙酰基转移酶 1(SAT1)-AMD1,与胃癌进程的发生发展相关联。
2.3 下调差异表达基因结果
2.3.1 GO 分析
在 984 个下调基因的 GO 分类条目中具有统计学意义的基因有 211 个,主要与细胞粘着、血液凝固、细胞基质黏附、小分子代谢进程、信号转导、细胞凋亡负性调控、血管再生、血小板激活、转变生长因子受体复杂集合、细胞外基质集合等相关。984 个条目对应 1 591 个下调基因,具有统计学意义的 211 个条目对应 627 个下调基因。结合富集度值从 211 个具有统计学意义的分类条目中筛选出与 Gene Ontology 数据库的 GO 索引号一致的胃癌差异表达基因条目 43 个(表 3)。sigmaplot 图结果显示,细胞基质黏附、小分子代谢进程、信号转导、凋亡进程负调控和血管生成几项生物功能的显著性最突出(图 2a)。随后又分析了 GO 显著性差异基因所对应的蛋白通路,发现了关联性蛋白通路 8 条,并发现了由关键性蛋白形成的关联性通路网络(图 2b)。

2.3.2 pathway 分析
在 161 条 pathway 下调通路中具有统计学意义者 37 条,主要与黏合连接、白细胞游出迁移、内质网蛋白加工、癌症通路、转化生长因子(TGF)信号通路、黏着斑、矿物质吸收、结直肠癌、胰腺癌、轴突导向、细胞周期、微丝骨架调控等有关。从 37 条具有统计学意义的下调通路中筛选出与胃癌相关性强的通路共有 19 条(表 4)。sigmaplot 图结果显示,黏合连接、内质网蛋白加工、癌症通路等生物功能的显著性最突出(图 2c)。随后又分析了 passway 显著性差异基因所对应的蛋白通路,总共发现关联性蛋白通路 2 条及 1 条由若干蛋白合成的通路网络(图 2d)。

通过样本检测,本研究发现,在上述两种下调富集分析中出现吻合的基因有:Ras 相关的 C3 肉毒素底物 1(RAC1)、5´-核苷酸酶 (NT5E)、磷酸肌醇 3 激酶调控亚基 1(PIK3R1)、胰岛素样生长因子 1(IGF1)、基质细胞衍生因子-1(CXCL12)、促分裂原活化蛋白激酶 10(MAPK10)、蜗牛同源物 2(SNAI2)、成纤维细胞生长因子受体 1(FGFR1)、母亲 DPP 同源物 4(SMAD4)、SEMA6D、鸟嘌呤核苷酸结合蛋白(G 蛋白)α 抑制活性肽 2(GNAI2)等,主要参与轴突导向、Wnt 信号通路和磷酯酰肌醇-3 激酶-丝氨酸/苏氨酸激酶(PI3K-Akt)信号通路,猜测它们与胃癌的发生机制关系密切。Strings 图所示的下调蛋白通路中,GO 和 pathway 分析相吻合的通路有:连接黏附分子 2(JAM2)-连接黏附分子 3(JAM3)通路,和以 GLI-Kruppel 家族成员 GLI3、SMAD4、SNAI2、IGF1、FGFR1、MAPK10、GNAI2、PIK3R1、RAC1、CXCL12 以及黏着斑蛋白(VCL)为主的通路网络,进一步证明了显著性基因之间及其与胃癌发生的关联性。
3 讨论
胃癌是世界上第 4 常见的癌症,每年大概有 100 万新发病例[4]。尽管在过去的 5 年中,胃癌的发病率和死亡率在全球范围内均有所下降,但胃癌仍是癌症相关死亡的第 3 大主要原因,位列于肺癌和结直肠癌之后[5]。肿瘤发生的直接原因是基因改变,如典型的胃癌相关基因 myc、ras、erb、hst 等突变,这些基因异常表达就会导致胃癌的发生。RNA 是基因转录产物,前体 mRNA 去除内含子后,外显子以不同方式拼接形成转录体,这种差异性剪接过程被称为可变剪接[6]。人类基因可变剪接的发生可能会造成蛋白质结构和功能的改变,进而造成相关疾病。许多研究者认为,真核基因的剪接调节在胃癌的发生发展中起重要作用[7]。本研究以此为切入点,通过临床胃癌患者的组织样本,将胃癌组和癌旁组织进行对比,检测差异基因和可变剪接的结果,以探讨胃癌的发生机制,具备一定的创新性及一定的临床意义。
可变剪接有 5 种基本剪切形式:① 内含子保留;② 可变 5´端;③ 可变 3´端;④ 外显子盒;⑤ 互斥外显子[8]。剪接过程中各种影响因素高度协调,在不改变基因组序列的前提下使蛋白质表达的复杂程度极大增加[9],它对于转录本的多样性具有重要的意义。剪接样本会有 3 种结果:① 外显子保留产物的表达量高于外显子被剪接产物的表达量;② 外显子保留产物的表达量低于外显子被剪接产物的表达量;③ 外显子保留产物的表达量与外显子被剪接产物的表达量几乎相同。剪接过程任意关键因素的突变都可能改变正常的剪接模式而得到差异转录体,编码出异常蛋白[10-11]。本试验将胃癌组织和癌旁组织做比较,分别检测 6 个样本的转录本浓度和基因信号值(取 log2),得出转录水平的差异倍数和置信水平。在非调控基因、上调基因和下调基因 3 种类型中分别有 20、33 和 16 个基因出现多转录本而并非出现单一转录本量值结果,则证明该基因在转录 RNA 时发生可变剪接。
信号通路参与癌症的作用机制,常见的有 Wnt 信号通路、PI3K-Akt 信号通路和 Notch 信号通路。PI3K-AKT-哺乳动物雷帕霉素靶点(mTOR)信号通路在人肿瘤细胞中经常性下调,而使基因改变其组成或使细胞表面受体的上游激活[12],而 PIK3R1-AKT 通路调控多重生物进程的信号,例如细胞凋亡、代谢、增殖和发育,与胃癌相关[13-14]。有学者[13, 15]利用 RNA 干扰(RNAi)技术敲低 PIK3R1 和 AKT1 的表达后证实,其对胃腺癌 SGC7901 细胞的侵袭具有抑制作用。PI3K 与致癌基因 ras 的结合对 ras 的转化特性至关重要[16-17]。AKT 为人第 10 号染色体缺失的磷酸酶及张力蛋白同源的基因(PTEN)-PI3K 的下游效应因子,p-AKT 是 AKT 的活化形式,其在细胞的增殖、分化和存活中扮演着重要的角色[18]。PTEN 由于其脂质磷酸酶活性而负向调节 PI3K 信号通路,从而抑制下游成分(如 AKT 和NF-κB)的激活,刺激癌细胞增殖和生长[19-20],PTEN 的失活将导致 AKT 的异常活化。有研究[21-23]证实,核苷酸还原酶(RRM1)与 PI3K-Akt 通路的 PTEN 下调相关,进而引发代谢抑制。mTOR 位于 PI3K-AKT-mTOR 信号通路的下游,活化后通过介导下游重要信号分子而影响细胞增殖并抑制细胞凋亡,在多种恶性肿瘤中发现 mTOR 呈高表达。Wnt 信号通路是一组由蛋白质组成的信号转导通路,通过细胞表面受体将信号传递到细胞中[24],最初用来描述脊椎动物和非脊椎动物的胚胎发育,随后发现,非正常的 Wnt/β-catenin 通路的激活涉及到各种人类的多种不同类型的肿瘤发展[25-26]。Wnt 家族蛋白成员,如 Wnt1、Wnt2 和 Wnt2B 被发现在胃癌组织中呈表达上调状态。关于该信号通路参与胃癌发生的机制可能是,通路过度表达破坏了正常胃黏膜的增殖、干细胞维持和稳态,导致胃肠上皮细胞的细胞增殖、细胞周期阻滞和细胞迁移之间出现失平衡,RAC1 作为中间环节也在其中发挥作用[27-28]。Notch 信号通路参与细胞增殖、分化、凋亡、干细胞维持等多个过程,在胃癌发生中 Notch 信号通路的激活不仅可以促进胃癌细胞增殖,抑制胃癌细胞凋亡,还能增加胃癌细胞的迁移性和侵袭性,在一定程度上加速了胃癌的进展[29]。
本研究检测结果发现,主要上调通路有 3 条:NADK-CMPK1、OAS1-RSAD2 和 SAT1-AMD1。其中,SAT1-AMD1 通路中的 AMD1 基因主要通过催化S-腺苷甲硫氨酸脱羧产生脱羧 S-腺苷甲硫氨酸。与癌旁组织相比,AMD1 在胃癌组织中的表达明显上调且 AMD1 高表达与肿瘤直径和肿瘤浸润深度密切相关(P<0.05),提示 AMD1 与胃癌的发生和发展密切相关[30]。而经证实,CMPK1 在非小细胞肺癌(NSCLC)进展中产生作用,可作为 NSCLC 治疗的靶点之一[31]。OAS 是 IFN 或病毒诱导的蛋白质家族之一,它能调节巨噬细胞中宿主的先天免疫信号,从而在病毒感染过程的信号通路中发挥作用,比如抵抗黄病毒、西尼罗河病毒、登革热病毒等[32]。RSAD2 在三阴性乳腺癌中表达上调,并且被用作预后预测因子[33]。
本研究检测结果还发现,主要下调通路有 JAM2-JAM3,和以 GLI3、SMAD4、SNAI2、IGF1、FGFR1、MAPK10、GNAI2、PIK3R1、RAC1、CXCL12 和 VCL 为主的关系网络。其中,IGF1 介导的信号传导控制着胃癌中的许多生物学过程。IGF1-IGF1R 途径参与了胃癌中干扰素引导跨膜蛋白 2(IFITM2)表达的上调。转录的信号转导活化蛋白质 3(STAT3)是由 IGF1-IGF1R 信号传导激活的转录因子。磷酸化 STAT3 促进细胞存活和增殖、细胞周期进程、血管生成和转移,在胃癌启动和进展中承担重要作用[34]。IGF1R 是受体酪氨酸激酶的胰岛素受体家族的成员,它与底物途径蛋白例如 mTOR 的上调与胃癌期间对化学疗法的不良反应和不良预后密切相关,并且 IGF1R 信号传导途径的异常与胃癌期间耐药性和化疗反应差也有紧密关联[35]。FGFR1 属于受体酪氨酸激酶,参与多种生物学功能,如细胞增殖、存活、迁移和分化。FGFR1 在许多不同的细胞类型中表达,它的扩增与食管癌、乳腺癌和鳞状细胞肺癌的生存率低有关[36]。与正常 GES-1 细胞相比,所有胃癌细胞系中 FGFR1 mRNA 及其蛋白的表达水平均显著上调[37],并且它们的表达与不良的生存预后、转移和 TNM 分期相关,表明 FGFR1 在胃癌的发生中起关键作用。SNAI2 位于 8 号染色体,又被称作 slug 基因,经实验证明,SNAI2 mRNA 的表达量在分化越低的胃癌组织中越高,不同分化胃癌组织的阳性表达率随着分化程度降低而增加,癌组织的阳性表达率要高于正常胃黏膜[38]。在人类中,Rho GTP 酶(Rho GTPase)家族包含 20 个 Rho 小 G 蛋白,可分为 Cdc42 亚组、Rac 亚组、Rho 亚组和其他不太具备特征的亚组[39]。Rho GTP 酶所属的 RAC1 功能十分复杂,参与肿瘤血管生成、细胞骨架组建和恶性细胞的多样功能当中,它过度活化和过度表达似乎与侵袭性生长和其他恶性特征相关[40],还涉及到 PI3K-Akt、JNK/SAPK 信号通路活化的多种相关生物功能链[41-43]。CXCL 是一类能够趋化细胞定向移动的分泌蛋白,它可以在结肠癌、肝癌、宫颈癌等恶性肿瘤中高表达,由癌相关成纤维细胞(CAFs)激活趋化因子 CXCL12/CXCL12 的特异受体(CXCR4)后,介导整合素 b1 聚集在细胞表面并促进胃癌细胞的侵袭[44],高表达 CXCL12 与 IGF1 的胃癌组织生长速度更高、转移能力更强且肿瘤发展更快[45-46]。此外,CXCL12 还在癌细胞或微环境细胞上过度表达,通过 CXCR4 诱导巨噬细胞在瘤内微环境的迁移,也与肿瘤组织缺氧条件下的血管生成有关[47],说明 CXCL12 对这些肿瘤的增殖和转移具有促进作用。SMAD4 是转化生长因子 β(TGF-β)信号通路中的一个重要分子。有研究[48]证实,SMAD4 能够提高胰腺癌细胞的迁移以及侵袭能力,表明它在胰腺肿瘤形成过程中能发挥作用。在胃癌方面,SMAD4 的高甲基化相对罕见,但 SMAD4 作为肿瘤抑制蛋白在细胞核中发挥的作用却不容忽视[49-50],它是关键的预后因素。各种机制包括:核质穿梭的失调、杂合性缺失(LOH)的下调、高甲基化或蛋白酶体降解,都参与了胃癌中 SMAD4 的缺失。GLI3 是3 种 GLI 转录因子(GLI1、GLI2 和 GLI3)中的一种,在经典 Hedgehog(HH)信号通路中起重要作用。人 GLI3 由 15 个外显子构建,编码由 1 580 个氨基酸组成的蛋白质。GLI3 功能结构域包含 N 末端转录抑制因子、5 个锌指(介导 DNA 结合)、蛋白酶切割位点、CBP 结合区、两个 C 末端转录激活区和 α-螺旋区域[51],可以作为转录激活因子或抑制剂起作用[52]。GLI3 不仅在肝纤维化中发挥作用[53],而且在 NSCLC 癌组织中其蛋白表达水平高于癌旁组织,它对 NSCLC 病情的发展具有重要的促进作用[54]。多种致癌途径增加 GLI 功能(非经典激活),包括 K-ras、PI3K/Akt 和 TGF-β,有助于肿瘤的发展和形成。MAPK10 是 MAPK 基因家族的成员,已经发现,MAPK 信号传导途径参与细胞发育、应激反应和其他细胞过程[55]。有研究[56]发现,MAPK10 可能受 miR-21 调控,从而调节乳腺癌的增殖和迁移并抑制乳腺癌细胞的凋亡。GNAI2 在免疫细胞中大量表达,参与 G 蛋白偶联受体(GPCR)和非 GPCR 信号通路[57]。细胞环境可以使得 GNAI2 作为肿瘤抑制剂起作用,它也被证明是卵巢癌的诊断指标[58]。PI3K 信号传导是几种人类癌症(包括结直肠癌)中最常被下调的途径之一,也是最为有吸引力的治疗靶点[59]。PIK3CA 和 AKT1 热点突变是肛门生殖器区域的良性疾病—鞘膜炎(HP)中最常见的遗传畸变,已鉴定 PIK3CA 和 PIK3R1 突变导致组成型激活的 PI3K/AKT 信号转导[60]。磷酸肌醇-3-激酶调节亚基 1(PIK3R1)是 PI3K 信号传导的组分,有研究发现,PIK3R1 轴能被下调的 circAKT3 靶向从而有效地增强 GC 细胞对小剂量顺铂(CDDP)的敏感性[61],另外 PIK3R1 在 CDDP 抗性卵巢癌细胞中高表达,它还是胰腺癌预后的临床生物标志物[62]。VCL 被称为肌动蛋白丝结合蛋白,参与细胞-基质黏附和细胞-细胞黏附,它调节细胞表面的 E 钙黏蛋白表达,并通过 E 钙黏蛋白复合物增强机械传感[63]。VCL 也可能在细胞形态和运动中发挥重要作用。由 VCL 组成的复合物可用于将肌动蛋白丝锚定到膜上。VCL 在前列腺癌(PCa)细胞中高表达,在 PCa 细胞迁移中起关键作用[64]。这些基因表达蛋白被证实参与不同肿瘤的形成与发展,从获得的实验结果推测它们也参与胃癌发生的进程。
综上,本研究运用基因芯片技术证实,提取的临床胃癌样本组织中存在着大量差异可变剪接转录本,它们的存在可能与原癌基因的激活、抑癌基因的突变、缺失以及细胞凋亡机制紊乱相关。利用基因富集分析,本研究筛选出来 NADK-CMPK1、OAS1-RSAD2、SAT1-AMD1 和 JAM2-JAM3 基因通路,以及以 GLI3、SMAD4、SNAI2、IGF1、FGFR1、MAPK10、GNAI2、PIK3R1、RAC1、CXCL12 和 VCL 为主的基因通路网络,这些经检测有显著差异性的基因,与胃肿瘤代谢密切关联。基因在转录过程中可能涉及到 RNA 可变剪接,从而导致蛋白质异常表达。对于个别基因的具体研究还应结合它所可能联系的相关生物学功能、信号通路等一并分析,以作出全面系统的概括。长链非编码 RNA(LncRNA)作为 ncRNA 的重要组成部分,参与人体生理功能的调节;miRNA 作为复杂调控系统中必不可少的信号分子,与 LncRNA 相互作用并参与到可变剪接过程中。探索剪接体在肿瘤组织的变化模式并在癌前良性病变阶段研发能对特定基因结构与功能进行检测的生物标志物,从而为胃癌高危患者进行预警,继而提供确凿诊断依据,是今后胃癌相关诊治的一个前景,也需要我们开展更深层次的研究来进一步证实。
重要声明
利益冲突声明:本文全体作者阅读并理解了《中国普外基础与临床杂志》的政策声明,我们没有相互竞争的利益。
作者贡献声明:王一晨,数据统计分析和文章撰写;王瑾,样本收集和质检;杨文山,协助分析;刘屏,技术指导和质控;董宪喆,研究方案设计和文章修校;胡园,文章修校。
伦理声明:本研究已通过中国人民解放军总医院的伦理审核批准(批准文号:总 2015006)。