研究原癌基因pim-2的分子生物学特性, 分析其相关机制。使用生物信息学方法和技术研究分析原癌基因pim-2, 用在线服务器分析pim-2基因的染色体定位, 预测外显子、开放式阅读框、CpG岛和miRNAs互补片段等。用生物信息学软件预测原癌基因pim-2转录蛋白的理化性质和蛋白序列各类修饰位点, 如泛素化、糖基化等, 计算抗原指数, 模建空间结构。结果显示原癌基因pim-2有6个外显子, CDS编码框转录一段含311个氨基酸的肽链; 基因启动子存在CpG岛; 3'UTR区域含miRNA基因。Pim-2蛋白分子量34 188.47, 等电点5.78, 不稳定指数是45.87, 消光系数为279 nm; 蛋白序列分布着多处共价修饰位点、2处泛素化位点、4处糖基化位点、1处SUMO化位点、1处亚硝基化位点以及2处棕榈酰化位点; 蛋白序列存在16段抗原指数较高区域。研究表明原癌基因pim-2序列上所分布的相关区域和修饰位点与其致癌作用存在密切关系。
引用本文: 周小东, 沈富兵. 原癌基因pim-2分子生物学特性研究. 生物医学工程学杂志, 2015, 32(2): 405-411. doi: 10.7507/1001-5515.20150073 复制
引言
丝/苏氨酸激酶Pim家族最初在莫罗尼鼠类白血病病毒(Moloney murine leukemia virus, MMLV)的前病毒整合过程中被发现而得名,后被证实属于钙/钙调蛋白激酶(calcium/calmodulin regulated kinase, CAMP)相关的蛋白激酶家族。Pim家族在多细胞组织进化过程中高度保守,广泛分布在各脊椎动物组织中,具有多种重要功能,是细胞通路的关键分子,能增强细胞的抗凋亡作用,对肿瘤细胞、某些正常细胞的增殖与细胞周期具有调节功能。现已发现3个成员pim-1、pim-2和pim-3,其中pim-2基因是一种原癌基因,是MMLV前病毒整合的共同位点,能抑制细胞凋亡,能使翻译抑制因子4EBP-1保持磷酸化而失活,其反义核苷酸可抑制前列腺肿瘤DU2145细胞系的增殖。但是,对pim-2基因和其转录蛋白研究甚少,它的大部分功能还未阐明。本研究利用生物信息学的方法和技术,对pim-2基因及其转录蛋白的结构和生物学特性做深入研究。
1 材料与方法
1.1 数据来源
数据资料来自美国国立信息技术中心NCBI,检索下载人类pim-2基因序列,序列号为NM_006875.3。
1.2 pim-2基因分析
使用生物信息学的在线服务器,分析pim-2基因的染色体定位,预测外显子、启动子、开放式阅读框、编码序列,分析CpG岛(cytosine guanine island,CpG island)和微RNA(microRNAs,miRNAs)互补片段。
1.3 Pim-2蛋白研究
生物信息学分析软件分析蛋白理化性质,预测蛋白的各类修饰位点,包括共价修饰、泛素化、糖基化、SUMO化、亚硝基化、棕榈酰化等,分析抗原指数,模建空间结构。
2 结果与分析
2.1 pim-2基因特性研究
pim-2基因位于X染色体短臂1区1带2亚带3次亚带,序列全长2 234碱基对(bp),含有478个腺嘌呤(adenine,A)、643个胞嘧啶(cytosine,C)、576个鸟嘌呤(guanine,G)、537个胸腺嘧啶(thymine,T)。使用在线服务器Sim4分析序列,结果显示pim-2基因分布着6个外显子,分别位于1-363、364-473、474-524、525-897、898-1 074、1 075-2 187位。2个尚未归类特征区(misc_feature)885-887和912-914位,2个序列标签位点(sequence-tagged site,STS)1941-2097和2037-2159位。使用在线服务程序Promoter Scan分析pim-2基因,在2-252位预测分值为89,为启动子区。启动子位于结构基因5′端上游,具有活化RNA聚合酶、转录起始的特异性。它本身并不控制基因活动,而是通过转录因子的结合而控制基因活动。当启动子发生基因突变,将导致基因表达障碍,可引起恶性肿瘤。使用在线服务器ORF Finder分析pim-2基因的阅读框,pim-2基因分布着多段开放式阅读框,可编码相应的肽链,如图 1所示。

其中蛋白质编码区(CDS)位于303-1238,长936 bp,编码一段311个氨基酸构成的肽链,编码序列为:MLTKPLQGPPAPPGTPTPPPGGKDREAFEAE-YRLGPLLGKGGFGTVFAGHRLTDRLQVAIK-VIPRNRVLGWSPLSDSVTCPLEVALLWKVGA-GGGHPGVIRLLDWFETQEGFMLVLERPLPA-QDLFDYITEKGPLGEGPSRCFFGQVVAAIQH-CHSRGVVHRDIKDENILIDLRRGCAKLIDFGS-GALLHDEPYTDFDGTRVYSPPEWISRHQYH-ALPATVWSLGILLYDMVCGDIPFERDQEILEA-ELHFPAHVSPDCCALIRRCLAPKPSSRPSLEE-ILLDPWMQTPAEDVPLNPSKGGPAPLAWSLLP。
2.2 CpG岛预测
使用在线服务器Urogene的Methprimer程序分析pim-2基因,在序列的启动子区域存在一段富含双核苷酸“CG”及磷酸酯键的重复序列,这段DNA片段被称为CpG岛。pim-2基因序列的CpG岛,位于48-487位,全长440 bp,预测结果如图 2所示。CpG岛易发生甲基化,DNA甲基化是在DNA甲基转移酶(DNA methyltransferase,DNAMTs)作用下将胞嘧啶第5位碳原子添加甲基基团,形成甲基化胞嘧啶(5-mC),再与3′端的鸟嘌呤结合形成甲基化CpG(methylation CpG,mCpG),并双链对称出现,这一过程可引起DNA构象、稳定性以及染色体结构的改变。由于pim-2基因的启动子与CpG岛重叠,启动子区发生CpG岛高甲基化后,在转录水平抑制基因表达,启动子区的高甲基化抑制基因转录的机制有以下几点:①mCpG的甲基化胞嘧啶伸入DNA双螺旋的主沟,抑制了DNA与多种转录因子的结合。②mCpG能抑制核因子-κB(nucleus factor-kappa B,NF-κB)、核转录因子2(elongation 2 factor,E2F)、增强子结合蛋白2(enhancer binding protein 2,AP-2)等序列特异性转录因子与DNA的结合。③mCpG激活DNA甲基转移酶相关蛋白1(DNA methyltransferase 1-associated protein 1,DMAP1)、肿瘤易感基因101(tumor susceptibility gene 101,TSG101)等阻遏蛋白因子,导致抑制蛋白转录。④乙酰化后的组蛋白H3、H4赖氨酸与DNA紧密结合,转录过程中难以解聚,从而抑制基因转录。另外基因甲基化导致突变率增高,自发出现5-甲基胞嘧啶脱氨形成胸腺嘧啶,再易发生C→T的突变。由上可见,CpG岛甲基化可抑制基因转录,改变亲代遗传印记,导致基因结构功能异常,使癌基因激活,造成一些疾病和肿瘤的发生。有文献报道很多肿瘤病例在确诊之前,如乳腺癌患者的血液、淋巴结标本、乳头导管分泌液,就已经明确出现甲基化阳性。

2.3 miRNAs基因预测
miRNAs是在一种内源性的具有调控功能的非编码RNA,长度约22个核苷酸,成熟后的miRNAs与靶基因mRNA的3′非编码区(3′Untranslated Regions,3′UTR)互补结合,抑制靶基因的翻译或降解切割,从而改变基因的表达[1]。通过数据库TargetScan,查找与pim-2基因配对的miRNAs,分析结果显示,pim-2基因3′UTR区域有一段与之互补的miRNAs互补片段,位于pim-2基因终止密码子下游区119-126位,与shsa-miR-200b、hsa-miR-200c、hsa-miR-429三种miRNAs能互补结合,相互交叉重叠。miRNAs的5′非编码区(5′UTR)与靶基因3′UTR完全互补结合后,靶mRNA可被分裂切割,蛋白质的合成被阻止,从而对细胞的增殖、分化、凋亡起到调节作用。当miRNAs的5′UTR与靶基因3′UTR发生不完全互补,则会抑制靶mRNA的翻译[2]。当一个靶基因能被多个miRNAs同时作用,常协同发生转录后抑制靶mRNA的作用,造成基因沉默。miRNAs若出现突变或异常表达,可引起多种人类肿瘤,大约50%得到注解的miRNAs都可以定位于在基因组上的肿瘤相关脆性位点,如纯合性缺失区、杂合性缺失区、断裂点区、扩增区、抑癌基因部位和近癌基因部位[3]。miRNAs与肿瘤的关系密切且多样,可发挥癌基因、抑癌基因、下调原癌基因活性、下调抑原癌基因活性的作用。
分析结果还显示该miRNAs靶基因序列在进化上有较高保守性,在人(Homo sapiens, Hsa)、黑猩猩(Pan troglodytes,Ptr)、猕猴(Macaca mulatta,Mml)、小耳大婴猴(Otolemur garnettii,Oga)、小家鼠(Mus musculus,Mmu)、褐家鼠(Rattus norvegicus,Rno)、豚鼠(Cavia porcellus,Cpo)、非洲象(Loxodonta africana,Laf)等多个物种之间保守存在,如图 3所示。进化保守一般意味着具有重要生理功能,转录蛋白具有特殊蛋白质位点,该位点位于重要功能区域内[4]。

2.4 Pim-2蛋白理化性质
使用生物信息学分析软件DNAMAN V6分析Pim-2蛋白序列,该肽链相对分子量为34 188.47,分子式为C1550H2401N417O433S12,预测等电点为5.78。通过线服务器expasy的protparam程序分析显示Pim-2蛋白的不稳定指数是45.87,消光系数为279 nm,脂肪指数91.25,平均亲水性-0.141。含38个酸性氨基酸,29个碱性氨基酸,53个亲水性氨基酸,112个疏水性氨基酸。肽链中含量最高的氨基酸是亮氨酸Leu(12.54%),其次是脯氨酸Pro(11.25%),甘氨酸Gly(9.65%)。肽链的氨基酸构成比如图 4所示。

2.5 转录蛋白共价修饰
蛋白共价修饰是蛋白质转录合成之后发生的共价修饰,修饰作用对功能发挥具有重要作用。使用在线服务器Prosite预测Pim-2蛋白可能的修饰位点[5],Pim-2蛋白序列上分布着6种13段蛋白质修饰位点,如表 1所示。

序列53-55、130-132、272-274位为蛋白激酶C磷酸化位点,蛋白激酶C能作用细胞质的靶酶调控生化反应,作用于细胞核中的转录因子调控基因表达,进而影响细胞的生长和分化。
序列25-32位为酪氨酸激酶磷酸化位点,酪氨酸激酶能将蛋白质上的某些酪氨酸残基磷酸化调节其功能,磷酸化的酪氨酸部位成为细胞内信号蛋白的结合位点,激活细胞内的生化反应,引起细胞的综合性应答。
序列195-198、204-207、276-279、288-291位为蛋白激酶CK2磷酸化位点,是典型的磷酸化受体部位,位点周围存在大量酸性氨基酸残基。蛋白激酶CK2是一类信使非依赖性丝/苏氨酸蛋白激酶,在很多肿瘤中表达失调、活性增高。其致癌机制很复杂,与下列因素有关:①CK2可影响c-myc癌基因(c-myelocytomatosis viral oncogene,c-myc)的稳定性,是肿瘤发生相关的Wnt信号的正性调节物[6];②CK2表达失衡,如c-myc联合CK2α转基因表达,可出现致癌潜能,可使小鼠出现白血病、淋巴瘤[7]。CK2还通过多条途径参与着细胞凋亡,作用于细胞质和细胞核的靶点,如半胱天冬酶-2(cysteinyl aspartate specific proteinase-2,Caspase-2)、核纤层蛋白A(nuclear lamina protein A,Lamin A)、凋亡抑制蛋白(inhibitor of apoptosis proteins,IAPs)等:①Caspase-2是CK2的靶点,被CK2作用后,可发生脱磷酸二聚作用后活化,使Bcl-2相关X蛋白(Bcl-2 Associated X Protein,BAX)转移到线粒体,释放出凋亡蛋白;②Lamin A的分裂程度常可用来指示核凋亡的活性,Lamin A与CK2之间的表达呈负相关,CK2表达下调时Lamin A分裂增强,CK2过度表达时Lamin A分裂被抑制;③IAPs能保护特定细胞抵抗凋亡,是一种抗凋亡基因表达产物,IAPs与CK2之间呈正相关的表达,当CK2被化学抑制剂抑制时,可导致IAPs水平降低,进而影响细胞凋亡[8]。
序列41-46、91-96、145-150位为N-豆蔻酰化位点。N-豆蔻酰化为豆蔻酰CoA与蛋白质N端甘氨酸残基成酰胺键,为不可逆的蛋白质脂酰基修饰方式。它在膜定位中起重要作用,豆蔻酰化残基穿梭于膜之间,可结合到疏水核心,能稳定蛋白质结构。插入质膜内脂层的豆蔻酰化残基可使膜容易相互作用,把细胞质内接受到的信号,通过核孔传递到核内。当豆蔻酰转移酶(N-Myristoyltransferase,NMT)活性过高,可导致蛋白质畸形豆蔻酰化,引起信号转导紊乱,导致肿瘤发生。据报道,Magnuson等发现早期结肠癌的细胞NMT活性异常增高。
2.6 泛素化位点预测
蛋白质泛素化是蛋白质翻译后的修饰模式,与细胞内蛋白质降解和细胞活动密切相关。预测蛋白质泛素化已有多种在线程序,如BDM-PUB、UbPred、CKSAAP_UbSite等。利用这些方法预测Pim-2蛋白的泛素化修饰,综合分析可见Pim-2蛋白上分布着5处泛素化得分较高位点,但第4和23位得分分别为0.114 845、0.120 762,超过阈值,可确定为泛素化位点,如图 5所示。泛素化是靶蛋白

上的特定赖氨酸残基与泛素分子共价结合,所形成肽键能促进蛋白质降解,该过程保守并可逆[9]。研究发现,细胞必须保持蛋白质的产生、降解动态平衡,才能使细胞功能正常,结构稳定。泛素与蛋白酶构成泛素-蛋白酶途径(ubiquitin-proteasome pathway,UPP)可选择性高效降解细胞内蛋白质,如癌基因、抑癌基因产物和短寿命细胞周期调节蛋白和变性变结蛋白等。当UPP系统对靶蛋白降解的部位、时间、速率出现功能失常,可引起抑癌蛋白异常降解、癌蛋白聚集、突变细胞凋亡受阻增殖加速,引起癌变。研究发现,其致癌机制有多种途径:①UPP系统调控着细胞周期依赖性蛋白激酶(cyclin-dependent protein kinases,CDKs)和细胞周期素(Cyclins),这二者控制着细胞周期转换,当泛素降解缺陷,导致Cyclins增高,一些恶性肿瘤的Cyclins表达异常增高。②UPP系统调控着细胞凋亡:B淋巴细胞瘤-2基因(B-cell lymphoma-2,Bcl-2)家族能促进具有凋亡作用的Bax表达,Bax进入线粒体后可活化半胱氨酸天冬氨酸蛋白酶-9(cysteinyl aspartate specific proteinase-9,Caspase-9),促进凋亡。随着前列腺癌的格利森评分(Gleason)增高,UPP对Bax蛋白的泛素化降解也明显增强。③UPP系统参与着一些关键蛋白和信号传导途径的调节:NF-κB、β-链蛋白(β-catenin)、抑癌基因p53(tumor suppressor p53)、表皮生长因子受体(epidermal growth factor receptor,EGFR)、第10号染色体缺失的磷酸酶和张力蛋白同源物基因(phosphatase and tensin hmmlogydeleted on ten,PTEN)[10]。
2.7 糖基化位点预测
蛋白糖基化是真核生物蛋白质翻译后的一种修饰,糖基转移酶将活化的单糖加到肽链上,而形成具有独特生物活性的糖蛋白[11]。使用在线生物信息学程序DictyOGlyc 1.1 Server分析Pim-2蛋白的糖基化结构,预测结果显示蛋白序列上存在4处糖基化位点,分别在15、17、140、272位。其分布如图 6如示。糖基化修饰是一种最普遍的蛋白质修饰,约50%的蛋白质经过糖基化修饰。蛋白质糖基化可调节受体与配体的作用,影响免疫分子的结构功能,控制蛋白质在细胞器之间的穿梭以及在细胞膜上的翻转[12],进而影响影响免疫分子的折叠、成熟、包装、投送、定位和稳定,以及影响T细胞功能、体液免疫的功能和免疫应答的强弱等。

2.8 其它蛋白质修饰预测
使用在线服务器biocuckoo的工具包,分析Pim-2蛋白的其它蛋白质修饰,包括小泛素相关修饰物(small ubiquitin-related modifier,SUMO)化、亚硝基化和棕榈酰化。使用程序SUMOsp 2.0.4,分析预测Pim-2蛋白SUMO化。该法是基于PSFS法,即连续前向特性选择法[13]。结果显示在蛋白序列的第165位,预测分值为2.886,存在SUMO化修饰序列RDIKDEN。SUMO修饰是一种依赖ATP的小蛋白共价修饰,能结合于组蛋白的赖氨酸残基。蛋白质经SUMO化修饰后更加稳定,并对其修饰底物具有广泛功能,如能调节蛋白质定位,调节蛋白质转录活性,调节细胞周期,拮泛素化作用,并能影响到蛋白的稳定性、核质转运、酶活性、蛋白之间、DNA-蛋白之间的相互作用等。蛋白质经SUMO化修饰后与肿瘤的发生发展关系密切,但致癌机制复杂,与P53、岗哨蛋白特异蛋白酶(sentrin-specificprotease,SENP)、瘦蛋白(Reptin蛋白)、肿瘤转移抑制基因1(kangai1, KAI1)、低氧诱导因子1(Hypoxia-inducible factor-1,HIF-1)、ETS转录因子家族(E-twenty six,Ets)等异常表达相关,一些致癌因素的机制已探明,一些尚在探索之中。如:①SUMO可激活P53转录活性,易化P53介导的细胞衰老,当SUMO化修饰减少,可降低P53的抑癌功能,导致癌症发生[14]。②SUMO化与去SUMO化处于动态平衡之中,位于细胞核内的SENP能逆转SUMO修饰,当SENP表达异常增高使SUMO化与去SUMO化的平衡被破坏,将导致调节功能发生异常。曾有文献报道大量前列腺癌患者SENP表达异常增高[15]。
使用程序GPS-YNO2 1.0分析预测Pim-2蛋白的亚硝基化位点,结果显示在Pim-2蛋白序列的80位,预测分值是23.022,存在亚硝基化序列PLSDSVTCPLEVALL。蛋白质亚硝基化是一氧化氮(nitric oxide,NO)氧化修饰半胱氨酸巯基(-SH)生成高分子量的亚硝基化蛋白质(protein S-nitrosylation,PSNO)和低分子量的亚硝基硫醇(s-nitrosothiols, RSNO)。蛋白硝基化改变了蛋白质的结构和功能,调节着很多生理、病理功能,如调控细胞信号转导,调控离子通道,调节膜受体功能,影响激酶活性,影响转录因子DNA结合活性,还参与细胞凋亡和炎症反应[16]。
使用生物信息学软件CSS-Palm 3.0,分析预测Pim-2蛋白质棕榈酰化结构,结果显示蛋白质序列在260位(AHVSPDCCALIRRCL)和266位(CCALIRRCLAPKPSS)预测分值为1.628、0.75,说明存在两段棕榈酰化序列。蛋白质棕榈酰化是蛋白质翻译后的一种脂质共价修饰,赋予蛋白质复杂的生理功能,如调节蛋白质活性、稳定性,参与调节多种细胞信号通路,介导蛋白质之间和蛋白质-脂质相互作用[17]。
2.9 抗原性指数分析
常用于预测蛋白质抗原性的软件有DNAMAN V6,使用软件DNAMAN V6分析Pim-2蛋白序列,结果显示蛋白序列存在16段抗原指数较高区域,如表 2所示。Pim-2蛋白序列的这些区段抗原指数值高,氨基酸残基亲水性强,二级结构易于形成转角和不规则卷曲,符合B细胞表位要求,说明该区段含潜在优势抗原表位,构成蛋白质表位的可能性较大[18]。

2.10 Pim-2蛋白空间结构模建
蛋白的功能发挥是与其空间结构和活性结构域密切相关,空间结构的不同很大程度上导致了其生物学功能多样性,将Pim-2蛋白序列提交通过专业网expasy的在线程序Swiss-Model同源模建Pim-2蛋白的空间构型。用Discovery Studio模建Pim-2蛋白的受体活性中心,受体活性中心呈球状结构,如图 7所示。受体活性中心是蛋白质结构和功能的重要组成部分,可按照能量互补、空间几何互补以及化学环境互补的原则,与相对应的配体互补结合,从而发挥相应的功能。Pim-2蛋白活性中心具体的生理作用、致癌机制尚未完全明确,与抗癌药物进行分子对接的研究工作也正在进行之中。

3 总结
pim-2是于1984年在染色体Xp11.23中被首次发现,后来发现在脑和淋巴样细胞广泛表达,具有丝氨酸/苏氨酸激酶活性的有效存活因子。在特定条件下,表现出原癌基因的作用,参与细胞抗凋亡作用及其信号转导,与多种肿瘤的发生发展密切相关。国内外学者对其展开了深入研究,取得一系列发现,pim-2具有抗凋亡特性,与B淋巴细胞瘤-xL(B-cell lymphoma-extra large,Bcl-xL)和蛋白激酶B(protein kinase B, PKB)类似,具有维持细胞大小的功能,在糖酵解时可维持线粒体膜蛋白完整,防止萎缩,在缺乏生长因子的状态下能够维持细胞的生存和合成代谢。pim-2抗凋亡受很多因素调节,如饱和性的影响,以及受白细胞介素3、4、6(interleukin-3, 4, 6, IL-3, 4, 6,)和γ干扰素等的影响。以色列希伯来大学的研究者发现,pim-2基因可转录出34、38和41 kDa的三种蛋白,三者N端不同但具有相同的活性中心,催化位点相同,其中34 kDa蛋白活性最强。Pim-2蛋白具有激酶作用,能使p21蛋白、促凋亡蛋白(Bcl-xl/Bcl-2-Associated Death promoter, BAD)发生磷酸化改变活性,抑制细胞凋亡。当凋亡和增生平衡被打破,可导致肿瘤发生。例如,研究发现非霍奇金淋巴瘤、淋巴细胞性白血病、急性骨髓性白血病等恶性肿瘤患者体内,pim-2水平表达异常增高。
pim-2是重要的原癌基因,它的结构和生物学功能、转录蛋白和激酶底物都是研究热点,并逐渐成为抗癌药物的新靶点。Pim-2激酶抑制剂是肿瘤治疗药物的研究方向。大多数研究分析了其在信号转导过程中的作用、致癌机制以及抗癌治疗设想,但未对pim-2的各特性做全面梳理归纳,故本研究用生物信息学的方法对pim-2从基因到蛋白层面都进行全面的分析和系统的总结。分析出pim-2基因分布的外显子,明确了启动子区,发现启动子区存在CpG岛,含有miRNAs基因互补片段。研究还分析了Pim-2蛋白的理化性质,发现蛋白序列上存在CK2、TYR、myristyl等多种蛋白共价修饰位点,以及泛素化位点、糖基化位点、SUMO化、亚硝基化和棕榈酰化修饰位点。预测出抗原指数,模建了空间结构。这些分析结果当中,CpG岛、miRNAs基因互补片段、CK2 phospho Site、泛素化位点、SUMO化等与致癌关系密切,并对各致癌机制做了分析归纳整理。外显子、理化性质、糖基化、亚硝基化、棕榈酰化、抗原指数、空间结构等,虽然不具备直接的致癌作用,但也是pim-2重要构成部分,会直接、间接地发挥着相应作用。通过这些基础性的研究工作,构建起pim-2的知识体系,可为进一步研究pim-2在各类肿瘤的发病机制、临床治疗和转归、预后,提供一定科学依据和必要的理论帮助。
引言
丝/苏氨酸激酶Pim家族最初在莫罗尼鼠类白血病病毒(Moloney murine leukemia virus, MMLV)的前病毒整合过程中被发现而得名,后被证实属于钙/钙调蛋白激酶(calcium/calmodulin regulated kinase, CAMP)相关的蛋白激酶家族。Pim家族在多细胞组织进化过程中高度保守,广泛分布在各脊椎动物组织中,具有多种重要功能,是细胞通路的关键分子,能增强细胞的抗凋亡作用,对肿瘤细胞、某些正常细胞的增殖与细胞周期具有调节功能。现已发现3个成员pim-1、pim-2和pim-3,其中pim-2基因是一种原癌基因,是MMLV前病毒整合的共同位点,能抑制细胞凋亡,能使翻译抑制因子4EBP-1保持磷酸化而失活,其反义核苷酸可抑制前列腺肿瘤DU2145细胞系的增殖。但是,对pim-2基因和其转录蛋白研究甚少,它的大部分功能还未阐明。本研究利用生物信息学的方法和技术,对pim-2基因及其转录蛋白的结构和生物学特性做深入研究。
1 材料与方法
1.1 数据来源
数据资料来自美国国立信息技术中心NCBI,检索下载人类pim-2基因序列,序列号为NM_006875.3。
1.2 pim-2基因分析
使用生物信息学的在线服务器,分析pim-2基因的染色体定位,预测外显子、启动子、开放式阅读框、编码序列,分析CpG岛(cytosine guanine island,CpG island)和微RNA(microRNAs,miRNAs)互补片段。
1.3 Pim-2蛋白研究
生物信息学分析软件分析蛋白理化性质,预测蛋白的各类修饰位点,包括共价修饰、泛素化、糖基化、SUMO化、亚硝基化、棕榈酰化等,分析抗原指数,模建空间结构。
2 结果与分析
2.1 pim-2基因特性研究
pim-2基因位于X染色体短臂1区1带2亚带3次亚带,序列全长2 234碱基对(bp),含有478个腺嘌呤(adenine,A)、643个胞嘧啶(cytosine,C)、576个鸟嘌呤(guanine,G)、537个胸腺嘧啶(thymine,T)。使用在线服务器Sim4分析序列,结果显示pim-2基因分布着6个外显子,分别位于1-363、364-473、474-524、525-897、898-1 074、1 075-2 187位。2个尚未归类特征区(misc_feature)885-887和912-914位,2个序列标签位点(sequence-tagged site,STS)1941-2097和2037-2159位。使用在线服务程序Promoter Scan分析pim-2基因,在2-252位预测分值为89,为启动子区。启动子位于结构基因5′端上游,具有活化RNA聚合酶、转录起始的特异性。它本身并不控制基因活动,而是通过转录因子的结合而控制基因活动。当启动子发生基因突变,将导致基因表达障碍,可引起恶性肿瘤。使用在线服务器ORF Finder分析pim-2基因的阅读框,pim-2基因分布着多段开放式阅读框,可编码相应的肽链,如图 1所示。

其中蛋白质编码区(CDS)位于303-1238,长936 bp,编码一段311个氨基酸构成的肽链,编码序列为:MLTKPLQGPPAPPGTPTPPPGGKDREAFEAE-YRLGPLLGKGGFGTVFAGHRLTDRLQVAIK-VIPRNRVLGWSPLSDSVTCPLEVALLWKVGA-GGGHPGVIRLLDWFETQEGFMLVLERPLPA-QDLFDYITEKGPLGEGPSRCFFGQVVAAIQH-CHSRGVVHRDIKDENILIDLRRGCAKLIDFGS-GALLHDEPYTDFDGTRVYSPPEWISRHQYH-ALPATVWSLGILLYDMVCGDIPFERDQEILEA-ELHFPAHVSPDCCALIRRCLAPKPSSRPSLEE-ILLDPWMQTPAEDVPLNPSKGGPAPLAWSLLP。
2.2 CpG岛预测
使用在线服务器Urogene的Methprimer程序分析pim-2基因,在序列的启动子区域存在一段富含双核苷酸“CG”及磷酸酯键的重复序列,这段DNA片段被称为CpG岛。pim-2基因序列的CpG岛,位于48-487位,全长440 bp,预测结果如图 2所示。CpG岛易发生甲基化,DNA甲基化是在DNA甲基转移酶(DNA methyltransferase,DNAMTs)作用下将胞嘧啶第5位碳原子添加甲基基团,形成甲基化胞嘧啶(5-mC),再与3′端的鸟嘌呤结合形成甲基化CpG(methylation CpG,mCpG),并双链对称出现,这一过程可引起DNA构象、稳定性以及染色体结构的改变。由于pim-2基因的启动子与CpG岛重叠,启动子区发生CpG岛高甲基化后,在转录水平抑制基因表达,启动子区的高甲基化抑制基因转录的机制有以下几点:①mCpG的甲基化胞嘧啶伸入DNA双螺旋的主沟,抑制了DNA与多种转录因子的结合。②mCpG能抑制核因子-κB(nucleus factor-kappa B,NF-κB)、核转录因子2(elongation 2 factor,E2F)、增强子结合蛋白2(enhancer binding protein 2,AP-2)等序列特异性转录因子与DNA的结合。③mCpG激活DNA甲基转移酶相关蛋白1(DNA methyltransferase 1-associated protein 1,DMAP1)、肿瘤易感基因101(tumor susceptibility gene 101,TSG101)等阻遏蛋白因子,导致抑制蛋白转录。④乙酰化后的组蛋白H3、H4赖氨酸与DNA紧密结合,转录过程中难以解聚,从而抑制基因转录。另外基因甲基化导致突变率增高,自发出现5-甲基胞嘧啶脱氨形成胸腺嘧啶,再易发生C→T的突变。由上可见,CpG岛甲基化可抑制基因转录,改变亲代遗传印记,导致基因结构功能异常,使癌基因激活,造成一些疾病和肿瘤的发生。有文献报道很多肿瘤病例在确诊之前,如乳腺癌患者的血液、淋巴结标本、乳头导管分泌液,就已经明确出现甲基化阳性。

2.3 miRNAs基因预测
miRNAs是在一种内源性的具有调控功能的非编码RNA,长度约22个核苷酸,成熟后的miRNAs与靶基因mRNA的3′非编码区(3′Untranslated Regions,3′UTR)互补结合,抑制靶基因的翻译或降解切割,从而改变基因的表达[1]。通过数据库TargetScan,查找与pim-2基因配对的miRNAs,分析结果显示,pim-2基因3′UTR区域有一段与之互补的miRNAs互补片段,位于pim-2基因终止密码子下游区119-126位,与shsa-miR-200b、hsa-miR-200c、hsa-miR-429三种miRNAs能互补结合,相互交叉重叠。miRNAs的5′非编码区(5′UTR)与靶基因3′UTR完全互补结合后,靶mRNA可被分裂切割,蛋白质的合成被阻止,从而对细胞的增殖、分化、凋亡起到调节作用。当miRNAs的5′UTR与靶基因3′UTR发生不完全互补,则会抑制靶mRNA的翻译[2]。当一个靶基因能被多个miRNAs同时作用,常协同发生转录后抑制靶mRNA的作用,造成基因沉默。miRNAs若出现突变或异常表达,可引起多种人类肿瘤,大约50%得到注解的miRNAs都可以定位于在基因组上的肿瘤相关脆性位点,如纯合性缺失区、杂合性缺失区、断裂点区、扩增区、抑癌基因部位和近癌基因部位[3]。miRNAs与肿瘤的关系密切且多样,可发挥癌基因、抑癌基因、下调原癌基因活性、下调抑原癌基因活性的作用。
分析结果还显示该miRNAs靶基因序列在进化上有较高保守性,在人(Homo sapiens, Hsa)、黑猩猩(Pan troglodytes,Ptr)、猕猴(Macaca mulatta,Mml)、小耳大婴猴(Otolemur garnettii,Oga)、小家鼠(Mus musculus,Mmu)、褐家鼠(Rattus norvegicus,Rno)、豚鼠(Cavia porcellus,Cpo)、非洲象(Loxodonta africana,Laf)等多个物种之间保守存在,如图 3所示。进化保守一般意味着具有重要生理功能,转录蛋白具有特殊蛋白质位点,该位点位于重要功能区域内[4]。

2.4 Pim-2蛋白理化性质
使用生物信息学分析软件DNAMAN V6分析Pim-2蛋白序列,该肽链相对分子量为34 188.47,分子式为C1550H2401N417O433S12,预测等电点为5.78。通过线服务器expasy的protparam程序分析显示Pim-2蛋白的不稳定指数是45.87,消光系数为279 nm,脂肪指数91.25,平均亲水性-0.141。含38个酸性氨基酸,29个碱性氨基酸,53个亲水性氨基酸,112个疏水性氨基酸。肽链中含量最高的氨基酸是亮氨酸Leu(12.54%),其次是脯氨酸Pro(11.25%),甘氨酸Gly(9.65%)。肽链的氨基酸构成比如图 4所示。

2.5 转录蛋白共价修饰
蛋白共价修饰是蛋白质转录合成之后发生的共价修饰,修饰作用对功能发挥具有重要作用。使用在线服务器Prosite预测Pim-2蛋白可能的修饰位点[5],Pim-2蛋白序列上分布着6种13段蛋白质修饰位点,如表 1所示。

序列53-55、130-132、272-274位为蛋白激酶C磷酸化位点,蛋白激酶C能作用细胞质的靶酶调控生化反应,作用于细胞核中的转录因子调控基因表达,进而影响细胞的生长和分化。
序列25-32位为酪氨酸激酶磷酸化位点,酪氨酸激酶能将蛋白质上的某些酪氨酸残基磷酸化调节其功能,磷酸化的酪氨酸部位成为细胞内信号蛋白的结合位点,激活细胞内的生化反应,引起细胞的综合性应答。
序列195-198、204-207、276-279、288-291位为蛋白激酶CK2磷酸化位点,是典型的磷酸化受体部位,位点周围存在大量酸性氨基酸残基。蛋白激酶CK2是一类信使非依赖性丝/苏氨酸蛋白激酶,在很多肿瘤中表达失调、活性增高。其致癌机制很复杂,与下列因素有关:①CK2可影响c-myc癌基因(c-myelocytomatosis viral oncogene,c-myc)的稳定性,是肿瘤发生相关的Wnt信号的正性调节物[6];②CK2表达失衡,如c-myc联合CK2α转基因表达,可出现致癌潜能,可使小鼠出现白血病、淋巴瘤[7]。CK2还通过多条途径参与着细胞凋亡,作用于细胞质和细胞核的靶点,如半胱天冬酶-2(cysteinyl aspartate specific proteinase-2,Caspase-2)、核纤层蛋白A(nuclear lamina protein A,Lamin A)、凋亡抑制蛋白(inhibitor of apoptosis proteins,IAPs)等:①Caspase-2是CK2的靶点,被CK2作用后,可发生脱磷酸二聚作用后活化,使Bcl-2相关X蛋白(Bcl-2 Associated X Protein,BAX)转移到线粒体,释放出凋亡蛋白;②Lamin A的分裂程度常可用来指示核凋亡的活性,Lamin A与CK2之间的表达呈负相关,CK2表达下调时Lamin A分裂增强,CK2过度表达时Lamin A分裂被抑制;③IAPs能保护特定细胞抵抗凋亡,是一种抗凋亡基因表达产物,IAPs与CK2之间呈正相关的表达,当CK2被化学抑制剂抑制时,可导致IAPs水平降低,进而影响细胞凋亡[8]。
序列41-46、91-96、145-150位为N-豆蔻酰化位点。N-豆蔻酰化为豆蔻酰CoA与蛋白质N端甘氨酸残基成酰胺键,为不可逆的蛋白质脂酰基修饰方式。它在膜定位中起重要作用,豆蔻酰化残基穿梭于膜之间,可结合到疏水核心,能稳定蛋白质结构。插入质膜内脂层的豆蔻酰化残基可使膜容易相互作用,把细胞质内接受到的信号,通过核孔传递到核内。当豆蔻酰转移酶(N-Myristoyltransferase,NMT)活性过高,可导致蛋白质畸形豆蔻酰化,引起信号转导紊乱,导致肿瘤发生。据报道,Magnuson等发现早期结肠癌的细胞NMT活性异常增高。
2.6 泛素化位点预测
蛋白质泛素化是蛋白质翻译后的修饰模式,与细胞内蛋白质降解和细胞活动密切相关。预测蛋白质泛素化已有多种在线程序,如BDM-PUB、UbPred、CKSAAP_UbSite等。利用这些方法预测Pim-2蛋白的泛素化修饰,综合分析可见Pim-2蛋白上分布着5处泛素化得分较高位点,但第4和23位得分分别为0.114 845、0.120 762,超过阈值,可确定为泛素化位点,如图 5所示。泛素化是靶蛋白

上的特定赖氨酸残基与泛素分子共价结合,所形成肽键能促进蛋白质降解,该过程保守并可逆[9]。研究发现,细胞必须保持蛋白质的产生、降解动态平衡,才能使细胞功能正常,结构稳定。泛素与蛋白酶构成泛素-蛋白酶途径(ubiquitin-proteasome pathway,UPP)可选择性高效降解细胞内蛋白质,如癌基因、抑癌基因产物和短寿命细胞周期调节蛋白和变性变结蛋白等。当UPP系统对靶蛋白降解的部位、时间、速率出现功能失常,可引起抑癌蛋白异常降解、癌蛋白聚集、突变细胞凋亡受阻增殖加速,引起癌变。研究发现,其致癌机制有多种途径:①UPP系统调控着细胞周期依赖性蛋白激酶(cyclin-dependent protein kinases,CDKs)和细胞周期素(Cyclins),这二者控制着细胞周期转换,当泛素降解缺陷,导致Cyclins增高,一些恶性肿瘤的Cyclins表达异常增高。②UPP系统调控着细胞凋亡:B淋巴细胞瘤-2基因(B-cell lymphoma-2,Bcl-2)家族能促进具有凋亡作用的Bax表达,Bax进入线粒体后可活化半胱氨酸天冬氨酸蛋白酶-9(cysteinyl aspartate specific proteinase-9,Caspase-9),促进凋亡。随着前列腺癌的格利森评分(Gleason)增高,UPP对Bax蛋白的泛素化降解也明显增强。③UPP系统参与着一些关键蛋白和信号传导途径的调节:NF-κB、β-链蛋白(β-catenin)、抑癌基因p53(tumor suppressor p53)、表皮生长因子受体(epidermal growth factor receptor,EGFR)、第10号染色体缺失的磷酸酶和张力蛋白同源物基因(phosphatase and tensin hmmlogydeleted on ten,PTEN)[10]。
2.7 糖基化位点预测
蛋白糖基化是真核生物蛋白质翻译后的一种修饰,糖基转移酶将活化的单糖加到肽链上,而形成具有独特生物活性的糖蛋白[11]。使用在线生物信息学程序DictyOGlyc 1.1 Server分析Pim-2蛋白的糖基化结构,预测结果显示蛋白序列上存在4处糖基化位点,分别在15、17、140、272位。其分布如图 6如示。糖基化修饰是一种最普遍的蛋白质修饰,约50%的蛋白质经过糖基化修饰。蛋白质糖基化可调节受体与配体的作用,影响免疫分子的结构功能,控制蛋白质在细胞器之间的穿梭以及在细胞膜上的翻转[12],进而影响影响免疫分子的折叠、成熟、包装、投送、定位和稳定,以及影响T细胞功能、体液免疫的功能和免疫应答的强弱等。

2.8 其它蛋白质修饰预测
使用在线服务器biocuckoo的工具包,分析Pim-2蛋白的其它蛋白质修饰,包括小泛素相关修饰物(small ubiquitin-related modifier,SUMO)化、亚硝基化和棕榈酰化。使用程序SUMOsp 2.0.4,分析预测Pim-2蛋白SUMO化。该法是基于PSFS法,即连续前向特性选择法[13]。结果显示在蛋白序列的第165位,预测分值为2.886,存在SUMO化修饰序列RDIKDEN。SUMO修饰是一种依赖ATP的小蛋白共价修饰,能结合于组蛋白的赖氨酸残基。蛋白质经SUMO化修饰后更加稳定,并对其修饰底物具有广泛功能,如能调节蛋白质定位,调节蛋白质转录活性,调节细胞周期,拮泛素化作用,并能影响到蛋白的稳定性、核质转运、酶活性、蛋白之间、DNA-蛋白之间的相互作用等。蛋白质经SUMO化修饰后与肿瘤的发生发展关系密切,但致癌机制复杂,与P53、岗哨蛋白特异蛋白酶(sentrin-specificprotease,SENP)、瘦蛋白(Reptin蛋白)、肿瘤转移抑制基因1(kangai1, KAI1)、低氧诱导因子1(Hypoxia-inducible factor-1,HIF-1)、ETS转录因子家族(E-twenty six,Ets)等异常表达相关,一些致癌因素的机制已探明,一些尚在探索之中。如:①SUMO可激活P53转录活性,易化P53介导的细胞衰老,当SUMO化修饰减少,可降低P53的抑癌功能,导致癌症发生[14]。②SUMO化与去SUMO化处于动态平衡之中,位于细胞核内的SENP能逆转SUMO修饰,当SENP表达异常增高使SUMO化与去SUMO化的平衡被破坏,将导致调节功能发生异常。曾有文献报道大量前列腺癌患者SENP表达异常增高[15]。
使用程序GPS-YNO2 1.0分析预测Pim-2蛋白的亚硝基化位点,结果显示在Pim-2蛋白序列的80位,预测分值是23.022,存在亚硝基化序列PLSDSVTCPLEVALL。蛋白质亚硝基化是一氧化氮(nitric oxide,NO)氧化修饰半胱氨酸巯基(-SH)生成高分子量的亚硝基化蛋白质(protein S-nitrosylation,PSNO)和低分子量的亚硝基硫醇(s-nitrosothiols, RSNO)。蛋白硝基化改变了蛋白质的结构和功能,调节着很多生理、病理功能,如调控细胞信号转导,调控离子通道,调节膜受体功能,影响激酶活性,影响转录因子DNA结合活性,还参与细胞凋亡和炎症反应[16]。
使用生物信息学软件CSS-Palm 3.0,分析预测Pim-2蛋白质棕榈酰化结构,结果显示蛋白质序列在260位(AHVSPDCCALIRRCL)和266位(CCALIRRCLAPKPSS)预测分值为1.628、0.75,说明存在两段棕榈酰化序列。蛋白质棕榈酰化是蛋白质翻译后的一种脂质共价修饰,赋予蛋白质复杂的生理功能,如调节蛋白质活性、稳定性,参与调节多种细胞信号通路,介导蛋白质之间和蛋白质-脂质相互作用[17]。
2.9 抗原性指数分析
常用于预测蛋白质抗原性的软件有DNAMAN V6,使用软件DNAMAN V6分析Pim-2蛋白序列,结果显示蛋白序列存在16段抗原指数较高区域,如表 2所示。Pim-2蛋白序列的这些区段抗原指数值高,氨基酸残基亲水性强,二级结构易于形成转角和不规则卷曲,符合B细胞表位要求,说明该区段含潜在优势抗原表位,构成蛋白质表位的可能性较大[18]。

2.10 Pim-2蛋白空间结构模建
蛋白的功能发挥是与其空间结构和活性结构域密切相关,空间结构的不同很大程度上导致了其生物学功能多样性,将Pim-2蛋白序列提交通过专业网expasy的在线程序Swiss-Model同源模建Pim-2蛋白的空间构型。用Discovery Studio模建Pim-2蛋白的受体活性中心,受体活性中心呈球状结构,如图 7所示。受体活性中心是蛋白质结构和功能的重要组成部分,可按照能量互补、空间几何互补以及化学环境互补的原则,与相对应的配体互补结合,从而发挥相应的功能。Pim-2蛋白活性中心具体的生理作用、致癌机制尚未完全明确,与抗癌药物进行分子对接的研究工作也正在进行之中。

3 总结
pim-2是于1984年在染色体Xp11.23中被首次发现,后来发现在脑和淋巴样细胞广泛表达,具有丝氨酸/苏氨酸激酶活性的有效存活因子。在特定条件下,表现出原癌基因的作用,参与细胞抗凋亡作用及其信号转导,与多种肿瘤的发生发展密切相关。国内外学者对其展开了深入研究,取得一系列发现,pim-2具有抗凋亡特性,与B淋巴细胞瘤-xL(B-cell lymphoma-extra large,Bcl-xL)和蛋白激酶B(protein kinase B, PKB)类似,具有维持细胞大小的功能,在糖酵解时可维持线粒体膜蛋白完整,防止萎缩,在缺乏生长因子的状态下能够维持细胞的生存和合成代谢。pim-2抗凋亡受很多因素调节,如饱和性的影响,以及受白细胞介素3、4、6(interleukin-3, 4, 6, IL-3, 4, 6,)和γ干扰素等的影响。以色列希伯来大学的研究者发现,pim-2基因可转录出34、38和41 kDa的三种蛋白,三者N端不同但具有相同的活性中心,催化位点相同,其中34 kDa蛋白活性最强。Pim-2蛋白具有激酶作用,能使p21蛋白、促凋亡蛋白(Bcl-xl/Bcl-2-Associated Death promoter, BAD)发生磷酸化改变活性,抑制细胞凋亡。当凋亡和增生平衡被打破,可导致肿瘤发生。例如,研究发现非霍奇金淋巴瘤、淋巴细胞性白血病、急性骨髓性白血病等恶性肿瘤患者体内,pim-2水平表达异常增高。
pim-2是重要的原癌基因,它的结构和生物学功能、转录蛋白和激酶底物都是研究热点,并逐渐成为抗癌药物的新靶点。Pim-2激酶抑制剂是肿瘤治疗药物的研究方向。大多数研究分析了其在信号转导过程中的作用、致癌机制以及抗癌治疗设想,但未对pim-2的各特性做全面梳理归纳,故本研究用生物信息学的方法对pim-2从基因到蛋白层面都进行全面的分析和系统的总结。分析出pim-2基因分布的外显子,明确了启动子区,发现启动子区存在CpG岛,含有miRNAs基因互补片段。研究还分析了Pim-2蛋白的理化性质,发现蛋白序列上存在CK2、TYR、myristyl等多种蛋白共价修饰位点,以及泛素化位点、糖基化位点、SUMO化、亚硝基化和棕榈酰化修饰位点。预测出抗原指数,模建了空间结构。这些分析结果当中,CpG岛、miRNAs基因互补片段、CK2 phospho Site、泛素化位点、SUMO化等与致癌关系密切,并对各致癌机制做了分析归纳整理。外显子、理化性质、糖基化、亚硝基化、棕榈酰化、抗原指数、空间结构等,虽然不具备直接的致癌作用,但也是pim-2重要构成部分,会直接、间接地发挥着相应作用。通过这些基础性的研究工作,构建起pim-2的知识体系,可为进一步研究pim-2在各类肿瘤的发病机制、临床治疗和转归、预后,提供一定科学依据和必要的理论帮助。