选择性剪接对揭示自身免疫性疾病的发病机理、诊断和治疗预后具有重要意义。选择性剪接在自身免疫性疾病中普遍存在且无偏好性,其中外显子跳跃的剪接方式最为常见。5' 剪接、3' 剪接、外显子数量改变、受单核苷酸多态性影响的剪接以及基因表达量差异都会影响自身免疫性疾病的发生发展,并且同一个基因的不同单核苷酸多态性可以影响多种自身免疫性疾病的发生发展。该文对不同选择性剪接形式在不同的自身免疫性疾病中的作用进行了综述,旨在为进一步深入研究自身免疫性疾病的不同发展阶段以及不同含量剪接产物的调控机制提供一定依据。
引用本文: 周羽, 陈路, 刘新乐. 自身免疫性疾病中选择性剪接的作用. 华西医学, 2021, 36(8): 1132-1138. doi: 10.7507/1002-0179.202002225 复制
自身免疫性疾病是机体免疫系统功能异常导致机体攻击自身组织的疾病,其发病机制复杂,与基因环境等有关[1]。常见的自身免疫病有系统性红斑狼疮、类风湿性关节炎、多发性硬化症、干燥综合征、重症肌无力、1 型糖尿病和溃疡性结肠炎等。近年来,高通量测序技术研究显示,人类 92%~94% 的基因存在选择性剪接,一个基因转录成信使 RNA(messenger RNA,mRNA)后,在选择性剪接体的协助下可以产生多种不同结构蛋白的编码基因,从而增加蛋白多样性,影响疾病的发生发展[2-3]。选择性剪接形式多样,常见的有外显子数量改变、5' 剪接和 3' 剪接、受单核苷酸多态性影响的剪接和基因表达量差异。在人类纯化免疫细胞中开展的首次大规模多组学综合研究结果表明,大多数基因的表达和选择性剪接的细胞特异性是由遗传和表观共同协调调控的,而且对 345 个自身免疫性疾病的相关疾病位点分析显示,某些疾病发生是由 DNA 序列或者是表观遗传为主导的[4]。因此,本文对近年来不同选择性剪接形式在不同自身免疫性疾病中的作用进行了综述,旨在为进一步了解选择性剪接的作用机制提供依据。
1 选择性剪接概述
真核生物的基因表达调控是一个多层次的过程,包括基因水平、转录水平、转录后水平、翻译水平和翻译后水平的调控。转录后调控是 RNA 水平上的调控,具体过程是未成熟的 mRNA 通过 5' 加帽、剪接、3' 加尾和 RNA 编辑等,最终形成成熟的 mRNA。其中选择性剪接指的是在成熟 mRNA 形成的过程中,前体 mRNA 剪接时某些外显子或内含子被包含或排除在最后的成熟 mRNA 中,因此由 1 个基因产生 2 条或 2 条以上的具有不同碱基序列并行使相同或不同生物学功能的转录本。选择性剪接在细胞或个体的整个生命活动周期中发挥着重要作用,主要表现在影响蛋白质多样性、细胞代谢和疾病的发生发展等方面。选择性剪接具有多种形式,包括外显子跨越、可变 3' 剪接位点、可变 5' 剪接位点、互斥外显子和内含子保留。大部分选择性剪接外显子并不是条件选择的结果,因此有些预测的选择性剪接转录产物可能并不会被翻译成蛋白质[5]。生物体不同组织转录组的选择性剪接差异产生蛋白功能区域的缺失或者功能蛋白结构区域的不同剪接重组亚型,这些蛋白与蛋白会形成有相互联系的生命活动网络,这是不同选择性剪接体存在的理论依据[6-7]。这种生命活动网络的研究对于理解人类疾病的发病机理和易感性以及生命进化和个体发育都具有重要意义。
2 选择性剪接的鉴定
早期选择性剪接的鉴定方法是首先获取样本的转录本,通过逆转录反应获得互补 DNA 序列,在此基础上进行选择性剪接事件的鉴定。随着下一代高通量测序技术的发展,选择性剪接事件的鉴定主要通过表达序列标签数据、剪接区域微阵列和转录组测序数据分析获得[8]。基于转录组测序数据分析得到的选择性剪接事件,可以通过 Mats、Cuffdiff2、SplAdder 等操作精简的生物信息学工具进行分析[9]。如 SplAdder 可通过转录组测序数据进行选择性剪接事件鉴定或样本间的差异分析[10]。
3 选择性剪接的作用
选择性剪接造成基因表达的多样性是细胞生命活动和机体表型调节的重要手段。因此研究转录后 mRNA 选择性剪接的分子机制对自身免疫性疾病的诊断、治疗和预后都有重要指导意义。目前报道的自身免疫性疾病有 80 多种,其发病机制复杂,受遗传或环境因素影响较多[11]。近年来全基因组关联分析为这类疾病的研究提供了新思路,该方法可鉴定出成千上万的与疾病相关的基因突变,如发生在 5' 和 3' 剪接位点的突变及外显子和内含子剪接区域的单核苷酸多态性都会影响 mRNA 的剪接。虽然全基因组关联分析已鉴定出很多单核苷酸多态性与复杂疾病的关联性,但理解单核苷酸多态性功能仍面临挑战,因为全基因组关联分析位点的很多突变未知,而且很难验证单核苷酸多态性与疾病的直接相关性[12]。针对 Garfield 芯片与 10 种复杂性状的全基因组关联分析结果进行的富集分析显示,内含子保留相关的单核苷酸多态性显著富集于自身免疫性疾病[13]。而 Newman 等[14]首次研究了自身免疫性疾病患者不同淋巴细胞亚群选择性剪接的表达差异,并与疾病基因的多样性做了关联分析,发现自身免疫性疾病相关基因的表达量和选择性剪接事件较多,并且许多单核苷酸多态性与基因功能区域的剪接数量性状基因座相关联。此外,另有多项研究表明多种自身免疫性疾病中相关基因都发生了选择性剪接事件[15-39],见表 1。

3.1 5' 剪接和 3' 剪接
3.1.1 系统性红斑狼疮
系统性红斑狼疮是一种多发于青年女性的累及多脏器的自身免疫性炎症性结缔组织病,其发病机制复杂,可能与Ⅰ型干扰素通路的激活有关,该通路的调控因子干扰素调节因子 5 是炎症和免疫应答的重要转录因子。Graham 等[33]研究发现 rs2004640 的单核苷酸多态性可以在干扰素调节因子 5 基因的 1 号外显子的 5'端形成 1 个剪接位点,不同的剪接产物形式发挥不同的生物学功能,而且这些不同类型的干扰素调节因子 5 是系统性红斑狼疮的高危遗传因子。
3.1.2 自身免疫性甲状腺疾病
桥本氏甲状腺炎是妇女中常见的一种自身免疫性疾病,20%~30% 患者的发病可能与基因易感性和环境因素导致的自身免疫攻击有关[40]。有研究显示与 P53 同源的细胞核蛋白编码基因 P63 通过 3' 端的选择性剪接可以形成多种亚型,P63 的表达与桥本甲状腺炎和甲状腺乳头状癌的病理学表现相关。P63 的免疫组化分析可以检测到 6 种亚型,在桥本甲状腺炎患者中 P63 呈阳性,而正常的甲状腺组织中则是阴性[34-35]。
3.1.3 重症肌无力
重症肌无力是神经和肌肉的接头部位发生传递功能障碍的一种自身免疫性疾病。有研究显示,细胞毒性 T 淋巴细胞相关抗原 4(cytotoxic T-lymphocyte associated antigen-4,CTLA4)在 2 号外显子 3' 端有 1 个剪接,可以形成 LCTLA4,其在重症肌无力患者中比较常见;此外,在重症肌无力患者中检测到 2 种新亚型,分别是 ssCTLA4 和 wCTLA4,但这 2 种新亚型在重症肌无力疾病中的相关研究有限,其中 ssCTLA4 基因缺失 2 号和 3 号外显子,wCTLA4 基因在 4 号外显子5' 端有一个剪接位点[38]。
3.2 外显子数量改变
3.2.1 系统性红斑狼疮
在系统性红斑狼疮疾病相关基因的研究中,C 端含有凝结素结构域的Ⅱ型跨膜蛋白分化抗原 72 对 B 细胞表面受体免疫球蛋白 G 和免疫球蛋白 M 有信号下调作用,且分化抗原 72 的多态性与系统性红斑狼疮的致病性相关[41-43]。有研究显示,分化抗原 72 基因的 8 号内含子中的 13 个核苷酸有 1 个或 2 个重复和 4 个核苷酸缺失,研究表明其中具有 2 个重复可降低系统性红斑狼疮的患病风险[26]。这 2 种 8 号内含子改变都可以调控选择性剪接,当选择性剪接发生在 8 号外显子的跳跃,9 号外显子接着被翻译,最终 C 端 42 个氨基酸被 49 个氨基酸替代,这种改变与鼠科系统性红斑狼疮相关[26]。而具有锚蛋白重复序列的 B 细胞支架蛋白 1 的选择性剪接产物有 2 种形式,其中缺失 2 号外显子时编码的蛋白会缺失 1, 4, 5-三磷酸肌醇受体可能的结合区域[25]。由于具有锚蛋白重复序列的 B 细胞支架蛋白 1 在 B 细胞受体介导信号中的重要作用,具有锚蛋白重复序列的 B 细胞支架蛋白 1 结构不完整或者位点改变可能会影响重要的调控位点和功能结构域,其与系统性红斑狼疮的致病相关性很大;同时,具有锚蛋白重复序列的 B 细胞支架蛋白 1 基因有多个单核苷酸多态性位点,比如 rs3733197 在 7 号外显子上由 A 突变为 T,可能影响锚蛋白模体的编码[25]。
3.2.2 类风湿性关节炎
类风湿性关节炎相关研究也显示,外显子数量改变同样影响到相关基因的生物学功能[22]。肿瘤坏死因子-α 是介导细胞免疫应答的一种强大的细胞因子,肿瘤坏死因子-α 主要通过细胞表面肿瘤坏死因子受体 1 和肿瘤坏死因子受体 2 发挥生物学功能。选择性剪接后缺失 7 号和 8 号外显子的肿瘤坏死因子受体 2 基因编码的蛋白缺少跨膜区域,其选择性剪接产物可调节肿瘤坏死因子-α 的生物学功能,并且研究显示其在类风湿性关节炎患者血清中的含量比健康者高[22]。
3.2.3 1 型糖尿病
在 1 型糖尿病的研究中,基因发生外显子跳跃后的剪接产物含量的变化也与其发生相关[23-24, 44]。CTLA4 与机体免疫系统调节紊乱引起的疾病有关,缺失 3 号外显子(跨膜区域)的 CTLA4 亚型 sCTLA4 在小鼠和人类中都有表达;sCTLA4 通过增强调节性 T 细胞的功能参与系统的免疫调节活动,在转基因小鼠中减弱 sCTLA4 基因的表达量可以加剧 1 型糖尿病的发生[24, 44]。缺失 2 号外显子后产生的 liCTLA4 缺失了细胞外的结合区域,其 mRNA 表达水平与 1 型糖尿病模型中的非肥胖糖尿病小鼠患病风险相关[23]。
3.2.4 多发性硬化症
在多发性硬化症的研究中,白细胞介素-7 受体的 6 号外显子的剪接激活与其相关[15-16]。白细胞介素-7 受体的 α 链分化抗原 127 有 2 种 mRNA 剪接产物形式,进而影响白细胞介素-7 受体的基因和功能蛋白表达[15]。有研究显示,6 号外显子的单核苷酸多态性 C/T(rs6897932)会使剪接几率增高[45]。另一些学者的进一步研究表明,在 6 号内含子 AAUAAA 位点上的多聚腺苷酸化复合物的组装以及 6 号外显子较弱的 5' 端剪接位点与形成功能缺失的白细胞介素-7 受体蛋白相关[45-46]。
3.2.5 溃疡性结肠炎
在溃疡性结肠炎相关选择性剪接基因的研究中,蛋白质酪氨酸磷酸酶编码基因的 3 个单核苷酸多态性 rs886936、rs17130 和 rs8100586 位于 8 号外显子边缘,可以导致与免疫球蛋白类结构域关联的 9 号外显子的剪接,可能改变二聚体形成和配体识别,进而影响溃疡性结肠炎的发生发展[21]。
3.3 受单核苷酸多态性影响的选择性剪接
受单核苷酸多态性影响的选择性剪接与自身免疫性疾病的发生有关,而且同一个基因可能与不同的自身免疫性疾病的发生相关。例如程序性死亡蛋白-1 内含子的 1 个碱基突变与欧洲人的系统性红斑狼疮的发生相关,程序性死亡蛋白-1 的第 1 个结合位点被单核苷酸多态性中断,影响了位于内含子增强区的转录因子的结合[47]。有研究在 94 例 1 型糖尿病患者程序性死亡蛋白-1 基因测序中,发现 14 个单核苷酸多态性位点与 1 型糖尿病发生有关,其在患者中有 12.2%,而对照组只有 6.8%[48]。另外,类风湿性关节炎中也检测出与疾病发生相关的多个程序性死亡蛋白-1 的单核苷酸多态性位点[49]。
此外,发生单核苷酸多态性位点的基因可能间接影响自身免疫性疾病中关键基因的选择性剪接事件的发生。位于 13 号外显子上的驱动蛋白轻链 1 编码基因上单核苷酸多态性位点与多发性硬化症的发生相关,而且该位点可以导致基因的选择性剪接事件发生,产生不同功能的驱动蛋白,进一步可能降低神经胶质细胞产生的能量,从而降低髓鞘合成所需的能量[50]。激活的白细胞免疫球蛋白样受体具有单核苷酸多态性,其也与疾病的发生相关联。其中白细胞免疫球蛋白样受体 A2 基因的一个单核苷酸多态性(rs2241524 G4A)位于 6 号内含子和 7 号外显子的连接处,该突变破坏基因 3' 端剪接受体位点,导致最终编码的白细胞免疫球蛋白样受体 A2 亚型缺少 3 个氨基酸,并且临床研究结果显示这种新型的剪接产物在系统性红斑狼疮的发生中起重要作用[32]。
3.4 基因表达量差异
3.4.1 系统性红斑狼疮
系统性红斑狼疮的研究显示,患者的淋巴细胞中选择性剪接因子和剪接体组件成分的降低可能会使自身免疫抗原增加,从而间接刺激自身相应抗体产量增加[51]。可溶性的跨膜蛋白分化抗原 276 与红细胞和血红蛋白的含量相关,Sun 等[27]在 78 例系统性红斑狼疮患者的外周血中发现可溶性的跨膜蛋白分化抗原 276 表达量较健康对照者明显降低,可以作为系统性红斑狼疮疾病的检测指标和治疗靶点。程序性死亡蛋白-1 是 T 细胞、B 细胞和单核细胞表面表达的免疫调控受体[52],可溶性的程序性死亡蛋白-1 分子是基因选择性剪接的表达产物,有研究显示在 59 例系统性红斑狼疮患者样本中可溶性的程序性死亡蛋白-1 的表达量与对照组相比有明显上升[30]。此外,单核细胞体外刺激培养研究显示,完整的程序性死亡蛋白-1 和缺失 3 号外显子的程序性死亡蛋白-1 基因表达量升高,表明其两者在外周免疫耐受和自身免疫预防中有重要作用[31]。
3.4.2 甲状腺功能亢进
甲状腺功能亢进相关研究显示,细胞凋亡调控分子在多种组织中都有表达,细胞凋亡调控分子 L 是细胞凋亡调控分子的配体,其中细胞凋亡调控分子可溶性形式的选择性剪接产物和细胞凋亡调控分子 L 的相互作用可以阻止细胞程序性死亡[53-54]。其中,可溶性细胞凋亡调控分子缺少跨膜区域,在甲状腺毒症、毒性甲状腺肿以及亚临床甲状腺功能亢进患者中含量增加,而在手术后甲状腺功能正常的弥漫性毒性甲状腺肿患者中含量下降[36]。
3.4.3 多发性硬化症
炎症、脱髓鞘和轴突变性是引起多发性硬化性临床表现的主要病理学机制[55-56]。髓鞘抗原可诱导建立多发性硬化症动物模型[57],这些抗原包括髓鞘碱性蛋白、蛋白脂质蛋白、髓鞘相关糖蛋白和髓鞘少突胶质细胞糖蛋白[58]。少突胶质细胞系中表达的少突胶质细胞谱系基因-髓鞘碱性蛋白和经典的髓鞘碱性蛋白的 mRNA 前体有多种选择性剪接形式,其不同剪接产物形式的髓鞘碱性蛋白在基质金属蛋白酶的作用下可以裂解成一系列免疫原片段,进而影响疾病发生[17]。髓鞘少突胶质细胞糖蛋白可以通过与髓鞘少突胶质细胞糖蛋白抗体结合来防止脱髓鞘发生,因此髓鞘少突胶质细胞糖蛋白的不同选择性剪接形式影响多发性硬化症的致病性[19]。
3.4.4 口眼干燥综合症
口眼干燥综合症是一种临床表现为口干和眼干的慢性自身免疫性疾病,主要由唾液腺和泪腺受损累及其他外分泌腺及腺体外器官功能下降导致。黏蛋白 1 是唇腺合成的膜锚定的可溶性的黏蛋白,黏蛋白 1 具有 3 种选择性剪接形式,比较特别的是在口眼干燥症患者唇腺中分泌型黏蛋白 1 缺少胞内区域和跨膜区域[39]。口眼干燥症患者的研究显示,患者黏蛋白 1 的 mRNA 含量明显高于健康对照者,但是黏蛋白 1 不同剪接亚型对疾病的调控机制研究尚不清楚[39, 59]。
4 小结与展望
外显子数量改变、5' 剪接和 3' 剪接、受单核苷酸多态性影响的选择性剪接以及基因表达量差异都会影响自身免疫性疾病的发生发展。从自身免疫性疾病中选择性剪接的研究成果来看,剪接方式在自身免疫性疾病中普遍存在并且没有偏好性,其中外显子跳跃的剪接方式最为常见,逆转录聚合酶链反应仍然是基因剪接研究的常用方法。在某些自身免疫性疾病中发生选择性剪接事件的基因较多,剪接方式多样,如系统性红斑狼疮疾病中外显子跳跃和可变 5' 剪接方式都有,且都可能是疾病发生发展的重要原因。本文关注的自身免疫性疾病研究显示,部分自身免疫性疾病主要与剪接产物功能区域缺失相关[22-25, 39, 44]。通常发生外显子跳跃后的基因结构不完整,可能会使疾病中相关蛋白跨膜区、与其他因子结合的区域等功能结构域被破坏;而且外显子跳跃可能会产生一些新型的剪接产物,这些剪接产物的含量在患者和健康者中有一定差异。可变 5' 剪接产生的不同类型的剪接产物可能是疾病的高危遗传因子,而可变 3' 剪接产生的多种亚型在患者和健康者体内有明显差异。选择性剪接因子和剪接产物含量高低也可能预示着自身免疫性疾病的发生。疾病相关基因的单核苷酸多态性位点可能导致选择性剪接事件的产生或者使外显子被剪接的几率增高,间接影响疾病的发生发展,并且同一个基因有不同的单核苷酸多态性,与不同的自身免疫性疾病的发生发展相关。
综上所述,不同的自身免疫性疾病相关功能基因和调控因子编码基因剪接方面的深入研究,对揭示自身免疫性疾病的发病机理以及寻找疾病治疗新靶点具有深远的意义。但是目前选择性剪接在自身免疫性疾病中的研究处于初级阶段,其在自身免疫性疾病的不同发展阶段中的情况以及基因内含子保留的选择性剪接方式还有待进一步深入研究。此外,不同剪接产物在自身免疫性疾病患者中的表达量有差异,但有关其调控机制的研究有限,寻找显著差异的选择性剪接产物作为疾病治疗和检测的特定靶点可能是未来的研究方向,还需要更深入广泛的基础和临床研究来探讨。
自身免疫性疾病是机体免疫系统功能异常导致机体攻击自身组织的疾病,其发病机制复杂,与基因环境等有关[1]。常见的自身免疫病有系统性红斑狼疮、类风湿性关节炎、多发性硬化症、干燥综合征、重症肌无力、1 型糖尿病和溃疡性结肠炎等。近年来,高通量测序技术研究显示,人类 92%~94% 的基因存在选择性剪接,一个基因转录成信使 RNA(messenger RNA,mRNA)后,在选择性剪接体的协助下可以产生多种不同结构蛋白的编码基因,从而增加蛋白多样性,影响疾病的发生发展[2-3]。选择性剪接形式多样,常见的有外显子数量改变、5' 剪接和 3' 剪接、受单核苷酸多态性影响的剪接和基因表达量差异。在人类纯化免疫细胞中开展的首次大规模多组学综合研究结果表明,大多数基因的表达和选择性剪接的细胞特异性是由遗传和表观共同协调调控的,而且对 345 个自身免疫性疾病的相关疾病位点分析显示,某些疾病发生是由 DNA 序列或者是表观遗传为主导的[4]。因此,本文对近年来不同选择性剪接形式在不同自身免疫性疾病中的作用进行了综述,旨在为进一步了解选择性剪接的作用机制提供依据。
1 选择性剪接概述
真核生物的基因表达调控是一个多层次的过程,包括基因水平、转录水平、转录后水平、翻译水平和翻译后水平的调控。转录后调控是 RNA 水平上的调控,具体过程是未成熟的 mRNA 通过 5' 加帽、剪接、3' 加尾和 RNA 编辑等,最终形成成熟的 mRNA。其中选择性剪接指的是在成熟 mRNA 形成的过程中,前体 mRNA 剪接时某些外显子或内含子被包含或排除在最后的成熟 mRNA 中,因此由 1 个基因产生 2 条或 2 条以上的具有不同碱基序列并行使相同或不同生物学功能的转录本。选择性剪接在细胞或个体的整个生命活动周期中发挥着重要作用,主要表现在影响蛋白质多样性、细胞代谢和疾病的发生发展等方面。选择性剪接具有多种形式,包括外显子跨越、可变 3' 剪接位点、可变 5' 剪接位点、互斥外显子和内含子保留。大部分选择性剪接外显子并不是条件选择的结果,因此有些预测的选择性剪接转录产物可能并不会被翻译成蛋白质[5]。生物体不同组织转录组的选择性剪接差异产生蛋白功能区域的缺失或者功能蛋白结构区域的不同剪接重组亚型,这些蛋白与蛋白会形成有相互联系的生命活动网络,这是不同选择性剪接体存在的理论依据[6-7]。这种生命活动网络的研究对于理解人类疾病的发病机理和易感性以及生命进化和个体发育都具有重要意义。
2 选择性剪接的鉴定
早期选择性剪接的鉴定方法是首先获取样本的转录本,通过逆转录反应获得互补 DNA 序列,在此基础上进行选择性剪接事件的鉴定。随着下一代高通量测序技术的发展,选择性剪接事件的鉴定主要通过表达序列标签数据、剪接区域微阵列和转录组测序数据分析获得[8]。基于转录组测序数据分析得到的选择性剪接事件,可以通过 Mats、Cuffdiff2、SplAdder 等操作精简的生物信息学工具进行分析[9]。如 SplAdder 可通过转录组测序数据进行选择性剪接事件鉴定或样本间的差异分析[10]。
3 选择性剪接的作用
选择性剪接造成基因表达的多样性是细胞生命活动和机体表型调节的重要手段。因此研究转录后 mRNA 选择性剪接的分子机制对自身免疫性疾病的诊断、治疗和预后都有重要指导意义。目前报道的自身免疫性疾病有 80 多种,其发病机制复杂,受遗传或环境因素影响较多[11]。近年来全基因组关联分析为这类疾病的研究提供了新思路,该方法可鉴定出成千上万的与疾病相关的基因突变,如发生在 5' 和 3' 剪接位点的突变及外显子和内含子剪接区域的单核苷酸多态性都会影响 mRNA 的剪接。虽然全基因组关联分析已鉴定出很多单核苷酸多态性与复杂疾病的关联性,但理解单核苷酸多态性功能仍面临挑战,因为全基因组关联分析位点的很多突变未知,而且很难验证单核苷酸多态性与疾病的直接相关性[12]。针对 Garfield 芯片与 10 种复杂性状的全基因组关联分析结果进行的富集分析显示,内含子保留相关的单核苷酸多态性显著富集于自身免疫性疾病[13]。而 Newman 等[14]首次研究了自身免疫性疾病患者不同淋巴细胞亚群选择性剪接的表达差异,并与疾病基因的多样性做了关联分析,发现自身免疫性疾病相关基因的表达量和选择性剪接事件较多,并且许多单核苷酸多态性与基因功能区域的剪接数量性状基因座相关联。此外,另有多项研究表明多种自身免疫性疾病中相关基因都发生了选择性剪接事件[15-39],见表 1。

3.1 5' 剪接和 3' 剪接
3.1.1 系统性红斑狼疮
系统性红斑狼疮是一种多发于青年女性的累及多脏器的自身免疫性炎症性结缔组织病,其发病机制复杂,可能与Ⅰ型干扰素通路的激活有关,该通路的调控因子干扰素调节因子 5 是炎症和免疫应答的重要转录因子。Graham 等[33]研究发现 rs2004640 的单核苷酸多态性可以在干扰素调节因子 5 基因的 1 号外显子的 5'端形成 1 个剪接位点,不同的剪接产物形式发挥不同的生物学功能,而且这些不同类型的干扰素调节因子 5 是系统性红斑狼疮的高危遗传因子。
3.1.2 自身免疫性甲状腺疾病
桥本氏甲状腺炎是妇女中常见的一种自身免疫性疾病,20%~30% 患者的发病可能与基因易感性和环境因素导致的自身免疫攻击有关[40]。有研究显示与 P53 同源的细胞核蛋白编码基因 P63 通过 3' 端的选择性剪接可以形成多种亚型,P63 的表达与桥本甲状腺炎和甲状腺乳头状癌的病理学表现相关。P63 的免疫组化分析可以检测到 6 种亚型,在桥本甲状腺炎患者中 P63 呈阳性,而正常的甲状腺组织中则是阴性[34-35]。
3.1.3 重症肌无力
重症肌无力是神经和肌肉的接头部位发生传递功能障碍的一种自身免疫性疾病。有研究显示,细胞毒性 T 淋巴细胞相关抗原 4(cytotoxic T-lymphocyte associated antigen-4,CTLA4)在 2 号外显子 3' 端有 1 个剪接,可以形成 LCTLA4,其在重症肌无力患者中比较常见;此外,在重症肌无力患者中检测到 2 种新亚型,分别是 ssCTLA4 和 wCTLA4,但这 2 种新亚型在重症肌无力疾病中的相关研究有限,其中 ssCTLA4 基因缺失 2 号和 3 号外显子,wCTLA4 基因在 4 号外显子5' 端有一个剪接位点[38]。
3.2 外显子数量改变
3.2.1 系统性红斑狼疮
在系统性红斑狼疮疾病相关基因的研究中,C 端含有凝结素结构域的Ⅱ型跨膜蛋白分化抗原 72 对 B 细胞表面受体免疫球蛋白 G 和免疫球蛋白 M 有信号下调作用,且分化抗原 72 的多态性与系统性红斑狼疮的致病性相关[41-43]。有研究显示,分化抗原 72 基因的 8 号内含子中的 13 个核苷酸有 1 个或 2 个重复和 4 个核苷酸缺失,研究表明其中具有 2 个重复可降低系统性红斑狼疮的患病风险[26]。这 2 种 8 号内含子改变都可以调控选择性剪接,当选择性剪接发生在 8 号外显子的跳跃,9 号外显子接着被翻译,最终 C 端 42 个氨基酸被 49 个氨基酸替代,这种改变与鼠科系统性红斑狼疮相关[26]。而具有锚蛋白重复序列的 B 细胞支架蛋白 1 的选择性剪接产物有 2 种形式,其中缺失 2 号外显子时编码的蛋白会缺失 1, 4, 5-三磷酸肌醇受体可能的结合区域[25]。由于具有锚蛋白重复序列的 B 细胞支架蛋白 1 在 B 细胞受体介导信号中的重要作用,具有锚蛋白重复序列的 B 细胞支架蛋白 1 结构不完整或者位点改变可能会影响重要的调控位点和功能结构域,其与系统性红斑狼疮的致病相关性很大;同时,具有锚蛋白重复序列的 B 细胞支架蛋白 1 基因有多个单核苷酸多态性位点,比如 rs3733197 在 7 号外显子上由 A 突变为 T,可能影响锚蛋白模体的编码[25]。
3.2.2 类风湿性关节炎
类风湿性关节炎相关研究也显示,外显子数量改变同样影响到相关基因的生物学功能[22]。肿瘤坏死因子-α 是介导细胞免疫应答的一种强大的细胞因子,肿瘤坏死因子-α 主要通过细胞表面肿瘤坏死因子受体 1 和肿瘤坏死因子受体 2 发挥生物学功能。选择性剪接后缺失 7 号和 8 号外显子的肿瘤坏死因子受体 2 基因编码的蛋白缺少跨膜区域,其选择性剪接产物可调节肿瘤坏死因子-α 的生物学功能,并且研究显示其在类风湿性关节炎患者血清中的含量比健康者高[22]。
3.2.3 1 型糖尿病
在 1 型糖尿病的研究中,基因发生外显子跳跃后的剪接产物含量的变化也与其发生相关[23-24, 44]。CTLA4 与机体免疫系统调节紊乱引起的疾病有关,缺失 3 号外显子(跨膜区域)的 CTLA4 亚型 sCTLA4 在小鼠和人类中都有表达;sCTLA4 通过增强调节性 T 细胞的功能参与系统的免疫调节活动,在转基因小鼠中减弱 sCTLA4 基因的表达量可以加剧 1 型糖尿病的发生[24, 44]。缺失 2 号外显子后产生的 liCTLA4 缺失了细胞外的结合区域,其 mRNA 表达水平与 1 型糖尿病模型中的非肥胖糖尿病小鼠患病风险相关[23]。
3.2.4 多发性硬化症
在多发性硬化症的研究中,白细胞介素-7 受体的 6 号外显子的剪接激活与其相关[15-16]。白细胞介素-7 受体的 α 链分化抗原 127 有 2 种 mRNA 剪接产物形式,进而影响白细胞介素-7 受体的基因和功能蛋白表达[15]。有研究显示,6 号外显子的单核苷酸多态性 C/T(rs6897932)会使剪接几率增高[45]。另一些学者的进一步研究表明,在 6 号内含子 AAUAAA 位点上的多聚腺苷酸化复合物的组装以及 6 号外显子较弱的 5' 端剪接位点与形成功能缺失的白细胞介素-7 受体蛋白相关[45-46]。
3.2.5 溃疡性结肠炎
在溃疡性结肠炎相关选择性剪接基因的研究中,蛋白质酪氨酸磷酸酶编码基因的 3 个单核苷酸多态性 rs886936、rs17130 和 rs8100586 位于 8 号外显子边缘,可以导致与免疫球蛋白类结构域关联的 9 号外显子的剪接,可能改变二聚体形成和配体识别,进而影响溃疡性结肠炎的发生发展[21]。
3.3 受单核苷酸多态性影响的选择性剪接
受单核苷酸多态性影响的选择性剪接与自身免疫性疾病的发生有关,而且同一个基因可能与不同的自身免疫性疾病的发生相关。例如程序性死亡蛋白-1 内含子的 1 个碱基突变与欧洲人的系统性红斑狼疮的发生相关,程序性死亡蛋白-1 的第 1 个结合位点被单核苷酸多态性中断,影响了位于内含子增强区的转录因子的结合[47]。有研究在 94 例 1 型糖尿病患者程序性死亡蛋白-1 基因测序中,发现 14 个单核苷酸多态性位点与 1 型糖尿病发生有关,其在患者中有 12.2%,而对照组只有 6.8%[48]。另外,类风湿性关节炎中也检测出与疾病发生相关的多个程序性死亡蛋白-1 的单核苷酸多态性位点[49]。
此外,发生单核苷酸多态性位点的基因可能间接影响自身免疫性疾病中关键基因的选择性剪接事件的发生。位于 13 号外显子上的驱动蛋白轻链 1 编码基因上单核苷酸多态性位点与多发性硬化症的发生相关,而且该位点可以导致基因的选择性剪接事件发生,产生不同功能的驱动蛋白,进一步可能降低神经胶质细胞产生的能量,从而降低髓鞘合成所需的能量[50]。激活的白细胞免疫球蛋白样受体具有单核苷酸多态性,其也与疾病的发生相关联。其中白细胞免疫球蛋白样受体 A2 基因的一个单核苷酸多态性(rs2241524 G4A)位于 6 号内含子和 7 号外显子的连接处,该突变破坏基因 3' 端剪接受体位点,导致最终编码的白细胞免疫球蛋白样受体 A2 亚型缺少 3 个氨基酸,并且临床研究结果显示这种新型的剪接产物在系统性红斑狼疮的发生中起重要作用[32]。
3.4 基因表达量差异
3.4.1 系统性红斑狼疮
系统性红斑狼疮的研究显示,患者的淋巴细胞中选择性剪接因子和剪接体组件成分的降低可能会使自身免疫抗原增加,从而间接刺激自身相应抗体产量增加[51]。可溶性的跨膜蛋白分化抗原 276 与红细胞和血红蛋白的含量相关,Sun 等[27]在 78 例系统性红斑狼疮患者的外周血中发现可溶性的跨膜蛋白分化抗原 276 表达量较健康对照者明显降低,可以作为系统性红斑狼疮疾病的检测指标和治疗靶点。程序性死亡蛋白-1 是 T 细胞、B 细胞和单核细胞表面表达的免疫调控受体[52],可溶性的程序性死亡蛋白-1 分子是基因选择性剪接的表达产物,有研究显示在 59 例系统性红斑狼疮患者样本中可溶性的程序性死亡蛋白-1 的表达量与对照组相比有明显上升[30]。此外,单核细胞体外刺激培养研究显示,完整的程序性死亡蛋白-1 和缺失 3 号外显子的程序性死亡蛋白-1 基因表达量升高,表明其两者在外周免疫耐受和自身免疫预防中有重要作用[31]。
3.4.2 甲状腺功能亢进
甲状腺功能亢进相关研究显示,细胞凋亡调控分子在多种组织中都有表达,细胞凋亡调控分子 L 是细胞凋亡调控分子的配体,其中细胞凋亡调控分子可溶性形式的选择性剪接产物和细胞凋亡调控分子 L 的相互作用可以阻止细胞程序性死亡[53-54]。其中,可溶性细胞凋亡调控分子缺少跨膜区域,在甲状腺毒症、毒性甲状腺肿以及亚临床甲状腺功能亢进患者中含量增加,而在手术后甲状腺功能正常的弥漫性毒性甲状腺肿患者中含量下降[36]。
3.4.3 多发性硬化症
炎症、脱髓鞘和轴突变性是引起多发性硬化性临床表现的主要病理学机制[55-56]。髓鞘抗原可诱导建立多发性硬化症动物模型[57],这些抗原包括髓鞘碱性蛋白、蛋白脂质蛋白、髓鞘相关糖蛋白和髓鞘少突胶质细胞糖蛋白[58]。少突胶质细胞系中表达的少突胶质细胞谱系基因-髓鞘碱性蛋白和经典的髓鞘碱性蛋白的 mRNA 前体有多种选择性剪接形式,其不同剪接产物形式的髓鞘碱性蛋白在基质金属蛋白酶的作用下可以裂解成一系列免疫原片段,进而影响疾病发生[17]。髓鞘少突胶质细胞糖蛋白可以通过与髓鞘少突胶质细胞糖蛋白抗体结合来防止脱髓鞘发生,因此髓鞘少突胶质细胞糖蛋白的不同选择性剪接形式影响多发性硬化症的致病性[19]。
3.4.4 口眼干燥综合症
口眼干燥综合症是一种临床表现为口干和眼干的慢性自身免疫性疾病,主要由唾液腺和泪腺受损累及其他外分泌腺及腺体外器官功能下降导致。黏蛋白 1 是唇腺合成的膜锚定的可溶性的黏蛋白,黏蛋白 1 具有 3 种选择性剪接形式,比较特别的是在口眼干燥症患者唇腺中分泌型黏蛋白 1 缺少胞内区域和跨膜区域[39]。口眼干燥症患者的研究显示,患者黏蛋白 1 的 mRNA 含量明显高于健康对照者,但是黏蛋白 1 不同剪接亚型对疾病的调控机制研究尚不清楚[39, 59]。
4 小结与展望
外显子数量改变、5' 剪接和 3' 剪接、受单核苷酸多态性影响的选择性剪接以及基因表达量差异都会影响自身免疫性疾病的发生发展。从自身免疫性疾病中选择性剪接的研究成果来看,剪接方式在自身免疫性疾病中普遍存在并且没有偏好性,其中外显子跳跃的剪接方式最为常见,逆转录聚合酶链反应仍然是基因剪接研究的常用方法。在某些自身免疫性疾病中发生选择性剪接事件的基因较多,剪接方式多样,如系统性红斑狼疮疾病中外显子跳跃和可变 5' 剪接方式都有,且都可能是疾病发生发展的重要原因。本文关注的自身免疫性疾病研究显示,部分自身免疫性疾病主要与剪接产物功能区域缺失相关[22-25, 39, 44]。通常发生外显子跳跃后的基因结构不完整,可能会使疾病中相关蛋白跨膜区、与其他因子结合的区域等功能结构域被破坏;而且外显子跳跃可能会产生一些新型的剪接产物,这些剪接产物的含量在患者和健康者中有一定差异。可变 5' 剪接产生的不同类型的剪接产物可能是疾病的高危遗传因子,而可变 3' 剪接产生的多种亚型在患者和健康者体内有明显差异。选择性剪接因子和剪接产物含量高低也可能预示着自身免疫性疾病的发生。疾病相关基因的单核苷酸多态性位点可能导致选择性剪接事件的产生或者使外显子被剪接的几率增高,间接影响疾病的发生发展,并且同一个基因有不同的单核苷酸多态性,与不同的自身免疫性疾病的发生发展相关。
综上所述,不同的自身免疫性疾病相关功能基因和调控因子编码基因剪接方面的深入研究,对揭示自身免疫性疾病的发病机理以及寻找疾病治疗新靶点具有深远的意义。但是目前选择性剪接在自身免疫性疾病中的研究处于初级阶段,其在自身免疫性疾病的不同发展阶段中的情况以及基因内含子保留的选择性剪接方式还有待进一步深入研究。此外,不同剪接产物在自身免疫性疾病患者中的表达量有差异,但有关其调控机制的研究有限,寻找显著差异的选择性剪接产物作为疾病治疗和检测的特定靶点可能是未来的研究方向,还需要更深入广泛的基础和临床研究来探讨。