目前世界范围内约有 2.4 亿慢性乙型肝炎病毒(hepatitis B virus,HBV)感染者,HBV 感染是世界性的重大公共卫生难题。随着分子生物学工具的不断发展,目前第 3 代基因定点编辑技术 CRISPR/Cas9 作为热点已经广泛地应用于多种病毒的研究与实验性治疗中。该文简要回顾了 HBV 基因组的特点、基因编辑技术的发展及原理和 CRISPR/Cas9 在 HBV 基因组抑制中的研究现状及局限性。相对于锌指核糖核酸酶和转录激活因子样效应物核酸酶其他两种基因编辑技术,CRISPR/Cas9 技术极大地提高了基因编辑的能力。虽然目前仍属于概念证明阶段,但多数基础研究均证实了 CRISPR/Cas9 技术在体内外对 HBV 基因组具有编辑能力并能降低其 DNA 复制与病毒蛋白的表达能力。在潜在安全风险及基因编辑载体的输送效率等问题得到解决后,CRISPR/Cas9 技术联合逆转录抑制药物的治疗将为 HBV 感染的临床治愈带来曙光。
引用本文: 唐光敏, 周威龙. CRISPR/Cas9 技术在乙型肝炎病毒基因组抑制中的应用. 华西医学, 2017, 32(12): 1967-1971. doi: 10.7507/1002-0179.201606030 复制
据估计,目前世界范围内约有 2.4 亿慢性乙型肝炎病毒(hepatitis B virus,HBV)感染者,其主要分布于低中收入国家。慢性 HBV 感染的主要并发症包括肝硬化和原发性肝细胞癌。20%~30% 的慢性 HBV 感染者会逐渐进展为以上并发症,并因肝硬化和(或)原发性肝细胞癌造成每年约 65 万人的慢性 HBV 感染相关性死亡[1-2]。尽管有效的 HBV 疫苗已经被应用超过 30 年,成熟的高效核苷类似物抗病毒药物与新剂型的干扰素也已投入临床规范化治疗,HBV 仍然位居十大世界范围内导致人类死亡的疾病之列。随着分子生物学工具的不断发展,目前第 3 代基因定点编辑技术 CRISPR/Cas9 作为热点已经广泛地应用于多种病毒的研究与实验性治疗中。本文简要回顾了 HBV 基因组的特点、CRISPR/Cas9 的发展及原理和 CRISPR/Cas9 在 HBV 基因组抑制中的研究现状及问题,以期为进一步的研究提供相关背景知识。
1 HBV 基因组概述
HBV 为 DNA 病毒中的嗜肝病毒属,与其他病毒不同,HBV 基因组为松弛、环状、部分呈双链结构(relaxed circular DNA,rcDNA),长度约 3.2 kb。双链 5’端交错排列且相互配对以维持环状基因组结构,其中正链不完整拥有 5’端寡核苷酸帽;负链为完整环状,但在特定位点有缺口并由病毒 DNA 聚合酶共价链接。正负链 5’端均包含直接重复区域(direct repeats,DR),区域内含有对病毒复制起始十分关键的 11 个核苷酸左右的重复序列(负链上称为“DR1”,正链上称为“DR2”)。
HBV 的基因组高度压缩,拥有 4 组重叠的开放读码框,分别编码:① P(Pol)ORF 编码区编码基因复制的核心酶病毒多聚酶组,其拥有 DNA 多聚酶,逆转录酶,核酶 H 的功能还负责 rcDNA 结构中负链 5’端与 3’端的链接(末端蛋白);② C 核心区基因编码前核心蛋白与核心蛋白,它们参与包裹新生 rcDNA 构成核衣壳;③ S 表面区(surface,S)基因编码 3 种不同包膜糖蛋白——前 S1 蛋白、前 S2 蛋白、S 蛋白,负责靶细胞的结合及亚细胞结构的定位,介导免疫耐受;④ X 区编码X 蛋白在 HBV 感染慢性化及 HBV 相关肝细胞癌发病中有重要作用。此外基因组中还包含启动子、增强子等调控元件与多聚腺苷化作用和病毒装配的信号合成。rcDNA 进入细胞核后,利用宿主细胞DNA 修复机制将正链 5’端的寡核苷酸帽与负链 5’端的末端蛋白去除,恢复完整的正链并且链接负链 5’、3’端缺口形成具有超螺旋结构共价闭合环状 DNA (covalently closed circular DNA,cccDNA)。cccDNA 一旦形成即标志着 HBV 感染成功,继而以负链为模板便可转录出前基因组 RNA(pre-genomic RNA,pgRNA)和 3 条亚基因组 RNA。这些 RNA 除拥有宿主 RNA 5’端帽子和 3’端 poly-A 结构以便在细胞质中表达外,pgRNA 5’端和 3’端尚有 ε 茎环结构参与病毒 DNA 复制。与其他逆转录病毒不同,嗜肝病毒 DNA 的复制是以 pgRNA 为模板合成的。首先病毒 DNA 多聚酶 N 端TP 结构域和 pgRNA 5’端 ε 茎环结构相结合,结构域上的羟基连接上一份子 5’-鸟嘌呤脱氧核苷酸 dGMP,后续核苷酸以茎环突出部分序列为模板添加于其后。而后新生的 DNA 转移到 pgRNA 3’端互补序列上形成第 1 次引物转移,其机制尚不清楚。转移后的 DNA 链以 pgRNA 为模板从其 3’端向 5’端方向逆转录形成 HBV DNA 的负链。逆转录过程的同时,作为模板的 pgRNA 则在核酶 H 作用下逐步降解直至只剩下其 5’端一段包含 DR1 序列长 15~18 nt 的寡核酸片段作为合成正链引物,负链完成后,其末端(3’端)由聚合酶 TP 结构域的羟基共价连接于其 5’端。同负链合成起始类似未降解的 pgRNA 寡核苷酸序列此时转移到负链 5’端下游互补的 DR2 区域,发生第 2 次引物转移且指导新生正链朝负链 5’端方向延长。当正链延长到负链 5’端时即发生模板转换,转换后的正链以负链 3’端序列为模板继续延伸,此时整个基因组也因双链碱基的互补配对呈现环形。
值得注意的是,HBV 基因组的复制、成熟及其表达和表达后的调控同步进行。这意味着以 pgRNA 为模板翻译的核心蛋白完成后,将随即包裹基因组并引导其进入肝细胞内质网。由于核心蛋白的包裹,病毒复制系统无法获得细胞浆中的游离三磷酸脱氧核糖核苷酸 dNTP 作为正链继续延伸的原料,导致正链合成的暂停或终止,形成嗜肝病毒特征性的 rcDNA。这些带有核衣壳的 rcDNA 或再次进入细胞核形成 cccDNA 维持核内 cccDNA 池的稳定,或进入分泌途径包装成致病性的病毒颗粒外排。少数时候,上述第 2 次引物转移不会发生,新生正链以位于负链 3’端的 pgRNA 引物为模板开始原位扩增,这将导致双链线状 DNA(double stranded linear DNA,dslDNA)代替 rcDNA。dslDNA 在 HBV 自然感染中的意义尚不清楚,但研究表明 dslDNA 仍然具有形成 cccDNA、表达基因组信息的能力,还可优先与宿主基因组发生融合。
2 基因编辑技术发展历程及原理
2.1 早期发展的两种基因编辑技术
限制性内切酶于 20 世纪 60 年代被首次分离鉴定,该酶可识别 DNA 中特定的片段并将其从内部或周边切断以保护产生该酶的细菌免受特异性噬菌体的裂解,宿主细胞则由修饰酶在内切酶识别的特异位点产生诸如腺嘌呤甲基化等的碱基共价修饰以保护噬菌体 DNA 清除过程中宿主 DNA 的完整。因此,限制性内切酶迅速成为基因重组研究中及其重要的工具。但自然界中内切酶识别的片段往往较短且呈回文结构,即便选择拥有最长识别片段的限制性内切酶,其作用区域远达不到大型病毒、哺乳动物基因组特异性单位点诱变的需求[3]。锌指核酸酶(zinc finger endonuclease,ZFN)因其具有选择性修饰病毒以及细胞基因组的潜能被开发为第 1 代解决上述问题的新技术。不同锌指结构均含有约 30 个氨基酸的结构域,该结构域可以部分地特异结合 3 bp 长的 DNA 序列。将拥有不同 3 bp 序列的锌指结构进行聚合,可使其特异性结合区域延长到 18 bp,从而带来了高度选择地结合人类基因组特异位点的可能。但锌指结构自身不具备切割自身结合 DNA 序列的能力,为此往往将它们同非特异性 DNA 内切酶进行连接以完成 DNA 的裂解。FokⅠ 限制性内切酶是目前最为通用的 ZFN 内切酶,其优势在于 Fok Ⅰ 酶必须形成同源二聚体才能表现出内切活性。这样只需设计两个不同的 ZFN 使它们分别识别目标序列邻近部分相反链上的序列,锌指结构连接的 FokⅠ 单体便可形成二聚体精确切割目标序列。切割产生的缺口由易错性的非同源 DNA 末端裂解(non-homologous DNA end joining,NHEJ)途径进行修复,修复的结构往往导致目标区基因的插入或缺失突变使得目标基因沉默。相反,如果目标基因经过 NHEJ 修复“不幸”恢复野生型,ZFN 则继续在原区域进行特异性的结合——切割过程直到 NHEJ 修复产生的突变使得 ZFN 不能再特异性识别。
尽管 ZFN 已在哺乳动物细胞 DNA 编辑与抑制病毒 DNA 复制的工作中展现出卓越的实用性,然而构成 ZFN 体系锌指结构的目标序列往往无法严格达到设计要求的特异性,同时可以识别任意设计目标序列的锌指结构尚未被分离[4-5]。针对 ZFN 存在的问题,转录激活物样核酸酶(transcription activator like endonucleases,TALEN)作为第 2 代基因定点编辑技术被成功开发。TALEN 与 ZFN 的 DNA 结合模体结构不同,系由植物病原菌黄单胞杆菌中分离得到,包含 4~34 个氨基酸结构域,每一个结构域可高特异地识别单个 DNA 碱基对。像 ZFN 一样,针对研究目标,只要逐一添加识别特定碱基对得到两个 TALEN 异二聚体,使它们从两条链分别识别目标序列的上下游部分,再由其连接的 FokⅠ 内切酶特异性切割目标序列产生缺口,继而由易错性的修复引发诱变。通常情况下单个 TALEN 的识别序列一般为 16 bp,整个异二聚体覆盖约 32 bp 区域以提高结合的特异性,避免脱靶效应。与 ZFN 相比,尽管 TALEN 拥有更高的准确性、特异性,然而其合成的难度、费用较高,还存在一定的生物毒性,同时 TALEN 往往大于其病毒表达载体。以上因素在一定程度上限制了 TALEN 技术的应用[6]。
2.2 CRISPR/Cas9 技术
鉴于 ZFN 和 TALEN 技术的局限,CRISPR/Cas9 作为第 3 代基因定点编辑技术逐渐成为最新的研究热点。CRISPR/Cas 是成簇规律间隔短回文重复序列(clustered regularly interspaced short palindromic repeat sequences,CRISPR)及其相关蛋白(CRISPR-associated,Cas)系统的缩写。自然界中病毒是最为丰富的生物实体,它们能高效、快速地感染不同环境中的宿主[7]。相应地,作为感染目标的宿主也在进化中产生了以限制性内切酶为代表的非特异免疫和以 CRISPR/Cas 系统为代表的基于 RNA 介导的适应性免疫系统以清除病毒。野生的 CRISPR/Cas 系统根据其行使免疫功能作用的保守蛋白和蛋白-RNA 结合方式与 DNA 裂解机制不同可分为 3 个亚型(typeⅠ、typeⅡ、typeⅢ),亚型间具有以下相同的特征:① 由间隔序列(spacer)分割的保守成簇规律间隔短回文 CRISPR 片段;② spacer 主要来自于外源感染的噬菌体等流动性的基因元件;③ CRISPR 序列旁为 Cas 基因,其编码的 Cas 蛋白与 CRISPR 转录序列一同发挥免疫作用[8]。在外源噬菌体感染的初始阶段,各型 CRISPR/Cas 系统共表达的 Cas1-Cas2 蛋白识别外源 DNA 中的前间隔序列并将其剪接到宿主 CRISPR 的重复片段间形成新的 spacer。此过程中 typeⅠ 和 typeⅡ 需要 protospace 相邻的前间隔序列相邻模体(protospacer adjacent motif,PAM)的辅助。PAM 是一段 2~5 bp 长的保守序列,在任何基因组中只要存在 PAM,其侧翼的片段就都有被整合进入宿主 CRISPR 序列的可能。当 protospcaer 剪接到 CRISPR 序列中后,CRISPR 即转录成为一条前体 crRNA 继而进一步剪切为小片段的成熟 crRNA 分子。那些包含有获得性病毒基因序列的成熟 crRNA 将被包裹进入 CRISPR 核苷酸蛋白复合体(CRISPR ribonucleoprotein complexes,crRNP),并在再次接触同样的病毒感染时特异地介导病毒基因组降解[9-12]。3 种亚型构成的 crRNP 中保守蛋白分别是:typeⅠCas3 蛋白,typeⅡCas 9 蛋白,typeⅢCas10 蛋白;其中 CRISPR/Cas3(typeⅠ)和 CRISPR/Cas10(typeⅢ)除 crRNA 和保守蛋白外尚需募集其他蛋白才能发挥免疫作用,相对而言 CRISPR/Cas9(typeⅡ)仅需要 Cas9 蛋白和辅助的反式激活 RNA(trans-activating RNA,tracrRNA),因而成为 3 型中最理想的选择。
以目前研究中最普遍使用的化脓性链球菌 Cas9(Streptococcus pyogenes,Spy Cas9)蛋白为例说明使用 CRISPR/Cas9 进行基因编辑的原理。经 Cas1、Cas3 切割、含有识别外源 DNA 成熟 crRNA 中的保守序列和 tracrRNA 形成二聚体并与 Spy Cas9 聚合为 crRNP,Spy Cas9 与含有 5’-NGG-3’序列的 PAM 发生结合,如果结合的 DNA 双链恰好拥有与 crRNA5’端 spacer 的互补序列,则 Spy Cas9 将在 PAM 位点切割双链,其中 Cas9 蛋白 HNH 亚基负责 crRNA 互补链,RuvC 结构域负责非互补链的切割。切割位点由 NHEJ 机制修复。同时野生型 Spy Cas9 蛋白所需的 crRNA-tracrRNA 异二聚体可被基于目标基因而人工合成的带有茎环结构的 crRNA-tracrRNA 所取代,故而只需将它们含有目标片段互补序列的 crRNA、tracrRNA 和 cas9 一同装入载体即可进行目标细胞内靶基因的定点编辑[13-20]。
3 CRISPR/Cas9 对 HBV 基因组抑制的研究现状及局限性
理论上来说,只需选择 HBV 基因组中 4 个 ORF 及 7 种结构蛋白编码的任一序列作为目标进行基因编辑即可阻止 HBV 基因组的复制与表达。Lin 等[21]首次报道了 CRISPR/cas9 系统可以分别干扰体内及体外的 HBV 复制。研究中选择 HBV 特异 Cas9/sgRNA 和 HBV 表达质粒共转染 Huh7 肝癌细胞系细胞,共转染后细胞内 HBV 核定蛋白与 S 蛋白表达显著降低。该 Cas9/sgRNA 复合物也同样抑制了水转化小鼠模型中肝内 HBV 表达载体的表达,降低小鼠血清中乙型肝炎表面抗原(hepatitis B surface antigen,HBsAg)的水平。这些结果说明 CRISPR/cas9 系统能在体内外破坏 HBV 表达模板,有根除持续性 HBV 感染的潜力。Kennedy 等[22]进一步发现,选择慢病毒载体的 HBV 特异 Cas9/sgRNA 可在体外有效地将新感染 HBV HepaRG 细胞及慢性 HBV 感染 HepAD38 细胞中 HBV DNA 的合成降低 1 000 倍以上,cccDNA 的蓄积减少 10 倍以上,且使得绝大多数残余的病毒 DNA 突变失活,提示 CRISPR/cas 系统可作为清除慢性 HBV 感染体内 cccDNA 池的有力工具。在另一项研究中,Liu 等[23]报道基于 Cas9/sgRNA 介导的模板易错修复或模板清除,不同基因型 HBV 的 DNA 复制在体内外均可以被抑制,而且利用不同的 gRNA/Cas9 系统组合能有效清除 HBV DNA。Zhen 等[24]选择病毒表面蛋白 ORF 作为靶序列,HepG2.2.15 细胞培养液与水转化小鼠模型血清中的 HBsAg 水平经过 CRISPR/Cas9 干预均出现下降,鼠肝脏中的 HBV DNA 复制与 HBsAg 表达也被显著地抑制,而且 CRISPR/Cas9 系统能够使 HBV 的 DNA 产生有效突变;该研究结果表明,CRISPR/Cas9 可在体内外抑制 HBV 的复制和表达,可能成为治疗 HBV 感染的一种新方法。Dong 等[25]研究表明,在前 cccDNA 转染的 Huh7 细胞、HBV 复制性细胞 HepG2.2.15 及携带 cccDNA 的小鼠模型中 CRISPR/Cas 对于肝细胞内的 cccDNA 水平及病毒复制有抑制作用,说明 CRISPR/Cas9 系统能够准确、高效地靶向 HBV cccDNA 和抑制 HBV 复制。Ramanan 等[26]发现针对野生型 HBV 保守序列的 sgRNA 对体内外模型中病体分离 HBV 毒株的复制仍有抑制作用,证实了 CRISPR/Cas9 直接靶向作用于 HBV cccDNA 的抗病毒潜力。Karimova 等[27]发现,CRISPR/Cas9 可特异、高效地靶向切割 HBV 基因组的 S 区域和 X 区域中的保守序列,对 Hela 细胞、HEK293 细胞系中 HBV cccDNA 和宿主整合 HBV DNA 均具有裂解作用,进一步论证了 CRISPR/Cas9 用于治疗 HBV 感染的可行性。此外,Wang 等[28]研究报道,双 gRNAs 导向 CRISPR/Cas9 系统可有效破坏 A~D 基因型的 HBV 表达模板、抑制 HBV 病毒复制且无明显的细胞毒性,因而可能成为在慢性 HBV 感染患者中根除持续存在的 HBV cccDNA 的一种新策略。综上,近年的研究均证明了 CRISPR/Cas9 系统拥有在体内外抑制 HBV 基因组的复制与表达的能力,展现了其作为急慢性 HBV 感染新治疗方法的潜力。
虽然现阶段的研究均展示了 CRISPR/Cas9 在 HBV 治疗中良好的前景,但是仍存在以下问题。首先,HBV 并不严格的寄生于肝细胞,人体内一系列肝外细胞均能发现 HBV DNA 并且允许其复制[28-31]。为了达到 HBV 治疗的终点——彻底清除病毒,就必须将特异的 Cas9/sgRNA 序列运送到持续感染的肝细胞及肝外保毒细胞中。除此以外,为了在活体内发挥持续的抗病毒功效,载体还必须满足低免疫原性、高转染率,同时不与宿主基因 DNA 发生融合。针对以上要求,重组腺相关病毒载体是目前最佳的选择,但是其载量对于长度超过 4.5 kb 的人类Cas9 基因、sgRNA 和调控元件系统显然不足。为此必须选择更小的 Cas9 同源基因材料等对整个 Cas9/sgRNA 体系进行瘦身[32-33]。其次,即使 Cas9 基因编辑载体的构建难度远远低于 ZFN 与 TALENS,CRISPR/Cas9 却存在较高的脱靶现象,最甚者出现了 sgRNA 对基因组中高达 5 个核苷酸的错配位点进行编辑的案例[34]。对此,目前主要的几种解决办法是:① 利用只有切割单链活性的变异 Cas9 蛋白(Cas9 nickase,Cas9n)的“配对切割”策略——与标准的 Cas9 切割产生的 DNA 双链断链相比,Cas9 裂解产生的切口可以使用另一条完整链为模板完成修复,故要求进行修饰需要位点正反方向均为 5’-NGG-3’ 识别位点并同时出现两条 sgRNA 才能对目的位点进行剪切,该方法从理论上提高了修饰位点的特异性,而研究结果显示该技术可以使其脱靶率较野生 CRISPR/Cas 体系降低 1 500 倍以上[35];② 将 sgRNA5’端与目标序列互补的碱基长度缩短,Fu 等[36]的研究中显示 17 或 18 个 nt 的 sgRNA5’端目标序列互补区可以使得结合率提高 5 000 倍;③ 与上述相反——延长 sgRNA 的结合序列使之在两条链上从相反顺序接近目标序列,同时将它们与失去剪切酶活性的 Dead Cas9n(dCAS9)与FokⅠ 限制性内切酶结合,FokⅠ 限制性内切酶在 sgRNA 及 dCAS9 指导下对目的位点进行剪切,这一方法在人体细胞内的特异性较传统体系可提高约 140 倍[37]。然而,此法在降低脱靶率的同时也降低了基因编辑的效率。最后,在慢性 HBV 感染或者肝细胞癌的患者中经常可以发现 HBV 亚基因组 DNA 碎片整合到宿主基因组中[38],该现象提示,经由 CRISPR/Cas9 切割的 HBV DNA 片段也可能与宿主基因融合导致 InDel 突变,干扰素宿主基因的正常功能。
4 结语
CRISPR/Cas9 技术极大地提高了我们基因编辑的能力,开启了疾病基因治疗的新时代。虽然目前仍属于概念证明阶段,但多数基础研究均证实了 CRISPR/Cas9 技术在体内外对 HBV 病毒基因组具有编辑能力并能降低其 DNA 复制与病毒蛋白的表达能力。我们相信,随着 CRISPR/Cas9 技术不断发展和相关研究逐渐深入,在潜在安全风险及基因编辑载体的输送效率等问题解决后,CRISPR/Cas9 技术联合逆转录抑制药物的治疗将为 HBV 感染的临床治愈带来曙光。
据估计,目前世界范围内约有 2.4 亿慢性乙型肝炎病毒(hepatitis B virus,HBV)感染者,其主要分布于低中收入国家。慢性 HBV 感染的主要并发症包括肝硬化和原发性肝细胞癌。20%~30% 的慢性 HBV 感染者会逐渐进展为以上并发症,并因肝硬化和(或)原发性肝细胞癌造成每年约 65 万人的慢性 HBV 感染相关性死亡[1-2]。尽管有效的 HBV 疫苗已经被应用超过 30 年,成熟的高效核苷类似物抗病毒药物与新剂型的干扰素也已投入临床规范化治疗,HBV 仍然位居十大世界范围内导致人类死亡的疾病之列。随着分子生物学工具的不断发展,目前第 3 代基因定点编辑技术 CRISPR/Cas9 作为热点已经广泛地应用于多种病毒的研究与实验性治疗中。本文简要回顾了 HBV 基因组的特点、CRISPR/Cas9 的发展及原理和 CRISPR/Cas9 在 HBV 基因组抑制中的研究现状及问题,以期为进一步的研究提供相关背景知识。
1 HBV 基因组概述
HBV 为 DNA 病毒中的嗜肝病毒属,与其他病毒不同,HBV 基因组为松弛、环状、部分呈双链结构(relaxed circular DNA,rcDNA),长度约 3.2 kb。双链 5’端交错排列且相互配对以维持环状基因组结构,其中正链不完整拥有 5’端寡核苷酸帽;负链为完整环状,但在特定位点有缺口并由病毒 DNA 聚合酶共价链接。正负链 5’端均包含直接重复区域(direct repeats,DR),区域内含有对病毒复制起始十分关键的 11 个核苷酸左右的重复序列(负链上称为“DR1”,正链上称为“DR2”)。
HBV 的基因组高度压缩,拥有 4 组重叠的开放读码框,分别编码:① P(Pol)ORF 编码区编码基因复制的核心酶病毒多聚酶组,其拥有 DNA 多聚酶,逆转录酶,核酶 H 的功能还负责 rcDNA 结构中负链 5’端与 3’端的链接(末端蛋白);② C 核心区基因编码前核心蛋白与核心蛋白,它们参与包裹新生 rcDNA 构成核衣壳;③ S 表面区(surface,S)基因编码 3 种不同包膜糖蛋白——前 S1 蛋白、前 S2 蛋白、S 蛋白,负责靶细胞的结合及亚细胞结构的定位,介导免疫耐受;④ X 区编码X 蛋白在 HBV 感染慢性化及 HBV 相关肝细胞癌发病中有重要作用。此外基因组中还包含启动子、增强子等调控元件与多聚腺苷化作用和病毒装配的信号合成。rcDNA 进入细胞核后,利用宿主细胞DNA 修复机制将正链 5’端的寡核苷酸帽与负链 5’端的末端蛋白去除,恢复完整的正链并且链接负链 5’、3’端缺口形成具有超螺旋结构共价闭合环状 DNA (covalently closed circular DNA,cccDNA)。cccDNA 一旦形成即标志着 HBV 感染成功,继而以负链为模板便可转录出前基因组 RNA(pre-genomic RNA,pgRNA)和 3 条亚基因组 RNA。这些 RNA 除拥有宿主 RNA 5’端帽子和 3’端 poly-A 结构以便在细胞质中表达外,pgRNA 5’端和 3’端尚有 ε 茎环结构参与病毒 DNA 复制。与其他逆转录病毒不同,嗜肝病毒 DNA 的复制是以 pgRNA 为模板合成的。首先病毒 DNA 多聚酶 N 端TP 结构域和 pgRNA 5’端 ε 茎环结构相结合,结构域上的羟基连接上一份子 5’-鸟嘌呤脱氧核苷酸 dGMP,后续核苷酸以茎环突出部分序列为模板添加于其后。而后新生的 DNA 转移到 pgRNA 3’端互补序列上形成第 1 次引物转移,其机制尚不清楚。转移后的 DNA 链以 pgRNA 为模板从其 3’端向 5’端方向逆转录形成 HBV DNA 的负链。逆转录过程的同时,作为模板的 pgRNA 则在核酶 H 作用下逐步降解直至只剩下其 5’端一段包含 DR1 序列长 15~18 nt 的寡核酸片段作为合成正链引物,负链完成后,其末端(3’端)由聚合酶 TP 结构域的羟基共价连接于其 5’端。同负链合成起始类似未降解的 pgRNA 寡核苷酸序列此时转移到负链 5’端下游互补的 DR2 区域,发生第 2 次引物转移且指导新生正链朝负链 5’端方向延长。当正链延长到负链 5’端时即发生模板转换,转换后的正链以负链 3’端序列为模板继续延伸,此时整个基因组也因双链碱基的互补配对呈现环形。
值得注意的是,HBV 基因组的复制、成熟及其表达和表达后的调控同步进行。这意味着以 pgRNA 为模板翻译的核心蛋白完成后,将随即包裹基因组并引导其进入肝细胞内质网。由于核心蛋白的包裹,病毒复制系统无法获得细胞浆中的游离三磷酸脱氧核糖核苷酸 dNTP 作为正链继续延伸的原料,导致正链合成的暂停或终止,形成嗜肝病毒特征性的 rcDNA。这些带有核衣壳的 rcDNA 或再次进入细胞核形成 cccDNA 维持核内 cccDNA 池的稳定,或进入分泌途径包装成致病性的病毒颗粒外排。少数时候,上述第 2 次引物转移不会发生,新生正链以位于负链 3’端的 pgRNA 引物为模板开始原位扩增,这将导致双链线状 DNA(double stranded linear DNA,dslDNA)代替 rcDNA。dslDNA 在 HBV 自然感染中的意义尚不清楚,但研究表明 dslDNA 仍然具有形成 cccDNA、表达基因组信息的能力,还可优先与宿主基因组发生融合。
2 基因编辑技术发展历程及原理
2.1 早期发展的两种基因编辑技术
限制性内切酶于 20 世纪 60 年代被首次分离鉴定,该酶可识别 DNA 中特定的片段并将其从内部或周边切断以保护产生该酶的细菌免受特异性噬菌体的裂解,宿主细胞则由修饰酶在内切酶识别的特异位点产生诸如腺嘌呤甲基化等的碱基共价修饰以保护噬菌体 DNA 清除过程中宿主 DNA 的完整。因此,限制性内切酶迅速成为基因重组研究中及其重要的工具。但自然界中内切酶识别的片段往往较短且呈回文结构,即便选择拥有最长识别片段的限制性内切酶,其作用区域远达不到大型病毒、哺乳动物基因组特异性单位点诱变的需求[3]。锌指核酸酶(zinc finger endonuclease,ZFN)因其具有选择性修饰病毒以及细胞基因组的潜能被开发为第 1 代解决上述问题的新技术。不同锌指结构均含有约 30 个氨基酸的结构域,该结构域可以部分地特异结合 3 bp 长的 DNA 序列。将拥有不同 3 bp 序列的锌指结构进行聚合,可使其特异性结合区域延长到 18 bp,从而带来了高度选择地结合人类基因组特异位点的可能。但锌指结构自身不具备切割自身结合 DNA 序列的能力,为此往往将它们同非特异性 DNA 内切酶进行连接以完成 DNA 的裂解。FokⅠ 限制性内切酶是目前最为通用的 ZFN 内切酶,其优势在于 Fok Ⅰ 酶必须形成同源二聚体才能表现出内切活性。这样只需设计两个不同的 ZFN 使它们分别识别目标序列邻近部分相反链上的序列,锌指结构连接的 FokⅠ 单体便可形成二聚体精确切割目标序列。切割产生的缺口由易错性的非同源 DNA 末端裂解(non-homologous DNA end joining,NHEJ)途径进行修复,修复的结构往往导致目标区基因的插入或缺失突变使得目标基因沉默。相反,如果目标基因经过 NHEJ 修复“不幸”恢复野生型,ZFN 则继续在原区域进行特异性的结合——切割过程直到 NHEJ 修复产生的突变使得 ZFN 不能再特异性识别。
尽管 ZFN 已在哺乳动物细胞 DNA 编辑与抑制病毒 DNA 复制的工作中展现出卓越的实用性,然而构成 ZFN 体系锌指结构的目标序列往往无法严格达到设计要求的特异性,同时可以识别任意设计目标序列的锌指结构尚未被分离[4-5]。针对 ZFN 存在的问题,转录激活物样核酸酶(transcription activator like endonucleases,TALEN)作为第 2 代基因定点编辑技术被成功开发。TALEN 与 ZFN 的 DNA 结合模体结构不同,系由植物病原菌黄单胞杆菌中分离得到,包含 4~34 个氨基酸结构域,每一个结构域可高特异地识别单个 DNA 碱基对。像 ZFN 一样,针对研究目标,只要逐一添加识别特定碱基对得到两个 TALEN 异二聚体,使它们从两条链分别识别目标序列的上下游部分,再由其连接的 FokⅠ 内切酶特异性切割目标序列产生缺口,继而由易错性的修复引发诱变。通常情况下单个 TALEN 的识别序列一般为 16 bp,整个异二聚体覆盖约 32 bp 区域以提高结合的特异性,避免脱靶效应。与 ZFN 相比,尽管 TALEN 拥有更高的准确性、特异性,然而其合成的难度、费用较高,还存在一定的生物毒性,同时 TALEN 往往大于其病毒表达载体。以上因素在一定程度上限制了 TALEN 技术的应用[6]。
2.2 CRISPR/Cas9 技术
鉴于 ZFN 和 TALEN 技术的局限,CRISPR/Cas9 作为第 3 代基因定点编辑技术逐渐成为最新的研究热点。CRISPR/Cas 是成簇规律间隔短回文重复序列(clustered regularly interspaced short palindromic repeat sequences,CRISPR)及其相关蛋白(CRISPR-associated,Cas)系统的缩写。自然界中病毒是最为丰富的生物实体,它们能高效、快速地感染不同环境中的宿主[7]。相应地,作为感染目标的宿主也在进化中产生了以限制性内切酶为代表的非特异免疫和以 CRISPR/Cas 系统为代表的基于 RNA 介导的适应性免疫系统以清除病毒。野生的 CRISPR/Cas 系统根据其行使免疫功能作用的保守蛋白和蛋白-RNA 结合方式与 DNA 裂解机制不同可分为 3 个亚型(typeⅠ、typeⅡ、typeⅢ),亚型间具有以下相同的特征:① 由间隔序列(spacer)分割的保守成簇规律间隔短回文 CRISPR 片段;② spacer 主要来自于外源感染的噬菌体等流动性的基因元件;③ CRISPR 序列旁为 Cas 基因,其编码的 Cas 蛋白与 CRISPR 转录序列一同发挥免疫作用[8]。在外源噬菌体感染的初始阶段,各型 CRISPR/Cas 系统共表达的 Cas1-Cas2 蛋白识别外源 DNA 中的前间隔序列并将其剪接到宿主 CRISPR 的重复片段间形成新的 spacer。此过程中 typeⅠ 和 typeⅡ 需要 protospace 相邻的前间隔序列相邻模体(protospacer adjacent motif,PAM)的辅助。PAM 是一段 2~5 bp 长的保守序列,在任何基因组中只要存在 PAM,其侧翼的片段就都有被整合进入宿主 CRISPR 序列的可能。当 protospcaer 剪接到 CRISPR 序列中后,CRISPR 即转录成为一条前体 crRNA 继而进一步剪切为小片段的成熟 crRNA 分子。那些包含有获得性病毒基因序列的成熟 crRNA 将被包裹进入 CRISPR 核苷酸蛋白复合体(CRISPR ribonucleoprotein complexes,crRNP),并在再次接触同样的病毒感染时特异地介导病毒基因组降解[9-12]。3 种亚型构成的 crRNP 中保守蛋白分别是:typeⅠCas3 蛋白,typeⅡCas 9 蛋白,typeⅢCas10 蛋白;其中 CRISPR/Cas3(typeⅠ)和 CRISPR/Cas10(typeⅢ)除 crRNA 和保守蛋白外尚需募集其他蛋白才能发挥免疫作用,相对而言 CRISPR/Cas9(typeⅡ)仅需要 Cas9 蛋白和辅助的反式激活 RNA(trans-activating RNA,tracrRNA),因而成为 3 型中最理想的选择。
以目前研究中最普遍使用的化脓性链球菌 Cas9(Streptococcus pyogenes,Spy Cas9)蛋白为例说明使用 CRISPR/Cas9 进行基因编辑的原理。经 Cas1、Cas3 切割、含有识别外源 DNA 成熟 crRNA 中的保守序列和 tracrRNA 形成二聚体并与 Spy Cas9 聚合为 crRNP,Spy Cas9 与含有 5’-NGG-3’序列的 PAM 发生结合,如果结合的 DNA 双链恰好拥有与 crRNA5’端 spacer 的互补序列,则 Spy Cas9 将在 PAM 位点切割双链,其中 Cas9 蛋白 HNH 亚基负责 crRNA 互补链,RuvC 结构域负责非互补链的切割。切割位点由 NHEJ 机制修复。同时野生型 Spy Cas9 蛋白所需的 crRNA-tracrRNA 异二聚体可被基于目标基因而人工合成的带有茎环结构的 crRNA-tracrRNA 所取代,故而只需将它们含有目标片段互补序列的 crRNA、tracrRNA 和 cas9 一同装入载体即可进行目标细胞内靶基因的定点编辑[13-20]。
3 CRISPR/Cas9 对 HBV 基因组抑制的研究现状及局限性
理论上来说,只需选择 HBV 基因组中 4 个 ORF 及 7 种结构蛋白编码的任一序列作为目标进行基因编辑即可阻止 HBV 基因组的复制与表达。Lin 等[21]首次报道了 CRISPR/cas9 系统可以分别干扰体内及体外的 HBV 复制。研究中选择 HBV 特异 Cas9/sgRNA 和 HBV 表达质粒共转染 Huh7 肝癌细胞系细胞,共转染后细胞内 HBV 核定蛋白与 S 蛋白表达显著降低。该 Cas9/sgRNA 复合物也同样抑制了水转化小鼠模型中肝内 HBV 表达载体的表达,降低小鼠血清中乙型肝炎表面抗原(hepatitis B surface antigen,HBsAg)的水平。这些结果说明 CRISPR/cas9 系统能在体内外破坏 HBV 表达模板,有根除持续性 HBV 感染的潜力。Kennedy 等[22]进一步发现,选择慢病毒载体的 HBV 特异 Cas9/sgRNA 可在体外有效地将新感染 HBV HepaRG 细胞及慢性 HBV 感染 HepAD38 细胞中 HBV DNA 的合成降低 1 000 倍以上,cccDNA 的蓄积减少 10 倍以上,且使得绝大多数残余的病毒 DNA 突变失活,提示 CRISPR/cas 系统可作为清除慢性 HBV 感染体内 cccDNA 池的有力工具。在另一项研究中,Liu 等[23]报道基于 Cas9/sgRNA 介导的模板易错修复或模板清除,不同基因型 HBV 的 DNA 复制在体内外均可以被抑制,而且利用不同的 gRNA/Cas9 系统组合能有效清除 HBV DNA。Zhen 等[24]选择病毒表面蛋白 ORF 作为靶序列,HepG2.2.15 细胞培养液与水转化小鼠模型血清中的 HBsAg 水平经过 CRISPR/Cas9 干预均出现下降,鼠肝脏中的 HBV DNA 复制与 HBsAg 表达也被显著地抑制,而且 CRISPR/Cas9 系统能够使 HBV 的 DNA 产生有效突变;该研究结果表明,CRISPR/Cas9 可在体内外抑制 HBV 的复制和表达,可能成为治疗 HBV 感染的一种新方法。Dong 等[25]研究表明,在前 cccDNA 转染的 Huh7 细胞、HBV 复制性细胞 HepG2.2.15 及携带 cccDNA 的小鼠模型中 CRISPR/Cas 对于肝细胞内的 cccDNA 水平及病毒复制有抑制作用,说明 CRISPR/Cas9 系统能够准确、高效地靶向 HBV cccDNA 和抑制 HBV 复制。Ramanan 等[26]发现针对野生型 HBV 保守序列的 sgRNA 对体内外模型中病体分离 HBV 毒株的复制仍有抑制作用,证实了 CRISPR/Cas9 直接靶向作用于 HBV cccDNA 的抗病毒潜力。Karimova 等[27]发现,CRISPR/Cas9 可特异、高效地靶向切割 HBV 基因组的 S 区域和 X 区域中的保守序列,对 Hela 细胞、HEK293 细胞系中 HBV cccDNA 和宿主整合 HBV DNA 均具有裂解作用,进一步论证了 CRISPR/Cas9 用于治疗 HBV 感染的可行性。此外,Wang 等[28]研究报道,双 gRNAs 导向 CRISPR/Cas9 系统可有效破坏 A~D 基因型的 HBV 表达模板、抑制 HBV 病毒复制且无明显的细胞毒性,因而可能成为在慢性 HBV 感染患者中根除持续存在的 HBV cccDNA 的一种新策略。综上,近年的研究均证明了 CRISPR/Cas9 系统拥有在体内外抑制 HBV 基因组的复制与表达的能力,展现了其作为急慢性 HBV 感染新治疗方法的潜力。
虽然现阶段的研究均展示了 CRISPR/Cas9 在 HBV 治疗中良好的前景,但是仍存在以下问题。首先,HBV 并不严格的寄生于肝细胞,人体内一系列肝外细胞均能发现 HBV DNA 并且允许其复制[28-31]。为了达到 HBV 治疗的终点——彻底清除病毒,就必须将特异的 Cas9/sgRNA 序列运送到持续感染的肝细胞及肝外保毒细胞中。除此以外,为了在活体内发挥持续的抗病毒功效,载体还必须满足低免疫原性、高转染率,同时不与宿主基因 DNA 发生融合。针对以上要求,重组腺相关病毒载体是目前最佳的选择,但是其载量对于长度超过 4.5 kb 的人类Cas9 基因、sgRNA 和调控元件系统显然不足。为此必须选择更小的 Cas9 同源基因材料等对整个 Cas9/sgRNA 体系进行瘦身[32-33]。其次,即使 Cas9 基因编辑载体的构建难度远远低于 ZFN 与 TALENS,CRISPR/Cas9 却存在较高的脱靶现象,最甚者出现了 sgRNA 对基因组中高达 5 个核苷酸的错配位点进行编辑的案例[34]。对此,目前主要的几种解决办法是:① 利用只有切割单链活性的变异 Cas9 蛋白(Cas9 nickase,Cas9n)的“配对切割”策略——与标准的 Cas9 切割产生的 DNA 双链断链相比,Cas9 裂解产生的切口可以使用另一条完整链为模板完成修复,故要求进行修饰需要位点正反方向均为 5’-NGG-3’ 识别位点并同时出现两条 sgRNA 才能对目的位点进行剪切,该方法从理论上提高了修饰位点的特异性,而研究结果显示该技术可以使其脱靶率较野生 CRISPR/Cas 体系降低 1 500 倍以上[35];② 将 sgRNA5’端与目标序列互补的碱基长度缩短,Fu 等[36]的研究中显示 17 或 18 个 nt 的 sgRNA5’端目标序列互补区可以使得结合率提高 5 000 倍;③ 与上述相反——延长 sgRNA 的结合序列使之在两条链上从相反顺序接近目标序列,同时将它们与失去剪切酶活性的 Dead Cas9n(dCAS9)与FokⅠ 限制性内切酶结合,FokⅠ 限制性内切酶在 sgRNA 及 dCAS9 指导下对目的位点进行剪切,这一方法在人体细胞内的特异性较传统体系可提高约 140 倍[37]。然而,此法在降低脱靶率的同时也降低了基因编辑的效率。最后,在慢性 HBV 感染或者肝细胞癌的患者中经常可以发现 HBV 亚基因组 DNA 碎片整合到宿主基因组中[38],该现象提示,经由 CRISPR/Cas9 切割的 HBV DNA 片段也可能与宿主基因融合导致 InDel 突变,干扰素宿主基因的正常功能。
4 结语
CRISPR/Cas9 技术极大地提高了我们基因编辑的能力,开启了疾病基因治疗的新时代。虽然目前仍属于概念证明阶段,但多数基础研究均证实了 CRISPR/Cas9 技术在体内外对 HBV 病毒基因组具有编辑能力并能降低其 DNA 复制与病毒蛋白的表达能力。我们相信,随着 CRISPR/Cas9 技术不断发展和相关研究逐渐深入,在潜在安全风险及基因编辑载体的输送效率等问题解决后,CRISPR/Cas9 技术联合逆转录抑制药物的治疗将为 HBV 感染的临床治愈带来曙光。