简述

(1)锌指核酸内切酶(zinc finger endonuclease,ZFN):是第一代人工核酸内切酶

锌指是一类能够结合DNA的蛋白质,人类细胞的转录因子中大约有一半含有锌指结构,ZFN 是将锌指蛋白与核酸内切酶 Fok I融合形成的核酸内切酶,利用它可以在各种复杂基因组的特定位置制造 DNA 的双链切口(这就是英文文献中说到的DSB,当时只当是DNA双链断裂,却不知其实叫做双链切口)。

(2)类转录激活因子效应物核酸酶(transcription activator-like effector nuclease,TALEN):第二代人工核酸酶。

(3)Clustered regularly interspaced short palindromic repeats (CRISPR)/CRISPR-associated (Cas)9 第三代人工核酸内切酶(前两代就是ZFN和TAILEN)。(4)人工核酸内切酶(engineered endonuclease,EEN)

CRISPR一词正式登上历史舞台还是2002年的事。Jansen****实验室****通过生物信息学分析,发现这种新型DNA序列家族只存在于细菌及古生菌中,而在真核生物及病毒中没有被发现,并将这种序列称为规律间隔成簇短回文重复序列(clustered regularly interspaced short palindromic repeats, CRISPR)。他们将临近CRISPR locus的基因命名为cas(CRISPR-associated),并发现了4个cas基因(cas1, cas2, cas3, cas4。

CRISPR能在细菌的免疫功能中起作用由Horvath****研究组在2007首次得到实验证实。

2008年,Oost****实验室揭示了宿主细胞中CRISPR的间隔序列如何在cas蛋白的协助下介导发挥抗病毒作用。

2011年,Charpentier****研究组通过对人类病原体化脓性链球菌的差异化RNA测序,揭示了反式编码crRNA(tracrRNA)参与pre-crRNA的加工成熟过程。她们的研究证明,在双链RNA指导下切割双链DNA断裂的内切酶家族并揭示了CRISPR/Cas系统在RNA指导下进行基因编辑的巨大潜力。

2012年6月,Doudna****/Charpentier联合课题组在《科学》杂志上发表CRISPR/Cas9作为基因编辑技术的第一篇研究论文,首次在体外证明CRISPR/Cas9技术可以切割任何的DNA链,指出CRISPR在活细胞中修改基因的能力,并且完整的讨论了CRISPR在基因组编辑上的可行性

2013年1月,哈佛大学的George Church实验室和麻省理工学院/哈佛大学的Broad****研究所的张锋课题组在同一期的《科学》杂志上发表文章,证实了CRISPR/Cas9基因编辑技术被成功地运用到人类细胞的基因组,实现了CRISPR在哺乳动物细胞的基因编辑

Jennifer Doudna和Emmanuelle Charpentier重在CRISPR/Cas9技术的基础研究,而张峰和George Church在各种人类细胞中的应用方面贡献较多,其中张锋对CRISPR/Cas9技术方面的改进也有突出的贡献。

Clustered Regularly Interspaced Short Palindromic Repeats(CRISPR):是在细菌中发现的有规律成簇又带间隔的短回文序列,可以帮助细菌抵抗噬菌体的入侵,是细菌针对噬菌体的获得性免疫。CRISPR-Cas系统是原核生物的一种天然免疫系统。某些细菌在遭到病毒入侵后,能够把病毒基因的一小段存储到自身的 DNA 里一个称为 CRISPR 的存储空间。当再次遇到病毒入侵时,细菌能够根据存写的片段识别病毒,将病毒的DNA切断而使之失效。

CRISPR locus是由几个原件构成,如下图:一开始是个反向转录的RNA,是特异的非编码RNA,可以和重复序列部分互补(trancrRNA,橙色矩形),后面是各种cas基因(箭头表示),接着是CRISPR排列(棕色的菱形是重复序列,彩色的是间隔)。而这些间隔序列是细菌从噬菌体DNA中获得的遗传序列:当噬菌体感染细菌,细菌激活相关的cas基因——Cas1,Cas2,和Csn2,将其中新的间隔序列整合到自身的CRISPR arry中。一旦获得新的间隔序列以后,新的spacer就会出现在pre-crRNA中,此时tracrRNA与不同的SPACER互补,在RNaseIII的作用下,产生crRNA,进一步在其他未知的核酸酶的作用,剪切crRNA的5'端,使得引导序列长为20nt。如果噬菌体注入DNA,那么这个免疫系统将被激活,来干扰剪切噬菌体DNA,起到获得性免疫作用。

经过广谱检测,人们发现了三种主要的CRISPR系统,它们由CRISPR-associated (Cas)基因、非编码rna和一组独特的重复元素(直接重复)组成,而这些重复序列则由来自外源性DNA靶点(即原间隔体)的短可变序列直接间隔开来;重复序列+间隔序列=CRISPR RNA (crRNA) array。在有DNA靶点的情况下,每一个间隔序列都有一个前间区序列邻近基序(PAM——Ⅱ型系统的PAM基序为5-NGG-3)。

II型CRISPR系统是最具特征的系统之一,它由核酸酶Cas9、编码引导rna的crRNA阵列和有助于将crRNA阵列加工成离散单元的所需辅助反式激活crRNA (tracrRNA)组成

S. pyogenes亚型II-A Cas9(1368个氨基酸)是基因组工程中研究最多、使用最多的Cas9版本。其优势是:氨基酸序列相对较小,方便操作,且只是需要一个DNA内切酶Cas9来对与sgRNA20个互补碱基的带有PAM结构的DNA进行剪切。剪切后是DNA产生平末端的DSB(双链断裂),然后在进行非同源的末端连接(NHEJ)过程中,容易随机插入或者删除或者替换。或者进行高保真的同源定向修复(HDR),修复DNA。

CRISPR RNA (crRNA) array,编码gRNA,再加上tracrRNA,则可达到定位+编辑的功能,gRNA用于引导,tracrRNA用于结合靶点。把crRNA和tracrRNA合在一起,成为了single-guide RNA,即sgRNA,而通过修改tracrRNA的序列,在理论上可以on-target任何目的靶点。

这项技术主要由sgRNA定位到一个基因位点上,由Cas9酶在该位点进行DNA双链的切割,切割导致DNA修复通路的激活,使得其它的碱基加入进切割的位点,造成frameshift突变,使得基因无法被表达成功能性蛋白。

DOI:10.1146/annurev-biophys-062215-010822

==PAM是target DNA上的一小段序列==,不同的Cas9识别不同PAM。

拿Streptococcus pyogenesis中的Cas9来说,它识别的PAM是5′-NGG-3′c因此在设计sgRNA的时候,需要先找到GG,然后取其旁边的序列。

大部分基因序列都有GG。但如果没有GG,就用其它细菌提出来的Cas9来做。

Cas9会在PAM上游第三个碱基后切断双链,由Cas9的HNH和RuvC部分来进行剪切。

双链断裂(DSB)之后,会有两种修复方式发生的可能:

Non-Homologous End Joining (NHEJ)

Homology Directed Repair (HDR)

Cas9造成基因不被表达是由NHEJ修复通路引起,然而,Cas9造成的DSB并不一定会引发NHEJ,因为DSB end的碱基并没有任何损坏,这种end也叫blunt end,很容易再次粘连在一起,此时可以通过外源性同源重组引入Gene drive,或者说blunt end再次粘连在一起,sgRNA也会会再次识别这段序列,然后Cas9会再次切,反复下去,直到发生了由NHEJ引导出的突变,sgRNA才不会识别这段序列。

CRISPR基因序列主要由前导序列(leader)、重复序列(repeat)和间隔序列(spacer)构成。

①前导序列:富含AT碱基,位于CRISPR基因上游,被认为是CRISPR序列的启动子。

②重复序列:长度约20–50 bp碱基且包含5–7 bp回文序列,转录产物可以形成发卡结构,稳定RNA的整体二级结构。

③间隔序列:是被细菌俘获的外源DNA序列。这就相当于细菌免疫系统的“黑名单”,当这些外源遗传物质再次入侵时,CRISPR/Cas系统就会予以精确打击。

化脓性链球菌Cas9(以下称为SpyCas9)是大型(1,368个氨基酸)多结构域和多功能DNA核酸内切酶。它通过其两个不同的核酸酶结构域在PAM上游剪接dsDNA 3 bp:一个HNH样核酸酶结构域,其切割与指导RNA序列互补的DNA链(靶链),以及一个RuvC样核酸酶结构域,其负责切割DNA。与互补链相反的链(非目标链)。除了在CRISPR干扰中起关键作用外,Cas9还参与crRNA成熟和间隔区获取。

先简单介绍一下张锋实验室的CRISPR DOUBLE NICKASE

和普通Cas9不同的是,Cas9n (Cas9 Nickase)上有一个D10A的氨基酸突变,这个突变使得Cas9不再导致DNA双链断裂和NHEJ修复(一种会引来突变的修复),而是会引起单链断裂和BER修复(一种不会引起突变的修复),如下图

利用Cas9 nickase只能进行单链剪切的特性,张峰团队想到把两个Cas9 nickase共同作用在一个基因位点上,使其形成双链断裂(DSB),而非特异性结合则不会引起DSB,这样就降低了非特异性突变。

Cas9可以对靶基因组进行剪切,形成DNA的双链断裂。在通常情况下,细胞会采用高效的非同源末端连接方式(NHEJ)对断裂的DNA进行修复。但是,在修复过程中通常会发生碱基插入或缺失的错配现象,造成移码突变,(移码突变:是指DNA分子由于某位点碱基的缺失或插入,引起阅读框架变化,造成下游的一系列密码改变,使原来编码某种肽链的基因变成编码另一种完全不同的肽链序列。)使靶标基因失去功能,从而实现基因敲除。为了提高CRISPR系统的特异性,可将Cas9的一个结构域进行突变,形成只能对DNA单链进行切割造成DNA缺口的Cas9 nickase核酸酶。因此想要形成双链断裂的效果可以设计两条sgRNA序列,分别靶向DNA互补的两条链,这样两条sgRNA特异性的结合靶标序列,即可形成DNA断裂,并在修复过程中通过移码突变实现基因敲除

当DNA双链断裂后,如果有DNA修复模板进入到细胞中,基因组断裂部分会依据修复模板进行同源重组修复(HDR),从而实现基因敲入。修复模板由需要导入的目标基因和靶序列上下游的同源性序列(同源臂)组成,同源臂的长度和位置由编辑序列的大小决定。DNA修复模板可以是线性/双链脱氧核苷酸链,也可以是双链DNA质粒。HDR修复模式在细胞中发生率较低,通常小于10%。为了增加基因敲入的成功率,目前有很多科学家致力于提高HDR效率,将编辑的细胞同步至HDR最活跃的细胞分裂时期,促进修复方式以HDR进行;或者利用化学方法抑制基因进行NHEJ,提高HDR的效率

Cas9的特点是能够自主结合和切割目的基因,通过点突变的方式使Cas9的两个结构域RuvC-和HNH-失去活性,形成的dCas9只能在sgRNA的介导下结合靶基因,而不具备剪切DNA的功能。因此,将dCas9结合到基因的转录起始位点,可以阻断转录的开始,从而抑制基因表达;将dCas9结合到基因的启动子区域也可以结合转录抑制/活化物,使下游靶基因转录受到抑制或激活。因此dCas9与Cas9、Cas9 nickase的不同之处在于,dCas9造成的激活或者抑制是可逆的,并不会对基因组DNA造成永久性的改变。

将多个sgRNA质粒转入到细胞中,可同时对多个基因进行编辑,具有基因组功能筛选作用。多重编辑的应用包括:使用双Cas9nickases提高基因敲除的准确率、大范围的基因组缺失及同时编辑不同的基因。通常情况下,一个质粒上可以构建2~7个不同的sgRNA进行多重CRISPR基因编辑。

利用CRISPR-Cas9进行基因编辑可以产生大量的基因突变细胞,因此利用这些突变细胞可以确认表型的变化是否是由基因或者遗传因素导致的。基因组筛选的传统方法是shRNA技术,但是shRNA有其局限性:具有很高的脱靶效应以及无法抑制全部基因而形成假阴性的结果。CRISRP-Cas9系统的基因组筛选功能具有高特异性和不可逆性的优势,在基因组筛选中得到了广泛的应用。目前CRISPR的基因组筛选功能应用于筛选对表型有调节作用的相关基因,如对化疗药物或者毒素产生抑制的基因、影响肿瘤迁移的基因以及构建病毒筛选文库对潜在基因进行大范围筛选等。

方锐, 畅飞, 孙照霖, 等. CRISPR/Cas9 介导的基因组定点编辑技术[J]. 生物化学与生物物理进展, 2013, 40(8): 691-702.

Shalem O, Sanjana NE, Zhang F. High-throughput functional genomics using CRISPR-Cas9. Nat Rev Genet. 2015;16(5):299-311.

Jiang F, Doudna JA. CRISPR-Cas9 Structures and Mechanisms. Annu Rev Biophys. 2017;46:505-29.

2014, 343(6166): 84-87.

Ran FA, Hsu PD, Lin CY, Gootenberg JS, Konermann S, Trevino AE, et al. Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editing specificity. Cell. 2013;154(6):1380-9.

THE END
0.第二章基因组的结构与功能自测题5. 断裂基因(split gene) 6. 假基因(pseudogene) 7. 单顺反子RNA(monocistronic RNA) 8. 多顺反子RNA(polycistronic RNA) 9. 卫星DNA(satellite DNA) 10. 单拷贝序列(single copy sequence) (三)简答题 1.原核生物染色体中结构基因的特点是什么? 2.简述质粒的基本jvzquC41yy}/5?5fqe4dp8ftvkimg85a49627<<540nuou
1.核酸分子杂交技术DNA杂交生物在线Labon(1)单拷贝顺序(single copy sequence):在整个DNA分子中只出现一次或少数几次,主要是编码蛋白质的结构基因。除组蛋白、角蛋白和肌动蛋白以外,几乎所有的蛋白质基因都是单拷贝顺序,平均为1000碱基对。单拷贝基因在整个基因组织中所占比例最高。在人的细胞中约占DNA含量的一半。 jvzquC41yy}/drtqp0ipo7hp1fud1|mqycxuklqg0cyqAwjyukj>3@;
2.分子生物学辅导笔记生物医学笔记•真核基因的断裂结构 基因家族(gene family) 指核苷酸序列或编码产物的结构具有一定程度同源性的一组基因。 假基因(pseudogene) 在多基因家族中有的成员并不能表达出有功能的产物。 •1、核酸序列相同:即为多拷贝基因如rRNA基因家族,tRNA基因家族,组蛋白基因家族。 •2、核酸序列高度同源:如人类生长激素基因jvzq<84yyy4gtnjmcqbp7hqo1tpvn4ujgthorsi14627856/3903=7:;2<47B73:;890|mvon
3.分子生物学简答题细菌所包含的重组DNA分子可能为不同的染色体DNA片段,这样全部转化细菌所携带的各种染色体片段就代表了染色体的整个基因组。存在于转 化细菌内、由克隆载体所携带的各种染色体片段就代表了染色体的整个基因组。7.简述RNA的分类,各类RNA的结构特点及其在蛋白质生物 合成中的作用?(1)mRNA,5’端有帽子结构m7Gppp;3’端有pojvzq<84yyy4489iqe0ipo8hqpvkov8741282886;19>75A=;7a713@;::9960|mvon
4.分子生物学第二章da结构与功能.ppt●基因组DNA与蛋白质结合形成染色体,储存于细胞核内,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。 ●单顺反子:一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。 ●基因不连续性 断裂基因(interrupted gene)、内含子(intron)、外显子(exon) ●非编码区较多 多于编码jvzquC41oc~/dxtm33>/exr1jvsm1;53:1733A4734:46:5622625=60ujzn
5.杂质中出现这几类结构,警惕遗传毒性!点击上方的行舟Drug▲添遗传毒性杂质在很低的浓度下即可诱导基因突变以及染色体的断裂和重排,因而具有潜在的致癌性。在缺乏杂质安全性数据支持的情况下,在EMA,FDA以及ICH发布的指导原则中均将警示结构作为区分普通杂质和潜在遗传毒性杂质的主要标志。本文就警示结构的起源、发展和识别进行简要论述。 jvzquC41zwkrk~3eqo555B;36974;87345?:8?;
6.XRCC1转化医学网基因结构 XRCC1基因全称X-ray repair complementing defective repair in Chinese hamster cells 1,人类X射线交错互补修复基因1,位于第19号染色体19q13.2位置。XRCC1基因全长32.3kb,共有17个外显子,mRNA全长2,087nt,编码634个氨基酸残基组成的蛋白。 基因分子生物学功能 jvzquC41yy}/5?5|j{~/exr1jqsf/{jugcxdj6npfg~.tri/844tj}rn
7.高通量测序领域常用名词解释reads水平contig外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、Indel等具有较大的优势,但无法研究基因组结构变异如染色体断裂重组等。 mRNA测序 (RNA-seq) jvzquC41dnuh0lxfp0tfv8Iqtky`zr}k1cxuklqg1fkucrqu1:7:9>;:9
8.二染色体的结构异常《医学遗传学基础》许多物理、化学和生物因子可以引起染色体断裂(breakage),这些因子称为致断因子(clastogenic factor)或染色体断裂剂。此外,染色体也能自发断裂。断裂端被认为具有“粘性”,即易与其它断端接合或重连(reunion)。因此,一次断裂产生的两个粘性末端通常重连而修复如初。但有时出现非正常的重连,结果导致多种染色体结构异常。 jvzquC41yy}/|‚xl0eun0ls1nkrvp|mwlk5zkzg{kiiwjszwgpjeqz136853=3jvor