CRISPR/Cas9 基因敲除技术介绍 1987 年, 日本大阪大学 (Osaka University) 的科研人员在对一种细菌编码的碱性磷酸酶 (alkaline phosphatase) 基因进行研究时, 发现在这个基因编码区域的附近存在一小段不同寻常的 DNA 片段, 这些片段是由简单的重复序列组成的, 而且在片段的两端还存在一段不太长的特有的序列 不过这在当时并没有引起太多人的注意, 报道只不过是一篇普普通通的小文章 关于这样一个重复序列他们当时在论文中是这样评价的 我们目前也不太清楚这些序列的生物学意义 不过这个在差不多三十年之前取得的不起眼的 小发现 现在却绽放出了耀眼的光芒, 因为如今科学家正是利用这个小片段找到了一种可对多种生物的基因组进行遗传改造的工具, 而且这种方法操作起来非常地简单, 即现在被称为简便而又实用的基因组改造新技术 CRISPR/Cas 基因敲除技术 1 技术来源 规律成簇的间隔短回文重复序列 (CRISPR,Clustered Regularly Interspaced Short Palindromic Repeats) 是一类独特的 DNA 直接重复序列家族, 它的结构非常稳定, 长度约 25~50bp 的重复序列 (repeats) 被单一序列 (spacers) 间隔 CRISPR 是细菌和古细菌为应对病毒和质粒不断攻击而演化来的获得性免疫防御机制, 广泛存在于众多原核生物基因中, 其中 II 型为 CRISPR/Cas 免疫系统依赖 Cas9 内切酶家族靶向和剪切外源 DNA 自 2002 年首次被人们所定义以来,CRISPR 一直以其奇特的结构与特殊的功能吸引着各国科学家们的共同关注 在这一系统中,crRNA(CRISPR-derived RNA) 通过碱基配对与 tracrrna (trans-activating RNA) 结合形成双链 RNA, 此 tracrrna/ 图 1 CRISPR/Cas 系统 1
crrna 二元复合体指导 Cas9 蛋白在 crrna 引导序列靶定位点剪切双链 DNA, 其中 Cas9 的 HNH 核酸酶结构域剪切互补链, 其 RuvC-like 结构域剪切非互补链 具体图 4 所示 2 CRISPR 的基本结构 随着细菌基因组学的发展,CRISPR 的基本结构已逐渐被确定, 由短的高度保守的 repeat 与长度相似的非重复的 spacers 序列间隔排列所组成 ( 图 2-A) Repeats 是一组高度保守的短小序列, 其长度一般为 25 至 50 个碱基对 Spacers 与 repeats 的长度相近, 约为 26 到 72 个碱基对 此外一组约由 4~10 个保守基因组成的序列被发现于 CRISPRs 周围, 我们称之为 CASs(CRISPR-associated sequences,cass) 在 CAS 蛋白中已鉴定出核酸内切酶 核酸外切酶 螺旋酶 RNA- 和 DNA- 结合等结构域, 因此, 认为 CAS 蛋白参与 CRISPR 的转录 加工和外来基因序列的降解等过程 图 2 CRISPR 的结构和操作步骤 3 CRISPR 的分布和多样性 在已测序的约 40% 细菌和 90% 古细菌基因组中至少存在 1 个 CRISPR 座位 (locus), 每个 CRISPR 座位具有几个到几百个 R-S 重复单位 ( 图 2-A) 根据 CAS 蛋白的序列同源 2
性 组成情况和功能, 可将 CRISPR 系统分为 8 个亚型 :Ecoli Ypest Nmeni Dvulg Tneap Hmari Apern 和 Mtube, 各亚型通常具有 2-6 个亚型特异的 cas 基因, 在没有 CRISPR 系统的基因组中则不存在相关基因 cas1-cas6 这 6 个家族广泛存在于不同的 CRISPR 亚型, 被认为是核心 cas 基因, 其中只有 cas1 和 cas2 家族存在于所有的 CRISPR 亚型, 因此,cas1 和 cas2 家族基因也被用作鉴定 CRISPR 系统的分子标记 此外, 间区序列 (S) 也具有极其丰富的多样性 3 技术原理 ( 图 5) Cas9 内切酶是一种 DNA 内切酶, 很多细菌都可以表达这种蛋白,Cas9 内切酶能够为细菌提供一种防御机制, 避免病毒或者质粒等外源 DNA 的侵入 利用 Cas9 内切酶家族来靶标和剪切外源 DNA 的 II 型 CRISPR/Cas 免疫系统来进行有效的靶向酶切 Cas9 内切酶必须在向导 RNA 分子的引导下对 DNA 进行切割, 这是因为这些向导 RNA 分子含有与靶 DNA 序列互补的序列, 称之为 PAM 序列 Cas9 内切酶在向导 RNA 分子的引导下对特定位点的 DNA 进行切割, 形成双链 DNA 缺口, 然后细胞会借助同源重组机制 (homologous recombination) 或者非同源末端连接机制 (non-homologous end joining) 对断裂的 DNA 进行修复 如果细胞通过同源重组机制进行修复, 会用另外一段 DNA 片段填补断裂的 DNA 缺口, 因而会引入一段 新的 遗传信息 图 3 RNA 介导的 Cas9 系统定向基因组修饰作用机制 3
4 技术优势 与其它基因组工程技术比较,CRISPR/Cas9 技术拥有以下技术优势 ( 表 1):(1) 无物种限制, 靶向精确性更高, 可实现对靶基因多个位点同时敲除 ;(2) 使用更方便, 费用更低, 无论是 ZFN 还是 TALEN 都需要针对不同靶点改变核酸酶前面的识别序列, 这些识别序列的合成或组装耗时耗力且费用很高, 但 Cas 蛋白不具特异性, 只需合成一个 sgrna 就能实现对基因的特异性修饰 (3) CRISPR/Cas 系统只需改变很短的 RNA 序列 ( 不超过 100bp) 就可实现不同位点的特异性识别, 可避免超长 高度重复的 TALENs 编码载体带来的并发症 表 1 TALEN 和 CRISPR 的比较 项 目 TALEN CRISPR 制 备 CRISPR 需要合成 DNA Oligo, 多 2 天, 不过只需最快的时间周期需要 4 天合要构建 1 个克隆即可 对于新手而言,CRISPR 更成 1 对分子有吸引力 应 用 需要转染两个质粒进入 1 个细胞 若要敲除 2 个位点,CRISPR 只需再多转染 1 个质粒, 在多位点需要转染两个质粒进入 1 个敲除上 CRIPSR 更有潜力 若能将 Cas9 等蛋白预细胞先转染进入细胞制备稳定株, 后续只需要转染一个 RNA 片段即可,CRISPR 具有高通量潜力 转 染 TALEN 的个头接近 3 Kbp, 相关病毒转导很难 常用慢病毒转导, 但易出现 CRISPR 系统的信号序列相当于 shrna, 慢病毒, 重组 若用逆转录病毒和腺逆转录病毒和腺相关病毒都可以用于转导 切割效率 TALEN 对 DNA 的识别会 CRISPR 中 RNA 对 DNA 的识别不受此限制, 效受甲基化的影响率比 TALEN 好 特异性数据 TALEN 的识别包括 30-40 CRISPR 只需要核心的 14 个碱基, 特异性有待进个碱基, 特异性不错一步证明 靶点选择 TALEN 靶点常以 T 为开头, CRISPR 则受限于 PAM 序列, 一般是 GG 开头的针对某个点来设计工具, 序列, 不宜使用 U6 表达 RNA TALEN 会更加灵活一些 5 技术在植物领域应用 CRISPR 系统间区序列的多样性和特异性已被广泛应用于基因分型 流行病学研究 分析不同人体内的细菌菌群差异 检测环境中的噬菌体等科学研究 利用 CRISPR 系统作用机制的独特性用于构建噬菌体抗性的工业生产菌株 CRISPR 系统还可能广泛应用于 : 作为遗传操作的工具, 用于靶向基因沉默 ;rrna-cascade 复合物可用于体外 DNA RNA 分子的位点特异性切割 ; 在临床上, 通过限制质粒结合转移而控制药物抗性基因在致病菌之间扩散等 4
植物领域的相关文献 (1) 水稻基因定点改造技术 - 北京大学生命科学学院 - 瞿礼嘉 相关报道链接 http://www.bio.pku.edu.cn/news.php?id=2196 文献 - 附件 1 (2) 植物基因组修饰 金剪刀 - 中科院上海植物逆境生物学研究中心 - 朱健康 相关报道链接 :http://www.psc.ac.cn/cn/cpnews_more.asp?id=161 文献 - 附件 2 (3) 对水稻和小麦进行定点基因组编辑研究 - 中科院遗传与发育生物学研究所 - 高彩霞 相关报道链接 :http://www.genetics.ac.cn/xwzx/kyjz/201308/t20130809_3910602.html 文献 - 附件 3 5