Illumina 平台测序原理及常见几 种测序文库构建流程简介
目录
第一部分 : 测序测序原理与流程 简介
1-8 samples HCS/RTA ICS MSR CASAVA BaseSpace cbot HiSeq2500 MiSeq 文库构建 (~ 6 hrs) HiSeq2000 HiSeq2500 GA IIx MiSeq
1-8 samples HCS/RTA ICS MSR CASAVA BaseSpace Illumina 测序流程 文库构建 (~ 6 hrs) cbot HiSeq2500 MiSeq HiSeq2000 HiSeq2500 GA IIx MiSeq
文库构建流程 片段化 DNA 末端补平 3 加 A 接头连接 PCR
高质量 DNA 文库结构 Index Sequencing Primer 此单链部分与 FlowCell 表面上 P7 接头相同 此单链部分与 FlowCell 表面上 P5 接头相同 文库构建的目的是在目的 DNA 片段两端都连接上想要的接头
1-8 samples HCS/RTA ICS MSR CASAVA BaseSpace cbot HiSeq2500 MiSeq 文库构建 (~ 6 hrs) HiSeq2000 HiSeq2500 GA IIx MiSeq
测序芯片 (Flow Cell) 简介 在 flow cell 上进行 cluster 簇生成 flow cell 是有 2 个或 8 个泳道 (Lane) 的玻璃片, 与一元硬币的厚度相当 每个泳道 (Lane) 内的上下两个表面随机的布满了能够与文库两端接头分别互补配对的寡核苷酸 (oligos,p7 和 P5 接头 )
仪器简介 单条 DNA 模板 35 个循环的桥式 PCR 约 1000 条 DNA 模板的拷贝 cbot HiSeq Sequencer
cbot 工作流程 DNA 文库变性 : 使用 NaOH 将双链 DNA 文库变性为单链 模板链杂交 : 将单链 DNA 模板杂交到 Flow Cell 上 第一链合成 : 以 Flow Cell 表面上的 oligos 为引物, 合成第一链 桥式 PCR: 线性化 : 阻断 3 OH: 冲走单链 DNA 模板, 以合成的第一链为模板进行 35 循环的桥式 PCR 将与 P5 接头连接的 DNA 链从 Flow Cell 上去除 防止在后续测序过程中继续延伸 DNA 链 杂交测序引物
DNA 模板杂交和一链合成 接头序列 单链 DNA 分子与 FlowCell 表面的对应接头杂交 以杂交的单链 DNA 为模板, FlowCell 上的接头为引物, 合成第一链 含有 P7 和 P5 两种接头的 FlowCell 表面 5-3 延伸
双链 DNA 变性 新合成的链 原始模板链 模板链被冲洗走 丢弃原始模板链 新合成的链留在 FlowCell 上
桥式 PCR 扩增 单链 DNA 与 FlowCell 表面对应接头杂交, 形成 桥 以接头为引物进行扩增
桥式 PCR 扩增
变性 变性双链的 桥 得到与 FlowCell 相连的两条互补的单链 DNA 分子
第二轮桥式 PCR 扩增
完成 28 循环的桥式 PCR 完成桥式 PCR 扩增
线性化 双链 桥 变性为单链 红色箭头为 P5 接头上的切割位点
线性化 切割并冲走与 P5 接头相连的那条 DNA 链
阻断 3 OH 阻断
杂交 Read 1 引物 将测序引物杂交到文库的接头上 Read1 测序引物
1-8 samples Illumina 测序流程 HCS/RTA ICS MSR CASAVA BaseSpace cbot HiSeq2500 MiSeq 文库构建 (~ 6 hrs) HiSeq2000 HiSeq2500 GA IIx MiSeq
HiSeq SBS 测序流程 进行 Read1 测序 杂交 Index 测序引物, 进行 Index 测序 Paired End Turnround, 合成 Read1 互补链 杂交 Read 2 测序引物, 进行 Read 2 测序
HiSeq SBS 测序流程 1 3 Paired End Turnaround 2
Sequencing By Synthesis,SBS 测序原理 4 种 Fl-NTP s + 聚合酶 拍照, 收集信号 去阻断, 切除荧光基团 X 36-151
可逆终止化学反应 一次加入 4 种修饰的 dntp( 可逆终止子 ) 准确度高 可以得到同聚物序列 下一个碱基合成 合成 照相, 收集信号 去阻断, 切除荧光基团
Clusters 100 Microns
Paired End Turnround 变性掉已完成测序合成的片段 Blocked 3 -ends 已完成测序合成的片段 恢复被阻断的 3 OH
Paired End Turnround 桥式 PCR 形成的桥 5-3 延伸 5-3 延伸
Paired End Turnround 形成的双链的桥
Paired End Turnround 等温变性, 完成 15 轮桥式 PCR 后, 进行线性化, 将模板链切除, 保留新合成的子链 模板链
Paired End Turnround 线性化,3 -OH 阻断 3 -OH 阻断 Read2 测序引物 杂交 Read2 测序引物 新合成的链
Sequencing By Synthesis 2nd Read 4 种 Fl-NTP s + 聚合酶 拍照, 收集信号 去阻断, 切除荧光基团 X 36-151
1-8 samples Illumina 测序流程 HCS/RTA ICS MSR CASAVA BaseSpace cbot HiSeq2500 MiSeq 文库构建 (~ 6 hrs) HiSeq2000 HiSeq2500 GA IIx MiSeq
第二部分 : 常见文库构建流程简 介
文库分类 DNA 类文库 DNA 小片段文库 DNA 大片段文库 Exon 文库 RNA 类文库 转录组文库 表达谱 (RNA-Seq) Small RNA PCR-Free 文库 简化基因组文库 单细胞样本 文库等
DNA 小片段文库 DNA 小片段文库 片段大小在 1Kb 以下的普通 DNA 文库 (200bp,350bp,500bp ) DNA 小片段文库可用来进行人重测序, 动植物 微生物的 de novo 和重测序,16s rrna 测序, 宏基因组测序等项目类型的文库构建
DNA 小片段建库流程
DNA 小片段建库流程
DNA 小片段建库流程
DNA 小片段建库流程
DNA 大片段文库 DNA 大片段文库, 又名末端配对 (mate-paired) 文库 片段长度大于 1K bp 主要用于动植物, 微生物的 de novo 测序
DNA 大片段文库建库流程
DNA 大片段文库建库流程
为什么要建大片段文库
Exon 文库 人类外显子组总共约 30Mb, 占全部人类基因组约 1% 外显子具有高度的保守型, 且大部分疾病的致病位点位于外显子区 外显子测序是指利用序列捕获技术将外显子区域 DNA 捕捉并富集后进行高通量测序的基因组分析方法 Exon 文库主要用于人全外显子测序和目标区域测序
Exon 文库流程
外显子捕获方式 液相杂交 液相杂交是通过在溶液中, 利用链碱基配对的原理, 将 DNA 片段与探针杂交, 然后洗脱, 富集目的片段
Exon 测序特点 优点 : 1 与全基因组测序相比, 外显子测序具有测序覆盖度更深 数据准确性更高 花费成本更低等优势, 对研究已知基因的 SNP Indel 等具有较大的优势 不足 : 1 与全基因组测序相比, 不能检测到基因组内较大的结构性变异 2 与转录组测序相比, 不能检测到新的基因
PCR-Free 文库 PCR-Free 文库, 顾名思义, 就是在文库构建过程中不需要进行 PCR 的文库 主要是针对一些特殊样本, 比如 GC 含量高, PCR 扩增困难的样本 ;PCR 产物 不足 : 所需的样本起始量较多
PCR-Free 文库与普通文库比较
简化基因组 (RAD-seq ) 文库 RAD-seq 即基于酶切的简化基因组测序技术, 是指利用限制性内切酶对基因组进行酶切, 结合一定大小的插入片段文库, 对其进行高通量测序, 快速鉴定高准确性的变异标记 (SNPs) 信息的技术 与传统技术相比, 该类技术操作简单 不受参考基因组限制 可简化复杂基因组 ; 另外, 基于 SNPs 的分子标记技术性价比高, 稳定性好, 在基因组中分布更加广泛, 特别是适合大样本量的分析
简化基因组文库建库流程
转录组文库 转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有 mrna 真核生物 利用 Oligo (dt) 富集 mrna 总 RNA 原核生物 去除 rrna 应用 : 转录本的种类和基因定量基因的转录结构可变剪切发现新的转录本 将 mrna 随机打断成 ~200 nt 随机引物六聚体反转录合成 cdna 末端修复, 加 A, 加接头后 PCR 扩增 Illumina 测序
链特异性转录组建库 使用 ssrna-seq 可以确定转录本是来自正链还是负链 以便更加准确的获得基因的结构以及基因表达信息, 并且发现新的基因 很多基因组区域具有正负链的转录本, 反义转录是真核基因的一个特征, 是一种重要的调控方式
链特异性转录组建库 常规转录组建库方法基础上, 在合成第二条 cdna 链时, 替换 dttp 为 dutp, 加上接头后降解含 du 的 DNA 单链
均一化 (DSN) 建库 方法 : 构建常规转录组文库, 库检合格后取 80-100ng 文库进行 DSN 处理, 然后 PCR 再次出库 目的 : 减低高丰度表达基因, 有效富集低丰度表达基因 DSN 酶 : 双链特异性核酸酶 (Duplex-Specific Nuclease, DSN), 能够选择性降解双链 DNA 和 DNA-RNA 杂交体中的 DNA, 由于高丰度的基因形成双链的速度较快, 所以降解也比较多
RNA-Seq 是用来研究某一生物对象在特定生物过程中基因表达差异的技术, 具有定量准 可重复性高 检测范围宽 成本低等特点 真核生物 利用 Oligo (dt) 富集 mrna 总 RNA 将 mrna 随机打断成 ~200 nt 随机引物六聚体反转录合成 cdna 末端修复, 加 A, 加接头后 PCR 扩增 Illumina 测序 原核生物 去除 rrna
RNA-Seq 与常规转录组区别 RNA-Seq 转录组 应用 用于基因表达丰度检测 用于拼接 (>1G 数据量 ) 测序类型 SE: 50+8 PE: 91+8+91 全程磁珠纯化 切胶回收 建库方法 插入片段弥散 ( 主峰 250-330) 单一条带
Small RNA 文库 18-30nt 范围内的 RNA 结构上 5 端主要以尿嘧啶开始 与 mrna 的降解 翻译抑制 ( 基因沉默 ) 以及形成异染色质有关 调控细胞生长 发育 基因转录和翻译等生物过程 包括 sirna, microrna 和 pirna
Small RNA 文库建库流程
谢谢! 欢迎一起讨论!