分子生物学一

Similar documents
未命名-1

2 1. (a Unit of Inheritace) RNA DNA 2. (Nature of gene) heredity heredity & variation variation

材料! 方法! # 基因的扩增及其序列分析

材料 方法

医学遗传学

幻灯片 1




<4D F736F F F696E74202D203220B7D6D7D3C9FACEEFD1A720B5DAB6FED5C220C8BEC9ABCCE5D3EB444E E41B5C4BDE1B9B92E >

福建农业学报 材料与方法 试验菌株 引物 主要仪器 主要试剂 细菌培养 模板的制备 反应条件 扩增产物的检测 特异性试验 敏感性试验 分离菌株检测 产物的克隆及序列测定 结果与分析

儿科学 儿科学 儿科学 儿科学 儿科学 儿科学 ( 专业学位 ) 儿科学 ( 专业学位 ) 儿科学 ( 专业学位 ) 儿科学 ( 专业学位 ) 儿科学 ( 专业学位 ) 耳鼻咽喉科学 ( 专业学位 ) 非定向 全国统考

干细胞和再生医学 科学学位 免考 免考 非定向 干细胞和再生医学 科学学位 免考 85 非定向 干细胞和再生医学 科学学位 免考 69 非定向 护理学 科学学位 免考 免考 非定向 护理学 科学学位

2008 中国生物技术发展报告 社 会 发 展 科 技 司 中华人民共和国科学技术部 中国生物技术发展中心 编著 北 2008.indd 1 京 :51:36


( ) 表达载体 于外源 DNA 的表达 1 原核表达载体: 在原核细胞表达外源基因 (1) 启动 : 转录 mrna 必需元件 (2)SD 序列 : 提供核糖体结合位点 (3) 转录终 序列 : 有助于 效表达外源基因 2 真核表达载体: 在真核细胞表达外源基因 (1) 真核表达载体特点 : 1

<4D F736F F D20B6AFCEEFD2C5B4ABD1A7BDCCD1A7B4F3B8D9>

基因组信息学 第 1 讲绪论 张高川生物信息学系 (Department of Bioinformatics) 基础医学与生物科学学院 (School of Biology and Basic Medical Science) 苏州大学医学部 (Medical College of Soochow

! " # +(!"# $%& (!"!#$%& (&%!)*) +,)) )!#$%&+!$%-./! $*0! +,)) 1*23!% %*2$*23 1!%%*$*2,2#%!,) )4542*$ *0!2$*1*#,$*&2!! 1!%%*$*2 $#!"!)!" "


一步一步教你使用NCBI

<4D F736F F F696E74202D D5E6BACBC9FACEEFB5C4BBF9D2F2B1EDB4EFD3EBB5F7BFD820A3A8B6FEA3A9>

An Introduction to Medical Genetics

新建 Microsoft PowerPoint 演示文稿.ppt

hm 2 63% 980hm 2 19% 680hm 2

材料导报 研究篇 年 月 下 第 卷第 期 种球的制备 单步溶胀法制备分子印迹聚合物微球 洗脱处理 种子溶胀聚合机理 种球用量的影响

《 生物化学》教学大纲

PowerPoint 演示文稿

:

中国科学院水生生物研究所硕士生入学考试专业课考试大纲

西安医学院教案(临床课程)

第十章 基因的作用

中国实验动物学会实验动物标准化专业委员会 ( 学会代章 ) 二 O 一七年六月五日 附件清单 : 附件 1.1- 实验动物教学用动物使用规范 - 征求意见稿附件 1.2- 实验动物教学用动物使用规范 - 编制说明附件 1.3- 实验动物教学用动物使用规范 - 征求意见反馈表附件 2.1- 实验动物汉

材料 方法 载体构建 转基因植株的获得

<4D F736F F F696E74202D203420B7D6D7D3C9FACEEFD1A720B5DAB6FED5C220C8BEC9ABCCE5D3EB444E E41B5C4D0DEB8B4BACDD7AAD7F92E

国内高等医学院校基础医学二级学科评价结果(1)

1

中国科学技术大学 材料工程 05 校外调剂 0870 化学工程 吉林大学 应用化学 05 校外调剂 0870 化学工程 四川大学 制药

Microsoft Word - 生理管理技術與有機栽培_施劍鎣.doc

2010年全国执业兽医资格考试大纲

食 品 与 生 物 技 术 学 报 第 卷 列入我国 的植物多酚黄酮抗氧剂 防治高血脂和心血管疾病

考生编号政治政治分外语外语分科目 1 科目 1 分科目 2 科目 2 分总分专业代码专业名称考试方式报名号 思想政治理论缺考英语一 45 生物综合 38 生理学缺考 药理学全国统考 思想政治理论


Microsoft PowerPoint - bioinfo_hebau23.ppt

4.8 微生物代谢的调节

考 试 科 目 代 码 考 试 科 目 名 称 724 教 育 心 理 学 728 建 筑 理 论 综 合 729 中 外 美 术 史 及 理 论 730 美 术 史 论 732 城 乡 规 划 基 本 理 论 与 相 关 知 识 733 细 胞 生 物 学 734 教 育 学 综 合 801 理


编 者 手 记 :2016 年 6 月 7 日, 六 个 人 六 段 长 情 的 告 白, 有 着 说 得 出 的 故 事 说 不 出 的 情 怀 华 大 序 说, 说 出 华 大 最 强 音, 用 我 们 的 声 音 来 为 华 大 测 序, 这 是 华 大 人 自 己 的 TED 秀 在 第 一

<4D F736F F F696E74202D205A D3038BBF9D2F2D0C5CFA2B4ABB5DD205BBCE6C8DDC4A3CABD5D>

<4D F736F F D B7D6D7D3C9FACEEFD1A7CAD4BEED42B2CEBFBCB4F0B0B82E646F63>


<4D F736F F F696E74202D20A5FEB279ACECA7DEADB2A DA5CDA4C6ACECA7DEA4A7BDC4C0BB>

生物技术通报 材料 方法

附件2:

untitled

核酸的结构和功能

原位检测 断裂 流式细胞仪检测凋亡峰 细胞形态观察 双标记法检测细胞早期凋亡


2015 Intellectual Sensitive 30 Physical A T G C DNA


对虾病毒病的症状

附件5:

(精校版)陕西省语文卷文档版(含答案)-2011年普通高等学校招生统一考试.doc


<4D F736F F F696E74202D203320B7D6D7D3C9FACEEFD1A720B5DAB6FED5C220C8BEC9ABCCE5D3EB444E E41B5C4B8B4D6C62E >

PowerPoint 演示文稿

最新文物管理执法全书(十七).doc


生命科学_一_.doc


Microsoft Word tb 刘林梦ys.doc

Microsoft PowerPoint Bio in the Bioinformatics

4.»ùÒò×é·ÖÎö £¨Genome analysis\)

<4D F736F F F696E74202D203420B7D6D7D3C9FACEEFD1A720B5DAB6FED5C220C8BEC9ABCCE5D3EB444E E41B5C4D0DEB8B4BACDD7AAD7F92E

食 品 与 生 物 技 术 学 报 第 卷

untitled

<3331D2A9D1A7A3A8CAA6A3A92E786C73>

中国注册营养师资格认证(上海试点)考试大纲(讨论稿)2015

genotype phenotype

本月專題 聽 DNA 和 RNA 的對話 葡萄糖代謝 : mg/dl mg/ dl glucose sensor glucose transporter

自我介绍 : 孙巍,M.D., Ph.D , 白求恩医科 大学临床医学系, 本科 生 , 吉林 大学药学院, 硕 士研究 生 , 吉林 大学 白求恩医学院, 博 士研究 生 , 美国俄亥俄州州 立 大学药学院, 博 士后 201


减色效应 (Hypochromatic effect) 随着 DNA 的复性,260nm 紫外线吸收值降低的现象 2) C 值反常现象 (C-value paradox) C 值是一种生物的单倍体基因组 DNA 的总量 真核细胞基因组的最大特点是它含有大量的重复序列, 而且功能 DNA 序列大多被不

<4D F736F F F696E74202D203720B7D6D7D3C9FACEEFD1A720B5DACBC4D5C2206D524E41B5C4B7ADD2EB20C3DCC2EBD7D3BACD74524E41>

自我介绍 : 孙巍,M.D., Ph.D , 白求恩医科大学临床医学系, 本科生 , 吉林大学药学院, 硕士研究生 , 吉林大学白求恩医学院, 博士研究生 , 美国俄亥俄州州立大学药学院, 博士后 , 白求恩医

<4D F736F F F696E74202D203720B7D6D7D3C9FACEEFD1A720B5DACBC4D5C2206D524E41B5C4B7ADD2EB20C3DCC2EBD7D3BACD74524E41>

<4D F736F F D20B5DACAAEC1F9D5C22020C1D9B4B2D2C5B4AB2E444F43>

Microsoft Word - 兽医全科类大纲.doc

(Microsoft Word - \256g\275b\252\354\305\351\305\347.doc)

¥Íª«²Ä9¦¸²Õ¨÷-«ü¦Ò«ÊŁ±.prn, page Normalize ( <4D F736F F D20A5CDAAABB2C439A6B8B2D5A8F72DABFCA6D2ABCAADB12E646F63> )

ZW.PDF

复旦大学 人群进化研究中心

标题

<4D F736F F F696E74202D EB5DACAAED5C22020CFB8B0FBD6CAD2C5B4AB2E BBCE6C8DDC4A3CABD5D>

间 相 近, 大 陆 消 费 者 权 益 保 护 法 于 1993 年 10 月 31 日 制 定, 台 湾 消 费 者 保 护 法 于 1994 年 1 月 11 日 制 定, 仅 隔 72 天 三 是 法 条 序 号 相 近, 大 陆 消 费 者 权 益 保 护 法 的 惩 罚 性 赔 偿 条

目錄

第二节分子生物学的主要研究内容第三节分子生物学的发展简史本章重点 难点 : 分子生物学的含义 研究对象本章教学要求 : 掌握分子生物学的定义, 理解分子生物学的研究内容, 了解分子生物学的发展简史 第二章细胞与生物大分子第一节细胞分类习题要点 : 原核生物与真核生物的最大差异第二节亚细胞器习题要点



< 1+1 <! " #$% &!"#$ %&' ( )( %&* ) + ), %&- )+. )../'0 ) 1 ) "' )!"#$%&' (1% ( )* " + + %,-.2(13/01 )' 扩增 &' 基因 煮沸获得铜绿假单胞菌 ) 基因组作为模板 ) )( 作为引物

Transcription:

第一章 基因 基因组和基因组学 Gene, Genome and Genomics 杜芬

Activities of Genes 基因 遗传的基本单位, 是负载特定生物遗传信息的 DNA 分子片段, 一定条件下表达遗传信息产生特定的生理功能 How do genes work? First, they are replicated faithfully; second, they direct the production of RNAs and proteins; third, they accumulate mutations and so allow evolution. 2

第一节基因 Gene 基因 遗传的基本单位, 是负载特定生物遗传信息的 DNA 分子片段, 一定条件下表达遗传信息产生特定的生理功能 一 基因概念的发展 一个遗传因子决定一个性状 (1865 年 ) Friedeich Miescher 1868 年,Miescher 从脓细胞中分离出细胞核, 加酸抽提得到了一种含氮和磷丰富的物质, 称其为核素 (nuclein). 1872 年, 他又在鲑鱼精子细胞核中发现了大量的这类物质 故称其为核酸 (nucleic acid) 3

第一节基因 Gene 基因 遗传的基本单位, 是负载特定生物遗传信息的 DNA 分子片段, 一定条件下表达遗传信息产生特定的生理功能 一 基因概念的发展 1909 年 Johannsen 采用 gene 来描述遗传性状的决定因子, 但当时并没有提出基因的定义, 甚至反对 基因是具有形态特征的结构. 维尔赫姆 路德维希 约翰逊 Wilhelm Ludwig Johannsen, 1857-1927 谈家祯在留学美国期间应邀为国内科学杂志撰文介绍现代遗传学时把 gene 的汉译名定为 基因 4

第一节基因 Gene 基因 遗传的基本单位, 是负载特定生物遗传信息的 DNA 分子片段, 一定条件下表达遗传信息产生特定的生理功能 一 基因概念的发展 一个基因控制一个性状 (1926 年 ), 明确了基因存在于染色体上 1933 年诺贝尔生理医学奖 5

第一节基因 Gene 基因 遗传的基本单位, 是负载特定生物遗传信息的 DNA 分子片段, 一定条件下表达遗传信息产生特定的生理功能 一 基因概念的发展 1944 年 Avery 等转化实验证明转移物的化学组成实际上就是脱氧核糖核酸 (DNA) 6 DNA 是遗传物质的携带者

第一节基因 Gene 基因 是一段有完整功能的 DNA 序列, 可作为一个转录单位, 其表达产物通常为 1 条多肽链或 1 个 RNA 分子 一 基因概念的发展 "for their discoveries of split genes" Richard J. Roberts New England Biolabs Beverly, MA, USA Phillip A. Sharp Massachusetts Institute of Technology, Center for Cancer Research Cambridge, MA, USA 7

第一节基因 Gene 基因 是一段有完整功能的 DNA 序列, 可作为一个转录单位, 其表达产物通常为 1 条多肽链或 1 个 RNA 分子 一 基因概念的发展基因 生命的最大奥秘 基因是所有生物体遗传信息的载体, 基因的物质基础是 DNA 分子 地球上人与人之间 99.99% 的基因序列相同, 人与人之间的差异仅为万分之一 8

第一节基因 Gene 基因 是 DNA 分子中含有特定遗传信息的核苷酸序列, 负责合成有功能的蛋白质或 RNA 所必需的 DNA 片段 ( 部分 RNA 病毒例外 ), 包括编码序列及调控序列, 是遗传物质的最小功能单位 二 基因的现代概念 ( 一 ) 基因的分类 包括 结构基因 : 转录翻译为多肽链 调控基因 : 调控结构基因表达的基因 只转录而不翻译的基因 : 核糖体 RNA 基因 小分子 RNA 9

第一节基因 Gene 基因 是 DNA 分子中含有特定遗传信息的核苷酸序列, 负责合成有功能的蛋白质或 RNA 所必需的 DNA 片段 ( 部分 RNA 病毒例外 ), 包括编码序列及调控序列, 是遗传物质的最小功能单位 二 基因的现代概念 ( 二 ) 基因的结构编码序列 : 包括插入序列 : 侧翼序列 : 外显子 (exon) 内含子 (intron) 含有调控序列 10

原核生物 : 连续 结构基因的结构特点 真核生物 : 断裂基因 ( 由外显子和内含子组成 ) 病毒 : 连续 / 断裂 exon mrna DNA前体 RNA 剪接 Intron Intron Intron GT AG GT AG intron 成熟 mrna GT-AG 法则 : 真核基因中 RNA 剪接的识别信号 内含子的 5 端以 GT 开始,3 端以 AG 结束 11

原核生物基因的调控序列 启动子 (promoter) 终止子 (terminator) 操纵元件 (operator) 调控基因的结构特点 真核生物基因的调控序列 顺式作用元件 (cis-acting element) 影响基因表达的非编码的 DNA 序列 启动子和上游启动元件 :promoter,upstream promoter element 增强子和沉默子 :enhancer,silencer 反应元件 response element Poly(A) 加尾信号 12

真核生物的基因结构 调控序列 结构基因 调控序列 Enhancer promoter CAAT box TATA box UTR exon exon exon Poly(A) 加尾信号 UTR 5 response element +1 ATG intron intron TGA Stop 3 开放阅读框 :open reading frame,orf 非翻译区 :untranslated regions,utr 13

真核生物基因的调控序列 启动子和上游启动元件 : 基因转录起始点上游 100 到 200bp, 是 RNA 聚合酶结合位点周围的一组转录控制序列, 至少包括一个转录起始点以 及一个以上的功能组件 如 TATA 盒 (TATA Box): 位于 -25~-30bp, 启动基因转录 ; CAAT 盒 (CAAT Box): 位于 -70~-80bp, 决定启动子转录效率 ; GC 盒 (GC Box): 位于 -35bp, 与转录因子 Sp1 结合, 促进转录的过程 增强子 : 与 TF 特异结合, 增强 转录活性, 基因任意位置都有效 无方向性 Poly(A) 加尾信号 : 含有 II 类启动子的基因末端存在终止信号 : 保守的 AATAAA 顺序及下游 GT 或 T 富含区 14

第一节基因 Gene 基因 是 DNA 分子中含有特定遗传信息的核苷酸序列, 负责合成有功能的蛋白质或 RNA 所必需的 DNA 片段 ( 部分 RNA 病毒例外 ), 包括编码序列及调控序列, 是遗传物质的最小功能单位 二 基因的现代概念 ( 三 ) 基因的功能生物学功能 : 如蛋白激酶对蛋白质的磷酸化修饰包括细胞学功能 : 参与细胞间 / 内信号传递 基因的功能体现于基因的表达, 基因的活化有严格的程序 ; 鉴定基因功能的技术 : 基因芯片 Western blot 模式生物等 ; 基因控制生物的性状 : 控制酶的合成 结构蛋白的成分 15

第二节基因组 Genome 基因组 一个细胞或生物体中, 一套完整单倍体的遗传物质的总和 不同生物基因组的大小和复杂程度各不相同 ; 基因组的功能 : 贮存和表达遗传信息 不同生物基因组蕴含遗传信息量有差别 病毒 < 细菌 < 真核生物 单倍体基因组中的全部 DNA 量 C 值 基因组中不同的区域具有不同的功能 : 有些区域编码蛋白质的结构基因 有些区域复制及转录的调控信号 有些区域的功能尚不清楚 16

第二节基因组 Genome 基因组 一个细胞或生物体中, 一套完整单倍体的遗传物质的总和 一 原核生物基因组的特点 1. 基因组通常由环状双链 DNA 组成, 相对较小 (4.6 10 6 bp, 约 4000 个基因 ), 细菌基因组包括细菌染色体 DNA 和质粒 DNA, 前者存在于类核 (nucleoid) 区 2. 只有一个 Ori., 具操纵子结构 : 功能上相关的几个结构基因往往串联在一起, 连同上游共同的调控区 ( 启动子和操纵基因 ) 及下游的转录终止信号构成的基因表达单位 基因开放时, 转录为一条多顺反子 mrna, 然后分别翻译合成各自的蛋白肽链 3. 编码序列一般不重叠 结构基因是连续的, 无内含子, 转录后不需剪接加工 17

第二节基因组 Genome 基因组 一个细胞或生物体中, 一套完整单倍体的遗传物质的总和 一 原核生物基因组的特点 4. 基因组中重复序列很少, 多为单拷贝, 编码 rrna 基因是多拷贝 5. 有编码同工酶的同基因 (isogene, 结构不完全相同, 而功能相同的基因 ) 6. 细菌基因组中存在可移动的 DNA 序列 ( 插入序列和转座子 ) 7. 编码区所占比例较高 (~50%), 小部分的非编码区主要是基因表达的调控序列 8. 多种功能识别区域, 如复制起始区 复制终止区 转录起始和终止区, 这些区域往往含有反向重复序列 9. 不同的原核生物基因组 GC 含量变化很大 (25%-75%), 可用于识别细菌种类 18

细菌基因组中有质粒 质粒是细菌染色体外的 具有自主复制能力的闭合环状双链 DNA 分子 小的为 2-3kb, 大的数千个 bp 大肠杆菌 (Escherichia coli) 特点 : 宿主细胞内独立自主复制 ; 质粒可以转移 ; 携带某些遗传信息, 会赋予宿主细胞新的遗传性状 ; 可能发生质粒间或质粒与染色体之间的重组 细菌染色体 DNA 和质粒 DNA 19

细菌基因组中有转座因子 转座 / 移位 (transposition): 指染色体因子从原来的位置释放, 插入到一个新位置上 转座因子 transposable element 是一种可以由染色体的一个位置转移到另外位置的遗传因子, 也就是一段可以发生转座的 DNA Barbara McClintock 1902-1992 Cold Spring Harbor Laboratory Cold Spring Harbor, NY, USA 1983 年诺贝尔生理学与医学奖 转座子对基因组而言是一个不稳定因素, 它可导致宿主序列删除 倒位或易位, 在基因组中成为 可移动的同源区 20

原核生物转座因子 插入序列 (insertion sequences, IS) 小于 2000bp, 只有转座相关基因 转座子 (transposon, Tn)2-20kb, 常带 有抗性基因 (Kan R ter R ) 等其它基因 转座因子共同结构 两末端具有反向重复序列 Mu 噬菌体 (MU) 是一种大肠杆菌的温和型噬菌体, 能像转座子那样在细胞内 DNA 上的不同位置间转移, 并没有一定的整合位置, 可引起突变 转座的结果使靶点序列倍增 ; 转座引起插入突变 ; 携带标志基因使受体增添新基因 21

转座引起插入突变 转座子 A B C D 复制插入 A B C D E F 转座子新拷贝 E F 基因 F 被隔断而失去功能 携带标志基因使受体增添新基因 转座酶 AmpR Tn3 terr 转座酶 Tn10 22

第二节基因组 Genome 基因组 一个细胞或生物体中, 一套完整单倍体的遗传物质的总和 二 真核生物基因组的特点 ( 一 ) 真核生物基因组 > 原核生物基因组 以染色体形式存于细胞核内, 除配子细胞外, 体细胞基因组是双份的 并非生物越高等, 基因组越大 染色体 DNA 线粒体 DNA 复杂多样的结构复杂精细的调控机制 23

第二节基因组 Genome ( 二 ) 真核生物基因组特点 1. 真核基因组较庞大 (3 10 9 bp, 约 2.5 万个基因 ), 非编码序列多于编码序列, 基因组包括染色体 DNA 和线粒体 DNA, 前者被包裹在核膜内 2. 基因组结构中有多个 Ori., 但每个复制子长度较小 3. 基因是不连续的断裂基因 ( 包含外显子和内含子等 ) 4. 转录单位一般是单顺反子的, 即一个基因一种 mrna 一种蛋白质, 但蛋白质的最终产物可因剪接方式的不同而有差异 5. DNA 序列组织的可变性 : 从胚胎到成人并非一成不变 如 B 细胞成熟过程中 Ig 基因结构的重排等 24

第二节基因组 Genome ( 二 ) 真核生物基因组特点 6. 非编码序列存在大量重复序列 ( 约占 50%), 重复序列具多态性 1) 高度重复序列 (10~300bp, 重复约 10 6 次, 约占 10%~60%, 较集中 ) 2) 中度重复序列 (100~500bp, 10~10 5 次, 约占 10%~40%, 散在分布 ) 3) 低度重复序列 ( 单拷贝序列, 约占 50~80%, 部分用于编码蛋白质 ) 25

(1) 高度重复序列 卫星 DNA satellite DNA: 非编码区的串联重复序列, 有固定的 2~10bp 重复单位 可用密度梯度离心将其与主体 DNA 分开, 故称卫星 DNA 在人基因组中约占 5% 大卫星 (macro-satellite)dna 小卫星 (minisatellite)dna A 260 总长度微卫星 0.1~20kb, (micro-satellite)dna 重复长度 15~70bp, ( 短串联重复序列位 ) 于染色体近端粒处 高度可变的小卫星 DNA: 是寡核苷酸串联重复序列, 重复单位 2~6bp, 反向重复序列重复单位 9~24 inverted bp, repeats( 呈高度多态性两个相同序列的互补拷贝在同一 DNA 链上反向排列 约含核心序列 GGGCAGGAXG 5%, 易于复性,1/3 为回文结构 常见于基因的重复单位的重复次数不同而具高度多态性, 调控区端粒, 可能参与复制 转录的调控 DNA:2~20kb, 端粒 ), (TTAGGG)n, 可作遗传标记, 是 DNA 指纹的形成基础 DNA 指纹用于亲子鉴定 常见 (AC)n 和 (TG)n, 重复 10~60 次 功能 : 染色体复制, 26末端保护 果蝇基因组

(1) 高度重复序列 高度重复序列的功能 a. 参与复制水平的调节 b. 参与基因表达的调控 c. 参与转位作用 d. 与进化有关 e. DNA 指纹 f. α 卫星 DNA 成簇分布在染色体着丝粒附近, 可能与染色体减数分裂时染色体配对有关. 27

(2) 中度重复序列 (10~10 5, 约占基因组的 10~40%) 短分散重复片断 (SINES):300-500 bp, 拷贝数 10 5 长分散重复片断 (LINES) :3500-5000 bp, 拷贝数 10 4 Alu 家族 : 有两个 130bp 的重复序列组成, 中间有 31bp 间隔序列, 重复单位 300bp, 重复 30~50 万次, 因在 170bp 处有一 AluⅠ 的酶切位点 (AG/CT) 而得名 Alu 序列是灵长类基因组特有, 可作为天然标记 也可能在 hnrna 转录和加工中起作用 ; 遗传重组及染色体不稳定性有关 ; 形成 Z-DNA 还有 :Kpn I 家族 : 人类和灵长类 DNA 经 KpnⅠ 酶解后, 产生 4 个片段 (1.2 1.5 1.8 1.9kb), 故被命名为 KpnⅠ 家族 散在分布的, 功能尚不清楚 Hinf 家族 : 人类基因组经 Hinf 酶解后, 产生 319bp 长的串联重复序列 分散分布,50-100 个拷贝 28

(2) 中度重复序列 (10~10 5, 约占基因组的 10~40%) 中度重复序列的功能编码 trna rrna 组蛋白 Ig 的结构基因种特异性, 可作为区分不同种哺乳动物的探针与基因调控相关序列 29

(3) 低度重复序列 ( 单拷贝序列 ) 在基因组中只出现一次或数次, 占基因组的 50~80%, 一小部分用于编码不同功能的蛋白质 其它功能不清 单拷贝序列的两侧往往为散在分别的重复序列 30

(4) 重复序列多态性 人类基因组中, 平均约 200 对碱基可发生一对变异 ( 称为中性突变 ), 其导致个体间核苷酸序列的差异, 称为基因多态性 DNA 位点多态性 DNA site polymorphism 可变数串联重复序列多态性 Variable number of tandem repeats, VNTRs( 高频率发生在小卫星和微卫星 DNA 中 ) 限制性片段长度的多态性 Restriction fragment length polymorphism, RFLP 单核苷酸多态性 Single-nucleotide polymorphism, SNP 31

限制性片段长度多态性 (RFLP) DNA 多态性发生在限制性内切酶识别位点上, 酶解该 DNA 片段就会产生长度不同的片断 按孟德尔方式遗传, 在某一特定家族中, 如果某一致病基因与特异的多态性片断紧密连锁, 就可用这一多态性片段为一种 遗传标志, 来判断家庭成员或胎儿是否为致病基因的携带者 甲型血友病 囊性纤维病变和苯丙酮尿症等均可借助这一方法得到诊断 32

HindIII A family living around Lake Maracaibo in Venezuela G8 probe to detect a PRLP that is very tightly linked to Huntington Disease 33

34

35

单核苷酸多态性 (SNP) 不同个体基因组 DNA 序列中在单个核苷 酸上的差别 定义 SNP 位点的变异在人群中出现的频率大于 1%, 人类基因组中 SNP 的数目约为 3 百万 ~1 千万 SNP 是基因组多样性的主要表现 遗传 信息变异是所有基因组的共同特征 不 同个体在疾病易感性 反应性和其他性 状上的差别, 最常见与 SNP 变异有关 SNP 决定你的与众不同! 遗传信息变异与疾病易感性 36

第二节基因组 Genome ( 二 ) 真核生物基因组特点 7. 存在多基因家族和超基因家族, 有假基因 (1) 多基因家族 (multigene family): 是指一组具有类似功能, 核苷酸序列又有同源性的基因 假基因 (pseudo gene,ψ ) : 按基因的终产物分两类 : 编码 RNA; 编码蛋白质 在多基因家族中按在基因组中的分布分类, 不产生有功能基因产物的基因 即序列与有 : 功能的基因结构相似, 但不能转录, 或转录后生成无功能的基 (2) 因产物 基因超家族 (supergene family): 另一类家族成员则分散在染色体不同部位上, 编码功能紧密相关的蛋白质 由多基因家族及单基因组成的更大的基因家族 成员间结产生原因是基因在进化过程中复制时发生突变, 或插入了 mrna 逆转录的 cdna, 按基因家族内成员同源性程度分构上有不同程度的同源缺失基因启动子序列所致, 但它们的功能并不相同 : 核酸序列相同 ; 核酸序列高, 基因在度同源 ; 编码产物的功能或功能区同源 进化上亲缘关系较远 如 Ig 超家族 一类串联排列在一起, 分布在某一染色体上形成基因簇, 亦称串联重复基因 ; 假基因往往缺少正常基因的内含子, 两侧有顺向重复序列, 大多没有调控区 37

第二节基因组 Genome ( 二 ) 真核生物基因组特点 8. 基因类型多样 (1) 跳动 ( 跃 ) 基因 ( 可转移的 DNA 成分 转座子 ): 可在 DNA 分子间进行转移的 DNA 片段 与一般转移概念不同, 转移后 仍保留原来位置上的 DNA 序列, 只是把一个新拷贝插入到另外的位置 上 真核和原核细胞都有 (2) 非剪接基因 ( 连续基因 ): 原核和真核细胞都有 真核 rrna 基因也是非剪接基因 (3) 自私 DNA(selfish DNA): 指极少转录成 mrna 并翻译的非编码序列, 包括分散的高度 中度重复序列, 内含子和间隔序列等, 除了复制自己, 它们对细胞存活 代谢等几无贡献, 故称为自私 DNA 且有些成分还通过转录成 mrna, 生成 cdna, 再转位插入到基因组, 颇象机体内寄生虫的繁殖 生活, 故也有人称之为寄生 DNA 38

第二节基因组 Genome ( 三 ) 线粒体基因组特点 闭环双链的线粒体 DNA (mitochondrial DNA, mtdna), 长度为 16.5 kb, 结构紧凑, 几乎无非编码区, 无内含子 外环的重链 (H 链 ) 和内环的轻链 (L 链 ) 39

第二节基因组 Genome ( 三 ) 线粒体基因组特点 动物细胞的 mtdna 编码 2 个 rrna 22 个 trna 和多种呼吸链复合物的酶蛋白 : trna 基因 : 啤酒酵母 mtdna 中有 24 个 trna 基因, 粗链孢霉菌的 mtdna 中有 40 个 trna 基因, 而人类 mtdna 中有 22 个 trna 基因 rrna 基因 : 人类 mtdna 中有一个拷贝的 16S 及 12SrRNA 基因 细胞色素氧化酶基因 : 细胞色素氧化酶有七个亚基, 其中三个亚基 mtdna 编码, 四个亚基由细胞核 DNA 编码 ATP 酶基因 :ATP 酶 (MW:340 KDa), 含有十个亚基, 其中四个由 mtdna 编码 细胞色素还原酶 (b,c 复合物 ) 基因 : 酶的七个亚基中有一个由 mtdna 编码 另外, 还有一些抗药性基因也在 mtdna 上 40

第二节基因组 Genome 三 病毒基因组的特点 1. 病毒基因组大小差别很大最小的乙肝病毒 :3kb, 仅编码 4 种蛋白质 ; 最大的豆病毒 : 可达 300kb, 有几百个基因 2. 病毒基因组由一种核酸组成 : 可以是 DNA 或 RNA DNA 或 RNA 病毒可以是单链或双链, 可以是环状或线性的 3. 多数 RNA 病毒基因组是连续的 RNA 单链组成 基因组形状少数乳头瘤病毒 RNA 病毒基因组是由不连续的几条链组成 DNA 闭环双链 ( 节段性 ), 每段腺病毒 RNA 分子都有编码蛋白质的信息 DNA 线状双链脊髓灰质炎病毒 RNA 单链 流感病毒基因组由 8 条 RNA 分子构成 ; 呼肠孤病毒 RNA 双链 呼肠孤病毒基因组由 10 个双链 RNA 片段. 大多数 DNA 病毒的基因组是双链 DNA 分子 大多数 RNA 病毒的基因组是单链 RNA 分子 41 8 节段 -ssrna 禽流感病毒

第二节基因组 Genome 三 病毒基因组的特点 4. 病毒基因组的功能单位 ( 转录单位 ) 形成多顺反子 mrna 可被一起转录成为含有多个 mrna 的分子, 称为多顺反子 mrna, 然后再加工成各种蛋白质的模板 mrna. 5. 病毒基因组基本上编码蛋白质 (>90%) 腺病毒晚期基因编码病毒的 12 种外壳蛋白, 是在一个启动只有一小部份不编码蛋白质子的作用下生成多顺反子 mrna, ( 通常是基因表达的调控序列再加工成各种 mrna ) ΦX174 乳头瘤病毒基因组基因组中的 D-E-J-F-G-H DNA 中不翻译的部份占基因也转录在同一个 1.0/8.0 Kb mrna 中, 然后再翻译成各种蛋白质, 其中 J F G 及 H 都是编码外壳蛋白的,D 蛋白与病毒的装配有关,E 蛋白即同一段负责细菌的裂解 DNA 片段能够编码两种甚至三种蛋白质分子, 因此它们在功能上是相关的., 这种结构使较小的基因组能够携带较多的遗传信息 6. 病毒基因存在基因重叠 42

基因重叠 : 同一段 DNA 片段能够编码两种甚至三种蛋白质 仅见于线粒体和质粒 DNA 基因重叠有以下几种情况 : 1) 完全重叠 2) 部分重叠 3) 两个基因只有一个碱基重叠 一个基因终止密码子的最后一个碱基是另一个基因起始密码子的第一个碱基 噬菌体 X174 基因图 43

第二节基因组 Genome 四 逆转录病毒基因组的特点 1. 逆转录病毒基因组的结构特征 : RNA 病毒类似于真核生物的 mrna, 5 有帽子,3 有 polya 尾巴 基因组有两个拷贝 编码区 : 均含有 gag pol env 三个结构基因 非编码区 : 与基因组复制和基因表达有关 2. 原病毒基因组的转录和翻译 HIV 逆病毒基因组的转录和翻译需经过 DNA 中间体 ( 原病毒 ) 才能完成 44

第三节基因组学 Genomics 基因组学是研究基因组的科学 背景 :1985 年提出,1990 年开始实施人类基因组计划 (Human Genome Project, HGP), 产生基因组学 概念 : 以分子生物学技术 计算机技术和信息网络技术为研究手段, 以生物体内全部基因为研究对象, 在全基因背景下和整体水平上探索生命活动的内在规律及其内外环境影响机制的科学 目的 : 阐明基因组结构 结构与功能的关系以及基因与基因之间相互作用 分类 : 结构基因组学 功能基因组学 肿瘤基因组学植物基因组学药物基因组学环境基因组学 45

第三节基因组学 Genomics 一 基因组学研究内容 ( 一 ) 结构基因组学 以全基因组测序为目标的基因结构研究, 弄清基因组中全部基因的位置和结构, 遗传图谱 转录图谱 为基因功能的研究奠定基础 其包括建立高分辨的遗传图谱物理图谱转录图谱序列图谱 ( 人类基因组的四张图谱 ) 0.7 cm 或 kb 物理图谱 100 kb STS map 序列图谱 46

遗传图谱 (genetic linkage map, 连锁图谱 ) 孟德尔的 新生 指基因或 DNA 标记在染色体上的相对位置与遗传距离 是以 DNA 多态性遗传标记为界标, 以遗传学距离 ( 在减数分裂事件中两个位点之间进行交换 重组的百分率,1% 的重组率称为 1 厘摩 cm) 为图距的基因组图 人类单倍体基因组 47 遗传标志限制性片段长度多态性 (RFLP) 短串联重复序列 STR (short tandem repeat, SSLP) 单核苷酸多态性 (SNP)

物理图谱 (physical map) - 路标与路轨 表示基因组中不同基因或 DNA 标记之间的实际距离 以定位的序列标记位点 STS 作为路标, 以 DNA 实际长度即 bp kb Mb( 百万碱基对 ) 为图距的基因组图谱 是进行 DNA 序列分析和基因组织结构研究的基础 物理图谱首先是利用限制性内切酶将染色体切成片段, 再根据重叠 序列把片段连接成染色体, 确定遗传标志之间的物理距离 作图标志是已知序列的 DNA 片段, 称为 STS(sequence tagged site) 一对紧密相邻的标志 中心粒 一对相邻较远的标志 染色体图 细菌人工染色体 (80~300 kb) 酵母人工染色体 ( 数百 ~ 2000 kb) 48

转录图谱 ( 表达图谱 ) 生命的乐谱 转录图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列 位置及表达模式等信息的图谱 以表达序列标签 EST( 长度为 300~500 bp 的 cdna) 为位标, 根据转录顺序的位置和距离绘制的图谱, 它是染色体 DNA 某一区域内所有可转录序列的分布图 ( 基因图谱 ). 49

序列图谱 ( 分子水平的物理图谱 ) 重中之重 以某一染色体上所含的全部碱基顺序绘制的图谱 是转录序列 调节序列和功能未知序列的总和 DNA sequencing (DNA 序列分析 ) 是一个包括制备 DNA 片段化及碱基分析 DNA 信息翻译的多阶段的过程 通过测序得到基因组的序列图谱 2003.5.28 2003.6.2 冷泉港 - 人类基因组完成图发布会 终极目标? 50

基因和基因组数据库 http:/www.ncbi.nih.gov/genome 51 51

DDBJ (DNA Data Bank of Japan) 创建于 1984 年, 由日本国家遗传学研究所负责管理 DDBJ 的网址是 :http://www.ddbj.nig.ac.jp/ EMBL (Eulopean Molecular Biology Laboratory) 创建于 1984 年,http://www.ebj.ac.uk/ 1988 年,EMBL NCBI 与 DDBJ 共同成立了国际核酸序列联合数据库中心, 可进行核苷酸序列检索和序列相似性咨询 52 52

第三节基因组学 Genomics 一 基因组学研究内容 ( 二 ) 功能基因组学 ( 后基因组学 ) 在基因组水平上阐明 DNA 序列的功能, 从基因整体水平上对基因的活动规律进行系统研究 1. 基因表达及调控 2. 人类基因信息的识别和鉴定 3. 基因功能信息的提取和鉴定 1) 人类基因突变体的系统鉴定 2) 基因表达图谱的绘制 3) 基因改变一功能改变 的鉴定 4) 蛋白质水平, 修饰状态和相互作用的检测 4. 测序和基因多样性分析 53

第三节基因组学 Genomics 一 基因组学研究内容 ( 三 ) 比较基因组学 comparative genomics 基于基因组图谱和测序基础上, 对已知的基因和基因组结构进行比较, 以了解基因的功能 表达机理和物种进化的学科 将人类基因组与模式生物基因组进行比较研究, 根据 同源性方法分析人类基因的功能, 疾病分子机制 阐明 物种进化关系和基因组内在结构 54

第三节基因组学 Genomics 一 基因组学研究内容 ( 四 ) 基因组学的研究技术和方法 结构基因组学 脉冲场凝胶电泳 毛细管电泳 基因芯片技术 全基因组随机测序 功能基因组学 基因转导技术 反义核苷酸技术 核酶技术 肽核酸 (PNA) 技术 RNA 干扰技术 基因敲除技术 基因表达系列分析 (SAGE) cdna 芯片 反向遗传学 蛋白质组研究 生物信息学技术 55

第三节基因组学 Genomics 二 人类基因组计划及其进展 ( 一 )HGP 揭开生命的奥秘 由美国科学家于 1985 年率先提出 于 1990 年正式启动的 1984 年 12 月 Utah 州的 Alta,White R 受美国能源部的委托, 主持召开了一个小型会议, 讨论 DNA 重组技术的发展及测定人类整个基因组的 DNA 序列的意义 1985 年 6 月, 在美国加州举行了一次会议, 美国能源部提出了 人类基因组计划 的初步草 案 1986 年 3 月, 诺贝尔奖获得者 Renato Dulbecco 发表短文 肿瘤研究的转折点: 人类基 因组测序 (Science, 231: 1055-1056) 1986 年 6 月, 在新墨西哥州讨论了这一计划的可行性 随后美国能源部宣布实施这一草案 1987 年初, 美国能源部与国家医学研究院 (NIH) 下拨了启动经费约 550 万美元,1987 年总 额近 1.66 亿美元 同时, 美国开始筹建实验室 1989 年美国成立 国家人类基因组研究中心 诺贝尔奖金获得者 J.Waston 为第一任主任 1990 年, 历经 5 年辩论之后, 美国国会批准美国的 人类基因组计划 于 10 月 1 日正式启动 总体规划是 : 拟在 15 年内至少投入 30 亿美元, 进行对人类全基因组的分析 56

第三节基因组学 Genomics 二 人类基因组计划及其进展 ( 二 )HGP 的研究进展 目标 : 完成人类基因组全部 DNA 序列测定 在 2003 年 6 月 26 日由美国总统克林顿与英国首相布莱尔联合宣布完成, 这一天也因此成为人类历史上 值得载入史册的一天 主要成果 : 30 亿 bp 的 DNA 包含人类基因约 3-3.5 万个 ; 人类基因组中存在 热点 和大片 荒漠 35.3% 的基因组包含重复序列 1999 年 12 月完成人类第 22 号染色体测序 地球上人与人具有 99.99% 的相同基因,SNP 对 个性 起决定作用 57

第三节基因组学 Genomics 二 人类基因组计划及其进展 ( 三 ) 我国对 HGP 的贡献 1994 年启动, 先后开展 中华民族基因组中 若干位点基因结构的研究 和 重大疾病相 关基因的定位克隆 结构和功能研究 ; 1998 年在上海成立南方基因中心 ; 1999 年在北京成立北方人类基因组中心 ; 1999 年 7 月完成人类 3 号染色体短臂上约 30Mb 的测序, 约占人类基因组的 1% 2001 年 8 月, HGP 中国部分 " 完成图 " 提前两年绘就 58

炎黄一号 (07.10.11) 炎黄计划 (06 年 ) 第一步绘制中国人的基因组参考图, 命名为 炎黄一号, 现已完成 第二步再绘制 99 个中国人的个体全基因组序列图, 构成中国人群的遗传和多态性标准图谱, 成为基因与医疗和健康的关键组成部分, 简称 炎黄 99 第三步在上述基础上开展大众的基因与健康的预测 监测及个体化诊断和治疗, 实现解读基因 2008 年 1 月, 华大基因研究院和国际同行提出 国际千人基因组计划 万种微生物基因组计划, 微生物的基因比人的要少得多, 大约有人的千分之一左右, 现在华大基因已经做了 400 种左右 59

世界首张大熊猫基因组序列图谱 (09.10.11) 大熊猫基因组与狗的基因组在结构上最为接近, 与人也有较大的相似性, 在哺乳动物中与小鼠差异较大 大熊猫的基因组与人的基因组大小相似, 大熊猫共有 21 对染色体, 约为 30 亿个碱基对, 包含 2-3 万个基因 60 60

第三节基因组学 Genomics 二 人类基因组计划及其进展 ( 四 )HGP 的意义与影响 生物的进化史, 都刻写在各基因组的 天书 上 ; 发展生物芯片等生物技术研究新功能基因 ; 对细胞 胚胎 组织工程的推动 : 干细胞 克隆技术 器官再造 发现新的致病基因, 建立疾病模型 ; 基因诊断 : 发展一些复杂疾病的基因诊断方法, 如 肿瘤基因组解剖计划 ; 亲子鉴定 ; 疾病易感基因的识别 ; 转基因食品与基因工程药物 ( 生物产业的社会和经济效益 ) 筛选新药和药物的靶点, 针对基因蛋白产物的药物设计 ; 基因治疗 人类基因组多样性形成个体化医学及个体化药物治疗 : 药物基因组学 61

第三节基因组学 Genomics 二 人类基因组计划及其进展 ( 五 ) HGP 带来的负面作用与影响 侏罗纪公园不再是科幻 种族选择性灭绝性生物武器 基因专利战 基因资源掠夺战 人类基因组基因与个人隐私 伦理学问题 DNA 序列数据的自由共享? 基个 新发现的基因是否可以申请专利? 62 基因是人类的共同财产 VS 人类基因组实际上是个人的 因注定论 人隐私!? DNA Report 我这辈子没戏了! 优生涉及种族问题? 遗传歧视 基因告密

第三节基因组学 Genomics 三 基因组变异的生理病理意义 ( 一 ) 基因组在进化过程中发生变异 基因组的序列变异 : 突变 插入 缺失 不同数目串联重复及 SNP; 寡核苷酸微阵列分析 (ROMA) 检测基因组中 拷贝数多态性. ( 二 ) 染色体 DNA 变异可导致疾病发生 染色体数目的变异 ; 结构与排列的变异 ( 三 ) 线粒体 DNA 突变可引起线粒体基因病 mtdna 无修复系统及 His 保护, 突变频率高, 如 Leber 遗传性视神经病 ( 四 ) 易感基因与环境的相互作用 环境相关疾病易感基因的等位多态性 家族性唐氏症 63 21 染色体易位, 接附在 14 号染色体

第三节基因组学 Genomics 三 基因组变异的生理病理意义 ( 五 ) 所有的疾病, 都可以说是基因病 基因相关论 : 所有疾病都与人类基因有关 ; 单基因病 基因修饰论 : 所有药物都是通过修饰基因本身结构 改变基因的表达调控 影响基因产物的功能而起作用的 ; 基因的多态性 多基因疾病 线粒体基因病 基因组与癌症研究 基因组某单个基因座上存在缺陷基因所引起的一类遗传病 (6000 余种 ) 红绿色盲 血友病等 其特点是一种基因型可产生不同的表现型 : 表型与致病基因之间存在确定对应关系, 或一种表现型 致病基因有显性和隐性之分 可由若干基因型所影响, 即基因型与表型非 一对一 突变基因在 关系 mtdna 上, 其传递和表达完全不同于核基因突变引起的遗传病, 而成为一组 心血管疾病 肿瘤 糖尿病 神经精神类疾病独特的遗传病 ( 老年性痴呆 精神分裂症 ) 自身免疫性疾病, 是目前疾病基因研究的重点 遗传特点 : 母系遗传 ( 突变的 mtdna 通过卵子细胞质的线粒体传给子代 ); 数量特征 : 突变的 mtdna 数量超过阈值时, 会出现临床症状 突变 mtdna 所占比例似与临床症状的表现程 度相关 64

线粒体基因病的数量概念 纯质 (homoplasmy) 杂质 (heteroplasmy) 65

基因组与癌症研究 癌症是最常见的基因病 癌基因和抑癌基因 全部基因组序列对比 获得癌基因活化和抑癌基因失活 : 基因片段丢失, 重排, 碱基替换, 小片段插入或缺失, 扩增或甲基化 66

小 结 研究对象和研究内容 基本概念 : 基因, 基因组, 断裂基因,ORF, 外显子, 内含子, 多基因家族, 基因超家族, 假基因, DNA 多态性, 卫星 DNA,RFLP,SNP, 转座子, 基因重叠, 转位因子, 结构基因组学, 功能基因组学 原核生物基因组的结构特点 真核生物基因组的结构特点 结构基因组学四大图谱 67