群体遗传学 Population Genetics
群体 (population) 一个物种生活在某一地区内的能相互交配的个体群 群体遗传学 (population geneics) 研究人群中的遗传结构及其变化的规律的学科
一 群体中的遗传平衡 基因频率和基因型频率 遗传平衡定律 遗传平衡定律的应用 二 影响遗传平衡的因素
一 群体中的遗传平衡 基因频率和基因型频率 1 基因频率 (gene frequence) A a f A = f a = A A + a a A + a (p) (q) p+q=1 I f A I = A IA + I B + i (p) I f B I = B IA + I B + i (q) I A I B i f i = i IA + I B + i (r) p+q+r=1
在不同群体中各等位基因的频率并不相同, 但频率总和均为 1 例如 : 某北美印第安人群体中 I A I B i 的频率分别为 (p)0.018 (q)0.009 (r)0.973,p+q+r=1 而另一群体中 I A I B i 的频率分别为 (p)0.277 (q)0.170 (r)0.553, p+q+r=1 基因频率的差异反映出不同群体的遗传结构的差异
2 基因型频率 (genotype frequence) A a 基因型 AA Aa aa 基因型频率 AA AA+Aa+aa Aa AA+Aa+aa aa AA+Aa+aa 若已知基因型频率, 则可计算基因频率 若设 f AA =D, f Aa =H, f aa =R, 则 D+H+R=1 等位基因 A 频率 等位基因 a 频率 p= q= 2D+H 2D+2H+2R = 2D+H 2(D+H+R) 2R+H 2D+2H+2R = R+½H = D+½H
例 : 某群体中 AA 个体占 50%,Aa 个体占 20%,aa 个体占 30%, 求该群体中 A 与 a 的基因频率 设 f A =p, f a =q p=f AA +½f Aa =0.5+½ 0.2=0.6 q=f aa +½f Aa =0.3 +½ 0.2=0.4=1-p 对于某些遗传方式, 个体表型可以直接反映出基因型, 因此根据基因型频率就可以计算出基因频率, 例如共显性等
例 : 一个 747 人的群体,M 血型者有 233 人, 占 31.2%;N 血型者 129 人, 占 17.3%;MN 血型者 485 人, 占 51.5%, 求 L M L N 基因型频率 设 f L M=p, f L N=q p=mm+½mn=0.312+½ 0.515=0.57 q=nn+½mn=0.173+½ 0.515=0.43=1-p 如果杂合子的表型与显性纯合子没有区别时, 那么就 不能通过观察表型来推算基因型频率 此时只能借助 于 Hardy-Weinberg 平衡定律进行计算
一 群体中的遗传平衡 基因频率和基因型频率 遗传平衡定律 遗传平衡定律的应用 二 影响遗传平衡的因素
遗传平衡定律 (Hardy-Weinberg 定律 ) 在一定条件下, 即群体很大, 随机婚配, 无选择, 无迁移, 无突变, 则不论开始的基因频率和基因型频率如何, 只要经过随机交配, 一代以后, 群体中的基因频率和基因型频率就可以一代一代保持不变, 成为遗传平衡的群体 (Law of genetic equilibrium)
假设某一基因座位 ( 等位基因 A 和 a) 的基因频率为 :f A =p 和 f B =q A(p) a(q) A(p) AA(p 2 ) Aa(pq) a(q) Aa(pq) aa(q 2 ) 在遗传平衡的群体中, 基因频率与基因型频率间存在以下对应关系 : f AA =p 2, f Aa =2pq, f aa =q 2, 且 p 2 +2pq+q 2 =1
群体中有 3 种基因型 (AA, Aa, aa) 和 6 种婚配类型 AA Aa aa AA Aa aa
Paternal genotypes AA(p 2 ) Aa(2pq) aa(q 2 ) AA (p 2 ) AA X AA (p 4 ) AA X Aa (2p 3 q) AA X aa (p 2 q 2 ) Maternal genotypes Aa (2pq) Aa X AA (2p 3 q) Aa X Aa (4p 2 q 2 ) Aa X aa (2pq 3 ) aa (q 2 ) aa X AA (p 2 q 2 ) aa X Aa (2pq 3 ) aa X aa (q 4 )
AA AA AA Aa AA aa Aa Aa Aa aa aa aa p 2 p 2 =p 4 2(p 2 2pq)=4p 3 q 2(p 2 q 2 )=2p 2 q 2 2pq 2pq=4p 2 q 2 2(2pq q 2 )=4pq 3 q 2 q 2 =q 4 子代基因型 AA Aa aa p 4 0 0 2p 3 q 2p 3 q 0 0 2p 2 q 2 0 p 2 q 2 2p 2 q 2 p 2 q 2 0 2pq 3 2pq 3 0 0 q 4 (p+q) 4 =1 p 2 (p 2 +2pq+q 2 ) q 2 (p 2 +2pq+q 2 ) =p 2 =q 2 2pq(p 2 +2pq+q 2 ) =2pq
若是非平衡群体, 经一代随机婚配, 也可以达到遗传平衡 某群体有 10000 人, 其中 AA 有 5000 人,Aa 有 2000 人,aa 有 3000 人 问该群体是否为平衡群体? 几代随机婚配后可达平衡? [ 分析 ]:(1) f AA =0.5, f Aa =0.2, f aa =0.3 Allele A p=0.5+½ 0.2=0.6, a 基因频率 q=0.3+½ 0.2=0.4 (2) 假设群体是平衡的, 那么理论上 f AA =0.6 2 =0.36, f Aa =2 0.6 0.4=0.48, f aa =0.4 2 =0.16 可见理论值与实际观察值不符, 经 X 2 检验, 差异显著, 由此可判断该群体不是平衡群体
子代基因型 婚配类型 AA Aa aa AA AA 0.5 2 AA Aa 2(0.5 0.2) AA aa 2(0.5 0.3) Aa Aa 0.2 0.2 Aa aa 2(0.2 0.3) aa aa 0.3 2 0.25 0.1 0.01 0.1 0.3 0.02 0.01 0.06 0.06 0.09 1 0.36 0.48 0.16 经过一代随机婚配, 该群体即可达到遗传平衡
一 群体中的遗传平衡 基因频率和基因型频率 遗传平衡定律 遗传平衡定律的应用 二 影响遗传平衡的因素
遗传平衡定律的应用 1 计算基因频率 (1)AR 基因频率计算 患者为 aa, 表型正常者为 AA 或 Aa; 平衡时基因型频率分别为 q 2 p 2 2pq 根据 Hardy-Weinberg 定律, 由隐性纯合子的基因型频率可求得等位基因的基因频率 q= q 2 p=1-q
例 : 苯丙酮尿症 (PKU) 是常染色体隐性遗传病, 群体发病率为 1/10000, 求各等位基因频率 解 : q 2 =1/10000 q=1/100, p=1-q=99/100 1 杂合子频率 2pq=2 1 1/100 1/50 当 q 很小时,p=1-q 1, 则杂合子频率 2pq 2q
(2) 复等位基因频率计算 如果某基因座位上有 3 个等位基因, 则 p+q+r=1, 在遗传平衡的群体中基因频率和基因型频率的关系仍符合二项式平方展开公式 : (p+q+r) 2 =p 2 +2pq+q 2 +2qr+r 2 +2pr 例如 : 人类 ABO 血型受控于 9q34 上的 I A I B i 在一项对 190177 人的群体调查发现,A 型者 79334 人 ;B 型者 16279 人 ; O 型者 88782 人 ;AB 型者 5782 人 求 I A I B i 基因频率 表型 (ABO 血型 ) 表型频率基因型基因型频率 A B O AB 0.41716 0.08560 0.46684 0.03040 I A I A I A i I B I B I B i ii I A I B p 2 +2pr q 2 +2qr r 2 2pq
1 r 2 =0.46684 r = r 2 = 0.46684=0.683 2 B+O 频率为 q 2 +2qr+r 2 =(q+r) 2 =(1-p) 2 =0.08560+0.46684 =0.55244 1-p= B+O p=1- B+O =1-0.55244 =0.257 A+O 频率为 p 2 +2pr+r 2 =(p+r) 2 =(1-q) 2 =0.41716+0.46684 =0.88400 1-q= A+O q=1- A+O =1-0.88400 =0.060 合计 :p+q+r =0.683+0.257+0.060 =1
(3) 共显性等位基因频率计算 例 :MN 血型 现调查有一个 847 人的群体,M 血型者 233 人 ;N 血型者 129 人 ;MN 血型者 485 人 计算此群体中 L M L N 的频率 L M 的频率 p= 233 2+485 847 2 L N 的频率 q= 129 2+485 847 2 =0.57 =0.43 注 : 也可以先分别算出各种血型 ( 基因型 ) 的频率, 再计算基因频率
(4)X 连锁隐性基因频率计算 X 染色体上的基因频率如按女性群体数据计算, 其方法同常染色体上基因频率的计算 ; 如按男性群体数据计算, 因男性是半合子, 所以男性群体的表型频率即为此基因频率 设 X A 频率为 p,x a 频率为 q, 则基因型 X A X A X A X a X a X a X A Y X a Y 基因型频率 p 2 2pq q 2 p q
例 : 红绿色盲基因 X d 频率为 7%, 那么男性发病率为多少? 女性的发病率呢? 男性的发病率为 7%, 患者基因型是 X d Y 女性的发病率为 0.49%, 患者基因型是 X d X d 携带者频率约为 14%, 基因型是 X D X d
针对不同遗传方式, 在遗传平衡定律的基础上, 可以推导出以下数据 : 对一种罕见的 AD 病来说, 纯合患者 (AA) 的频率 p 2 很低, 可以忽略 所以几乎所有的受累者均为杂合子, 即 2pq 1 p 2 +2pq 对一种罕见的 AR 病来说, 纯合患者 (aa) 的频率 q 2 很低, 可以忽略 所以杂合携带者频率约为致病基因频率的 2 倍, 即 : 2pq=2q(1-q)=2q-2q 2 2q 对一种罕见的 AR 病来说,q 很小,p 近于 1, 所以杂合子携带者对纯合患者的比例为 2pq 2q q 2 = 2 q q 2
对一种罕见的 XD 病来说,p 很小, 可以忽略, 所以男患 者对女患者的比例为 p p 2 = 1 +2pq p +2q = 1 p +2(1- p) = 1 2- p 1 2 对一种罕见的 XR 病来说, 男患者对女患者的比例为 q q 2 = 1 q
一 群体中的遗传平衡 基因频率和基因型频率 遗传平衡定律 遗传平衡定律的应用 二 影响遗传平衡的因素
二 影响遗传平衡的因素 ( 一 ) 近亲结婚 (consanguineous marriage) 3-4 代内具有共同祖先的个体之间婚配 在我国常见表亲结婚 隔山表亲结婚 从表亲结婚 堂兄妹姑表亲姨表亲舅表亲
半同胞 隔山表亲 从表亲
1 亲缘系数 亲缘系数 (coefficient of relationship, r) 两个个体在一定位点上具有共同祖先同一个等位基因的概率 A 1 A 2 A 3 A 4 1/2 1/2 1/2 1/2
亲缘级数亲属关系亲缘系数 一级亲 二级亲 三级亲 父 ( 母 ) 子, 同胞 祖父 ( 母 ), 舅 姨 姑 叔 侄 甥 孙 同父异母或同母异父同胞 曾祖父 ( 母 ), 舅 ( 叔 ) 公 姨 ( 姑 ) 婆 曾孙 堂 ( 表 ) 兄弟姐妹 r=1/2 r=1/4 r=1/8 遗传上最近的亲缘关系是? 同卵双生
Royal Consanguinity Czarina Alexandra I was a carrier of hemophilia Her son, Grand Duke Alexis was affected with hemophilia A well-documented case of consanguinity to retain power occurred in European Royal Families of many countries.
2 近婚系数 近婚系数 (inbreeding coefficient, F) 由于近亲婚配使来自共同祖先的一个等位基因在 子代中纯合的概率 1) 常染色体上基因近婚系数的计算 1 同胞兄妹的近婚系数 S 为 A 1 A 1 的概率 :(½) 4 A 1 A 2 A 3 A 4 P 1 P 2 1/2 1/2 B 1 B 2 S 为纯合子的总概率 : F=4 (½) 4 =¼ 1/2 1/2 S A 1 A 1 A 2 A 2 A 3 A 3 A 4 A 4
2 舅甥女或姑侄 ( 二级亲属间婚配 ) 间的近婚系数 A 1 A 2 A 3 A 4 S 为 A 1 A 1 的概率 :(½) 5 P 1 P 2 1/2 1/2 B 1 B 2 S 为纯合子的总概率 : F=4 (½) 5 =1/8 C 1/2 1/2 S 1/2 A 1 A 1 A 2 A 2 A 3 A 3 A 4 A 4
3 一级表亲婚配的近婚系数 A 1 A 2 A 3 A 4 S 为 A 1 A 1 的概率 :(½) 6 S 为纯合子的总概率 : F=4 (½) 6 =1/16 P 1 P 2 1/2 1/2 B 1 B 2 1/2 1/2 C 1 C 2 1/2 S 1/2 A 1 A 1 A 2 A 2 A 3 A 3 A 4 A 4
4 二级表亲婚配的近婚系数 S 为 A 1 A 1 的概率 :(½) 8 S 为纯合子的总概率 : F=4 (½) 8 =1/64 对于常染色体基因, 近婚系数与 亲缘系数的对应关系为 :F=r/2 A 1 A 2 A 3 A 4 P 1 P 2 1/2 1/2 B 1 B 2 1/2 C 1 C 2 1/2 1/2 S 1/2 1/2 D 1 D 2 1/2 A 1 A 1 A 2 A 2 A 3 A 3 A 4 A 4
2)X 染色体连锁基因的近婚系数计算 1 姨表兄妹婚配中,X 连锁基因的传递图解 X 1 Y X 2 X 3 P1 B1 1 1/2 1 1/2 1/2 1/2 P2 B2 C1 C2 1 1/2 X S 1 X 1 (½) 3 =1/8 X 2 X 2 (½) 5 =1/32 X 3 X 3 (½) 5 =1/32 F=1/8+2 1/32=3/16
2 舅表兄妹婚配中,X 连锁基因的传递图解 X 1 Y X 2 X 3 P1 P2 B1 1 1/2 0 1/2 1/2 B2 C1 C2 1 1/2 1 S X 2 X 2 (½) 4 =1/16 X 3 X 3 (½) 4 =1/16 F=2 1/16=1/8
3 姑表兄妹婚配中,X 连锁基因的传递图解 P1 B1 C1 0 0 X 1 Y X 2 X 3 1 1/2 0 1/2 1/2 1/2 P2 B2 C2 S F=0, 不能形成纯合子
4 堂表兄妹婚配中,X 连锁基因的传递图解 P1 B1 C1 0 0 X 1 Y X 2 X 3 0 1/2 1/2 1 0 1/2 P2 B2 C2 S F=0, 不能形成纯合子
3 近亲结婚的危害 可增加隐性遗传病的发病风险 (esp. AR); 增加多基因病的发病风险 ; 增加先天出生缺陷的风险 例 : 已知 Ⅱ 1 为 AR 患者, 该病的 PF=1/10000, 求 Ⅱ 2 与其姨表兄弟结婚后代的再发风险? Ⅱ 2 与群体中一个无关个体婚配, 后代的再发风险又是多少? Aa Aa Aa 1/2 aa Aa 2/3? Aa 1/4
1) 如果 Ⅱ 2 与其姨表兄弟婚配, 子代发病风险为 2 3 2) 如果 Ⅱ 2 与群体中无亲缘关系的人婚配, 子代发病风险为 : 2 3 1 1 = 4 4 1 1 = 50 4 1 24 由于 PF=1/10000 则 :q 2 =1/10000, 则 q=1/100,2pq 2q=1/50 1 300
( 二 ) 突变对遗传平衡的影响 世代 I A A A a a p=0.6; q=0.4 II A A a a a p=0.4; q=0.6
( 二 ) 突变对遗传平衡的影响 突变率 (mutation rate) 一般用每一代中每一百万个 基因中发生突变的次数来表示, 即 n 10-6/ 基因 代 A u v a f A =p f a =q 由 A 突变为 a 的数量 :pu=(1-q)u; 由 a 突变为 A 的数量 :qv pu=(1-q)u > qv pu=(1-q)u < qv (1-q)u = qv 基因 a 的数量增加基因 A 的数量增加中性突变对遗传平衡无影响, 在遗传平衡时 基因频率完全由等位基因突变频率决定 u q= u+v v p= u+v
例 : 人类对苯硫脲 (PTC) 的尝味能力决定于 7q 上的基因 T,T 突变为 t 后, 失去了 PTC 的尝味能力 即属中性突变 不同人群中等位基因 T 和 t 频率的差异可能就是来源于突变率的差异 西欧白人人群中 u=0.6 10-6 / 代,v=0.4 10-6 / 代 q= u 0.6 u+v = 0.6+0.4 = 0.60 味盲 (tt) 的频率约为 36% 我国汉族人群中 u=0.9 10-6 / 代 v=2.1 10-6 / 代 q= u u+v 0.9 = = 0.30 味盲 (tt) 的频率约为 9% 2.1+0.9
( 三 ) 选择对遗传平衡的影响 自然选择 (selection) 在自然界的一个群体内, 造成不同基因型个体成活率 生育率差异的过程, 称为自然选择 适合度 (fitness) 在一定环境条件下, 某基因型的个体能够生存并将其基因传给下一代的相对能力, 可用相同环境中不同个体的相对生育率来衡量, 一般用 f 表示 选择系数 (selection coefficient) 在选择作用下降低的适合度, 一般用 S 表示,S=1-f, 反映了某一基因型个体在群体中不利于生存的程度 若 S=1, f=0, 则说明患者不能将其基因传递给后代 选择压力 : 选择对群体遗传结构改变所引起的作用
1 选择对显性基因的作用 Aa aa 当 S=1 时,f=1-S=0. 群体中致病基因 A 的频率 p 在一代中即降低为 0, 下一代中的致病基因频率 p 将与突变率 v 相同 因此致病基因 A 的频率迅速降低 H=2pq 2p v=sp=s ½H 对 AD 病来说, 如果是致死的, 则其发病率完全决定于突变率 v; 如果患者治愈后并和正常人一样地生育, 即 f=1,s=0, 经过一代以后, 群体发病率将增高一倍 ( 选择压力放松 )
2 选择对隐性基因的作用 AA Aa aa 选择对常染色体隐性基因的作用是缓慢的 当 S=1 时,f=1-S=0, 但致病 a 基因频率降低很慢 经 n 代后 q n =q/(1+nq) u=sq 2 例 : 白化病基因 a 在群体中的频率为 0.01, 若选择压力增加, 使所有患者 aa 均不生育, 要经多少世代才能使群体中的 a 降低一半? n= 1/q n -1/q =1/0.005 1/0.01 =200-100=100( 代 ) 对 AR 病来说, 如果是致死的, 在完全放松选择压力下, 群体发病率上升是很缓慢的
对 AR 病来说, 携带者 / 患者的比例 Disease Incidence Carrier Frequency Ratio Carrier/Affected 0.1 0.43 4.3 0.01 0.18 18.0 0.001 0.06 61.2 0.0001 0.02 198.0 q2 2pq
3 选择对 X 连锁隐性基因的作用 设 f X d=q, 由于男性是半合子, 群体中有 ⅓ 的 X 染色体存在于男性,⅔ 的 X 染色体存在于女性 而且只有男性患者才被选择 每一代隐性致病基因频率减少 ⅓Sq X A X A X A X a X a X a X A Y X a Y p 2 2pq q 2 p q f X a = q+2pq+2q 2 = q 3 男患者 : X a Y; 女患者 : X a X a u=s*⅓q
4 选择对 X 连锁显性基因的作用 设 f X D=p, 由于男性半合子和女性杂合子均将被选择 每一代显性致病基因频率减少 Sp X A X A X A X a X a X a X A Y X a Y p 2 2pq q 2 p f XA = p+2pq+2p 2 3 = p q 男患者 : X A Y; 女患者 : X A X a, X A X A v=s*(⅓p+ 2pq) Sp
5 选择压力改变对遗传平衡的作用 选择压力增加引起致病基因频率向降低方向变化 AD, XD: AR: XR: 选择压力放松 AD,XD: S=0, 一代以后群体发病率增加一倍 AR: S=0, 群体发病率上升很缓慢 XR: S=0, 经过三个世代致病基因频率可增加一倍 选择的作用 : AD>XR>AR
遗传漂变 I II III Generation A A A a a A A a a a a a a a p=0.6; q=0.4 p=0.5; q=0.5 p=0; q=1 IV a a a a a q=1 N a a a a a q=1
( 四 ) 遗传漂变 迁移对遗传平衡的影响 建立者效应 (founder effect) 若一个数目有限的新群体原是由少数几个迁移个体 ( 奠基者 ) 繁衍而来的, 在这个群体中由于遗传漂变使某个等位基因频率达到很高的现象称为建立者效应
( 四 ) 遗传漂变 迁移对遗传平衡的影响 迁移 (migration) 一个群体中的个体迁入另一个群体, 并与后一个群体中个体婚配 Generation I II A A A a a A A A a a A a a p=0.6; q=0.4 p=0.5; q=0.5
(1) 有两个相互隔离的小岛, 均为平衡群体, 火山爆发使二岛合为一体, 合并前甲岛 a 基因频率为 q=1%, 乙岛 a 基因频率为 q= 50% 求 1) 刚合并时大群体中的基因频率和基因型频率 ;2) 达平衡后, 大群体中的基因频率和基因型频率 q= 1%+50% 2 =25.5% 甲 : f AA =0.9801, f Aa =0.0198, f aa =0.0001 乙 : f AA =0.25, f Aa =0.50, f aa =0.25 p=1-q=74.5% 合并后 : f AA =0.61505, f Aa =0.3099, f aa =0.12505 (2) 平衡后 : f AA =0.555, f Aa =0.380, f aa =0.065
基因频率 (gene frequence) 某个等位基因在群体中所占的比率, 用小数表示 基因型频率 (genotype frequence) 某种基因型个体在群体中所占的比率, 用小数表示