浙 江 农 林 大 学 学 报!!"#$!!""%#$ &$%'&()!"#$%&' "( )*+,-&%. / 0 1 2%-3+$4-56 *+,-#).##(//012,3342!56&!5$&78!"9$2"%2""! 毛竹生长素反应因子基因的生物信息学分析及差异表达 程占超! 侯 丹! 马艳军! 高 健!国际竹藤中心 国家林业局竹藤科学与技术重点开放实验" 北京 9""9"!# 摘要! 生长素反应因子%:;< &基因家族在植物的生长发育中起至关重要的作用' 关于毛竹 7*6''"45&8*64 +9#'-4 :;< 基因家族在花器官中生物信息学分析未见报道' 以毛竹花器官为材料! 采用生物信息学的方法! 对毛竹中 :;< 基 因进行筛选! 并对其系统进化关系( 保守基序及在花器官中的差异表达模式进行了初步的分析' 结果表明$ 毛竹 全基因组中含有 %% 个 :;< 基因! 分为!! "! # 类' 与拟南芥 /$&:-9";4-4 5*&'-&%& 和水稻 <$6=& 4&5-3& 分别比较! 发现毛竹与水稻存在 99 个姐妹同源基因对' 此外! 7*+/>19/! 7*+/>19% 和 7*+/>1/& 在花芽( 雌 蕊和 幼 胚 中 高 量表达! 同时 7*+/>1!! 7*+/>1/5! 7*+/>19%! 7*+/>19/! 7*+/>1/&! 7*+/>1$! 7*+/>1/$! 7*+/>1/( 在雌蕊 和幼胚中高量表达! 推测这些基因可能在花发育和种子发育中发挥重要的作用' 图 / 表 9 参 /! 关键词! 林木育种学) 毛竹) 生长素应答因子) 花发育 中图分类号! =$!! 文献标志码! : 文章编号!!56&!5$&7"!59$&5%!5&$%!5$ >,+,4?+@ABC,D B4BEF3,3 B4* *,??G@G4C,BE GHI@G33,+4 +? BJH,4 @G3I+43G?BDC+@!:;<$ KG4G,4 7*6''"45&8*64 +9#'-4 LMNOP QRB4DRB+S MTU VB4S W: XB41J4S P:T Y,B4 % ZGF [B\+@BC+@F +? >BA\++ B4* ;BCCB4 =D,G4DG B4* ]GDR4+E+KF +? =CBCG <+@G3C@F :*A,4,3C@BC,+4S ^4CG@4BC,+4BE LG4CG@?+@ >BA\++ B4* ;BCCB4S >G,1,4K 95595!S LR,4B $!"#$%&'$( ]RG BJH,4 @G3I+43G?BDC+@!:;<$ KG4G?BA,EF IEBF3 B _GF @+EG,4 IEB4C K@+`CR B4* *GaGE+IAG4CBE I@+DG33G3S 3JDR B3 @++C B4* 3R++C *GaGE+IAG4C B3 `GEE B3?E+`G@ B4*?@J,C *GaGE+IAG4C. ]+ I@+a,*G B CRG+@GC,DBE \B3,3?+@?E+`G@ B4* 3GG* *GaGE+IAG4C +? 7*6''"45&8*64 +9#'-4S B KG4+AG!`,*G B4BEF3,3 +? CRG I@Ga,+J3EF J4*+D! JAG4CG* :;< KG4G?BA,EF?+@ 7*? +9#'-4 `B3 D+4*JDCG*. ^4 CR,3 3CJ*F B `R+EG!KG4+AG 3J@aGF +? 7*@ +9#'-4 `B3 IG@?+@AG* B4* B *GCB,EG* B4BEF3,3 +? CRG KG4G A+C,? B4* IRFE+KG4GC,D DEB33,?,DBC,+4 `B3 I@+a,*G*. ;G3JEC3 3R+`G* %% :;< KG4G3 `R,DR `G@G DEB33,?,G*,4C+ CR@GG K@+JI3. : D+AIB@BC,aG B4BEF3,3 +? CRG :;< KG4G3 BA+4K A*@ +9#'-4S @,DGS B4* /$&:-9";4-4 3JKKG3CG* B C+CBE +? 99 3,3CG@ IB,@3!T3:;<!bRG:;<$ I@+a,*,4K,43,KRC3,4C+ ab@,+j3 +@CR+E+K+J3 @GEBC,+43R,I3 \GC`GG4 T3:;<3 B4* brg:;<3. <+@ :;< GHI@G33,+4 IBCCG@43 +? *,ag@3g?e+@be +@KB43S A*+/B19/S A*+/B19%S B4* A*+/B1/& 3R+`G* CRG R,KRG3C GHI@G33,+4,4 CRG?E+`G@ \J*S I,3C,ES B4* F+J4K GA\@F+c `RG@GB3S A*+/B1!S A*+/B1/5S A*+/B19%S A*+/B19/S A*+/B1/&S A*+/B1$S A*+/B1/$S B4* A*+/B1/( `G@G R,KREF GHI@G33G*,4 CRG I,3C,E B4* CRG F+J4K GA\@F+. ]R,3 3CJ*F 3JKKG3CG* CRBC :;< KG4G3 ABF IEBF B ag@f D@,C,DBE @+EG *J@,4K?E+`G@ B4*?@J,C *GaGE+IAG4C +? A*@ +9#'-4. &LRS /?,K. 9 CB\. /! @G?. ' )*+,-%.#(?+@G3C C@GG \@GG*,4Kc A*6''"45&8*64 +9#'-4c BJH,4 @G3I+43G?BDC+@3c?E+@BE *GaGE+IAG4C 植物生长激素能够调节或者影响植物不同的生理过程" 比如顶端优势( 侧根萌发( 导管分化( 胚胎 发育和芽的伸长" 也可以促进细胞的分裂( 延伸和分化 &9') 在分子水平上" 生长素能够特异性地调节基 收稿日期*!597!57!9/+ 修回日期*!597!5$!9% 基金项目* 国 家 高 技 术 研 究 发 展 计 划 %, (7/- 计 划 $项 目!!59/::95!75$!%$ + 国 家 自 然 科 学 基 金 资 助 项 目!/9&$57$/$ 作者简介* 程占超" 博士" 从事林木遗传育种研究) N!AB,E- DRG4KdRB4eDRB+f#!7.D+A) 通信作者* 高健" 研究 员" 博士" 博士生导师" 从事林木遗传育种研究) N!AB,E- KB+1,B4f,D\@.BD.D4
第!" 卷第 " 期 程占超等* 毛竹生长素反应因子基因的生物信息学分析及差异表达 /1/ 因的表达!#"# 生长素信号转导相关的! 类主要蛋白是 $%&'($$) $ $*+) 和,-+ 复合体!!!""% 作为生长素信 号途径一个重要的成员& $*+) 基因能够通过结合生长素启动子上的 $%&*. 来调控生长素反应基因的表 达!/"% 这些 $*+) 基因调控不同的发育过程& 比如顶芽形成& 导管组织的形成& 胚胎' 花和果实的形成!0"# 一个 经典的 $*+ 蛋白 & 结构相对简 单& 大部分蛋 白的分子 量为 1234!5 67 & 含有! 个 保守的结构 域& 它们分别是 8 末端 78$ 结合结构域(797 )& 中间区域(:* )和 - 末端二聚体结构域(-;7 )% 不同的结构 域也决定 $*+ 不同的功能& 797 在信号转导中起着鉴别作用& -;7 可以使 $*+ 之间形成二聚体 & 而 :* 则起着转录激活或抑制的功能!1"% <=:$,>? 等!@"鉴定出第 4 个 $*+ 基因& 即!"!#$4& 先后在拟南 芥 %&'()*+,-)- ".'/)'0' 和水稻 1&23' -'")4' 中鉴定出 #! 和 #/ 个 $*+ 基因!A!45"% $*+) 大部分在植物中发 现& 比如在双子叶' 单子叶' 裸子和蕨类植物中都有发现& 但是在动物和微生物中至今没有发现% 因 此& $*+) 是植物中特有的一类转录因子!44"% $*+ 的生物学功能主要来自拟南芥 $*+ 基因功能缺失的表 型& 到目前为止& 已经发现很多 $*+ 基因及其功能& 比如 %56! 和 75$1!4#!4""% 研究表明* 拟南芥 '&8! 的突变体会出现花蕊基部和顶端的发育不良& 说明 %5$! 在调节花器官发育上起作用+ 缺失 %5$1 & 导 致上胚轴的向光性和下胚轴的向地性功能的消失% 这 # 个 $*+ 基因有着不同的功能& 很少在功能上出 现冗余现象% 毛竹 9.2//+-"':.2- ;*</)- 与水稻' 玉 米 =;' >'2- 等同属 于禾本科 BCDEFGHDH 单 子叶植物& 但是& 毛竹营养生长周期长& 开花时期不确定& 开花后死亡& 导致竹林面积减少& 对经济发展和生态环 境造成重大损失和破坏& 竹子开花的调控机制一直是竹类植物研究中的难点和热点% 目前& $*+ 家族 基因在模式植物拟南芥' 水稻' 玉米中已有研究& 而毛竹 $*+ 家族基因在花器官和幼胚发育上鲜有报 道% 本研究通过生物信息学的方法& 根据毛竹的基因组& 鉴定 $*+ 基因家族& 进行进化树分析' 基序 分析' 基因差异表达模式分析& 为研究 $*+ 基因在毛竹花和种子发育过程中的功能奠定基础% 4!"! 材料与方法 实验材料 毛竹开花实验地位于广西壮族自治区桂林市南岭山系的西南部% 该毛竹林属于自然生长状态& 基本 无人为干扰% 以毛竹的花器官为材料& 进行解剖& 分离出花芽' 苞片' 颖片' 稃片' 雄蕊' 雌蕊和幼胚 以及未开花的成熟叶片& 建立 @ 个样本进行转录组高通量测序%!"# 4I#I4 方法 毛竹中 JKH$*+ 家族成员的检索 从拟南芥基因组数据库,KLLMN ''OOOIDCDPFQRM)F)IRCS' )和水稻基因 组 数 据 库,KLLMN ''CFTHIMUDGLPFRURSVIE)%IHQ%'FGQH&IKLEU )中 分 别 检 索 拟 南 芥 和 水 稻 中 $*+ 蛋 白 序 列 + 毛 竹 $*+ 相关蛋白序列从毛竹基因组数据库,KLLMN ''OOOIPDEPRRSQPIRCS'FGQH&IW)M)中获得% 毛竹 JKH$*+ 家族 蛋白的序列号& 开放阅读框的长度' 氨基酸数目' 分子质量和等电点在表 4 中提供% 毛竹 $*+ 分子量 及等电点数据通过.&J$,X,KLLMN''OHPIH&MD)VIRCS'TREM%LHYMF' )获得% 4I#I# 进化树分析 用 -U%)LDUZ 4I@!,KLLMN''OOOITU%)LDUIRCS' )!4/" 软件对蛋白全长的多序列比对进行分析& 进 化 树 分 析 前 去 掉 比 对 序 列 的 差 异 和 不 明 确 序 列 % 用 GR"CRRLHQ GHFSKPRC"WRFGFGS 方 法 通 过 :.B$ 0I5,KLLMN''OOOIEHSD)R[LODCHIGHL'EHSDIKLEU )!40"构建系统进化树% :.:. \HC)FRG "I44I#,KLLMN''EHEH")%FLHIRCS')!41"在线工具鉴定候选蛋白序列的保守区域& 公式为 DGV & ED&FE%E G%EPHC R[ ERLF[) ] #5 & EFGFE%E OFQLK! 0 和 ED&FE%E OFQLK " #55 % 4I#I" 表达量分析 将花芽' 苞片' 颖片' 稃片' 雄蕊' 雌蕊和幼胚以及未开花的成熟叶片的 +J^: 值 4I#I! 基序分析 输入到 -U%)LHC!I5 & 用 _D\D ;CHH?FHO 生成热点图!4@"% # #"! 结果 毛竹 $%&'() 家族序列鉴定 通过 #! 个拟南 芥和 #/ 个水稻 $*+ 蛋白序列检 索毛竹基因 组数据库& 共 得到 "" 个 $*+ 蛋 白,表 4)% 从表 4 可以看出& $*+ 家族的蛋白的等电点为 /I##3AI#!& 蛋白序列的长度为 4A#34 #/1 个氨基酸& 分子量的大小为!4I15 34!AI51 67 %
*- 浙江农林大学学报 年 月 日 表 毛竹中 成员数量及其属性! "# "$%! & ' #" & # &% ' 蛋白氨基酸开放阅等电分子 ' 蛋白氨基酸开放阅等电分子毛竹 ' 序列号毛竹 ' 序列号名称长度读框 点量 名称长度读框 点量 ' ()**+ ),- ),- ') (.)+ -- - *,. /-,* ' (-*+ - -,,*- '. ().+ -) / *,)-., ') (-+ - / *,., '* ()*+-/ -)* /,* -/,.- '. (*)+ / )/ -,/,./ '- (+ */ - -,/ -.,-/ '* ()-)+) ).// *,. /, ' (*/+ /. * -,-, '- ()/-+ / -- *,),/ ' (+ / *,, ' (*+- *,//,/- '/ (+ * *) -, ), ' (*+.-.) /,) *.,) ') ()+* / -/. -,) //, '/ (-+. *) -,/ /), ') (-+*. ) )-- -,.,) ' (-*+ -* -,/ -*,/ ') (-+/.*.,- /, ' (./+ -* / -,.-,. ')) (.+* * ). -,) )/, ' (-+ *. -,-.,-. '). (/)+- * *) -, ), ') (//+* *,-, ')* (+). ) *,*,/ '. (-/+) - -,* -,// ')- (*+. / *,*.,/ '* (***+)/ -) -,- /, ') (.-+ ). * -,,* '- (*+.) -), -*,) ') (..+*..)/ ) *,.,.* ' (+/ )-. /*,* )/,/ ')/ (+/. --. -,/-.,)- ' (-+).. )*,**, '. (.+-.. /,.,) '/ (--+ -) /. *,,. '. (+-- **. --* *,-- -,)* ' (--+. -/) *,).,** '. (+). -,. /,** ' (-)+.. - ) *-, ), '.) (/)+-/ / */ *,.., ' (*.+) /* /* -,*, '.. ()+. *. *.*,* *-,.. 毛竹 家族进化分析系统进化结果显示.. 个基因之间相似性比较高 图 将.. 个毛竹的 ' 蛋白列同 ) 个拟南芥和 * 个水稻的蛋白序列同时比对 发现可以将这 ) 个物种的 ' 分为三大类 分别为 和 其中有 ) 个基因分布在 类 个基因分布在 类 还有. 个基因属于 类 大部分的 '! 包含 ) 个经典的结构域 0 结构域 和 '1'' 家族结构域 有 个与水稻的同源关系较近的基因对 *)!-"!.!/"!)!*"!)!"!.!."!) /!)"! -!) "!)!"!-!"! 和!"! 这些基因大部分出现在 类和 类中 说明这 类的基因相对比较保守 毛竹 基序分析为了进一步了解毛竹 ' 保守区域的结构 通过 在线工具构建基序分析图 结果如图 所示 毛竹 ' 成员含有的基序结构不一 大概有 个不同的基序组成 其中每个基因都包含不同种类的基序 大部分的基序为. 个 大部分的 ' 基因都包含 & & & &. & 和 & 等 这些基序出现的次数较多 而 &) &- 和 & 等基序在这些基因中不常见 从进化角度来看 同源关系较近的 类的基因在基序的长度和种类较为相似 比如 类的 "!. "!/ 和 "!) 等 类的 "! "!) 和 "!)) 等 类的 "! "! 和 "!) 等 以上结果说明大部分的毛竹 ' 家族基因是相当保守的 毛竹 ' 基因在花器官中差异表达分析为了研究毛竹 ' 基因在花器官发育中的作用和调控机制 进一步分析 ' 基因在花芽 苞片 颖片 稃片 雌蕊 雄蕊 幼胚和未开花的叶中表达分析 结果表明 "! "!) "!. "!* "!. "!)* "!.) "!) 和 "!) 在花芽中高量表
第 卷第 期 程占超等 毛竹生长素反应因子基因的生物信息学分析及差异表达 - #$%& 图 毛竹 水稻和拟南芥 的系统进化树分析 '$&&#( ))& * & +%&# # & $'$ " $! $' ), $$ '! 达 说明这些 基因可能在开花初期起着重要的调控作用 图 在雄蕊中 和 高量表达 但是这些基因在幼胚中表达量极低 和 在雌蕊中表达量较高 同时在幼胚中也高量表达 说明这些基因同时调控毛竹雌蕊形成和幼胚的发育 和 同时在花芽 雌蕊和幼胚中高表达 这 个基因可能既调控开花又能控制花的发育 此外 和 在颖片和稃片中都高量表达 可能调节稃片和颖片的发育 讨论 生长素是植物器官发育和模式形态形成和发育非常重要的信号分子 生长素转导途径中最重要的 类家族分别为 和! 在发育过程中 能直接地调控下游靶基因的表达 但大部 分的 和 都是以家族的形式存在 所以它们在植物体内的调控机制是相当复杂的 基因也参与生殖过程 木瓜 和番茄!"# $%"# 的 基因家族的分析 和鉴定揭示了该家族基因在花和果实的发育过程中具有调控作用 在本研究中 通过生物信息学工具 检索 个毛竹的 基因 在拟南芥和水稻中的 基因 分别为 和 个 基因家族在不同植物中成员数量不同 这可能与植物体内的基因组复制有关 而基因数量多少由该基因复制事件的频率决定 毛竹基因组为 " 左右 大于水稻和拟南芥的基因
+ 浙江农林大学学报 年 月 日 图 毛竹 保守基序分析!"!# $!"%& '!# "!" &"#& " $!! 组 以上分析表明 毛竹 基因复制事件的频繁发生有可能导致毛竹 家族成员数量增多 通过系统进化分析 毛竹 家族基因大致分为 ( 个亚组 图 亚组内的基因相似性比较高 但是亚组之间相似性不高 或许在基因功能上也有差异 毛竹与拟南芥和水稻的 家族的系统进化关系表明 毛竹与水稻之间有 对同源基因对 这些基因对都属于 类和 类 一方面说明毛竹的 家族与水稻有很高的同源性 图 另一方面说明毛竹 家族 类和 类的基因保守性很高 )( 研究人员对水稻和拟南芥的 基因进行了广泛地研究 基因在花和种子发育中起着非常重要的作用 为研究毛竹的开花及种子发育提供了许多有用的信息 据报道 拟南芥的 ( 和 ( * 参与花的发育 在花中高量表达 与 ( 和 * 同源的毛竹 * 和 ( 在幼胚和雌蕊中都高量表达 说明 个毛竹 基因可能与 ( 和 * 基因功能相似 推测它们在毛竹花和种子发育过程中起着关键的作用
第 卷第 期 程占超等 毛竹生长素反应因子基因的生物信息学分析及差异表达 4 图 毛竹 基因在不同花器官中表达模式分析! " # $ % / 3 4 2 %0 参考文献 &'! "#$!( %) &$#!' # &% * &"+,#( -$ '+"!+.,) /0% 1 ' " #.!!! ) %23) %( 04 2 56 1 ) 5*' 1) '7 1, '! #+# +# " #, #,! 8 #+# ( )) %2) 4( 3% 3/4 7 9,:) 65 ;) 57 1) *!$" "# +# " +#! '% #! #!! )) /0%) %%( / 1' ) '7 ) 56 1 1, +# "! 8 #+#! ) /00) /( 56 1 ) '7 ' +# ## +,!! &) /004) ( 30 '* ') 7 7) 6 ) * " ""# "+#+ +" # ; +8"! +" "! " #! ""#! ) /00%) %0( / /30 5*' 1) '7 ) 56 1 '%) #+# +# #,#." #!# )!) %4) /0( %23 %232 '7 ) 56 1 '8 ( )!# " # +#! &) /00/) ( 4 2 *717 & ) 7 1 ) 56 1 ) * 9##!" "8 +# #, ''' "
' 浙江农林大学学报 年 月 日!" # $# %& % '" (# (()! *" +,-. /01 -,.,.,.,!" # # %1$& % $" 2 (34 "! 5 --.., 6.-/,,,6,, /,,!" " # # 277# 7& 227 227" 2% 8)9:( # 5((98 9" 9! $%$&'$ -., -,. -,., ;6. 0.,. -/.,!" '$ ## 277# '& 2$' 2$22" 2$ 8( # 93*((4 ( # (( ) # 9 48$.-/ -., /0. -,. # -.,. /,..,.,!, /!" # # '& ' " 2' 98334! )# +534 9!# (*4: # 9 9.,-& 0;,,. /, /-, ;6 /,6 6,..!" %( ( # 277# $& $ $" 2 9 :# 9(8( +# (9(34 )# (+&.-/./,.6,- 6. "!" ')# 2%# 2& ' 7" 2 5(< 9 # (:4 " 9 /.. =. -..,, (( " ( & * + * #.& # 277'& 2 7" 2 )48!"! 90, ; />,.. -.6,!" +"(# $# 2& %$ %$" 27 39 (# ()4( # (43 9"./ 6., /0,.=!" $# 2'# %& $ '" 3 9# (99!# 8+(4 +# /01., 0..., -.,,/ 6 -, 6,,- /0.,!" # 277# 22& 27% 272" 2 王垒 陈劲枫 娄丽娜 等 黄瓜果实中, 和 /01 基因对外源激素的应答! 西北植物学报 22 22 22%2 *4+ # 8(4!# 3 # (0. 6 ;./,. /01 6 ; /,. -/-/;, 0../..!" ( $(( # 22# & 22 22%2" 史梦雅 李阳 张巍 等 生长素反应因子作用机制研究进展! 生物技术通报 2 $ 8 6# <#?84+ *#. -. /0. -,.!" ( # 2& $ " % )4)(4)( # 5 # # " +.,-,.# /-,. 6 0..., /01 6,.,.!" # 2# $& '7 " $ 83 8# < 8# 83 # " -,, -,. 54,..6,..,..,,, /0. /,..,.,!" % # 2$# 2& " ' (# : 5# * # /,.,# /,6,, 6.!" &! # # %1$& $ " : # 9<+ :# 8 :" +. 6. /0. -,. 6.,.,. 6.,.. /,.,!" - -"(..# 22# %& $' " 3843 " ') - /!( " 8;& # 2%" (4+?/# <# /;# " 9,..,,..,;., -.. ; ;.. ( ((!" % -# 2%# $& $' $2" 7 @ </# *4+ /=# 8(4 A# 3 2#, -,. -,,.. /0. # /,..,.,. -,. --//,. - $0 )!" %1 # 2# 2& 27 2" % 3( # 84)(!# *(!( )# )348(4 -,,,., /0. -,. 3439(3,! ;6.!" /)!"# 7# 2& 2$% 2'2" %2! # ) /#?83 </".. /0. -,. 27 /0,6!!" # # %& 77 7" % 849( # *44 # * +# 9 -, 4,.. (,, $ /,,.;,6!!" /)!"# # 2'& 7% 72"