DOI: /SP.J 应用与环境生物学报 Chin J Appl Environ Biol 2014,20 ( 5 ) : 铁皮石斛尿苷二磷酸葡萄糖焦磷酸化酶基因 (UGP)

Similar documents
应用与环境生物学报 2011,17 ( 1 ): 012~017 Chin J Appl Environ Biol=ISSN X DOI: /SP.J 籽粒苋苹果酸酶 (NAD-ME) 基因密码子偏好性分析 * 李平

tbjx0121ZW.PDF

分子生物学实验专题手册.ai

i

..I II GST GST

生 物 进 化 指 生 物 与 其 生 存 环 境 之 间 相 互 作 用 并 导 致 遗 传 系 统 和 表 型 发 生 一 系 列 不 可 逆 转 的 改 变 的 过 程, 这 种 改 变 一 般 导 致 对 其 生 存 环 境 的 相 对 适 应 生 物 进 化 表 现 在 生 物 多 样 性

标题

Microsoft PowerPoint - 04 Models of Amino Acid and Codon Substitution.ppt

中国细胞生物学学报 Chinese Journal of Cell Biology 2018, 40(12): DOI: /cjcb 两种茶树全基因组数据的密码子偏好性比较分析 王占军 #* 李豹 # 姜行舟欧祖兰徐忠东代欢欢 ( 合肥师

United Nations ~ ~ % 2010

doc

2

多肽知识手册.doc

doc

11 25 stable state. These conclusions were basically consistent with the analysis results of the multi - stage landslide in loess area with the Monte

34 生命科学研究 2014 年 现为在蛋白质翻译过程中偏好使用其中某一个或 [3] 两个密码子 影响同义密码子中不同密码子使用频率的因素很多, 比如 GC 含量 (AT-rich 的生物倾向于使用 AT-rich 的密码子 ); 施加于 DNA 序列上的突变压力 ; 基因表达水平的因素 : 高表达

Microsoft Word tb 赵宏宇s-高校教改纵横.doc


Microsoft Word 陈伟婵-二校

第四章 蛋白质的营养

SVM OA 1 SVM MLP Tab 1 1 Drug feature data quantization table

< F63756D656E D2D796E2D31C6DABFAF2D31D6D0D2BDD2A9CFD6B4FABBAF2D C4EA2DB5DA37C6DA2D30352DD6D0D2BDD1D0BEBF2E6D6469>

填 表 说 明 1. 本 表 所 填 数 据 截 至 时 间 为 2011 年 9 月 底 2. 本 表 请 用 A4 纸 双 面 打 印, 加 盖 学 校 公 章 后 上 报 3. 表 内 所 填 数 据 请 学 校 认 真 核 实, 确 保 准 确 无 误 4. 建 设 完 成 情 况 对 照

a b

畜牧 动物医学 蚕 蜂

H 2 SO ml ml 1. 0 ml C 4. 0 ml - 30 min 490 nm 0 ~ 100 μg /ml Zhao = VρN 100% 1 m V ml ρ g

<D2BDC1C6BDA1BFB5CDB6C8DAD7CAB8DFB7E5C2DBCCB3B2CEBBE1C3FBB5A52E786C7378>

Microsoft Word doc

48 5 ( Pinctada) ( P. fucata ), 3 [ 7 ] ( P. maxima ) ( P. albina), ( P. margaritifera) ( P. nigra) RAPD, ( P. chemnitzi), ( Pteria penguin) [ 1-2 ] [

TGF-β AngⅡ B SD ~ 220g SPF. SCXK No SYXK ~ 25 40% ~ 70% OR37G-C

材料! 方法! # 基因的扩增及其序列分析

Microsoft Word 定版

Supporting_Information_revise

Dan Buettner / /

Microsoft Word 聂雪梅.doc

(CIP) : /. :, (/ ) ISBN T S H CI P (2006) XIANGPIAOWANLI JIUW ENH UA YU CH ENGYU

59-81

njj00004zw.PDF

380 研 究 论 文 发 酵 天 数 双 乙 酰 测 定 : 参 照 GB 标 准 发 酵 液 中 的 化 学 成 分 的 测 定 : 采 用 GC-8A 型 气 相 色 谱 测 定 1.5 离 子 注 入 方 法 [6] 把 待 处 理 的 菌 株 细 胞 均 匀 涂

~ 10 2 P Y i t = my i t W Y i t 1000 PY i t Y t i W Y i t t i m Y i t t i 15 ~ 49 1 Y Y Y 15 ~ j j t j t = j P i t i = 15 P n i t n Y

~ ~ ~

Vol. 22 No. 4 JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY Aug GPS,,, : km, 2. 51, , ; ; ; ; DOI: 10.

: 307, [], [2],,,, [3] (Response Surface Methodology, RSA),,, [4,5] Design-Expert 6.0,,,, [6] VPJ33 ph 3,, ph, OD, Design-Expert 6.0 Box-Behnken, VPJ3

3 ( ) (flakes) () (coixenolide, C 38 H 70 O 4 ) (5,6) (4) (7) (4,3) (Erhlin) 4 5 ( ) (4 ) ( ) ( ) 4 5 ( ) (8) (nitrogen-free extract, NFE) (

物理学报 Acta Phys. Sin. Vol. 62, No. 14 (2013) 叠 [4]. PET 设备最重要的部件就是探测器环, 探测 备重建图像具有减少数据插值的优势. 器环的性能直接影响 PET 的成像能力. 探头与探头 之间得到的符合直线叫做投影线. 所有的投影线在

标题

Microsoft Word _File000009_ doc

mm 400 mm 15 mm EOF mm/10a Fig. 1 Distributions

Mixtions Pin Yin Homepage

一步一步教你使用NCBI

Microsoft Word - A _ doc

698 39,., [6].,,,, : 1) ; 2) ,, 14,, [7].,,,,, : 1) :,. 2) :,,, 3) :,,,., [8].,. 1.,,,, ,,,. : 1) :,, 2) :,, 200, s, ) :,.

Microsoft Word - 第2章 遺傳.doc

窑 374窑 国 际 生 殖 健 康 / 计 划 生 育 杂 志 2013 年 9 月 第 32 卷 第 5 期 JInt Reprod Health 蛐 Fam Plan,September 2013 熏 Vol. 32 熏 No 统 计 学 方 法 数 据 审 核 后 录 入 计


Microsoft Word 任 辉_new_.doc

第 33 卷 第 2 期 2010 年 4 月 脱 蛋 白 较 好 的 方 法 是 Sevag 法, 它 是 根 据 蛋 白 质 在 氯 仿 等 有 机 溶 剂 中 变 性 的 特 点, 使 蛋 白 质 变 性 成 胶 状, 此 法 条 件 温 和, 可 避 免 多 糖 的 降 解

A9R1m8w0s5_g9pd6r_4yg.tmp

<4D F736F F D D DBACEC0F25FD0A3B6D4B8E55F2DB6FED0A32D2D2DC8A5B5F4CDBCD6D0B5C4BBD8B3B5B7FBBAC52E646F63>

~-' 一 ~ U 百 陳 子 展 ( ), 本 名 炳 聾, 字 子 展, 以 字 行 於 世, 湖 南 長 沙 人 幼 時 曾 在 私 塾 求 學, 後 入 長 沙 縣 立 師 範 學 校, 再 入 東 南 大 學 教 育 系, 因 病 輯 學 回 湖 南, 寄 住 長 沙

5-25袁宏钧.indd

序 近 十 年 来, 在 人 类 基 因 组 计 划 的 带 动 下, 临 床 分 子 生 物 学 步 入 了 一 个 快 速 发 展 的 阶 段 O 这 一 阶 段 层 出 不 穷 的 新 理 论 和 新 技 术 的 诞 生 发 展 与 应 用, 积 极 地 促 进 和 提 高 了 临 床 诊 断

2 3. 1,,,.,., CAD,,,. : 1) :, 1,,. ; 2) :,, ; 3) :,; 4) : Fig. 1 Flowchart of generation and application of 3D2digital2building 2 :.. 3 : 1) :,

第二部分

~ a 3 h NCEP ~ 24 3 ~ ~ 8 9 ~ km m ~ 500 m 500 ~ 800 m 800 ~ m a 200

<4D F736F F D20C1D6C2B3C6BCD0A3D1F932>

<30302DB7E2C3E6CDC6BDE9A3A D32A3A92E4D4449>

(1) 脂 肪 族 氨 基 酸 (2) 芳 香 族 氨 基 酸 : 苯 丙 氨 酸 色 氨 酸 酪 氨 酸 (3) 杂 环 氨 基 酸 : 脯 氨 酸 组 氨 酸 3 按 侧 基 R 基 与 水 的 关 系 分 : (1) 非 极 性 氨 基 酸 : 有 甘 氨 酸 丙 氨 酸 缬 氨 酸 亮 氨

权 利 要 求 书 1/2 页 1. 一 种 RAMOSA2 多 肽 或 其 编 码 基 因 或 RAMOSA2 多 肽 的 调 节 剂 的 用 途, 用 于 调 节 植 物 株 高 穗 表 型 或 支 梗 长 度 ; 所 述 RAMOSA2 多 肽 选 自 : (a)seq ID NO :2 所

% 8. 48% 3 80 Alcalase Novozymes Alcalase 2. 4 L Bacillus licheniformis 2. 4 AU /g 1. 2 Hitachi S-4700 JEOL JEM-1200EX Olympus Bu

< F63756D656E D2D796E2D31C6DABFAF2D31D6D0D2BDD2A9CFD6B4FABBAF2D C4EA2DB5DA36C6DA2D30322DD7A8C0FBD0C5CFA2D7CAD4B4D1D0BEBF36C6DA2E6D6469>

CBI intro for undergrad.ppt

Microsoft Word _4_doc doc

标题

3期

Microsoft Word - 张晓君.doc

(CIP) : /. :, (/ ) ISBN T S H CI P (2006) CH IJIASH EN GXIAN G YINSHI WEN H U A Y U CHENGY U 1

ADU

untitled

2 : 111 ( Pinctada maxima), 13, 11,,,,,, 15, 25 cm, cm, 4 5 kg 1-2],,, 3-7] 24] 25-26],,, ] min, 1, 5 m 4 m, 20 m , 9-22],,, (

Microsoft Word 杨芳-二校出4173

Microsoft Word - A doc

<4D F736F F F696E74202D20A960A6CCA5CDA7DEAB4FB0B7A4B6B2D02DC2B2B3F82E BACDBAE65BCD2A6A15D>

度 身 體 活 動 量 ; 芬 蘭 幼 兒 呈 現 中 度 身 體 活 動 量 之 比 例 高 於 臺 灣 幼 兒 (5) 幼 兒 在 投 入 度 方 面 亦 達 顯 著 差 異 (χ²=185.35, p <.001), 芬 蘭 與 臺 灣 幼 兒 多 半 表 現 出 中 度 投 入 與 高 度

θ 1 = φ n -n 2 2 n AR n φ i = 0 1 = a t - θ θ m a t-m 3 3 m MA m 1. 2 ρ k = R k /R 0 5 Akaike ρ k 1 AIC = n ln δ 2

1 GIS 95 Y = F y + (1 F) (1) 0 0 Y0 kg/hm 2 /day F y 0 y c kg/hm 2 /day [12] y m 20 kg/hm 2 /hour Y = cl cn ch G [ F( y ) T m yo + (2) (1 F)(

BISQ理论模型与声波测井响应研究

Syngene GBOXHR Retsch MM400 KQ DE Eppendorf Table 1 The sources of Astragali Radix and Hedysarum Radix No. 1 AMM2011_NMGTY Astr

untitled

36期

Microsoft Word - 8 期中文目次.doc

u l l u u l l

現代學術之建立 陳平 美學十五講 淩繼堯 美學 論集 徐複觀 書店出版社 的方位 陳寶生 宣傳 敦煌文藝出版社 論集續篇 徐複觀 書店出版社 莊子哲學 王博 道家 的天方學 沙宗平 伊斯蘭教 周易 經傳十


甘蔗糖业2011年电子合订本

/MPa / kg m - 3 /MPa /MPa 2. 1E ~ 56 ANSYS 6 Hz (a) 一阶垂向弯曲 (b) 一阶侧向弯曲 (c) 一阶扭转 (d) 二阶侧向弯曲 (e) 二阶垂向弯曲 (f) 弯扭组合 2 6 Hz

101¦~«ü©w¦Ò¸Õ¸ÑªR-¥Íª«¦Ò¬ì

,, [1 ], [223 ] :, 1) :, 2) :,,, 3) :,, ( ),, [ 6 ],,, [ 3,728 ], ; [9222 ], ;,,() ;, : (1) ; (2),,,,, [23224 ] ; 2,, x y,,, x y R, ( ),,, :

1 引言

标题

Transcription:

2014-10-25 DOI: 10.3724/SP.J.1145.2014.03041 应用与环境生物学报 Chin J Appl Environ Biol 2014,20 ( 5 ) : 759-766 铁皮石斛尿苷二磷酸葡萄糖焦磷酸化酶基因 (UGP) 的密码子偏好性分析 * 孙晶 1, 2 何涛 1 万闰兰 1, 2 彭小凤 1, 2 淳泽 1** 1 中国科学院成都生物研究所成都 610041 2 中国科学院大学北京 100049 摘要尿苷二磷酸葡萄糖焦磷酸化酶 (UDP-Glucose pyrophosphorylase,ugpase) 是糖代谢的主要酶类之一. 为了解铁皮石斛 (Dendrobium officinale) 尿苷二磷酸葡萄糖焦磷酸化酶基因 (UGP) 的密码子使用特性, 运用 CHIPS CUSP 和 CodonW 在线程序分析自主克隆的铁皮石斛 UGP 基因 (GenBank 登录号 :KF711982.1) 的密码子偏好性, 并与其他物种的 UGP 基因以及基因组进行比较. 结果显示, 铁皮石斛 UGP 基因偏好使用 A/T 结尾的密码子,27 种偏好密码子 (RSCU > 1) 中偏好性较强的有 TAA 和 CCU(RSCU 2). 与其他物种的 UGP 基因密码子使用对比后, 发现不同物种 UGP 基因密码子使用偏好性存在一定差异. 在 9 个所选物种的聚类分析中, 发现基于 UGP 基因 CDS 序列聚类的进化树比基于 RSCU 的聚类更与传统的系统发育观点接近. 与 3 种生物基因组密码子使用频率比较发现, 与大肠杆菌基因组密码子使用频率差值较大的有 23 个, 与酵母和拟南芥基因组差值较大的均有 13 个, 这预示着铁皮石斛 UGP 基因在酵母和拟南芥中的表达效率较高. 本研究结果为铁皮石斛 UGP 基因选择最佳的外源表达系统以及提高其表达水平奠定了前期的研究基础. 图 2 表 4 参 28 关键词铁皮石斛 ; 尿苷二磷酸葡萄糖焦磷酸化酶基因 (UGP); 密码子偏好性 ; 聚类分析 CLC Q949.71 + 8.430.3 The Codon usage bias of UDP-glucose pyrophosphorylase gene (UGP) in Dendrobium officinale* SUN Jing 1, 2, HE Tao 1, WAN Runlan 1, 2, PENG Xiaofeng 1, 2 & CHUN Ze 1** 1 Chengdu Institute of Biology, Chinese Academy of Sciences, Chengdu 610041, China 2 University of Chinese Academy of Sciences, Beijing 100049, China Abstract UDP-glucose pyrophosphorylase is one of the key enzymes in the carbohydrate metabolic pathway. In order to understand the codon bias of Dendrobium officinale UDP-glucose pyrophosphorylase gene (UGP) and to select appropriate expression systems, the D. officinale UGP (GenBank Accession: KF711982.1) was analyzed by online Codon W, CHIPS, and CUSP programs, and then compared with UGP genes from other species and genomes. The results showed that the D. officinale UGP preferred to use codons ended with A or T. There were 27 biased codons (relative synonymous codon usage, RSCU > 1), among which TAA and CCU were highly frequently used codons with RSCU value more than 2. Comparative analysis of UGP genes from the selected species indicated that there existed differences in their codon bias. In comparison with the phylogenetic tree based on RSCU, the phylogenetic tree calculated with CDS sequence of the 9 species was more consistent with conventional developmental viewpoint. There were 23 codons showing distinct usage differences between UGP of D. officinale and genome of Escherichia coli, 13 between UGP of D. officinale and genome of Saccharomyces cerevisiae and Arabidopsis thaliana. Therefore, it might be more suitable for expression of D. officinale UGP in the Saccharomyces cerevisiae and Arabidopsis thaliana expression systems. Our study may provide a basis for selecting appropriate expression systems and improving the expression level of D. officinale UGP. Keywords Dendrobium officinale; UDP-glucose pyrophosphorylase gene; codon bias; cluster analysis 收稿日期 Received: 2014-03-24 接受日期 Accepted: 2014-04-14 * 国家科技支撑计划项目 (2011BAC09B04) 中国科学院知识创新工程及院地合作项目 (XBCD-2011-007) 四川省 十二五 中药材育种攻关项目 (2011NZ0098-12-10) 四川省应用基础研究和科技支撑计划项目 (2013JY0133 2014JY0179 2014FZ0086) 和四川省科技基础条件平台项目资助 Supported by the National Science and Technology Pillar Program of China (2011BAC09B04), the Knowledge Innovation and Cooperation Project of the Chinese Academy of Sciences (XBCD-2011-007), the Sichuan 12th Five-year Plan Project of Chinese Herbal Breeding Research (2011NZ0098-12-10), the Applied Basic Research Project of Sichuan (2013JY0133, 2014JY0179), the Science and Technology Pillar Program of Sichuan (2014FZ0086) and the Sichuan Platform Construction Project for Science and Technology Condition ** 通讯作者 Corresponding author (E-mail: chunze@cib.ac.cn)

760 铁皮石斛尿苷二磷酸葡萄糖焦磷酸化酶基因 (UGP) 的密码子... 5 期 编码天然蛋白质 20 种氨基酸的密码子共 61 种, 每种氨基 酸至少对应 1 种密码子, 最多的有 6 种对应的密码子. 编码同一 种氨基酸的密码子称为同义密码子. 在蛋白质合成过程中同义 密码子并不被随机使用, 某一物种或某一基因往往倾向于使 用一种或几种特定的同义密码子, 这种现象被称为密码子使 用偏好性 (Codon usage bias). 密码子使用特征的分析有助于 理解分子进化 基因功能 蛋白质的表达和蛋白的二级结构, 因此对于密码子使用偏好性的研究具有理论和实际意义 [1-3]. 密码子使用偏好性是生物在长期进化过程中形成的, 具有种族特异性, 该现象常导致外源基因在宿主中的表达降 低. 因此在研究基因异源表达的时候, 密码子偏好性研究具 有重要作用, 使用密码子的偏好性可利于选择合适的宿主表 达系统, 或者通过改造密码子来提高外源基因的表达 [4]. 尿苷二磷酸葡萄糖焦磷酸化酶 [Uridine diphosphate (UDP)-glucose pyrophosphorylase,ugpase] 是植物糖代谢的 主要酶类之一, 它催化反应尿苷三磷酸 (Uridine triphosphate, UTP)+ 葡萄糖 -1-P UDP- 葡萄糖 + 焦磷酸 (Pyrophosphoric acid,ppi), 而尿苷二磷酸葡萄糖 (Uridine diphosphate glucose,udpg) 是高等植物中主要活化糖的形式, 作为葡萄 糖基供体参与多糖类物质的合成代谢 [5]. 已有研究表明尿苷二 磷酸葡萄糖焦磷酸化酶基因 (UGP) 是多糖生物合成的关键酶 基因 [6-8]. 目前关于铁皮石斛 (Dendrobium officinale)ugp 基因 研究报道还较少, 虽然已经自主克隆获得其 cdna 序列, 但对 于该基因最佳外源表达系统的选择以及表达水平的预测等问 题还知之甚少, 为了更确切地了解铁皮石斛多糖的合成过程, 并且将它应用到天然药物的生物合成方面, 有必要对铁皮石斛 UGP 基因的功能 ( 调控 ) 以及它的异源表达情况进行深入研究. 本研究利用自主克隆的铁皮石斛 UGP 基因序列, 通过 CHIPS CUSP 和 CondonW 在线程序分析铁皮石斛中 UGP 基因 密码子使用偏好性, 进一步与其他 8 个物种 UGP 基因的密码 子使用偏好性作比较并进行聚类分析, 可为深入了解该基因 及表达调控机制提供理论基础 ; 同时也将铁皮石斛 UGP 基因 与大肠杆菌 酵母 拟南芥基因组密码子偏好性进行比较, 分析该基因与代表生物基因组的密码子使用偏好性差异, 以期为该基因实现异源表达选择合适的宿主表达系统, 以 及通过优化密码子提高基因的表达量提供参考. 1 材料与方法 1.1 序列来源铁皮石斛 UGP cdna(dougp) 是本实验室通过 RT- PCR 和 RACE 方法自主克隆的, 该序列编码区长度为 1 419 bp, 编码 472 个氨基酸,GenBank 登录号为 KF711982.1. 水 稻 (Oryza sativa) 甘蔗 (Saccharum officinarum) 大麦 (Hordeum vulgare) 拟南芥 (Arabidopsis thaliana) 棉 花 (Gossypium hirsutum) 马铃薯 (Solanum tuberosum) 酵母 (Saccharomyces cerevisiae) 大肠杆菌 (Escherichia coli)ugp 基因的完整编码区序列来自 GenBank, 序列登录 号分别为 AB062606.1 FJ536261.1 X91347.1 AT3G03250 GU067484.1 AY082621.1 NM_001179601.3 M98830.1. 大 肠杆菌 酵母 拟南芥基因组的密码子偏好性数据来源于 Codon Usage Database(http://www.kazusa.or.jp/codon). 1.2 分析软件利用 CodonW 软件 (http://codonw.sourceforge.net/) 计算 有效密码子数 (Effective number of codons,enc) 计算 CDS 区的 GC 含量 密码子中第 3 位碱基的 GC 含量 (GC3s) 和相 对同义密码子使用概率 (Relative synonymous codon usage, RSCU). 利用 EMBOSS 中的 CUSP 程序 (http://150.185.138.86/ cgi-bin/emboss/cusp) 计算密码子使用概率. 1.3 同义密码子使用偏好性分析 1.3.1 有效密码子数 ENC 值是一个基因的密码子使用频率 与同义密码子平均使用频率偏差的量化值, 代表某个基因的 密码子偏好程度 [9]. 取值范围为 20( 每个氨基酸只使用一个 密码子 )-61( 各个密码子被均衡使用 ), 其值越小, 表明该基 因的密码子使用偏好性越强 [10]. 1.3.2 全长基因的 GC 含量和 GC3s 含量 GC3s 则表示密码子 的第 3 位碱基中 G + C 的含量在第 3 位碱基总量中所占的比率. 1.3.3 同义密码子的相对使用度 RSCU 能直观地反映出密 码子使用偏好性程度, 该值的计算方法为某一密码子所使 用的频率与其在无偏使用时预期频率之间的比值 [11], 若某一 密码子的 RSCU 值等于 1, 则表明该密码子的使用没有偏爱, RSCU 值大于 l 表明该密码子的使用频率相对较高,RSCU 值 小于 l 表明该密码子的使用频率相对较低 [12]. 1.3.4 比例比例 (Fraction 表示各个密码子在编码该氨基 酸的密码子中所占的比例 ( 各个比例相加总和等于 1). 1.3.5 频率 (Frequency) 频率 (Frequency) 代表某一特定 密码子在编码基因总密码子中出现的频率 (%). 1.4 基于密码子使用偏好性和 CDS 序列的聚类利用 SPSS 软件对 9 条 UGP 基因基于密码子使用偏好性 进行聚类分析. 在此过程中, 将每一条基因作为一个对象, RSCU 作为变量, 采用 59 个同义密码子 [ 去除编码蛋氨酸 (M) 的密码子 AUG 和编码色氨酸 (W) 的密码子 UGG 以及 3 个终 止密码子 ] 的 RSCU 值对其密码子使用偏好性进行分析, 基因 间的距离规定为 RSCU 的欧氏平方距离 [13]. 利用 MEGA 5.0 软 件, 采用 Neighbor-Joining 法对 14 条 CDS 序列进行系统发育树 的构建. 2 结果与分析 2.1 铁皮石斛 UGP 基因密码子使用偏好性 2.1.1 有效密码子数和 GC 含量运用 CondonW 分析得到该 序列的 ENC 值和 GC 含量. 由表 1 中可见, 铁皮石斛 UGP 基因的 ENC 值 GC 含量和 GC3s 值分别为 58.04 0.431 和 0.425. ENC 值越大, 对应的内源基因往往表达量也越低,Jiang 等将 ENC 取值 35 作为偏好性强弱的区分标准 [14]. 铁皮石斛 UGP 基因的 ENC 值偏大, 表明铁皮石斛 UGP 各密码子在编码氨基酸时出 现的频率比较一致, 基因表达量偏低 ; 编码区 GC 含量较低, 整个编码区序列中 A + T 含量大于 G + C, 而 GC3s 值则更低, 应用与环境生物学报 Chin J Appl Environ Biol

20 卷孙晶等 761 表 1 铁皮石斛 UGP 基因的密码子偏好性 Table 1 Codon bias of UGP gene of Dendrobium officinale 氨基酸 Amino acid 密码子 Codon 个数 Number 相对密码子使用度 RSCU 频率 Frequency 比例 Fraction Phe UUU 10 0.95 21.142 0.476 UUC 11 1.05 23.256 0.524 Leu UUA 5 0.61 10.571 0.102 UUG 14 1.71 29.598 0.286 CUU 10 1.22 21.142 0.204 CUC 5 0.61 10.571 0.102 CUA 9 1.1 19.027 0.184 CUG 6 0.73 12.685 0.122 Ile AUU 18 1.5 38.055 0.5 AUC 11 0.92 23.256 0.306 AUA 7 0.58 14.799 0.194 Met AUG 5 1 10.571 1 Val GUU 17 1.55 35.941 0.386 GUC 10 0.91 21.142 0.227 GUA 8 0.73 16.913 0.182 GUG 9 0.82 19.027 0.205 Ser UCU 9 1.74 19.027 0.29 UCC 5 0.97 10.571 0.161 UCA 6 1.16 12.685 0.194 UCG 1 0.19 2.114 0.032 Pro CCU 13 2.17 27.484 0.542 CCC 2 0.33 4.228 0.083 CCA 8 1.33 16.913 0.333 CCG 1 0.17 2.114 0.042 Thr ACU 6 1.04 12.685 0.261 ACC 7 1.22 14.799 0.304 ACA 5 0.87 10.571 0.217 ACG 5 0.87 10.571 0.217 Ala GCU 12 1.66 25.37 0.414 GCC 6 0.83 12.685 0.207 GCA 9 1.24 19.027 0.31 GCG 2 0.28 4.228 0.069 Tyr UAU 6 1.2 12.685 0.6 UAC 4 0.8 8.457 0.4 TER UAA 1 3 2.114 1 UAG 0 0 0 0 His CAU 5 1.67 10.571 0.833 CAC 1 0.33 2.114 0.167 Gln CAA 3 0.55 6.342 0.273 CAG 8 1.45 16.913 0.727 Asn AAU 14 0.93 29.598 0.467 AAC 16 1.07 33.827 0.533 Lys AAA 11 0.58 23.256 0.289 AAG 27 1.42 57.082 0.711 Asp GAU 22 1.69 46.512 0.846 GAC 4 0.31 8.457 0.154 Glu GAA 20 1.03 42.283 0.513 GAG 19 0.97 40.169 0.487 Cys UGU 1 0.67 2.114 0.333 UGC 2 1.33 4.228 0.667 TER UGA 0 0 0 0 Trp UGG 4 1 8.457 1 Arg CGU 3 1.5 6.342 0.25 CGC 2 1 4.228 0.167 CGA 1 0.5 2.114 0.083 CGG 1 0.5 2.114 0.083 Ser AGU 6 1.16 12.685 0.194 AGC 4 0.77 8.457 0.129 Arg AGA 2 1 4.228 0.167 AGG 3 1.5 6.342 0.25 Gly GGU 6 0.77 12.685 0.194 GGC 5 0.65 10.571 0.161 GGA 14 1.81 29.598 0.452 GGG 6 0.77 12.685 0.194 下划线表示 RSCU > 1. Underlined are the values of RSCU >1. 这意味着铁皮石斛 UGP 偏好使用以 A/T 结尾的密码子. 2.1.2 相对同义密码子使用度在铁皮石斛 UGP 基因的密 码子中, 有 27 种密码子的 RSCU 值大于 1, 为铁皮石斛 UGP 的 偏好密码子, 并且其中 19 种密码子都是以 A/T 结尾 ; 其中偏 好性较强的有 TAA 和 CCU(RSCU 2); 然而编码 Met 的密码 子 ATG, 编码 Trp 的密码子 TGG 以及编码 Arg 的密码子 AGA CGC 其 RSCU 值均等于 1, 表明铁皮石斛 UGP 基因中 Met Trp 和 Arg 的使用没有偏好性. 大多数 G 或 C 碱基结尾的密码子的 RSCU 值和 Fraction 值均较低, 表明这些密码子在该基因中的 使用频率较低. 2.2 铁皮石斛 UGP 与其他物种 UGP 密码子偏好性的比较 2.2.1 ENC RSCU 及 GC 含量选用作比较分析的其他生物 有原核生物大肠杆菌 真核生物酵母以及单子叶植物水稻 甘 蔗 大麦和双子叶植物拟南芥 棉花 马铃薯等. 各物种 UGP 基因序列已在 GenBank 登录注册, 其各自的 ENC 值 RSCU 和 GC 含量计算结果见表 2 表 3. 结果显示, 各物种 UGP 基因的 ENC 值在 43.43-58.04 之间. 其中酵母 大肠杆菌 大麦的 ENC 均在 50 以下, 说明其表达水平较高 ; 甘蔗 棉花 马铃薯的 ENC 值在 50-55 之间, 其表达水平一般, 而拟南芥和铁皮石斛 ENC 值均大于 55, 其表达较低. 由此可见,UGP 基因偏好性较弱, 在 各物种的表达水平普遍不高, 但物种间还是存在一定差异. 密码子 RSCU 值大于 1 的水稻中有 34 个, 甘蔗有 29 个, 大 麦有 26 个, 拟南芥有 34 个, 棉花有 29 个, 马铃薯有 28, 酵母有 25 个, 大肠杆菌有 26 个. 其中 G/C 结尾的密码子水稻有 21 个, 甘蔗有 16 个, 大麦有 20 个, 拟南芥有 19 个, 均占 50% 以上 ; 而 棉花 G/C 结尾的密码子只有 9 个, 马铃薯有 9 个, 酵母有 11 个, 这几个均不到 50%; 大肠杆菌有 13 个. 由此可见, 水稻 甘蔗 大麦 拟南芥偏向以 G/C 结尾, 铁皮石斛则与棉花 马铃薯 酵母类似, 偏向以 A/T 结尾, 而大肠杆菌没有表现出明显的 偏好. 在所分析的物种中, 发现有个共同的特点, 就是铁皮石 斛 UGP 与其他物种 UGP 的密码子 UUG AUU 的 RSCU 值都大 于 1, 说明这几个密码子出现频率较高, 属于共同偏好使用的 密码子, 由此推测 UUG AUU 为最佳密码子 ; 而另一些密码 子, 如 AUA GUA 的 RSCU 值均小于 1, 属于使用频率较低的 密码子. 表 2 8 个物种 UGP 的 ENC GC 和 GC3s Table 2 ENC values and contents of GC and GC3s for UGP gene in nine species 物种 Species ENC GC GC3s 铁皮石斛 Dendrobium officinale 58.04 0.431 0.425 水稻 Oryza sativa 53.82 0.496 0.615 甘蔗 Saccharum officinarum 50.51 0.489 0.578 大麦 Hordeum vulgare 47.68 0.52 0.659 拟南芥 Arabidopsis thaliana 52.68 0.423 0.407 棉花 Gossypium hirsutum 57.31 0.461 0.513 马铃薯 Solanum tuberosum 54.81 0.432 0.394 酵母 Saccharomyces cerevisiae 43.43 0.415 0.448 大肠杆菌 Escherichia coli 46.53 0.471 0.42 ENC: 有效密码子数 ;GC3s: 密码子中第 3 位碱基的 GC 含量. ENC: Effective number of codons; GC3s: GC content of the 3rd base in codon. Chin J Appl Environ Biol 应用与环境生物学报

762 铁皮石斛尿苷二磷酸葡萄糖焦磷酸化酶基因 (UGP) 的密码子... 5 期 表 3 各物种 UGP 基因相对同义密码子使用度 (RSCU) Table 3 Relative synonymous codon usage (RSCU) of UGP 铁皮石斛水稻甘蔗大麦拟南芥棉花酵母密码子马铃薯 Solanum Dendrobium Oryza Saccharum Hordeum Arabidopsis Gossypium Saccharomyces Codon tuberosum officinale sativa officinarum vulgare thaliana hirsutum cerevisiae Phe UUU 0.95 0.74 0.53 0.67 0.95 0.74 0.56 0.95 1.6 UUC 1.05 1.26 1.47 1.33 1.05 1.26 1.44 1.05 0.4 Leu UUA 0.61 0.12 0.35 0.24 0.64 0.72 0.44 1.58 0.89 UUG 1.71 1.73 1.27 1.44 1.28 1.44 1.42 3.16 1.11 CUU 1.22 1.15 2.08 1.44 1.4 2.04 1.75 0.32 1.11 CUC 0.61 1.73 1.62 1.8 1.53 0.84 0.65 0 0.44 CUA 1.1 0.23 0.12 0.36 0.13 0.36 0.87 0.21 0 CUG 0.73 1.04 0.58 0.72 1.02 0.6 0.87 0.74 2.44 Ile AUU 1.5 1.55 1.46 1.03 1.39 1.63 1.94 1.06 2.29 AUC 0.92 1.45 1.37 1.71 1.29 1.11 0.87 1.59 0.71 AUA 0.58 0 0.17 0.26 0.32 0.26 0.19 0.35 0 Met AUG 1 1 1 1 1 1 1 1 1 Val GUU 1.55 1.3 1.27 0.93 1.83 1.85 1.54 1.78 1.58 GUC 0.91 1.4 0.98 1.4 0.83 1.17 0.92 1.56 0.36 GUA 0.73 0.2 0.29 0.19 0.25 0.2 0.41 0.33 0.85 GUG 0.82 1.1 1.46 1.49 1.08 0.78 1.13 0.33 1.21 Ser UCU 1.74 1.24 2.13 1.35 0.73 1.8 1.8 2.62 2 UCC 0.97 1.03 0.58 0.77 1.09 0.6 0.6 1.54 0.5 UCA 1.16 1.03 0.58 0.77 1.45 1.4 1.4 0.62 1 UCG 0.19 1.03 0.77 1.16 0.36 0.2 0.4 0.46 0 Pro CCU 2.17 1.33 1.44 0.92 1.17 1.54 1.38 0.76 0.44 CCC 0.33 1.17 0.8 1.85 1.17 0.92 1.08 0.57 0.22 CCA 1.33 1.17 1.44 0.92 1 1.23 1.38 2.48 0.67 CCG 0.17 0.33 0.32 0.31 0.67 0.31 0.15 0.19 2.67 Thr ACU 1.04 1 1.45 0.76 1.71 2 1.92 1.52 0.57 ACC 1.22 1.71 1.09 2.1 1.14 1.2 0.96 1.66 1.71 ACA 0.87 0.71 0.91 1.14 1.14 0.6 0.8 0.41 0.29 ACG 0.87 0.57 0.55 0 0 0.2 0.32 0.41 1.43 Ala GCU 1.66 1.23 1.62 0.73 1.12 2.67 1.03 2.09 1.04 GCC 0.83 1.54 1.38 2.06 1.6 0.17 1.26 1.22 0.89 GCA 1.24 0.77 0.5 0.48 0.96 1 1.49 0.52 0.74 GCG 0.28 0.46 0.5 0.73 0.32 0.17 0.23 0.17 1.33 Tyr UAU 1.2 0.8 0.8 0.91 1 1.2 1.4 1.09 0.86 UAC 0.8 1.2 1.2 1.09 1 0.8 0.6 0.91 1.14 TER UAA 3 0 3 0 0 0 0 0 3 UAG 0 0 0 0 0 0 3 0 0 His CAU 1.67 1.33 2 1 1.43 1.56 1.67 0.88 0.89 CAC 0.33 0.67 0 1 0.57 0.44 0.33 1.12 1.11 Gln CAA 0.55 0.62 0.46 0.31 0.67 0.67 1 1.5 0.67 CAG 1.45 1.38 1.54 1.69 1.33 1.33 1 0.5 1.33 Asn AAU 0.93 0.52 0.6 0.21 0.67 1.12 1.09 0.61 1 AAC 1.07 1.48 1.4 1.79 1.33 0.88 0.91 1.39 1 Lys AAA 0.58 0.3 0.34 0.37 0.56 0.67 0.95 0.86 1.62 AAG 1.42 1.7 1.66 1.63 1.44 1.33 1.05 1.14 0.38 Asp GAU 1.69 1.04 1.07 1 1.19 1.33 1.53 1.29 1.76 GAC 0.31 0.96 0.93 1 0.81 0.67 0.47 0.71 0.24 Glu GAA 1.03 0.71 0.44 0.62 0.81 1.31 1.29 1.48 1.77 GAG 0.97 1.29 1.56 1.38 1.19 0.69 0.71 0.52 0.23 Cys UGU 0.67 0.67 0 0 0 2 0 1 1.2 UGC 1.33 1.33 2 2 2 0 2 1 0.8 TER UGA 0 3 0 3 3 3 0 3 0 Trp UGG 1 1 1 1 1 1 1 1 1 Arg CGU 1.5 0 0.5 0.5 1.8 0.6 1.8 0.92 3.75 CGC 1 3 2.5 3 0.6 1.2 1.2 0.23 1.5 CGA 0.5 0 0 0 0.6 1.8 1.2 0 0 CGG 0.5 1 1 0 1.2 0.6 0.6 0 0 Ser AGU 1.16 0.41 0.58 0.39 1.09 1.2 1.2 0.15 0.5 AGC 0.77 1.24 1.35 1.55 1.27 0.8 0.6 0.62 2 Arg AGA 1 1.5 1.5 0.5 0.6 0.6 0.6 3.69 0 AGG 1.5 0.5 0.5 2 1.2 1.2 0.6 1.15 0.75 Gly GGU 0.77 1.09 0.75 0.82 1.6 1.41 1.37 3.07 1.9 GGC 0.65 1.45 1.12 1.65 1.07 0.82 0.69 0.53 1.14 GGA 1.81 0.85 1.12 1.06 1.2 1.29 1.83 0.27 0.76 GGG 0.77 0.61 1 0.47 0.13 0.47 0.11 0.13 0.19 氨基酸 Amino acid 下划线表示 RSCU > 1. Underlined are the values of RSCU >1. 大肠杆菌 Escherichia coli 应用与环境生物学报 Chin J Appl Environ Biol

20 卷孙晶等 763 图 1 基于 UGP 基因相对密码子使用度 (RSCU) 的聚类图. Fig. 1 Cluster tree based on RSCU values of UGP genes. 图 2 基于 UGP 基因 CDS 序列的聚类图. Fig. 2 Dendrogram based on CDS sequences of UGP genes. 进一步分析各物种的 GC 含量, 由表中可看出, 除了大麦的 GC 含量大于 50% 以外, 其余物种的 GC 含量均在 50% 以下, 说明所列物种中的 UGP 基因组成大部分是 A + T 的含量大于 G + C, 并且单子叶植物中除了铁皮石斛外, 其余物种 G + C 的含量均高于双子叶植物拟南芥 棉花 马铃薯及大肠杆菌和酵母. 2.2.2 基于密码子使用偏好性和基于 CDS 序列的系统聚类为进一步了解所列物种 UGP 基因密码子使用差异的大小, 根据表 3 中各密码子的 RSCU 进行聚类分析, 结果见图 1. 由图 1 可以看出, 原核生物大肠杆菌单独聚成一支, 其他真核生物聚成一支, 表明原核生物大肠杆菌 UGP 基因在密码子使用上与真核生物具有明显的差异性. 在真核生物这一分支中, 酵母又单独聚为一类, 其他植物物种则聚为一大类, 其中单子叶植物水稻 大麦与双子叶植物拟南芥 棉花聚为一类, 而单子叶植物铁皮石斛 甘蔗与双子叶植物马铃薯聚为一类. 这表明亲缘关系较近的物种, 它们的密码子使用偏好性也比较相似, 但是某些物种仍存在一定的差异. 基于 CDS 聚类的结果如图 2 所示, 从图中可以看出, 原核生物大肠杆菌单独聚为一支, 其他真核生物聚为一支, 在真核生物这一分支中, 作为真菌的酵母单独聚为一类, 剩下的植物物种又分为两个分支, 单子叶植物大麦 水稻 甘蔗 铁皮石斛聚为一支, 双子叶植物拟南芥 棉花 马铃薯聚为一支. 这一结果与基于密码子使用偏好性聚类的结果稍有不一致, 而基于 CDS 序列的系统进化树更符合该 9 个物种的真实系统分类. 2.3 铁皮石斛 UGP 与代表生物大肠杆菌 酵母以及拟南芥基因组密码子偏好性比较将铁皮石斛 UGP 基因密码子使用频率与大肠杆菌 酵母和拟南芥基因组密码子使用频率进行比较, 结果如表 4 所示. 密码子使用频率的比值是衡量物种间密码子使用偏好性差异的指标之一. 比值在 0.5-2.0 之间表示二者的密码子偏好性较为接近, 比值小于或等于 0.5, 大于或等于 2.0, 表示偏好性差异较大 [15]. 结果表明, 铁皮石斛 UGP 基因与大肠杆菌基因组中偏好性差异较大的密码子有 23 个, 其中比值大于 2 的有 9 个, 小于或等于 0.5 的有 14 个,0.5-2 之间的有 39 个 ; 与酵母基因组中偏好性差异较大的密码子有 13 个, 其中比值大于 2 的有 5 个, 小于 0.5 的有 8 个,0.5-2 之间的有 49 个 ; 与拟南芥中偏好性差异较大的密码子同样也是 13 个其中比值大于 2 的有 2 个, 小于或等于 0.5 的有 11 个,0.5-2 之间的有 49 个. 可见铁皮石斛 UGP 基因与酵母和拟南芥基因组的差异小于与大肠杆菌基因组的差异, 表明两种真核表达系统优于原核表达系统. Chin J Appl Environ Biol 应用与环境生物学报

764 铁皮石斛尿苷二磷酸葡萄糖焦磷酸化酶基因 (UGP) 的密码子... 5 期 表 4 铁皮石斛 UGP 与 3 种代表生物基因组密码子使用偏好性的比较 Table 4 Comparison of codon usage preference between Dendrobium officinale UGP and 3 model organism genomes 氨基酸 Amino acid 密码子 Codon 铁皮石斛 UGP 基因 Dendrobium officinale UGP 大肠杆菌基因组 E. coli Genome (E) 酵母基因组 Yeast Genome (Y) 拟南芥基因组 Arabidopsis thaliana Genome (Y) UGP/E UGP/Y UGP/A Lys AAA 23.256 33.2 42.2 30.8 0.70 0.55 0.76 AAC 33.827 21.4 24.9 20.9 1.58 1.36 1.62 AAG 57.082 10.7 30.7 22.7 5.33 1.86 2.51 Asn AAT 29.598 18.6 36.3 22.3 1.59 0.82 1.33 ACA 10.571 8.2 17.8 15.7 1.29 0.59 0.67 ACC 14.799 22.8 12.6 10.3 0.65 1.17 1.44 ACG 10.571 14.8 7.9 7.7 0.71 1.34 1.37 Thr ACT 12.685 9.1 20.3 17.5 1.39 0.62 0.72 Arg AGA 4.228 2.9 21.3 19 1.46 0.20 0.22 AGC 8.457 16 9.7 11.3 0.53 0.87 0.75 AGG 6.342 1.9 9.2 11 3.34 0.69 0.58 Ser AGT 12.685 9.5 14.2 14 1.34 0.89 0.91 ATA 14.799 5.4 17.8 12.6 2.74 0.83 1.17 ATC 23.256 24.2 17 18.5 0.96 1.37 1.26 Met ATG 10.571 27 20.9 24.5 0.39 0.51 0.43 Ile ATT 38.055 29.8 30.4 21.5 1.28 1.25 1.77 Gln CAA 6.342 15 27.5 19.4 0.42 0.23 0.33 CAC 2.114 9.8 7.7 8.7 0.22 0.27 0.24 CAG 16.913 29.5 12.1 15.2 0.57 1.40 1.11 His CAT 10.571 13.6 13.7 13.8 0.78 0.77 0.77 CCA 16.913 8.5 18.2 16.1 1.99 0.93 1.05 CCC 4.228 5.8 6.8 5.3 0.73 0.62 0.80 CCG 2.114 21.8 5.3 8.6 0.10 0.40 0.25 Pro CCT 27.484 7.3 13.6 18.7 3.76 2.02 1.47 CGA 2.114 3.9 3 6.3 0.54 0.70 0.34 CGC 4.228 21 2.6 3.8 0.20 1.63 1.11 CGG 2.114 6.3 1.7 4.9 0.34 1.24 0.43 Arg CGT 6.342 20.3 6.5 9 0.31 0.98 0.70 CTA 19.027 4 13.3 9.9 4.76 1.43 1.92 CTC 10.571 11 5.4 16.1 0.96 1.96 0.66 CTG 12.685 50.9 10.4 9.8 0.25 1.22 1.29 CTT 21.142 11.7 12.1 24.1 1.81 1.75 0.88 Glu GAA 42.283 38.2 48.5 34.3 1.11 0.87 1.23 GAC 8.457 18.6 20.2 17.2 0.45 0.42 0.49 GAG 40.169 17.7 19.1 32.2 2.27 2.10 1.25 Asp GAT 46.512 32.1 37.8 36.6 1.45 1.23 1.27 GCA 19.027 20.6 16.1 17.5 0.92 1.18 1.09 GCC 12.685 25.5 12.5 10.3 0.50 1.01 1.23 GCG 4.228 31.7 6.1 9 0.13 0.69 0.47 Ala GCT 25.37 15.6 21.1 28.3 1.63 1.20 0.90 GGA 29.598 9 10.9 24.2 3.29 2.72 1.22 GGC 10.571 27.9 9.7 9.2 0.38 1.09 1.15 GGG 12.685 11.3 6 10.2 1.12 2.11 1.24 Gly GGT 12.685 24.4 24 22.2 0.52 0.53 0.57 GTA 16.913 11.1 11.8 9.9 1.52 1.43 1.71 GTC 21.142 15.1 11.6 12.8 1.40 1.82 1.65 GTG 19.027 25.5 10.6 17.4 0.75 1.80 1.09 Val GTT 35.941 18.5 22 27.2 1.94 1.63 1.32 TER TAA 2.114 2 1 0.9 1.06 2.11 2.35 TAC 8.457 12.1 14.6 13.7 0.70 0.58 0.62 TAG 0 0.3 0.5 0.5 0.00 0.00 0.00 Tyr TAT 12.685 16.5 18.9 14.6 0.77 0.67 0.87 TCA 12.685 7.8 18.8 18.3 1.63 0.67 0.69 TCC 10.571 8.9 14.2 11.2 1.19 0.74 0.94 TCG 2.114 8.7 8.5 9.3 0.24 0.25 0.23 Ser TCT 19.027 8.7 23.5 25.2 2.19 0.81 0.76 TER TGA 0 1.1 0.7 1.2 0.00 0.00 0.00 TGC 4.228 6.9 4.7 7.2 0.61 0.90 0.59 Trp TGG 8.457 15.2 10.3 12.5 0.56 0.82 0.68 Cys TGT 2.114 5.5 8 10.5 0.38 0.26 0.20 Leu TTA 10.571 13.9 26.7 12.7 0.76 0.40 0.83 TTC 23.256 16.9 18.2 20.7 1.38 1.28 1.12 TTG 29.598 14 27 20.9 2.11 1.10 1.42 Phe TTT 21.142 23.2 26.1 21.8 0.91 0.81 0.97 下划线表示两个物种密码子比较具有明显偏差 ( 0.5 或 2) 的分值. Underlined are values with obvious differences ( 0.5 or 2) between the codons of two species. 应用与环境生物学报 Chin J Appl Environ Biol

20 卷孙晶等 765 3 讨论 前人研究表明, 双子叶植物偏向使用以 A 或 T 结尾的密 码子, 而单子叶植物则偏向使用以 C 或 G 结尾的密码子 [16]. 本 研究对 4 种单子叶植物 ( 铁皮石斛 水稻 甘蔗 大麦 ) 3 种 双子叶植物 ( 拟南芥 棉花 马铃薯 ) 的 UGP 基因密码子使 用偏好性分析发现, 单子叶植物如水稻 甘蔗 大麦等偏好 使用 C/G 结尾的密码子, 双子叶植物如棉花 马铃薯等偏好 [17-18] 使用 A/T 结尾的密码子, 这与前人研究相符. 而作为单子 叶植物的铁皮石斛和作为双子叶植物的拟南芥则分别表现 出偏好使用 A/T 和 C/G 结尾的密码子, 分析这种现象的出现 可能是本文所分析的基因与前人分析的基因类型不同所造 成的, 同时也可说明不同功能的基因, 其密码子使用偏好性 也存在较大的差异 [19]. 密码子偏好性不仅受突变和选择的影 响, 还受其他多种因素影响, 如基因表达水平 [20] 基因碱基 组成 [21] GC 含量 [22] 基因长度 [23] [24] trna 丰度等. 关于影响 UGP 基因密码子使用的影响因素还有待于进一步的研究. 本研究中基于基因密码子用法的聚类分析与基于 CDS 的 [25-28] 进化分析结果两者存在一定差异, 这在前人的研究结果 中也曾出现, 分析造成这种现象的原因可能是单基因在进化 上可能发生较大的突变, 密码子的使用特性发生变化, 从而 导致与真实的分类存在差异, 可以通过增加分析的基因类型 以及聚类时使用更多的参数的方法来弥补分析单一因素聚 类造成的不足. 比较外源基因与宿主系统的密码子的偏好性, 并对一 些密码子进行改造, 采用符合宿主基因组的密码子, 对提高 转录 翻译效率, 进而提高表达量有重要意义 [18]. 本文将铁皮 石斛 UGP 基因密码子使用频率与代表生物大肠杆菌 酵母和 拟南芥基因组密码子使用频率进行比较, 结果显示铁皮石斛 UGP 基因密码子使用与大肠杆菌的差异大于与酵母和拟南 芥的差异, 这表明真核表达系统要优于原核表达系统, 这一 结果可以为今后铁皮石斛 UGP 基因在宿主中实现较高水平表 达的研究确立方向, 也可为通过优化密码子提高基因的表达 量提供依据. 参考文献 [References] 1 Chiapello H, Ollivier E, Landès-Devauchelle C, Nitschké P, Risler J-L. Codon usage as a tool to predict the cellular location of eukaryotic ribosomal proteins and aminoacyl-trna synthetases [J]. Nuc Acid Res, 1999, 27 (14): 2848-2851 2 McInerney JO. Replicational and transcriptional selection on codon usage in Borrelia burgdorferi [J]. Proc Natl Acad Sci, 1998, 95 (18): 10698-10703 3 Moriyama EN, Hartl D. Codon usage bias and base composition of nuclear genes in Drosophila [J]. Genetics, 1993, 134 (3): 847-858 4 吴宪明, 吴松锋, 任大明, 朱云平, 贺福初. 密码子偏好性的分析方法 及相关研究进展 [J]. 遗传, 2007, 29 (4): 420-426 [Wu XM, Wu SF, Ren DM, Zhu PY, He FC. The analysis method and progress in the study of codon bias [J]. Hereditas, 2007, 29 (4): 420-426] 5 吴晓俊, 刘涤, 胡之璧. 尿苷二磷酸葡萄糖焦磷酸化酶 [J]. 植物生理学通讯, 2000, 36 (3): 193-200 [Wu XJ, Liu D, Hu ZB. UDP-glucose pyrophosphorylase [J]. Plant Phys J, 2000, 36 (3): 193-200] 6 吴晓俊, 刘涤, 胡之璧. 黄芪毛状根中尿苷二磷酸葡萄糖焦磷酸化酶活性与多糖含量关系的研究 [J]. 上海中医药大学学报, 2000, 14 (2): 53-55 [Wu XJ, Liu D, Hu ZB. Study on Relationship between uridine diphosphate glucose pyrophosphorylase activity and polysaccharide content in hairy root of Astragalus membranaceus [J]. J Shanghai Univ Trad Chin Med, 2000, 14 (2): 53-55] 7 赵洲, 陈向东, 王立华, 王秋颖, 兰进. 灵芝子实体多糖积累和糖代谢相关酶的关系研究 [J]. 中国农学通报, 2012, 28 (22): 253-257 [Zhao Z, Chen XD, Wang LH, Wang QY, Lan J. Studies on the correlation between polysaccharides accumulation and sugar metabolizing enzymes in Ganoderma lucidum [J]. Chin Agric Sci Bull, 2012, 28 (22): 253-257] 8 张帆, 钟威, 穆虹, 李刚. 过量表达 OsUgp2 基因提高紫芝多糖含量 [J]. 菌物学报, 2011, 30 (3): 442-452 [Zhang F, Zhong W, Mu H, Li G. Increasing polysaccharide yield by over-expression of OsUgp2 in Ganoderma sinense [J]. Mycosystema, 2011, 30 (3): 442-452] 9 Wright F. The effective number of codons used in a gene [J]. Gene, 1990, 87 (1): 23-29 10 Gupta S, Bhattacharyya T, Ghosh TC. Synonymous codon usage in Lactococcus lactis: mutational bias versus translational selection [J]. J Biom Struc Dynam, 2004, 21 (4): 527-535 11 Sharp PM, Li W-H. Codon usage in regulatory genes in Escherichia coli does not reflect selection for rare codons [J]. Nuc Acid Res, 1986, 14 (19):7737-7749 12 Sharp PM, Li WH. An evolutionary perspective on synonymous codon usage in unicellular organisms [J]. J Mol Evol, 1986, 24 (1-2): 28-38 13 Sau K, Gupta SK, Sau S, Ghosh TC. Synonymous codon usage bias in 16 Staphylococcus aureus phages: implication in phage therapy [J]. Virus Res, 2005, 113 (2): 123-131 14 Jiang Y, Deng F, Wang H L, Hu ZH. An extensive analysis on the global codon usage pattern of baculoviruses [J]. Arch Virol, 2008, 153 (12): 2273-2282 15 李平, 白云凤, 冯瑞云, 王原媛, 张维锋. 籽粒苋苹果酸酶 (NAD-ME) 基因密码子偏好性分析. 应用与环境生物学报, 2011, 17 (1): 12-17 [Li P, Bai YF, Feng RY, Wang YY, Zhang WF. Analysis of codon bias of NAD-ME gene in Amaranthus hypochondriacus [J]. Chin J Appl Environ Biol, 2011, 17 (1): 12-17 16 Wang L, Roossinck MJ. Comparative analysis of expressed sequences reveals a conserved pattern of optimal codon usage in plants [J]. Plant Mol Biol, 2006, 61 (4-5): 699-710 17 刘庆坡, 冯英, 董辉. 20 个物种同义密码子偏好性的比较分析 [J]. 西北农林科技大学学报 : 自然科学版, 2004, 32 (7): 67-71 [Liu QP, Feng Y, Dong H. Comparative studies on synonymous codon usage bias in twenty species [J]. Northwest A & F Univ (Nat Sci Ed), 2004, 32 (7): 67-71] 18 赵耀, 刘汉梅, 顾勇, 黄玉碧. 玉米 waxy 基因密码子偏好性分析 [J]. 玉米科学, 2008, 16 (2): 16-21 [Zhao Y, Liu HM, Gu Y, Huang YB. Analysis of characteristic of codon usage in waxy gene of Zea mays [J]. J Maize Sci, 2008, 16 (2): 16-21 Chin J Appl Environ Biol 应用与环境生物学报

766 铁皮石斛尿苷二磷酸葡萄糖焦磷酸化酶基因 (UGP) 的密码子... 5 期 19 Liu Q, Dou S, Ji Z, Xue Q. Synonymous codon usage and gene function are strongly related in Oryza sativa [J]. Biosystems, 2005, 80 (2): 123-131 20 Hiraoka Y, Kawamata K, Haraguchi T, Chikashige Y. Codon usage bias is correlated with gene expression levels in the fission yeast Schizosaccharomyces pombe [J]. Genes to Cells, 2009, 14 (4): 499-509 21 Fedorov A, Saxonov S, Gilbert W. Regularties of context-dependent codon bias in eukaryotic genes [J]. Nuc Acid Res, 2002, 30 (5): 1192-1197 22 石秀凡, 黄京飞, 柳树群, 刘次全. 人类基因同义密码子偏好的特征以及与基因 GC 含量的关系 [J]. 生物化学与生物物理进展, 2002, 29 (3): 411-414 [Shi XF, Huang JF, Liu SQ, Liu CQ. The feature of synonymous codon bias and GC-content relationship in human genes [J]. Progr Biochem Biophys, 2002, 29 (3): 411-414] 23 孙铮, 马亮, Murphy R, 张宪省, 黄大卫. Wolbachia pipientis wmel 基因组水平上的密码子使用分析 [J]. 中国科学 C 辑 : 生命科学, 2009, 39 (10): 948-953 [Sun Z, Ma L, Murphy R, Zhang XS, Huang DW. The codon usage of Wolbachia pipientis wmel genome [J]. Sci Sin Vitae, 2009, 39 (10): 948-953] 24 Moriyama E, Powell J. Codon usage bias and trna abundance in Drosophila [J]. J Mol Evol, 1997, 45 (5): 514-523 25 Christianson M L. Codon usage patterns distort phylogenies from or of DNA sequences [J]. Am J Bot, 2005, 92(8): 1221-1233 26 郭秀丽, 王玉, 杨路成, 丁兆堂. 茶树 CBF1 基因密码子使用特性分析 [J]. 遗传, 2012, 34 (12): 1614-1623 [Guo XL, Wang Y, Yang YC, Ding ZT. Analysis of codon use features of CBF gene in Camellia sinensis [J]. Hereditas, 2012, 34 (12): 1614-1623] 27 时慧, 王玉, 杨路成, 丁兆堂. 茶树抗寒调控转录因子 ICE1 密码子偏好性分析 [J]. 园艺学报, 2012, 39 (7): 1341-1352 [Shi H, Wang Y, Yang LC, Ding ZT. Analysis of codon bias of the cold regulated transcription factor ICE1 in tea plant [J]. Acta Hort, 2012, 39 (7): 1341-1352] 28 吴正常, 王靖, 赵乔辉, 朱世平, 訾臣, 吴圣龙, 包文斌. 猪脂多糖结合蛋白基因 (LBP) 的密码子偏好性分析 [J]. 农业生物技术学报, 2013, 21 (10): 1135-1144 [Wu ZC, Wang J, Zhao QH, Zhu SP, Zi C, Wu SL, Bao WB. Analysis of codon bias of lipopolysaccharide-binding protein gene (LBP) in pigs (Sus scrofa) [J]. J Agric Biotechnol, 2013, 21 (10): 1135-1144] 应用与环境生物学报 Chin J Appl Environ Biol