doc

Similar documents
doc

i

tbjx0121ZW.PDF

Supporting_Information_revise

相 对 校 正 因 子 的 相 关 方 法 1.1 内 标 多 控 法 研 究 发 现, 在 中 药 各 成 分 间 存 在 着 一 定 的 比 例 关 系, 只 要 各 成 分 的 量 符 合 该 比 例 关 系, 中 药 的 多 [6] 指 标 质 量 控 制 可 以 依 此 法

标题

< F63756D656E D2D796E2D31C6DABFAF2D31D6D0D2BDD2A9CFD6B4FABBAF2D C4EA2DB5DA35C6DA2D30322DD7A8C0FBD0C5CFA2D7CAD4B4D1D0BEBF35C6DA2E6D6469>

DOI: /SP.J 应用与环境生物学报 Chin J Appl Environ Biol 2014,20 ( 5 ) : 铁皮石斛尿苷二磷酸葡萄糖焦磷酸化酶基因 (UGP)

7 北京大学学报 医学版 # +94* 4 ' % 论著!! "# $ #% %"&!%'!! $ "( )& * $ +,-.)/ ) 01 " * ). " 2")3 )01 ( /" 433% /1 " 0 "51 " -.)/$ 6',)") 4.))%) 0

United Nations ~ ~ % 2010

< F63756D656E D2D796E2D31C6DABFAF2D31D6D0D2BDD2A9CFD6B4FABBAF2D C4EA2DB5DA36C6DA2D30322DD7A8C0FBD0C5CFA2D7CAD4B4D1D0BEBF36C6DA2E6D6469>

untitled

SVM OA 1 SVM MLP Tab 1 1 Drug feature data quantization table

380 研 究 论 文 发 酵 天 数 双 乙 酰 测 定 : 参 照 GB 标 准 发 酵 液 中 的 化 学 成 分 的 测 定 : 采 用 GC-8A 型 气 相 色 谱 测 定 1.5 离 子 注 入 方 法 [6] 把 待 处 理 的 菌 株 细 胞 均 匀 涂

4期

生 物 进 化 指 生 物 与 其 生 存 环 境 之 间 相 互 作 用 并 导 致 遗 传 系 统 和 表 型 发 生 一 系 列 不 可 逆 转 的 改 变 的 过 程, 这 种 改 变 一 般 导 致 对 其 生 存 环 境 的 相 对 适 应 生 物 进 化 表 现 在 生 物 多 样 性

34 生命科学研究 2014 年 现为在蛋白质翻译过程中偏好使用其中某一个或 [3] 两个密码子 影响同义密码子中不同密码子使用频率的因素很多, 比如 GC 含量 (AT-rich 的生物倾向于使用 AT-rich 的密码子 ); 施加于 DNA 序列上的突变压力 ; 基因表达水平的因素 : 高表达

第 33 卷 第 2 期 2010 年 4 月 脱 蛋 白 较 好 的 方 法 是 Sevag 法, 它 是 根 据 蛋 白 质 在 氯 仿 等 有 机 溶 剂 中 变 性 的 特 点, 使 蛋 白 质 变 性 成 胶 状, 此 法 条 件 温 和, 可 避 免 多 糖 的 降 解


the southern city was higher than that in the northern city. In rural areas the proportion of the nuclear family in the northern region was higher tha

Microsoft Word 定版

Microsoft Word doc

10 中 草 药 Chinese Traditional and Herbal Drugs 第 43 卷 第 1 期 2012 年 1 月 生 药 打 粉 入 药 的 基 本 特 点, 借 鉴 材 料 学 粉 体 学 等 学 科 的 研 究 成 果, 在 中 药 传 统 制 药 理 念 的 启 发

第四章 蛋白质的营养

多肽知识手册.doc

2 : 111 ( Pinctada maxima), 13, 11,,,,,, 15, 25 cm, cm, 4 5 kg 1-2],,, 3-7] 24] 25-26],,, ] min, 1, 5 m 4 m, 20 m , 9-22],,, (

by industrial structure evolution from 1952 to 2007 and its influence effect was first acceleration and then deceleration second the effects of indust

%

% GIS / / Fig. 1 Characteristics of flood disaster variation in suburbs of Shang

CBI intro for undergrad.ppt

1 引言

Dan Buettner / /

,, [1 ], [223 ] :, 1) :, 2) :,,, 3) :,, ( ),, [ 6 ],,, [ 3,728 ], ; [9222 ], ;,,() ;, : (1) ; (2),,,,, [23224 ] ; 2,, x y,,, x y R, ( ),,, :

48 1. (1) (2) A B C.

蒋 哲等 基于 CVM 的有机农业认知程度和消费意愿研究 201 (P 0.000). On the basis of these results, enhancing publicity, pricing reasonably, focusing on high- income groups ar

Syngene GBOXHR Retsch MM400 KQ DE Eppendorf Table 1 The sources of Astragali Radix and Hedysarum Radix No. 1 AMM2011_NMGTY Astr

Microsoft Word 聂雪梅.doc

11 25 stable state. These conclusions were basically consistent with the analysis results of the multi - stage landslide in loess area with the Monte

<D2BDC1C6BDA1BFB5CDB6C8DAD7CAB8DFB7E5C2DBCCB3B2CEBBE1C3FBB5A52E786C7378>

~ 10 2 P Y i t = my i t W Y i t 1000 PY i t Y t i W Y i t t i m Y i t t i 15 ~ 49 1 Y Y Y 15 ~ j j t j t = j P i t i = 15 P n i t n Y

分子生物学实验专题手册.ai

~ ~ ~

698 39,., [6].,,,, : 1) ; 2) ,, 14,, [7].,,,,, : 1) :,. 2) :,,, 3) :,,,., [8].,. 1.,,,, ,,,. : 1) :,, 2) :,, 200, s, ) :,.

RNA 序列分析 (1) 张高川生物信息学系 (Department of Bioinformatics) 基础医学与生物科学学院 (School of Biology and Basic Medical Science) 苏州大学医学部 (Medical College of Soochow Un

404 中 草 药 Chinese Traditional and Herbal Drugs 第 42 卷 第 2 期 2011 年 2 月 加 入 的 十 二 烷 基 磺 酸 钠 活 性 剂 1.23 g, 在 球 磨 机 转 速 600 r/min 的 条 件 下 球 磨 8 h, 所 得 粉

Supplemental information Exome sequencing identifies truncating mutations in the PRRT2 gene that cause paroxysmal kinesigenic dyskinesia Wan-Jin Chen

Schumpeter Mensch Freeman Clark Schumpeter Mensch 1975 technological stalemate 2000 Van Dujin 1977 OECD 1992 Freeman 1982 Van


材料! 方法! # 基因的扩增及其序列分析

月32期

Supplementary Information LC-MS-guided isolation of anti-inflammatory 2-(2-phenylethyl)chromone dimers from Chinese agarwood (Aquilaria sinensis) Hui-

be invested on the desilting of water sources and to paved canals with cement mortar while drinking water project can focus on the improvement of wate

njj00004zw.PDF

163 β

1 GIS 95 Y = F y + (1 F) (1) 0 0 Y0 kg/hm 2 /day F y 0 y c kg/hm 2 /day [12] y m 20 kg/hm 2 /hour Y = cl cn ch G [ F( y ) T m yo + (2) (1 F)(

标题

Microsoft Word 姜雪晶-二校 出2757、2758、2759、2760、2761

132 包 装 工 程 2016 年 5 月 网 产 品 生 命 周 期 是 否 有 与 传 统 产 品 生 命 周 期 曲 线 相 关 的 类 似 趋 势 旨 在 抛 砖 引 玉, 引 起 大 家 对 相 关 问 题 的 重 视, 并 为 进 一 步 研 究 处 于 不 同 阶 段 的 互 联 网

* Reproducing Men Wu 2010 Reproducing Women 1 Men 2 * 17SRC

Microsoft Word tb 赵宏宇s-高校教改纵横.doc

AFLP % 1. 1 DNA 5 RAPD DNA 0. 1g % ~ ph 6 10 DNA 9 40μl TE SSR STS 20ng /L

应用与环境生物学报 2011,17 ( 1 ): 012~017 Chin J Appl Environ Biol=ISSN X DOI: /SP.J 籽粒苋苹果酸酶 (NAD-ME) 基因密码子偏好性分析 * 李平

1 SARS SARS SARS SARS SARS SARS S SARS SARS SARS 2 3 DNA SARS 8 NatureScienceEmerging Infectious DiseasesJournal of Virology NatureScienceLance

TGF-β AngⅡ B SD ~ 220g SPF. SCXK No SYXK ~ 25 40% ~ 70% OR37G-C

<30302DB7E2C3E6CDC6BDE9A3A D32A3A92E4D4449>

畜牧 动物医学 蚕 蜂

1 SARS SARS SARS SARS SARS SARS S SARS SARS SARS 2 3 DNA SARS NatureScienceEmerging Infectious DiseasesJournal of Virology NatureScienceLa

Microsoft Word 陈伟婵-二校

中 草 药 Chinese Traditional and Herbal Drugs 第 5 卷 第 1 期 201 年 1 月 51 其 他 试 剂 均 为 分 析 纯 对 照 品 栀 子 苷 ( 批 号 ) 甘 草 苷 ( 批 号 ) 连 翘 酯 苷

中国科学技术大学 材料工程 05 校外调剂 0870 化学工程 吉林大学 应用化学 05 校外调剂 0870 化学工程 四川大学 制药

Microsoft Word 杨芳-二校出4173

穨75.PDF

Microsoft PowerPoint - 04 Models of Amino Acid and Codon Substitution.ppt

第11期(copy)(copy)(copy)(copy)

38 張 元 素 歸 經 引 經 理 論 研 究 本 文 以 張 元 素 著 述 為 主 要 材 料, 采 用 上 海 涵 芬 樓 景 印 元 杜 思 敬 濟 生 拔 粹 刊 本 4 ; 醫 學 啟 源 為 任 應 秋 點 校 本, 任 本 以 明 成 化 八 年 刊 本 為 底 本, 旁 校 上

untitled

中 草 药 Chinese Traditional and Herbal Drugs 第 46 卷 第 9 期 2015 年 5 月 1339 非 酒 精 性 脂 肪 性 肝 病 (nonalcoholic fatty liver disease,nafld) 是 一 种 与 胰 岛 素 抵 抗 遗

中国细胞生物学学报 Chinese Journal of Cell Biology 2018, 40(12): DOI: /cjcb 两种茶树全基因组数据的密码子偏好性比较分析 王占军 #* 李豹 # 姜行舟欧祖兰徐忠东代欢欢 ( 合肥师

填 表 说 明 1. 本 表 所 填 数 据 截 至 时 间 为 2011 年 9 月 底 2. 本 表 请 用 A4 纸 双 面 打 印, 加 盖 学 校 公 章 后 上 报 3. 表 内 所 填 数 据 请 学 校 认 真 核 实, 确 保 准 确 无 误 4. 建 设 完 成 情 况 对 照

Microsoft Word 谢雯雯.doc

36(4) (2004) Journal of Soil and Water Conservation, 36(4) (2004) earthworms dig soil on surface and prevent plants to grow. But until D

: 3 : , , ,, , :, ( Ravallion Chen, 2004 ; Khan Riskin, 2005,Yue et al, 2006),, (,2003 ;,200

标题

KJWJ01 Fig. 1 Geological map of the Kajiwa landslide PDH01 60 ~ 70m 80 ~ 90m 80m 2 930m 556m 641m 598m m m 3 2 Ⅰ m 2

为 止, 以 集 中 式 光 伏 发 电 系 统 为 主, 其 主 要 原 因 是 我 国 政 策 推 动 方 面 以 国 家 主 导 为 主, 这 种 自 上 而 下 的 政 策 和 运 行 方 式, 更 容 易 迅 速 推 动 集 中 式 光 伏 系 统 的 建 设 集 中 式 光 伏 发 电

Scoones World Bank DFID Sussex IDS UNDP CARE DFID DFID DFID 1997 IDS

标题

中国媒体发展研究报告

% % % % % % % % : 11. 9: 12. 8:

林学 园艺

< F63756D656E D2D796E2D31C6DABFAF2D31D6D0D2BDD2A9CFD6B4FABBAF2D C4EA2DB5DA37C6DA2D30352DD6D0D2BDD1D0BEBF2E6D6469>

1556 地 理 科 学 进 展 30 卷 他 关 于 农 村 住 房 结 构 与 抗 震 性 能 的 研 究, 则 多 是 从 工 程 抗 灾 的 角 度, 研 究 某 种 构 造 类 型 的 房 屋, 力 图 找 到 传 统 房 屋 的 结 构 失 误 和 新 建 房 屋 中 存 在 的 问 [

untitled

cm /s c d 1 /40 1 /4 1 / / / /m /Hz /kn / kn m ~

205 4 GCC % 5% % 2. 67% 0. % 00mm % % %. 2% ~ 06 60

JOURNAL OF EARTHQUAKE ENGINEERING AND ENGINEERING VIBRATION Vol. 31 No. 6 Dec

2015医学版第六期


720 () 2009,,, , ( ) (6 8 ), ( 5) ( 6).,,119 E, 150 km., 25. 5, 25,., 5b. 3 ROMS 3. 1 ROMS, S,.,,,, [ 9 ]. 1/ 32 ( ),25, 18 s, 180 s

Microsoft Word - 8 期中文目次.doc

Transcription:

1340 药学学报 Acta Pharmaceutica Sinica 2014, 49 (9): 1340 1345 基于全基因组和转录组分析的赤芝密码子使用偏好性比较研究 朱孝轩 1, 朱英杰 1, 宋经元 1, 孙超 1*, 陈士林 1, 2 (1. 中国医学科学院 北京协和医学院药用植物研究所, 北京 100193; 2. 中国中医科学院中药研究所, 北京 100700) 摘要 : 密码子使用偏好性是物种在遗传信息传递过程中的一个重要特点, 分析物种的密码子使用偏好性对于了解该物种遗传信息的传递规律具有重要意义 原有的密码子偏好性分析主要基于全基因组数据完成, 然而由于目前可获得的高等生物全基因组数据有限, 使得密码子偏好性分析受到了极大的限制 本研究通过分析赤芝 [Ganoderma lucidum (Curtis: Fr.) P. Karst] 全基因组及其液体培养菌丝 原基和子实体大规模转录组数据, 发现基于全基因组和转录组数据分析获得的所有氨基酸的最优密码子完全一致 以上研究结果表明, 利用大规模转录组数据代替基因组数据分析物种密码子使用偏好性具有可行性 通过计算 26 个赤芝萜类合酶 (terpene synthase, TS) 编码基因中大肠杆菌和酿酒酵母稀有密码子所占比例, 发现酿酒酵母稀有密码子在赤芝 TS 基因中所占比例较高, 而大肠杆菌稀有密码子所占比例相对较低, 表明赤芝 TS 基因更难以在酿酒酵母中进行表达 参照酵母最优密码子, 利用化学方法全合成 TS 基因将是解决外源基因与底盘系统密码子不匹配问题的有效手段 关键词 : 赤芝 ; 基因组 ; 转录组 ; 密码子偏好性中图分类号 : R931 文献标识码 : A 文章编号 : 0513-4870 (2014) 09-1340-06 Comparative studies on codon usage bias of Ganoderma lucidum based on analysis of genomic and transcriptomic data ZHU Xiao-xuan 1, ZHU Ying-jie 1, SONG Jing-yuan 1, SUN Chao 1*, CHEN Shi-lin 1, 2 (1. Institute of Medicinal Plant Development, China Academy of Medical Sciences and Peking Union Medical College, Beijing 100193, China; 2. Institute of Chinese Materia Medica, China Academy of Chinese Medical Sciences, Beijing 100700, China ) Abstract: Codon usage bias is an important characteristic of genetic information transfer in organisms. Analysis of codon usage bias of different species is important for understanding the rules on genetic information transfer. The previous method for analysis of codon usage bias is mainly based on genomic data. However, this method is greatly limited, because the genome sequences of higher organisms are still not available up to now. In this study, we found that we could obtain the same optimal codons of Ganoderma lucidum (Curtis: Fr.) P. Karst based on its whole genomic data or large-scale transcriptomic data from its liquid-cultured hyphae, primordium and fruiting body, separately. This result indicated the feasibility to understand the codon usage bias based on the large-scale transcriptomic data. By calculating the proportion of rare codons of Escherichia coli and Saccharomyces cerevisiae in 26 terpene synthases (TS) of G. lucidum, we found that the rare codons of S. cerevisiae have a higher proportion in TS genes, while the rare codons of E. coli have relatively lower, suggesting that the TS genes of G. lucidum are possibly more difficult to be expressed in S. cerevisiae than in E.coli. Chemical synthesis of TS genes according to the yeast optimal codons will be an effective way to solve 收稿日期 : 2014-01-16; 修回日期 : 2014-02-27. 基金项目 : 国家自然科学基金面上项目 (81273485); 协和青年基金 (3332013159); 中央高校基本科研业务费专项资金 (3332013159). 共同第一作者. * 通讯作者 Tel / Fax: 86-10-57833197, E-mail: csun@implad.ac.cn

朱孝轩等 : 基于全基因组和转录组分析的赤芝密码子使用偏好性比较研究 1341 the problem on the mismatch of gene codon bias between the foreign genes and the host strain. Key words: Ganoderma lucidum; genome; transcriptome; codon usage bias 密码子是遗传信息输出的重要环节, 是连接 DNA 和蛋白质的信息纽带 每种氨基酸至少对应一种密 码子, 最多对应 6 种密码子 编码同一种氨基酸的密 码子称为同义密码子 在蛋白质翻译过程中, 同义密 码子的使用频率并不相同, 某一物种甚至某一基因 通常倾向于使用一种或几种特定的同义密码子, 这 种现象被称为密码子使用偏好性 已有研究表明, 密 码子使用偏好性与基因表达水平 [1, 2] trna 丰度 [3, 4] GC 含量 [5 7] [8, 9] [10] 突变偏好以及基因长度等众多因 素相关 不同物种之间的密码子使用偏好往往不同, 甚至同一物种不同基因的密码子使用偏好也存在很 大的差异 通过密码子使用偏好性分析, 寻找和发现 不同物种的密码子使用偏好特点, 对于物种分子进 化规律的分析及外源表达基因的序列优化等都具有 重要的意义 以往的密码子使用偏好性研究主要是通过全基 因组数据分析完成的 但是目前已完成全基因组测序 的高等生物还很少, 已严重制约了对不同物种的密 码子偏好性研究 相对于全基因组测序的高投入和高 难度, 随着高通量测序技术的不断进步 [11, 12], 转录组 测序已变得更加经济和快捷 [13], 目前 NCBI 等数据库 中已积累了大量物种的大规模转录组数据 通过大规 模转录组数据分析物种的密码子使用偏好性将成为 解决基因组数据匮乏问题的新途径 赤芝 [Ganoderma lucidum (Curtis: Fr.) P. Karst] 是传统珍贵中药材, 其药用记载最早出现在 神农本 草经 上, 目前赤芝已被 美国草药药典与治疗纲 要 (American Herbal Pharmacopoeia and Therapeutic Compendium) 收录 [14], 药用价值已得到世界各国的 广泛认可 赤芝中含有多种生物活性物质, 目前已有 400 多种不同的化合物被鉴定出来 [15], 其中灵芝三萜 和灵芝多糖是赤芝的主要药用活性成分 本研究以赤 芝为材料, 基于本课题组完成的赤芝基因组和转录 [16] 组数据对赤芝的密码子使用偏好性进行了系统研 究, 首次证明了基于基因组和大规模转录组数据的分 析结果的一致性, 从而为通过大规模转录组数据分 析研究物种的密码子使用偏好性, 进而为研究物种 的进化规律及异源基因表达的优化奠定了基础 此 外, 通过分析赤芝中 26 个萜类合酶 (terpene synthase, TS) 编码基因中大肠杆菌和酿酒酵母稀有密码子所 占比例, 为实现赤芝萜类化合物在微生物系统中的高效异源表达奠定了基础 材料与方法数据来源赤芝 (C. lucidum) 基因组与转录组数据来源于赤芝基因组数据库 (http://www.herbalgenomics. org/galu) [16] 通过编写 Perl 语言程序, 对数据进行筛选, 标准如下 : 1 密码子数大于等于 100 (300 bp) 的蛋白质编码序列 (coding sequence, CDS); 2 能够比对到 NCBI 公共数据库 酿酒酵母与大肠杆菌的密码子使用偏好性数据来源于数据库 Codon Usage Database (http://www.kazusa.or.jp/codon/) 同义密码子相对使用度分析同义密码子相对使用度 (relative synonymous codon usage, RSCU) 是对同义密码子使用偏好的评估 该值等于同义密码子的实际观测值与同义密码子平均使用期望值的比值 如果密码子使用无偏好性, 则 RSCU 值为 1; 如果该密码子比其他同义密码子使用更频繁, 则其 RSCU 值大于 1; 反之 RSCU 值则小于 1 [17] 同义密码子相对使用度分析使用 CodonW 1.4.2 (http://codonw.sourceforge. net/) 完成 有效密码子数分析有效密码子数 (effective number of codons, ENC or Nc) 检测单个基因密码子非均衡使用的偏好程度, 取值范围为 20 ( 每个氨基酸只使用一个密码子 ) 到 61 ( 各个密码子被均衡使用 ) 其值越低, 表明该基因的密码子使用偏好性越强 [18] 有效密码子数分析使用 CodonW 1.4.2 (http://codonw. sourceforge.net/) 完成 最优密码子分析采用高表达优越密码子分析方法 [3], 首先计算所有基因的 ENC 值, 并对这些值进行排序, 取该有序数据集的上下限区域各 10% 的序列数据, 形成 2 个新的数据子集 比较 2 个数据子集中密码子的 RSCU 值, 如果差异大于 0.3, 且该密码子的 RSCU 值在高表达基因样本中大于 1, 在低表达基因样本中小于 1, 则将该密码子定义为最优密码子 结果 1 基于基因组和转录组的灵芝基因密码子偏好性分析通过编写 Perl 语言程序进行数据筛选, 共获得赤

1342 药学学报 Acta Pharmaceutica Sinica 2014, 49 (9): 1340 1345 芝基因组 CDS 9 702 条, 液体培养菌丝转录组 CDS 3 176 条, 原基转录组 CDS 3 108 条, 子实体转录组 CDS 3 370 条 利用 Codon W 分别计算赤芝基因组及 菌丝 原基 子实体转录组的密码子第 3 位碱基组成 (G3 A3 T3 C3) 及 RSCU 值等密码子偏好性分析 参数, 并确定其最优密码子 1.1 灵芝基因密码子的 GC 含量分析基因组数据分 析结果显示, 所有 CDS 的总 GC 含量为 59.5%, 而菌 丝 原基 子实体转录组的总 GC 含量分别为 58.6% 58.4% 和 58.7%, 不同来源数据的分析结果基本一致 基因组 CDS 的第 3 位密码子平均 GC 含量为 70.6%, 显著高于总 GC 含量, 且第 3 位密码子的碱基组成分 析表明, G 和 C 的使用频率 ( 分别为 38.87% 和 47.89%) 显著高于 A 和 T 的使用频率 ( 分别为 15.59% 和 19.71%) 这说明赤芝较偏爱使用以 G 和 C 结尾的密 码子, 对以 A 和 T 结尾的密码子使用较少 ( 表 1) 基 于菌丝 原基 子实体的转录组数据分析结果与基因 组数据分析结果一致, 密码子第 3 位碱基组成中 GC 明显占优势 ( 分别是 71.3% 70.7% 70.9%) Table 1 GC content analysis of G. lucidum genome and transcriptome T3 C3 A3 G3 GC3 GC Genome 0.197 1 0.478 9 0.155 9 0.388 7 0.706 0.595 Mycelium 0.198 8 0.492 6 0.147 9 0.392 0.713 0.586 Primordium 0.200 4 0.484 2 0.153 9 0.393 4 0.707 0.584 Fruiting body 0.199 9 0.491 0.151 2 0.387 3 0.709 0.587 1.2 灵芝基因有效密码子数分析基因组数据中各 [19] 基因的 ENC 值取值范围为 24.75~61, Jiang 等和 [18] Wright 等将 ENC 取值 35 作为偏好性强弱的区分 标准 基因组数据分析结果中取值范围从 24.75~35 的 CDS 有 632 条, 占所有 CDS 的 6.51%; 取值范围 从 36~61 的 CDS 有 9 070 条, 占所有 CDS 的 93.49%, 其中取值为 61 ( 密码子使用绝对平均 ) 的 CDS 有 127 条, 占所有 CDS 的 1.31% 这说明赤芝所有蛋白编码 基因的密码子使用偏好程度差别较大, 既存在使用 偏好性非常强的基因, 也存在使用偏好性绝对平均 的基因, 但整体来说, 大多数蛋白编码基因的密码子 使用偏好性较弱 1.3 基于基因组和转录组数据的灵芝最优密码子比 较分析通过分析来源于基因组及菌丝 原基和子实 体转录组数据, 发现 RSCU > 1 的密码子多以 G 或 C 结尾 ( 表 2) 根据高表达优越密码子分析方法, 分别 计算基因组样本及各转录组样本的最优密码子, 结 果完全一致 ( 表 2), 最终确定 18 个氨基酸 ( 未包含蛋氨酸和色氨酸, 因其只有 1 个密码子, 不存在密码子使用偏好性 ) 在赤芝中的最优密码子, 共 22 个 : UUC CUC AUC GUC GAG UGC CCC CCG ACC ACG GCG UAC CAC CAG AAC AAG GAC UCC UCG AGC CGC GGC 其中, 脯氨酸和苏氨酸拥有两个最优密码子, 分别为 CCC CCG 和 ACC ACG; 丝氨酸 Ser 拥有 3 个最优密码子 UCC UCG 和 AGC 最优密码子在赤芝中具有较高的使用频率, 转录组数据和基因组数据的分析结果在密码子碱基组成和最优密码子计算结果上表现出的高度一致性, 表明在缺乏基因组数据的情况下, 利用转录组数据分析物种的密码子使用偏好性是可行的 2 萜类合酶基因在大肠杆菌和酿酒酵母中的表达预测根据 Codon Usage Database 数据, 大肠杆菌中最稀有的 8 个密码子分别为 : AGG AGA AUA CUA CGA CGG CCC UCG, 其中仅大肠杆菌稀有密码子 CCC 和 UCG 为赤芝中的最优密码子 如果赤芝基因中含有较多的 CCC 和 UCG 密码子, 可能会造成该基因在大肠杆菌中表达困难 大肠杆菌基因组总 GC 含量为 52.35%, 稍低于赤芝基因组总 GC 含量 59.5%; 密码子第 3 位碱基 GC 含量为 55.62%, 显著低于赤芝基因组的 70.6%, 显示大肠杆菌并不像赤芝一样偏好使用以 GC 结尾的密码子 酿酒酵母中最稀有的 8 个密码子分别为 : AGG CGA CGG CGC CCG CUC GCG ACG 其中, 有 5 个稀有密码子 (CGC CCG CUC GCG ACG) 在赤芝中作为最优密码子被使用 酿酒酵母基因组总 GC 含量为 39.77%, 显著低于赤芝基因组总 GC 含量 59.5%; 密码子第 3 位碱基 GC 含量为 38.10%, 显著低于赤芝基因组的 70.6% 因此, 与大肠杆菌相比, 酵母的密码子使用偏好性与赤芝的差别更大 如果一个赤芝基因含有大量的酿酒酵母稀有密码子, 其在酿酒酵母中的表达可能会受到较大影响 为了更直观地预测赤芝基因在大肠杆菌及酿酒酵母中的表达情况, 挑选了 26 个萜类合酶 (terpene synthase, TS) 编码基因, 分别计算其基因序列中大肠杆菌和酿酒酵母稀有密码子所占比例 结果如图 1 所示, 酿酒酵母稀有密码子在 TS 基因中所占比例明显高于大肠杆菌稀有密码子, 最高时接近 25%, 这表明 TS 基因在酿酒酵母中的表达可能会受到较大的限制

朱孝轩等 : 基于全基因组和转录组分析的赤芝密码子使用偏好性比较研究 1343 Table 2 RSCU value and optimal codons based on genome and transcriptome data of G. lucidum. * Optimal codons Amino acid Codon Genome Mycelium Primordium Fruiting body Amino acid Codon Genome Mycelium Primordium Fruiting body Phe UUU 0.41 0.35 0.37 0.35 Tyr UAU 0.55 0.49 0.51 0.50 UUC 1.59 * 1.65 * 1.63 * 1.65 * UAC 1.45 * 1.51 * 1.49 * 1.50 * Leu UUA 0.17 0.15 0.15 0.14 His CAU 0.67 0.66 0.67 0/67 UUG 0.73 0.79 0.82 0.80 CAC 1.33 * 1.34 * 1.33* 1.33 * CUU 0.86 0.92 0.90 0.91 Gln CAA 0.63 0.61 0.62 0.62 CUC 2.55 * 2.55 * 2.48 * 2.57 * CAG 1.37 * 1.39 * 1.38 * 1.38 * CUA 0.37 0.33 0.35 0.34 Asn AAU 0.49 0.45 0.46 0.44 CUG 1.31 1.27 1.30 1.25 AAC 1.51 * 1.55 * 1.54 * 1.56 * Val GUU 0.62 0.66 0.66 0.65 Lys AAA 0.42 0.36 0.38 0.38 GUC 1.90 * 2.08 * 1.93 * 1.96 * AAG 1.58 * 1.64 * 1.62 * 1.62 * GUA 0.34 0.33 0.34 0.34 Asp GAU 0.60 0.59 0.61 0.61 GUG 1.14 1.04 1.07 1.05 GAC 1.40 * 1.41 * 1.39 * 1.39 * Glu GAA 0.56 0.52 0.55 0.55 Ser UCU 0.84 0.79 0.83 0.81 GAG 1.44 * 1.48 * 1.45 * 1.45 * UCC 1.53 * 1.50 * 1.47 * 1.51 * Pro CCU 0.83 0.85 0.85 0.85 UCA 0.58 0.54 0.57 0.57 CCC 1.31 * 1.31 * 1.29 * 1.35 * UCG 1.50 * 1.59 * 1.54 * 1.52 * CCA 0.68 0.67 0.68 0.67 AGU 0.41 0.40 0.41 0.41 CCG 1.18 * 1.17 * 1.17 * 1.13 * AGC 1.14 * 1.18 * 1.18 * 1.17 * Thr ACU 0.61 0.61 0.61 0.63 Arg CGU 0.91 1.05 0.99 0.99 ACC 1.37 * 1.43 * 1.39 * 1.42 * CGC 2.13 * 2.06 * 2.00 * 2.06 * ACA 0.60 0.55 0.59 0.57 CGA 0.66 0.65 0.68 0.67 ACG 1.42 * 1.41 * 1.41 * 1.39 * CGG 1.19 1.3 1.19 1.17 Ala GCU 0.67 0.68 0.69 0.70 AGA 0.34 0.34 0.36 0.36 GCC 1.17 1.21 1.17 1.20 AGG 0.76 0.77 0.78 0.76 GCA 0.66 0.65 0.67 0.65 Ile AUU 0.64 0.62 0.65 0.64 GCG 1.50 * 1.46 * 1.47 * 1.45 * AUC 2.01 * 2.08 * 2.03 * 2.06 * Gly GGU 0.74 0.86 0.83 0.85 AUA 0.35 0.30 0.32 0.30 GGC 1.69 * 1.72 * 1.71 * 1.73 * Cys UGU 0.60 0.60 0.60 0.60 GGA 0.63 0.63 0.64 0.63 UGC 1.40 * 1.40 * 1.40 * 1.40 * GGG 0.93 0.78 0.82 0.79 Figure 1 The rare codon proportion of Ganoderma lucidum TS gene in E. coli and Saccharomyces cerevisiae. 1: GL28150-R1; 2: GL20791-R1; 3: GL30649-R1; 4: 25830-R1; 5: GL26009-R1; 6: GL20244-R1; 7: GL20792-R1; 8: GL27623-R1; 9: GL18758- R1; 10: GL22353-R1; 11: GL24248-R1; 12: GL22395-R2; 13: GL22395-R1; 14: GL20423-R1; 15: GL23883-R1; 16: GL23663- R1; 17: GL23663-R2; 18: GL24515-R1; 19: GL27625-R1; 20: GL19741-R1; 21: GL23369-R1; 22: GL20733-R1; 23: GL31554- R1; 24: GL16845-R1; 25: GL25909-R1; 26: GL23797-R1 讨论 了解物种的密码子使用偏好性对于预测并指 导相关基因在异源生物中的表达有着十分重要的意 义, 然而由于绝大多数高等生物缺乏关键的基因组 数据支撑, 使得我们无法通过分析基因组数据获得 相应物种的密码子使用偏好特性 赤芝为担子菌纲 (Basidiomycetes), 多孔菌目 (Polyporales), 灵芝属 (Ganoderma) 药用真菌, 在我国被称为 仙草, 已 [20, 有 2000 多年的应用历史 21] [16] 2012 年陈士林等 发布了赤芝全基因组序列, 为赤芝功能基因组学研 [22] 究奠定了基础 2011 年张乐等首次比较了大豆基 因组和转录组的核基因密码子使用偏好性, 发现转 录组基因的同义密码子第 3 位鸟嘌呤频率 G3 和芳香 族氨基酸含量这两个参数的变化范围大于基因组基 因, 其余各参数变化范围都位于大豆基因组高置信 蛋白编码区密码子使用参数的取值范围内, 不同组 织转录组数据分析结果有轻微变动, 可能与其转录

1344 药学学报 Acta Pharmaceutica Sinica 2014, 49 (9): 1340 1345 组数据量较少有关 本研究分别通过基于赤芝基因组及大规模转录组数据的密码子使用偏好性分析, 证明以大规模转录组数据为基础分析物种密码子使用偏好的可行性, 将会极大地拓展可进行密码子使用偏好特性分析的物种范围, 进而推进相关物种的生物进化及其基因异源表达研究 我国药用物种多达 1 万种以上 [23], 蕴藏着丰富的药用基因资源 近年来通过解析天然药物的生物合成途径, 并利用合成生物学技术异源合成天然产物已成为国内外研究热点 [24] 2013 年, 美国 Amyris 公司通过在酿酒酵母中重构部分青蒿素合成途径合成青蒿素前体 青蒿酸, 产量达到 25 g L 1, 然后通过化学方法成功将青蒿酸转化为青蒿素, 实现了合成生物学技术生产青蒿素的产业化, 为天然产物合成生物学应用提供了成功的范例 [25] 外源基因和底盘系统密码子使用偏好的匹配性是影响外源基因表达的重要因素之一 萜类化合物是种类最多的一类天然产物, 目前已分离鉴定的萜类化合物达到 5.5 万种, 目前一些重要的临床药物, 如青蒿素和抗癌药物紫杉醇都属于萜类物质, 因此萜类化合物是新药研发的重要源泉 以赤芝编码的 26 个 TS 基因为例, 预测了其在大肠杆菌和酿酒酵母中的表达情况, 大肠杆菌 8 个稀有密码子中仅 2 个为灵芝的最优使用密码子, 而酵母的 8 个稀有密码子中有 5 个为灵芝的最优密码子, 提示灵芝与酵母的密码子使用偏好特性差异更大, 有可能影响灵芝 TS 基因在酵母中的表达能力 随着长片段 DNA 化学合成技术的进步, 参照酵母的最优密码子, 利用化学方法全合成相应的基因将是解决外源基因与底盘系统密码子不匹配问题的有效手段 References [1] Duret L, Mouchiroud D. Expression pattern and, surprisingly, gene length shape codon usage in Caenorhabditis, Drosophila and Arabidopsis [J]. Proc Natl Acad Sci USA, 1999, 96: 4482 4487. [2] Carlini DB, Chen Y, Stephan W. The relationship between third-codon position nucleotide content, codon bias, mrna secondary structure and gene expression in the drosophild alcohol dehydrogenase genes Adh and Adhr [J]. Genetics, 2001, 159: 623 633. [3] Stenico M, Lloyd AT, Sharp PM. Codon usage in Caenorhabditis elegans: delineation of translational selection and mutational biases [J]. Nucleic Acids Res, 1994, 22: 2437 2446. [4] Olejniczak M, Uhlenbeck OC. trna residues that have coevolved with their anticodon to ensure uniform and accurate codon recognition [J]. Biochimie, 2006, 88: 943 950. [5] Holmouist GP, Flipske J. Organization of mutations along the genome: a prime determinant of genome evolution [J]. Trends Ecol Evol, 1994, 9: 65 69. [6] Bernard IG. The human genome: organization and evolutionary history [J]. Annu Rev Genet, 1995, 29: 445 476 [7] Shi XF, Huang JF, Liu SQ, et al. The feature of synonymous codon bias and GC-content relationship in human genes [J]. Prog Biochem Biophys ( 生物化学与生物物理进展 ), 2002, 29: 411 414. [8] Xia X. Mutation and selection on the anticodon of trna genes in vertebrate mitochondrial genomes [J]. Gene, 2005, 345: 13 20. [9] Chen SL, Lee W, Hottes AK, et al. Codon usage between genomes is constrained by genome-wide mutational processes [J]. Proc Natl Acad Sci USA, 2004, 101: 3480 3485. [10] Moriyama EN, Powell JR. Gene length and codon usage bias in Drosophila melanogaster, Saccharomyces cervisiae and Escherichia coli [J]. Nucleic Acids Res, 1998, 26: 3188 3193. [11] Shendure J, Ji H. Next-generation DNA sequencing [J]. Nat Biotechnol, 2008, 26: 1135 1145. [12] Metzker ML. Sequencing technologies the next generation [J]. Nat Rev Genet, 2009, 11: 31 46. [13] Wu Q, Sun C, Chen SL, et al. Application of transcriptomics in the studies of medicinal plants [J]. World Sci Technol Mod Tradit Chin Med ( 世界科学技术 : 中医药现代化 ), 2010, 12: 457 457. [14] Sanodiya BS, Thakur GS, Baghel RK, et al. Ganoderma lucidum: a potent pharmacological macrofungus [J]. Curr Pharm Biotechnol, 2009, 10: 717 742. [15] Shiao MS. Natural products of the medicinal fungus Ganoderma lucidum: occurrence, biological activities, and pharmacological functions [J]. Chem Rec, 2003, 3: 172 180. [16] Chen SL, Xu J, Liu C, et al. Genome sequence of the model medicinal mushroom Ganoderma lucidum [J]. Nat Commun, 2012, 3: 913. [17] Sharp PM, Li WH. An evolutionary perspective on synonymous codon usage in unicellular organisms [J]. J Mol Evol, 1986, 24: 28 38. [18] Wright F. The effective number of codons used in a gene [J]. Gene, 1990, 87: 23 29. [19] Jiang Y, Deng F, Wang HL. An extensive analysis on the

朱孝轩等 : 基于全基因组和转录组分析的赤芝密码子使用偏好性比较研究 1345 global codon usage pattern of baculoviruses [J]. Arch Virol, 2008, 153: 2273 2282. [20] Wachtel-Galor S, Tomlinson B, Benzie IFF. Ganoderma lucidum ( Lingzhi ), a Chinese medicinal mushroom: biomarker responses in a controlled human supplementation study [J]. Br J Nutr, 2004, 91: 263 269. [21] Paterson MRR. Ganoderma - a therapeutic fungal biofactory [J]. Phytochemistry, 2006, 67: 1985 2001. [22] Zhang L, Guo Y, Luo L, et al. Analysis of nuclear gene codon bias on soybean genome and transcriptome [J]. Acta Agron Sin ( 作物学报 ), 2011, 37: 965 974. [23] Chen SL, Sun YZ, Xu J, et al. Strategies of the study on Herb Genome Program [J]. Acta Pharm Sin ( 药学学报 ), 2010, 45: 807 812. [24] Chen SL, Zhu XX, Li CF, et al. Genomics and synthetic biology of traditional Chinese medicine [J]. Acta Pharm Sin ( 药学学报 ), 2012, 47: 1070 1078. [25] Paddon CJ, Westfall PJ, Pitera DJ, et al. High-level semisynthetic production of the potent antimalarial artemisinin [J]. Nature, 2013, 496: 528 532. 第四届全国药物分析大会第二轮通知 第四届全国药物分析大会已定于 2014 年 11 月 7~9 日在上海召开 本次会议将邀请国家药典委员会 国家自然科学基金委等相关职能机构领导和专家出席, 海内外科研院所 大专院校著名学者做大会专题报告, 并组织优秀论文进行分会报告和学术交流 热诚欢迎从事药品标准与质量控制 药物活性分析 药物分析信息学 新型分析技术在药物分析中的应用以及其他从事药物分析教学 科研等方面的有关人员参加 如有其他疑问, 请与大会组织会联系 (ywfx_2014@163.com)