标题

Similar documents
tbjx0121ZW.PDF

i

多肽知识手册.doc

生 物 进 化 指 生 物 与 其 生 存 环 境 之 间 相 互 作 用 并 导 致 遗 传 系 统 和 表 型 发 生 一 系 列 不 可 逆 转 的 改 变 的 过 程, 这 种 改 变 一 般 导 致 对 其 生 存 环 境 的 相 对 适 应 生 物 进 化 表 现 在 生 物 多 样 性

34 生命科学研究 2014 年 现为在蛋白质翻译过程中偏好使用其中某一个或 [3] 两个密码子 影响同义密码子中不同密码子使用频率的因素很多, 比如 GC 含量 (AT-rich 的生物倾向于使用 AT-rich 的密码子 ); 施加于 DNA 序列上的突变压力 ; 基因表达水平的因素 : 高表达

第四章 蛋白质的营养

(1) 脂 肪 族 氨 基 酸 (2) 芳 香 族 氨 基 酸 : 苯 丙 氨 酸 色 氨 酸 酪 氨 酸 (3) 杂 环 氨 基 酸 : 脯 氨 酸 组 氨 酸 3 按 侧 基 R 基 与 水 的 关 系 分 : (1) 非 极 性 氨 基 酸 : 有 甘 氨 酸 丙 氨 酸 缬 氨 酸 亮 氨

ADU

序 近 十 年 来, 在 人 类 基 因 组 计 划 的 带 动 下, 临 床 分 子 生 物 学 步 入 了 一 个 快 速 发 展 的 阶 段 O 这 一 阶 段 层 出 不 穷 的 新 理 论 和 新 技 术 的 诞 生 发 展 与 应 用, 积 极 地 促 进 和 提 高 了 临 床 诊 断

njj00004zw.PDF

DOI: /SP.J 应用与环境生物学报 Chin J Appl Environ Biol 2014,20 ( 5 ) : 铁皮石斛尿苷二磷酸葡萄糖焦磷酸化酶基因 (UGP)

Microsoft Word - 第2章 遺傳.doc


权 利 要 求 书 1/2 页 1. 一 种 RAMOSA2 多 肽 或 其 编 码 基 因 或 RAMOSA2 多 肽 的 调 节 剂 的 用 途, 用 于 调 节 植 物 株 高 穗 表 型 或 支 梗 长 度 ; 所 述 RAMOSA2 多 肽 选 自 : (a)seq ID NO :2 所

绪论


标题

分子生物学实验专题手册.ai

幻灯片 1

<4D F736F F F696E74202D20A960A6CCA5CDA7DEAB4FB0B7A4B6B2D02DC2B2B3F82E BACDBAE65BCD2A6A15D>

untitled

101¦~«ü©w¦Ò¸Õ¸ÑªR-¥Íª«¦Ò¬ì

未命名-1

Microsoft Word 陈伟婵-二校


3 ( ) (flakes) () (coixenolide, C 38 H 70 O 4 ) (5,6) (4) (7) (4,3) (Erhlin) 4 5 ( ) (4 ) ( ) ( ) 4 5 ( ) (8) (nitrogen-free extract, NFE) (

6 期夏云等 : 两栖动物线粒体基因组 trna 基因重复 丢失及其影响 823 中, 相关的研究十分少见并未在真正意义上展开. 近 10 年来, 两栖动物线粒体基因组全序列的测定得到大力拓展. 较之其他脊椎动物类群, 在两栖类中发现的 mtdna 的基因重排和 tr NA 基因的重复及丢失呈现出未

:,,?,?,,,,,,, 1 ( ) (. ) ( ) :,?? :,,,,, ( ) (. ) : (. ) ( ),,, ( ) ( ), (. ), ( ) ( ) - (. - ) (. ) ;, (. ) ( ),, ( ),,, : ( - ), ( - - ) ( ) (. ),,,

doc

目 录 第 一 章 总 论 项 目 背 景 项 目 概 况 问 题 与 建 议... 7 第 二 章 市 场 预 测 产 品 市 场 供 应 预 测 产 品 市 场 需 求 预 测 产 品 目

doc

Microsoft Word 尤宏争_new_.doc

Microsoft Word 指考生物(定稿)

t, SN/ T GB/T ( 13 ( 57% ) [ 2] ),, 44%, 1. 3,, FAO/ WHO 1973, [ 3 ],,, [ ],,, : [ 4-5 ] [ 6

Microsoft Word - 16 区又君-核红.doc

自然科学版 预处理 视盘粗定位 视盘垂直坐标的粗定位 视盘水平坐标的粗定位



u l l u u l l

<4D F736F F F696E74202D203720B7D6D7D3C9FACEEFD1A720B5DACBC4D5C2206D524E41B5C4B7ADD2EB20C3DCC2EBD7D3BACD74524E412E >

2007届山东省惠民一中高三第二次调研试题

标题

..I II GST GST

:,,, :,, ; (, : ) :, ;,,,, ;, ; ;,,, -,,. %, %,,. %, ;. % ;. % (, : ),,, :,,,, (, : ),,,, -,, (, : ), -,,,,,,,,, - (, : ),,,,,,,

Microsoft Word 杨旭昆_二校 勿动版

Microsoft Word 王金浩-二校.doc

46 33 (1 6 )40 min ; 20.1% 0.2mol/L 20 min(1 4 ) ; 75 5h6000r/min 10min 2.2 阿胶的提取 d min min(1 6 ) % 2.3 低铁饲料的配制 AIN-93M

untitled

债 券 牛 市 仍 将 延 续 值 得 关 注 的 是, 证 监 会 此 番 完 善 新 股 发 行 制 度 对 新 股 申 购 规 则 做 出 调 整, 改 为 市 值 配 售 + 无 需 提 前 预 缴 款 的 申 购 方 式 对 此, 一 基 金 认 为, 新 规 之 下 打 新 对 债 市


Microsoft Word 杨芳-二校出4173

Microsoft PowerPoint - chap7-1.ppt [兼容模式]

Microsoft Word 姜雪晶-二校 出2757、2758、2759、2760、2761

标题

幻灯片 1

! %! &!! % &


2

儿科学 儿科学 儿科学 儿科学 儿科学 儿科学 ( 专业学位 ) 儿科学 ( 专业学位 ) 儿科学 ( 专业学位 ) 儿科学 ( 专业学位 ) 儿科学 ( 专业学位 ) 耳鼻咽喉科学 ( 专业学位 ) 非定向 全国统考


,,,,,,,, (, ); (, ); ; (, : ), : ( : - );, ( : - );, ( : - ); () ( ), ; ( ), (, : - );,,, (, ); ( ),, (, : - );,,, ( : - ); (. ),, (, : ),,,,,,,,,, (

第 1 期 顾万君, 等 : 不同折叠类型蛋白中基于密码子的二级结构偏向性分析 73 息. 因此, 蛋白质的高级结构信息最有可能还包含在编码这一蛋白的基因序列中 [11]. 由于密码子的简并性, 核酸序列和蛋白序列之间有着多对一的关系. 所以, 基因同义密码子的使用中可能存在蛋白质的结构信息. 已经

( 343 nm DNA 483 nm) (5) ( ) 2. (Mitochondria) (mitochondrial genome) RNA (mrna) (matrix) (6) ( ) (signal sequence) (N-terminus) +H 3 N Met-Leu-Ser-Le

Microsoft Word - tck-103-4y-10-1(衛生)

第十章 基因的作用

公务员版 B 河北 公务员版 B 河北 公务员版 C 河北 公务员版 C 河北 公务员版 C 河北

中国细胞生物学学报 Chinese Journal of Cell Biology 2018, 40(12): DOI: /cjcb 两种茶树全基因组数据的密码子偏好性比较分析 王占军 #* 李豹 # 姜行舟欧祖兰徐忠东代欢欢 ( 合肥师


8

Microsoft Word 刘佳-二校

!"!""# $ $"% $! # & % ( ) $!

2015 年 水 利 建 设 市 场 主 体 信 用 评 价 结 果 一 勘 察 单 位 ( 共 92 家 ) AAA 级 (48 家 ) 1 中 国 电 建 集 团 北 京 勘 测 设 计 研 究 院 有 限 公 司 2 北 京 市 水 利 规 划 设 计 研 究 院 3 中 水 北 方 勘 测

标题

5 : 991,, 1.5 cm 3 cm, ; 15, 30 (, 2 ),,,, 105, ; 10, 20 (2 ) 10g ; 5, 10 (2 ) 5 g, 含肉率和其他组织占有率测定,,,,,, =(/ ) 100% =( /) 100% =( /) 100% =(/ )

非营利组织专职人员专业化问题研究


江人发2009年第49号突发事件应对法培训.doc

南通大学学报 社会科学版 第 卷 第 期 双月刊 年 月出版 3 9 S ^ 9 F = S ]( ^ >? 67 = D ^ E Y GH I 摘要!"#$%&' ()*+,-./* :; 1 < #D.E? FGAH!" BI7JK LM.NO F

2. 禁 止 母 乳 代 用 品 之 促 銷 活 動, 以 及 不 得 以 贊 助 試 用 或 免 費 等 方 式, 取 得 奶 瓶 及 安 撫 奶 嘴 認 證 說 明 以 贊 助 試 用 或 免 費 等 方 式, 取 得 奶 瓶 及 安 撫 奶 嘴, 並 在 婦 產 科 門 診 兒 科 門 診 產

市 立 永 平 高 中 無 填 報 無 填 報 (02) 市 立 樹 林 高 中 已 填 報 已 填 報 (02) 市 立 明 德 高 中 已 填 報 (02) 市 立 秀 峰 高 中 已 填 報

第 期 赵金莲等 荧光光谱法分析花茶对羟自由基 诱导的 氧化损伤的保护作用!!!!!!!! 花茶冲泡方法 荧光扫描方法 # 稳定性试验方法 重复性试验方法

第 期 高克宁等 网站分类体系包装器

第三章 食物与健康Food and health

10 生物有机化合物


第 期 徐娴英等 服务质量测量方法改进与应用


Microsoft Word 卢斌斌-二校

第 期 叶 柠等 基于 小波包子带能量比的疲劳驾驶检测方法

第二章 遗传密码的逻辑和进化

,,,,,,,,,,, :,,,,,,,,,,,,,,,,,,,,, ( - ), ( ),,,,,,,,.... : ( ),,,,, ( ),,,, ( ), (,, ),, :,,,,,,,,,, (, ),,

<4D F736F F D D2D2D31352D333336CFF2D3F1D3C25F6E65775FBDF0D2F8BBA8B3DFF3B6D3D7B3E6A1A2D3BCBACDB3C9B3E6B5C4D3AAD1F8B3C9B7D6A1AD>

:DDQ-D3266 (3) : :SA % 15% :CR-400 ( ) :TA-XTPlus Stable MicroSystem (1) : 3 Design- Expert

國立中山大學學位論文典藏.PDF

商 周 三 代 年 代 學 的 研 究 經 過 近 五 年 的 努 力, 完 成 夏 商 周 年 表 本 大 事 概 覽 中 夏 商 周 三 代 的 大 事 紀 年, 即 採 用 夏 商 周 斷 代 工 程 的 考 論 成 果 對 於 無 法 考 證 年 份 的 史 事 或 發 生 在 史 前 時

第 三 条 实 验 室 技 术 安 全 工 作 贯 彻 以 人 为 本 安 全 第 一 预 防 为 主 综 合 治 理 的 方 针 各 单 位 及 教 职 工 学 生 应 树 立 安 全 意 识, 履 行 安 全 义 务 承 担 安 全 责 任 第 四 条 实 验 室 技 术 安 全 工 作 坚 持

500 C ~ C 2

2015年全国硕士研究生入学考试

<4D F736F F D204238A67EABD7B2C4A447BEC7B4C1BCCCBEF0B0EAA4A4B0CFB0ECA4E8AED7A5D3BDD0AED >

Transcription:

2015 年 11 月内蒙古大学学报 ( 自然科学版 ) Nov. 2015 第 46 卷第 6 期 JournalofInnerMongoliaUniversity(NaturalScienceEdition) Vol.46 No.6 文章编号 :1000-1638(2015)06-0609-10 DOI:10.13484/j.nmgdxxbzk.20150609 冠状病毒同义密码子使用对 * mrna 二级结构的影响 黄俏, 李瑞芳, 于志芬, 李雪 ( 内蒙古师范大学物理与电子信息学院, 呼和浩特 010022) 摘要 : 从 NCBI 中获得了 45 种冠状病毒的 mrna 序列总计 416 条. 分别计算了每条编码序列中相对同义密码子使用度 (RSCU), 然后预测每条 mrna 序列的 RNA 二级结构, 计算相应 mrna 茎结构含量 环结构含量 单位平均折叠自由能以及 mrna 柔性. 由此, 建立了冠状病毒 mrna 二级结构数据库. 在此基础上, 分析每条 mrna 序列同义密码子使用度与 mrna 二级结构之间的相关性. 分析结果表明, 有 90% 的氨基酸所对应的密码子使用度与 mrna 茎结构含量显著相关 ; 有 75% 的氨基酸所对应的密码子使用度与 mrna 环结构含量显著相关 ; 有 90% 的氨基酸所对应的密码子使用度与单位平均折叠自由能显著相关 ; 有 85% 的氨基酸所对应的密码子使用度与 mrna 柔性显著相关. 进一步分析发现, 同时与茎结构含量和环结构含量都显著相关的密码子, 它们的使用度与两种结构含量的相关性截然相反, 在所选的参量中, 柔性与同义密码子使用度显示出更好的相关性. 结果证实, 冠状病毒同义密码子的使用对 mrna 二级结构存在很大的影响. 关键词 : 冠状病毒 ; 同义密码子使用度 ;mrna 二级结构 ; 折叠自由能 ;mrna 柔性中图分类号 : Q6 ;Q7 文献标志码 :A 引 言 同一个基因组内, 同义密码子非均衡的使用现象被称为同义密码子使用偏性. 同义密码子使用偏 性的研究一直是生物学家们所关注的热点. 早期 Grantham 等人发现密码子偏性有物种差异性, 同时 [1] 发现同一物种中的不同基因却使用了相似的偏好. 随着基因测序技术的发展, 越来越多的大规模基 因组数据为密码子使用偏性的研究提供了丰富的材料. 目前相关研究大多是通过比较数个或者数百 [2-3] [4] 个基因组情况来研究同义密码子使用偏性进化规律, 探索其使用规律和原因. 同时很多理论工 作者对密码子使用偏性问题仍在不断地深入研究, 试图揭示出更多的生物学意义. 目前人们认为多种 [5] [6] [7] 因素与密码子偏性相关, 如 : 氨基酸组分翻译起始效应,G+C 含量 蛋白质结构和 mrna 的 [8] 二级结构等. 我们认为密码子偏性是影响 mrna 二级结构的一个重要因素, 并在本文中试图去探 索同义密码子使用度对 mrna 二级结构的影响. mrna 在一系列细胞进程中充当调控元件, 有重要的生物学功能, 包括翻译起始, 翻译延伸, [9-10] mrna 或蛋白质的转运等.mRNA 的结构比较复杂, 有一级, 二级和三级结构. 它作为遗传信息 * 收稿日期 :2015-03-25; 修回日期 :2015-08-06 基金项目 : 内蒙古自治区自然科学基金资助项目 (2012MS0115); 内蒙古自治区研究生教育创新计划资助项目 (S20141013523); 内蒙古师范大学研究生科研创新基金资助项目 (CXJJS14061) 作者简介 : 黄俏 (1990-), 女, 辽宁盘锦人,2013 级硕士研究生.E-mail:418690539@qq.com. 通信作者 : 李瑞芳 (1974-), 女, 内蒙古乌兰察布人, 副教授, 博士.E-mail:liruifang@imnu.edu.cn.

610 内蒙古大学学报 ( 自然科学版 ) 2015 年 的临时携带者, 不断与蛋白质之类的分子结合, 不具有独立而稳定的三级结构. 研究表明,mRNA 分 [11] 子的折叠二级结构比其三级结构更有利于行使作为信使的基本功能. 所以人们越来越意识到了 mrna 二级结构研究的重要性. 现在已具备一些生物信息学的方法, 可以基于基因序列来预测 mr- NA 二级结构. 本文以冠状病毒的 mrna 序列为研究对象, 建立了一个 mrna 二级结构数据库, 计算了冠状 病毒 mrna 序列的相关核酸序列同义密码子使用度和二级结构参量. 试图探索同义密码子使用度 对 mrna 二级结构的影响, 并加深对冠状病毒 mrna 序列和结构的了解. 冠状病毒是引起动物和 人消化道 呼吸道疾病的重要病原体 [12], 具有遗传多样性和高度变异性, 是一种高危致病病毒. 其高 死亡率以及易传染性引起了科学家们的高度关注. 冠状病毒的基因组是单股正链 RNA, 具有 mrna 功能和感染性, 约含 7~10 个功能基因 [13], 蕴含丰富的生物学信息. 1 材料 本文收集了 NCBI 上冠状病毒的每个蛋白对应的编码 mrna 序列, 计算了每条 mrna 序列的 二级结构, 建立了 mrna 二级结构信息数据库. 该数据库包含了每一个蛋白 mrna 序列长度 ( 核苷 酸个数 ) mrna 序列 同义密码子使用度 mrna 茎结构含量 mrna 环结构含量 mrna 折叠自 由能以及 mrna 的柔性等信息. 数据库中共包含 45 种冠状病毒, 经过分析, 我们发现这 45 种冠状病 毒共包括 420 条 mrna 序列, 其中有 4 条 mrna 序列在本文所使用的 RNA 二级结构预测软件计 算结果中均只有一种可能的折叠方式, 根据公式 (4) 这 4 条 mrna 的柔性值无意义, 所以在分析中去 掉了这 4 条 mrna 序列的信息, 使用剩余的 416 条 mrna 序列作为分析样本. 2 方法 2.1 mrna 二级结构预测 [14] 有关 RNA 二级结构预测的软件有很多种, 本文使用的是 RNAstructure5.6 程序. 该软件应 用了多种算法, 包括最小自由能, 计算配分函数和估计碱基配对概率, 优化期望准确度, 随机抽样等, 是一个能够较精确地预测分析 RNA 二级结构的程序. 对于每个病毒的每个蛋白 mrna 序列, 本文 用该程序计算它们的二级结构, 得到它们的茎结构含量, 环结构含量, 折叠自由能以及柔性值. 2.2 mrna 二级结构的特征量 2.2.1 茎结构含量和环结构含量 mrna 的茎与环是组成其二级结构的最基本单元, 二者的数量和比例将会影响 mrna 的整体 二级结构, 基于这种想法, 对 mrna 的茎结构含量췍 NSP 和环结构含量췍 NL 分别作如下定义 : 췍 Nsp = Nsp N (1) 췍 NL = NL N 式中,Nsp 和 NL 分别为 mrna 中包含的茎结构和环结构的数量,N 为 mrna 序列的长度 ( 包含核苷 酸的个数 ). 2.2.2 mrna 单位平均折叠自由能 折叠自由能通常被认为是影响 RNA 二级结构稳定性的重要因素, 而且自由能越低, 对应二级结 构就越稳定. 本文使用 RNAstructure5.6 程序计算 mrna 折叠自由能, 然而在计算结果中折叠方式 有多种, 即对应的能量也就多种, 同时为了避免序列长度对结果的影响, 定义了 mrna 单位平均折 叠自由能 E * : (2) E * = E N (3) 考虑到选取 mrna 最可能的 20 种折叠方式已足够, 在 RNAstructure5.6 程序计算中设定最多折叠

第 6 期黄俏等冠状病毒同义密码子使用对 mrna 二级结构的影响 611 方式数为 20. 式中, 췍 E 为 mrna 序列所有可能折叠方式折叠自由能的平均值,N 为 mrna 序列的长 度. 2.2.3 mrna 的柔性 柔性 SF(specificflexibility) 是以 mrna 折叠自由能为基础的一个综合参量, 它可以有效地描 述 mrna 结构的可变性和稳定性, 仿照 DNA 序列柔性的描述方法 [15-16], 用序列折叠自由能的均方 [17] 偏差来描述 RNA 的柔性, 定义为结构柔性. 计算方法如下 : SF =100 SdE 췍 E E= n E j j=1 n (4) (5) SdE = n (E j -E) 췍 2 j=1 (n-1) 式中, 췍 E 为 mrna 所有可能折叠方式折叠自由能的平均值,E j (E j 0) 为第 j(j=1,2,,n) 种折叠 结构对应的折叠自由能,n 为可能折叠方式的数目,SdE 为折叠自由能的标准偏差, 它反映了 mrna 结构的可变性. 2.2.4 密码子使用度 密码子偏性用相对同义密码子使用参数来描述, 我们称为密码子使用度, 计算公式如下 : RSCUij = 1 xij n n xij i=1 式中,RSCUij 是第 i 个氨基酸的第 j 个同义密码子的相对使用频率,n 是编码第 i 个氨基酸的同义密 码子的数量,xij 是编码第 i 个氨基酸的第 j 个同义密码子的出现次数. 本文运用了 CodonW 软件对密 码子使用进行了分析, 该软件可以对密码子使用进行多变量分析, 还可以对密码子使用与氨基酸的相 关性进行分析. 通过使用该软件, 我们得到了 416 条 mrna 序列的密码子使用度. 3 结果分析 3.1 冠状病毒同义密码使用度对 mrna 茎结构和环结构的影响 对每个病毒的每个蛋白所对应的 mrna 序列, 计算得到茎结构含量与环结构含量, 并与其相应 的 RSCU 值进行相关性分析, 得到它们与 64 组密码子使用度的相关性, 结果见表 1 和表 2. 表中只列 出了与茎结构含量 环结构含量具有相关性的密码子. 从表 1 和表 2 可以看出同义密码子使用度与茎结构含量和环结构含量均有很好的相关性. 对于 茎结构含量,31 个密码子的使用与其显著相关, 涉及显著相关的氨基酸有 18 种, 占编码相关氨基酸 所有密码子数的 54.39%. 对于环结构含量,24 个密码子的使用与其显著相关, 涉及显著相关的氨基 酸有 15 种, 占编码相关氨基酸所有密码子数的 47.06%. 而且同时与茎结构含量和环结构含量都显 著相关的密码子, 它们的使用度与两种结构含量的相关性截然相反, 也就说当编码同一个氨基酸的同 一个密码子使用与茎结构含量成正相关时, 即对 mrna 环结构形成有促进作用, 这个密码的使用就 与环结构含量成负相关, 即对 mrna 环结构形成有阻碍作用. 例如 : 在表 1 表 2 中, 编码氨基酸 Gly 的密码子 GGU, 其使用度与茎结构含量的相关系数为 +0.32, 而与环结构含量的相关系数为 -0.28, 说明密码子的使用偏性可能在茎环的形成过程中起到了重要的调控作用. 3.2 冠状病毒同义密码子使用度对 mrna 单位平均折叠自由能的影响 mrna 分子折叠自由能的极小化决定其结构, 是衡量 mrna 二级结构稳定性的重要参量, 折叠 自由能越小, 对应结构就越稳定. 考虑到同义密码子的使用偏性可能是影响单位平均折叠自由能的重 (6) (7)

612 内蒙古大学学报 ( 自然科学版 ) 2015 年 要因素, 本文对每个病毒每个蛋白 mrna 序列的 RSCU 值与单位平均折叠自由能 E * 进行相关性分 析, 结果见表 3. 表 1 同义密码子使用度与茎结构含量之间的相关性分析结果 Table1 Resultsoflinearregresionbetweenthesynonymouscodonusagebiasandstemstructure Amino Codon R P F Gly GGU 0.32*** 1.24E-11 48.61 Glu GAA 0.29*** 8.73E-10 39.40 Asp GAU 0.21*** 1.54E-05 19.14 GAC -0.17*** 0.0006 11.95 Val GUU 0.27*** 3.90E-08 31.37 GUC -0.38*** 9.81E-16 69.85 Ala GCU 0.21*** 1.81E-05 18.81 Arg AGG 0.16** 0.0013 10.51 AGA -0.14** 0.0057 7.74 CGU 0.27*** 2.69E-08 32.14 Ser AGU 0.19*** 9.78E-05 15.48 UCU 0.10* 0.0430 4.12 UCC -0.30*** 5.09E-10 40.55 Lys AAG 0.10* 0.0427 4.13 Asn AAU 0.14** 0.0049 8.00 Thr ACA 0.12* 0.0123 6.33 Trp UGG 0.28*** 4.79E-09 35.77 Cys UGU 0.14** 0.0035 8.65 Tyr UAU 0.30*** 2.14E-10 42.42 UAC -0.10* 0.0350 4.48 Leu UUG 0.34*** 6.46E-13 55.14 UUA -0.11* 0.0278 4.87 CUA -0.19*** 6.88E-05 16.17 CUC -0.11* 0.0314 4.66 Phe UUU 0.24*** 8.16E-07 25.08 UUC -0.21*** 1.22E-05 19.60 Gln CAG 0.18*** 0.0003 13.61 His CAU 0.17*** 0.0005 12.49 Pro CCG 0.16** 0.0012 10.57 CCA 0.17*** 0.0007 11.67 CCC -0.14** 0.0045 8.16 Note:Twoṯailedsignificance:*:P 0.05;**:P 0.01;***:P 0.001.Risthecorrelationcoeficient,Pis thesignificancelevel,fisthestatistics.

第 6 期黄俏等冠状病毒同义密码子使用对 mrna 二级结构的影响 613 表 2 同义密码子使用度与环结构含量之间的相关性分析结果 Table2 Resultsoflinearregresionbetweenthesynonymouscodonusagebiasandloopstructure Amino Codon R P F Gly GGU -0.28*** 9.65E-09 34.30 Glu GAA -0.19*** 0.0001 15.29 Asp GAU -0.16*** 0.0008 11.30 GAC 0.13** 0.0066 7.45 Val GUU -0.21*** 1.09E-05 19.83 GUC 0.29*** 1.41E-09 38.37 Ala GCU -0.15** 0.0020 9.65 Arg AGG -0.10* 0.0477 3.94 CGA 0.12* 0.0132 6.19 CGU -0.21*** 1.17E-05 19.69 Ser AGU -0.16*** 0.0008 11.44 UCU -0.11* 0.0266 4.95 UCC 0.22*** 6.79E-06 20.78 Asn AAU -0.10* 0.0467 3.98 Thr ACA -0.11* 0.0213 5.34 Trp UGG -0.20*** 4.97E-05 16.81 Tyr UAU -0.22*** 8.65E-06 20.30 Leu UUG -0.27*** 1.99E-08 32.78 UUA 0.11* 0.0228 5.22 CUC 0.10* 0.0439 4.09 Phe UUU -0.20*** 5.94E-05 16.46 UUC 0.18*** 0.0003 13.43 Gln CAG -0.11* 0.0193 5.51 Pro CCA -0.12* 0.0138 6.11 Note:Twoṯailedsignificance:*:P 0.05;**:P 0.01;***:P 0.001.Risthecorrelationcoeficient,Pis thesignificancelevel,fisthestatistics. 表 3 同义密码子使用度与单位平均折叠自由能之间的相关性分析结果 Table3 Resultsoflinearregresionbetweenthesynonymouscodonusagebiasandaveragefoldingfreeenergy Amino Codon R P F Gly GGU -0.10* 0.0395 4.27 GGC -0.23*** 1.45E-06 23.90 Glu GAG -0.17*** 0.0006 12.0 GAA -0.16** 0.0014 10.33 Val GUG -0.11* 0.0252 5.04 GUA 0.10* 0.0464 3.99 GUU -0.11* 0.0310 4.68

614 内蒙古大学学报 ( 自然科学版 ) 2015 年 续表 3 Amino Codon R P F GUC 0.16*** 0.0010 11.07 Ala GCG -0.11* 0.0226 5.24 GCC -0.15** 0.0020 9.67 Arg AGG -0.17*** 0.0005 12.21 AGA 0.28*** 9.37E-09 34.36 CGG -0.10* 0.0406 4.22 CGA 0.10* 0.0386 4.31 CGU -0.22*** 3.59E-06 22.06 CGC -0.31*** 7.03E-11 44.83 Ser AGC -0.18*** 0.0002 14.50 UCC 0.21*** 1.67E-05 18.98 Lys AAG -0.23*** 1.94E-06 23.31 AAA 0.12* 0.0173 5.71 Asn AAC -0.11* 0.0206 5.40 Ile AUA 0.14** 0.0036 8.58 AUC -0.23*** 1.92E-06 23.34 Thr ACG -0.14** 0.0042 8.27 ACU 0.21*** 1.33E-05 19.43 ACC -0.17*** 0.0006 12.12 Trp UGG -0.33*** 5.35E-12 50.46 Cys UGU 0.17*** 0.0005 12.19 UGC -0.23*** 2.12E-06 23.13 Tyr UAC -0.18*** 0.0002 14.49 Leu UUG -0.23*** 1.89E-06 23.36 UUA 0.43*** 2.11E-20 95.32 CUG -0.38*** 1.74E-15 68.53 CUC -0.17*** 0.0007 11.73 Phe UUU 0.12* 0.0124 6.31 UUC -0.17*** 0.0006 11.98 Gln CAG -0.40*** 3.63E-17 77.51 CAA 0.19*** 0.0001 14.69 His CAU -0.12* 0.0172 5.72 CAC -0.15** 0.0016 10.11 Pro CCG -0.26*** 7.95E-08 29.88 CCA -0.23*** 3.40E-06 22.18 CCU 0.13** 0.0094 6.82 Note:Twoṯailedsignificance:*:P 0.05;**:P 0.01;***:P 0.001.Risthecorrelationcoeficient,Pis thesignificancelevel,fisthestatistics.

第 6 期黄俏等冠状病毒同义密码子使用对 mrna 二级结构的影响 615 从表 3 中可以看出, 在本文分析的所有特征量中, 与 mrna 单位平均折叠自由能相关的密码子 最多. 有 43 个密码子的使用与其显著相关, 涉及显著相关的氨基酸有 18 种, 占编码相关氨基酸所有 密码子数的 75.44%. 当我们进一步比较相关系数时, 发现密码子使用偏性与单位平均折叠自由能的 相关系数相对比较高, 说明密码子使用偏性对 mrna 二级结构的稳定性有很重要的影响. 表 4 同义密码子使用度与柔性之间的相关性分析结果 Table4 Resultsoflinearregresionbetweenthesynonymouscodonusagebiasandspecificflexibility Amino Codon R P F Gly GGA 0.11* 0.0228 5.22 GGU -0.23*** 1.29E-06 24.14 GGC 0.13** 0.0075 7.21 Glu GAA -0.15** 0.0021 9.55 Asp GAU 0.11* 0.0218 5.30 Val GUA 0.16*** 0.0009 11.29 GUU -0.18*** 0.0002 13.95 Ala GCU -0.13** 0.0065 7.49 Arg AGA 0.18*** 0.0002 13.99 CGU -0.32*** 2.34E-11 47.22 Ser AGU -0.13** 0.0097 6.75 UCC 0.12* 0.0121 6.36 Lys AAG -0.24*** 1.13E-06 24.41 AAA 0.10* 0.0324 4.61 Asn AAU -0.12* 0.0144 6.04 Trp UGG -0.30*** 4.98E-10 40.60 Tyr UAU -0.14** 0.0033 8.72 Leu UUG -0.36*** 4.59E-14 61.07 UUA 0.18*** 0.0002 13.75 CUG -0.12* 0.0129 6.24 CUA 0.13** 0.0095 6.79 Phe UUU 0.10* 0.0413 4.19 Gln CAG -0.17*** 0.0005 12.26 His CAU 0.31*** 1.37E-10 43.37 Pro CCG -0.13** 0.0081 7.08 CCA -0.12* 0.0123 6.32 CCC 0.13** 0.0059 7.66 End UAG -0.14** 0.0031 8.88 UAA 0.10* 0.0387 4.30 Note:Twoṯailedsignificance:*:P 0.05;**:P 0.01;***:P 0.001.Risthecorrelationcoeficient,Pis thesignificancelevel,fisthestatistics. 3.3 冠状病毒同义密码子使用度对 mrna 柔性 (SF) 的影响 柔性是以 mrna 折叠自由能为基础的一个综合参量, 可以有效地描述 mrna 二级结构的可变

616 内蒙古大学学报 ( 自然科学版 ) 2015 年 性和稳定性. 我们认为它是影响 mrna 功能的一个重要参量. 为研究同义密码子的使用偏性对 mr- NA 柔性的影响, 对每个病毒每个蛋白 mrna 序列的 RSCU 值与 mrna 柔性进行相关性分析, 结果 如表 4. 从表 4 中可以看出密码子使用偏性与我们所选的 mrna 柔性参量有很好的相关性. 对于柔性, 29 个密码子的使用与其显著相关, 涉及显著相关的氨基酸有 16 种, 占编码相关氨基酸所有密码子数 的 53.70%. 当我们进一步比较与该参量相关的密码子时, 发现约 2/3 的密码子使用与其呈极显著相 关, 说明密码子使用偏性对 mrna 柔性影响比较大. 也就是说, 密码子的使用偏性大大影响了 mr- NA 结构的可变性. 3.4 mrna 二级结构随同义密码子使用度变化的关系图 为了能够直观的看出茎结构含量 环结构含量 单位平均折叠自由能以及柔性随同义密码子使用 度的变化关系, 我们给出了这四个参量随同义密码子使用度的变化关系图 ( 见图 1- 图 3). 由于涉及 相关的密码子很多, 仅以某个密码子作为示例. 图 1 mrna 茎结构含量和环结构含量随密码子 GUC 使用度的变化关系 Fig.1 Relationsofstemstructurecontentsandloop structurecontentsofmrna withrscuvaluesofguc 图 1 是以编码氨基酸 Val 的密码子 GUC 为例绘制的关系图, 它很直观地表达出了茎结构含量和环结构含量随密码子 GUC 使用度的变化趋势正好相反, 且它们与同义密码子使用度相关性的强度很相近 ( 斜率相近 ), 图 2 和图 3 分别是以编码氨基酸 Leu 的密码子 UUA 和 UUG 为例绘制的关系图, 它说明单位平均折叠自由能与密码子 UUA 使用度呈正相关趋势, 而柔性与密码子 UUG 使用度呈负相关趋势, 且在所选的参量中柔性与密码子使用度的相关性最强 ( 斜率最大 ). 其它涉及相关的密码子也可以得到类似相关图, 这些相关图进一步说明同义密码子使用度对 mrna 二级结构有很重要的影响. 图 2 mrna 单位平均折叠自由能随密码子 UUA 使用度的变化关系 Fig.2 Relationsofaverageunitfoldingfree energyofmrna withrscuvaluesofuua 图 3 mrna 柔性随密码子 UUG 使用度的变化关系 Fig.3 RelationsofflexibilitiesofmRNA withrscuvaluesofuug 4 讨论 本文通过分析同义密码子使用偏性与 mrna 二级结构的相关性, 来探索同义密码子使用度对 mrna 二级结构的影响. 我们的统计结果表明, 对于冠状病毒, 同义密码子使用度与其 mrna 二级结构各特征量之间均有很好的相关性. 同义密码子使用度与茎结构含量和环结构含量的相关性正好

第 6 期黄俏等冠状病毒同义密码子使用对 mrna 二级结构的影响 617 相反, 涉及显著相关的氨基酸分别占总数的 90% 和 75%, 茎结构含量反映了结构的稳定性. 茎结构含 量越高, 序列中配对的碱基越多, 对应二级结构中的环区域就越少, 从而能够减少蛋白质因子与 mr- NA 序列的结合几率 [18-19], 抑制由蛋白质因子诱导的 mrna 结构的改变, 保证了二级结构的稳定 性.mRNA 二级结构与功能密切相关, 在翻译起始 mrna 转运等细胞进程中起到重要调控作用, 能 够影响翻译效率和 mrna 的稳定性.mRNA 二级结构参与细胞进程一般通过两种方式, 一种是二级 [9] [20-21] 结构通过特异性的结合其它分子来调控一些生物过程 ; 另一种涉及 mrna 结构的稳定性. 因 此近年来有关对 mrna 二级结构的研究备受关注. 同时本文还得到了同义密码子使用度分别与能量和柔性的相关性分析结果, 在本文分析的所有 特征量中, 与 mrna 单位平均折叠自由能相关的密码子最多, 涉及显著相关的氨基酸占总数的 90%, 相关系数相对较高. 平均折叠自由能反映了结构的稳定性, 柔性是以折叠自由能为基础的一个 综合参量, 体现了 mrna 二级结构的可变性. 密码子使用偏性与 mrna 柔性相关性非常显著, 涉及 显著相关的氨基酸占总数的 80%, 且与其呈极显著相关的密码子占多数,mRNA 的柔性越强, 对应 区域形成二级结构的可能性越小, 结构就越不稳定 ;mrna 的柔性越弱, 对应区域形成二级结构的可 [22] 能性越大, 结构就越稳定. 综上所述, 密码子使用偏性对 mrna 二级结构的稳定性有很重要的影 响. 本文只针对冠状病毒作为研究对象, 从统计学的角度分析, 数据显得有些不足. 但是, 通过本文的 分析, 我们看到了同义密码子使用偏性对 mrna 二级结构的影响趋势. 下一步, 我们将致力于收集 更多物种的相关数据, 更加深入地揭示二者之间的相关性. 参考文献 : [1] Grantham R,GautierC,Gouy M,etal.Codoncatalogusageandthegenomehypothesis[J].NucleicAcidsRes, 1980,8(1):r49-r62. [2] DuretL.Evolutionofsynonymouscodonusageinmetazoans[J].CurrOpinGenetDev,2002,12(6):640-649. [3] WalDP,HerbeckJT.EvolutionarypaternsofcodonusageinthechloroplastgenerbcL[J].JMolEvol,2003, 56(6):673-688. [4] RochaEP.CodonusagebiasfromtRNA'spointofview:redundancy,specialization,andeficientdecodingfor translationoptimization[j].genomeres,2004,14(11):2279-2286. [5] D OnofrioG,MouchiroudD,AissaniB,etal.Correlationsbetweenthecompositionalpropertiesofhumangenes, codonusage,andaminoacidcompositionofproteins[j].jmolevol,1991,32(6):504-510. [6] KnightRD,FreelandSJ,LandweberLF.Asimplemodelbasedonmutationandselectionexplainstrendsinco- donandamino-acidusageandgccompositionwithinandacrossgenomes[j].genomebiology,2001,2(4):re- search0010-research0013. [7] GuptaSK,MajumdarS,BhatacharyaTK,etal.Studiesontherelationshipsbetweenthesynonymouscodonusageandproteinsecondarystructuralunits[J].BiochemBiophysResCommun,2000,269(3):692-696. [8] ZamaM.CodonusageandsecondarystructureofMrna[J].NueleicAcidsSympSer,1990(22):93-94. [9] DethofE A,ChuqhJ,MustoeA M,etal.FunctionalcomplexityandregulationthroughRNAdynamics[J].Nature,2012,482(7385):322-330. [10] WanY,Kertesz M,SpitaleR C,etal.Understandingthetranscriptomethrough RNAstructure[J].NatRev Genet,2011,12(9):641-655. [11] BateyRT.StructuresofregulatoryelementsinmRNAs[J].CurrOpinStructBiol,2006,16(3):299-306. [12] GengH Y,Tan WJ.Anovelhumancoronavirus:MiddleEastrespiratorysyndromehumancoronavirus[J].Sci ChinaLifeSci,2013,56(8):683-687. [13] 孙淑芳, 王媛媛, 刘陆世, 等. 冠状病毒概述 [J]. 中国动物检疫,2013,30(6):68-71. [14] ReuterJS,MathewsD H.RNAstructure:softwareforRNAsecondarystructurepredictionandanalysis[J]. BMCBioinformatics,2010,11(1):129.

618 内蒙古大学学报 ( 自然科学版 ) 2015 年 [15] TsaiL,LuoLF.AstatisticalmechanicalmodelforpredictingB-DNAcurvatureandflexibility[J].JTheorBiol,2000,207(2):177-194. [16] LuoL F.Theoretic-physicalapproachto molecularbiology[m].shanghai:shanghaiscientific & Tecẖnical Publishers,2004. [17] Chen W,LuoLF,ZhangLR.Theorganizationofnucleosomesaroundsplicesites[J].NucleicAcidsRes,2010, 38(9):2788-2798. [18] HalKB.RNA-proteininteractions[J].CurrOpinStructBioL,2002,12(3):283-288. [19] MessiasA C,Satler M.Structuralbasisofsingle-strandedRNArecognition[J].AccChem Res,2004,37(5): 279-287. [20] GiedrocDP,CornishPV.FrameshiftingRNApseudoknots:structureandmechanism[J].VirusRes,2009,139 (2):193-208. [21] SilerE,DeZwaanDC,AndersonJF,etal.Slowingbacterialtranslationspeedenhanceseukaryoticproteinfolḏ ingeficiency[j].jmolbiol,2010,396(5):1310-1318. [22] WatsJM,DangK K,GorelickRJ,etal.ArchitectureandsecondarystructureofanentireHIV-1RNAgenome [J].Nature,2009,460(7256):711-716. ( 责任编委李前忠 ) InfluenceofSynonymousCodonUsageBiasonmRNA SecondaryStructureinCoronavirus HUANG Qiao,LIRui-fang,YU Zhi-fen,LIXue (ColegeofPhysicsandElectronicInformation, InnerMongoliaNormalUniversity,Hohhot010022,China) Abstract:Theinformationof416mRNAsequencesabout45coronavirusesincludedintheNCBI wascolected.foreverycoronavirus,firstly,thesynonymouscodonusagebiasofthe mrna sequenceofeachproteinwascalculated.thenthesecondarystructureofevery mrnasequencewas predicted,andthestemstructure,theloopstructure,theaveragefoldingfreeenergyandthespecific flexibilityof mrna werecalculated.afterthis,adatabaseabout mrna secondarystructureof coronaviruseswasfounded.onthisbasis,thecorrelationbetweensynonymouscodonusagebiasand thefourkindsofparametersof mrna secondarystructure wereanalyzedforevery mrna sequence.theresultsshowthat,thecorrespondingcodonusageof90percentofaminoacidsissignificantlycorrelatedwiththecontentofstemstructure;thatof75percentofaminoacidsissignificantly correlatedwiththecontentofloopstructure;thatof90percentofaminoacidsissignificantlycorrelatedwiththeaverageunitfoldingfreeenergy;andthatof85percentofaminoacidsissignificantly correlatedwiththemrnaspecificflexibility.furtheranalysisisfound,thatforthecodesofboth significantlycorrelatedwithstemstructureandloopstructure,thecorrelationbetweentheirusage withtwokindsofstructurecontentsiscompletelyopposite,thecorrelationbetweenspecificflexibiḻ itywithsynonymouscodonusagebiasisexcelentinalparameters.theresultsindicatethatthere areimportantinfluencesofthesynonymouscodonusagebiasonthemrnasecondarystructure. Keywords:coronavirus;synonymouscodonusagebias;mRNAsecondarystructure;foldingfree energy;mrnaspecificflexibility