Similar documents
《C语言基础入门》课程教学大纲

说 明 为 了 反 映 教 运 行 的 基 本 状 态, 为 校 和 院 制 定 相 关 政 策 和 进 行 教 建 设 与 改 革 提 供 据 依 据, 校 从 程 资 源 ( 开 类 别 开 量 规 模 ) 教 师 结 构 程 考 核 等 维 度, 对 2015 年 春 季 期 教 运 行 基

<433A5C446F63756D656E E E67735C41646D696E F725CD7C0C3E65CC2DBCEC4CFB5CDB3CAB9D3C3D6B8C4CFA3A8BCF2BBAFA3A95CCAB9D3C3D6B8C4CF31302D31392E646F63>

中 日 信 息 化 的 比 较 与 合 作 一 中 日 信 息 化 的 规 模 比 较

一 公 共 卫 生 硕 士 专 业 学 位 论 文 的 概 述 学 位 论 文 是 对 研 究 生 进 行 科 学 研 究 或 承 担 专 门 技 术 工 作 的 全 面 训 练, 是 培 养 研 究 生 创 新 能 力, 综 合 运 用 所 学 知 识 发 现 问 题, 分 析 问 题 和 解 决

何 秋 琳 张 立 春 视 觉 学 习 研 究 进 展 视 觉 注 意 视 觉 感 知

( ) 信 号 与 系 统 Ⅰ 学 科 基 础 必 修 课 教 周 2016 年 06 月 13 日 (08:00-09:35) ( )

中 国 软 科 学 年 第 期!!!

名 称 生 命 科 学 学 院 环 境 科 学 1 生 物 学 仅 接 收 院 内 调 剂, 初 试 分 数 满 足 我 院 生 物 学 复 试 最 低 分 数 线 生 命 科 学 学 院 生 态 学 5 生 态 学 或 生 物 学 生 命 科 学 学 院

西 南 民 族 学 院 学 报 哲 学 社 会 科 学 版 第 卷 资 料 来 源 中 国 统 计 年 鉴 年 年 新 中 国 五 十 年 统 计 资 料 汇 编 中 国 人 口 统 计 年 鉴 年 数 据 资 料 来 源 中 国 统 计 年 鉴 中 国 统 计 出 版 社 年 版 资 料 来 源

正 规 培 训 达 规 定 标 准 学 时 数, 并 取 得 结 业 证 书 二 级 可 编 程 师 ( 具 备 以 下 条 件 之 一 者 ) (1) 连 续 从 事 本 职 业 工 作 13 年 以 上 (2) 取 得 本 职 业 三 级 职 业 资 格 证 书 后, 连 续 从 事 本 职 业

 编号:


课程类 别

评 委 : 李 炎 斌 - 个 人 技 术 标 资 信 标 初 步 审 查 明 细 表 序 号 投 标 单 位 投 标 函 未 按 招 标 文 件 规 定 填 写 漏 填 或 内 容 填 写 错 误 的 ; 不 同 投 标 人 的 投 标 文 件 由 同 一 台 电 脑 或 同 一 家 投 标 单

2014年中央财经大学研究生招生录取工作简报

<4D F736F F D20BFC9B1E0B3CCD0F2BFD8D6C6CFB5CDB3C9E8BCC6CAA6B9FABCD2D6B0D2B5B1EAD7BC2E646F63>

2006年顺德区高中阶段学校招生录取分数线

第 期 李 伟 等 用 方 法 对 中 国 历 史 气 温 数 据 插 值 可 行 性 讨 论

定 位 和 描 述 : 程 序 设 计 / 办 公 软 件 高 级 应 用 级 考 核 内 容 包 括 计 算 机 语 言 与 基 础 程 序 设 计 能 力, 要 求 参 试 者 掌 握 一 门 计 算 机 语 言, 可 选 类 别 有 高 级 语 言 程 序 设 计 类 数 据 库 编 程 类

<4D F736F F D D323630D6D0B9FAD3A6B6D4C6F8BAF2B1E4BBAFB5C4D5FEB2DFD3EBD0D0B6AF C4EAB6C8B1A8B8E6>

I

¹ º ¹ º 农 业 流 动 人 口 是 指 户 口 性 质 为 农 业 户 口 在 流 入 地 城 市 工 作 生 活 居 住 一 个 月 及 以 上 的 流 动 人 口 非 农 流 动 人 口 是 指 户 口 性 质 为 非 农 户 口 在 流 入 地 城 市 工 作 生 活 居 住 一 个

学 年 第 二 学 期 集 中 考 试 安 排 (18 周 ) 考 试 日 期 :6 月 27 日 星 期 一 8:10-9:50 第 二 公 共 教 学 楼 A 区 A 高 等 数 学 ( 理 二 2) 复 材 材 料 科 学 与 工 程

18 上 报 该 学 期 新 生 数 据 至 阳 光 平 台 第 一 学 期 第 四 周 至 第 六 周 19 督 促 学 习 中 心 提 交 新 增 专 业 申 请 第 一 学 期 第 四 周 至 第 八 周 20 编 制 全 国 网 络 统 考 十 二 月 批 次 考 前 模 拟 题 第 一 学

深圳市新亚电子制程股份有限公司

抗 战 时 期 国 民 政 府 的 银 行 监 理 体 制 探 析 % # % % % ) % % # # + #, ) +, % % % % % % % %

龚 亚 夫 在 重 新 思 考 基 础 教 育 英 语 教 学 的 理 念 一 文 中 援 引 的 观 点 认 为 当 跳 出 本 族 语 主 义 的 思 维 定 式 后 需 要 重 新 思 考 许 多 相 连 带 的 问 题 比 如 许 多 发 音 的 细 微 区 别 并 不 影 响 理 解 和

附件1:

<433A5C C6B73625C B746F705CB9FABCCAD6D0D2BDD2A9D7A8D2B5B8DFBCB6BCBCCAF5D6B0B3C6C6C0C9F3C9EAC7EBD6B8C4CFA3A CDA8D3C3B0E6A3A92E646F63>

评 委 : 徐 岩 宇 - 个 人 技 术 标 资 信 标 初 步 审 查 明 细 表 序 号 投 标 单 位 投 标 函 未 按 招 标 文 件 规 定 填 写 漏 填 或 内 容 填 写 错 误 的 ; 不 同 投 标 人 的 投 标 文 件 由 同 一 台 电 脑 或 同 一 家 投 标 单

伊 犁 师 范 学 院 611 语 言 学 概 论 全 套 考 研 资 料 <2016 年 最 新 考 研 资 料 > 2-2 语 言 学 纲 要 笔 记, 由 考 取 本 校 本 专 业 高 分 研 究 生 总 结 而 来, 重 点 突 出, 借 助 此 笔 记 可 以 大 大 提 高 复 习 效

中 国 社 会 科 学 年 第 期!!!! ( ( ) % ) ) ) % % % %

<4D F736F F D20D6D8D3CA3535BAC5B9D8D3DAD3A1B7A2A1B6D6D8C7ECD3CAB5E7B4F3D1A7D1A7CABFD1A7CEBBCADAD3E8B9A4D7F7CFB8D4F2A1B7B5C4CDA8D6AA2E646F63>

!!!!!!!!!!

0 年 上 半 年 评 价 与 考 核 细 则 序 号 部 门 要 素 值 考 核 内 容 考 核 方 式 考 核 标 准 考 核 ( 扣 原 因 ) 考 评 得 3 安 全 生 产 目 30 无 同 等 责 任 以 上 道 路 交 通 亡 人 事 故 无 轻 伤 责 任 事 故 无 重 大 质 量

,,,,, :,, (.,, );, (, : ), (.., ;. &., ;.. &.., ;, ;, ),,,,,,, ( ) ( ),,,,.,,,,,, : ;, ;,.,,,,, (., : - ),,,, ( ),,,, (, : ),, :,

附 件 : 上 海 市 建 筑 施 工 企 业 施 工 现 场 项 目 管 理 机 构 关 键 岗 位 人 员 配 备 指 南 二 一 四 年 九 月 十 一 日 2

2 熟 悉 Visual Basic 的 集 成 开 发 环 境 3 了 解 可 视 化 面 向 对 象 编 程 事 件 驱 动 交 互 式 开 发 等 基 本 概 念 4 了 解 Visual Basic 的 特 点 环 境 要 求 与 安 装 方 法 1 Visual Basic 开 发 应 用

一 开 放 性 的 政 策 与 法 规 二 两 岸 共 同 的 文 化 传 承 三 两 岸 高 校 各 自 具 有 专 业 优 势 远 见 杂 志 年 月 日

一 从 分 封 制 到 郡 县 制 一 从 打 虎 亭 汉 墓 说 起

第1篇 道路桥梁工程技术核心专业课程标准及学习绩效考评体系

全国建筑市场注册执业人员不良行为记录认定标准(试行).doc

上海证券交易所会议纪要

国 际 中 国 研 究 动 态 是 中 国 社 会 科 学 院 国 际 中 国 学 研 究 中 心 出 品 的 以 介 绍 国 际 中 国 问 题 研 究 最 新 成 果 为 宗 旨 的 电 子 杂 志 计 划 每 月 出 版 一 期 除 编 译 和 摘 编 网 络 和 中 外 期 刊 库 上 可

三武一宗灭佛研究

<4D F736F F D20C6F3D2B5C5E0D1B5CAA6B9FABCD2D6B0D2B5B1EAD7BC2E646F63>


<4D F736F F D20322EC9F3BACBC8CBD4B1D7CAB8F1D7A2B2E1B9DCC0EDB9E6B7B6B8BDB1ED2E646F63>

修改版-操作手册.doc

(Microsoft Word - NCRE\314\345\317\265\265\367\325\37313\324\27221\272\3051.doc)

!!

随着执业中医师资格考试制度的不断完善,本着为我校中医学专业认证服务的目的,本文通过对我校中医类毕业生参加2012年和2013年的中医执业医师考试成绩及通过率、掌握率进行分析,并与全国的平均水平进行差异比较分析,以此了解我校执业中医师考试的现状,进而反映我校中医类课程总体教学水平,发现考核知识模块教学中存在的不足,反馈给相关学院和教学管理部门,以此提高教学和管理水平。

2009—2010级本科课程教学大纲与课程简介格式

思 想 政 治 理 论 经 核 查 无 误 思 想 政 治 理 论 经 核 查 无 误 思 想 政 治 理 论 经 核 查 无 误 思 想

<4D F736F F D20CAAEC8FDCEE5B9E6BBAED7EED6D5B8E5352E33312E646F63>

上证指数

国债回购交易业务指引

2016年南开大学MBA招生信息

新, 各 地 各 部 门 ( 单 位 ) 各 文 化 事 业 单 位 要 高 度 重 视, 切 实 加 强 领 导, 精 心 组 织 实 施 要 根 据 事 业 单 位 岗 位 设 置 管 理 的 规 定 和 要 求, 在 深 入 调 查 研 究 广 泛 听 取 意 见 的 基 础 上, 研 究 提

复旦大学关于做好2013年同等学力人员

内 容 二 : 建 立 并 完 善 了 三 点 的 网 络 教 学 管 理 体 系 内 容 三 : 注 重 培 养 学 生 的 听 说 能 力 14

HSK( 一 级 ) 考 查 考 生 的 日 常 汉 语 应 用 能 力, 它 对 应 于 国 际 汉 语 能 力 标 准 一 级 欧 洲 语 言 共 同 参 考 框 架 (CEF) A1 级 通 过 HSK( 一 级 ) 的 考 生 可 以 理 解 并 使 用 一 些 非 常 简 单 的 汉 语

( 二 ) 现 行 统 一 高 考 制 度 不 利 于 培 养 人 的 创 新 精 神,,,,,,,,,,,,, [ ],,,,,,,,,,, :, ;,,,,,,? ( 三 ) 现 行 统 一 高 考 制 度 不 利 于 全 体 学 生 都 获 得 全 面 发 展,, [ ],,,,,,,,,,,

马 克 思 主 义 公 正 观 的 基 本 向 度 及 方 法 论 原 则!! # #

ETF、分级基金规模、份额变化统计

国家职业标准:网络课件设计师


报 价 量 单 位 变 动 点 交 割 方 式 挂 牌 基 准 价 每 日 结 算 价 到 期 交 割 价 到 期 交 割 结 算 金 额 等 2.2 合 约 代 码 交 易 系 统 中 用 于 区 分 不 同 合 约 品 种 的 代 码, 由 标 的 债 券 缩 写 和 到 期 月 份 组 成 如

北京信息科技大学本科学生成绩管理办法

002 电 子 科 学 与 工 程 学 院 拟 招 生 150 人 联 系 人 : 周 老 师, 电 话 物 理 电 子 学 电 路 分 析 电 磁 场 理 论 01 电 磁 物 理 与 微 波 电 子 学 02 光 子 学 与 光 电 技 术 03 微 纳

<4D F736F F D20D0A3B7A2A1B A1B BAC5B9D8D3DAD7E9D6AFBFAAD5B9C8ABD0A3BDCCD6B0B9A4B8DACEBBC6B8D3C3B1E4B6AFB9A4D7F7B5C4CDA8D6AA2E646F63>

( 此 页 无 正 文, 为 广 东 东 方 精 工 科 技 股 份 有 限 公 司 关 于 提 供 资 料 真 实 准 确 和 完 整 的 承 诺 函 之 签 署 页 ) 广 东 东 方 精 工 科 技 股 份 有 限 公 司 法 定 代 表 人 : 唐 灼 林 2016 年 7 月 28 日

物 流 从 业 人 员 职 业 能 力 等 级 证 书 分 为 四 个 级 别, 分 别 为 初 级 助 理 级 中 级 和 高 级 ; 采 购 从 业 人 员 职 业 能 力 等 级 证 书 分 为 三 个 级 别, 分 别 为 中 级 高 级 和 注 册 级 请 各 有 关 单 位 按 照 通

金 不 少 于 800 万 元, 净 资 产 不 少 于 960 万 元 ; (3) 近 五 年 独 立 承 担 过 单 项 合 同 额 不 少 于 1000 万 元 的 智 能 化 工 程 ( 设 计 或 施 工 或 设 计 施 工 一 体 ) 不 少 于 2 项 ; (4) 近 三 年 每 年

校 级 2 3 年 1 分 /10 万 双 语 示 范 课 程 国 家 级 6 3 年 1 分 /10 万 精 品 教 材 国 家 主 编 2, 副 获 奖 当 年 ( 教 育 部 ) 主 编 1 省 部 级 5 在 研 究 期 间 1 分 /10 万 元 其 它 教 研 课 题 校 级 2 在 研

上海工程技术大学教学管理工作流

Microsoft Word - 文件汇编.doc

02 软 件 工 程 技 术 一 3301 数 学 一 4861 数 据 结 构 面 向 对 象 技 术 计 算 机 组 成 原 理 03 软 件 工 程 管 理 04 软 件 服 务 工 程 或 862 软 件 工 程 软 件 工 程 10 不 多 于 1 人 01 软 件 工 程


抗 日 战 争 研 究 年 第 期

<4D F736F F D20B5E7D7D3B7A2CEC4CEC4CDB7A3A8D2CBB1F6D1A7D4BACEC4BCFEA3A92E646F63>

抗 日 战 争 研 究 % 年 第 期! # # % %

·岗位设置管理流程

<443A5C6D B5C30312EB9A4D7F7CEC4B5B55C30322EBACFCDACCEC4B5B55C C30342EC8CBC9E7CCFC5C31332ECFEEC4BFC5E0D1B55C E30385C322EB2D9D7F7CAD6B2E12E646F63>

证券代码: 证券简称:长城电脑 公告编号:


<4D F736F F D20C9C2CAA6D0A3B7A B9D8D3DAD3A1B7A2A1B6C9C2CEF7CAA6B7B6B4F3D1A7BFC6D1D0D2B5BCA8C8CFB6A8D4DDD0D0B0ECB7A8A3A8D7D4C8BBBFC6D1A7C0E0A3A9A1B7BACDA1B6C9C2CEF7CAA6B7B6B4F3D1A7B1EAD6BED0D4BFC6D1D0D2B5BCA8BEADB7D

3 月 30 日 在 中 国 证 券 报 上 海 证 券 报 证 券 时 报 证 券 日 报 和 上 海 证 券 交 易 所 网 站 上 发 出 召 开 本 次 股 东 大 会 公 告, 该 公 告 中 载 明 了 召 开 股 东 大 会 的 日 期 网 络 投 票 的 方 式 时 间 以 及 审

( 四 ) 教 授 二 资 质 与 推 荐 ( 一 ) 实 行 教 师 资 质 管 理 的 国 家, 申 请 国 际 中 医 药 教 师 高 级 职 称 评 审 者, 必 须 具 有 所 在 国 教 育 部 认 定 的 教 师 资 格 ( 二 ) 没 有 实 行 教 师 资 质 管 理 的 国 家,

数 学 标 准 不 练 习 1.1 理 解 问 题 并 坚 持 解 决 这 些 问 题 1.2 以 抽 象 和 定 量 方 式 推 理 1.3 建 构 可 行 参 数 和 评 判 他 人 的 推 理 1.4 使 用 数 学 方 法 建 模 1.5 策 略 性 地 使 用 合 适 的 工 具 1.6

中 国 投 资 率 波 动 的 度 量 与 变 化 的 分 解 年 经 济 发 展 水 平

<4D F736F F D20D0A3D1D0D7D65B DC4EA313037BAC5B9D8D3DAD3A1B7A2D6D0BFC6B4F3D1D0BEBFC9FAC5E0D1F8B7BDB0B8D7DCD4F B0E6B5C4CDA8D6AA2E646F63>


工 程 造 价 咨 询 企 业 管 理 系 统 操 作 手 册 目 录 1 造 价 企 业 登 录 企 业 基 本 信 息 查 看 企 业 人 员 信 息 查 看 企 业 基 本 信 息 操 作 企 业 简 介 企 业 章

(1) 连 续 从 事 本 职 业 工 作 2 年 以 上, 经 本 职 业 助 网 络 编 辑 师 正 规 培 训 达 规 定 标 准 学 时 数, 并 取 得 结 业 证 书 (2) 取 得 本 职 业 网 络 编 辑 员 职 业 资 格 证 书 后, 连 续 从 事 本 职 业 工 作 2 年

<4D F736F F D20B9D8D3DAB0BABBAAA3A8C9CFBAA3A3A9D7D4B6AFBBAFB9A4B3CCB9C9B7DDD3D0CFDEB9ABCBBE C4EAC4EAB6C8B9C9B6ABB4F3BBE1B7A8C2C9D2E2BCFBCAE92E646F6378>

中 中 中 中 部 中 岗 位 条 件 历 其 它 历 史 师 地 理 师 生 物 师 体 与 健 康 师 从 事 中 历 史 工 从 事 中 地 理 工 从 事 中 生 物 工 从 事 中 体 与 健 康 工 2. 课 程 与 论 ( 历 史 ); 2. 科 ( 历 史 )

!!!!!

人 工 抗 原 的 鉴 定

Transcription:

中 国 科 学 技 术 大 学 保 密 博 士 学 位 论 文 多 核 环 境 中 系 统 软 件 访 存 与 同 步 优 化 问 题 的 研 究 作 者 姓 名 : 学 科 专 业 : 导 师 姓 名 : 林 传 文 计 算 机 应 用 技 术 吴 曼 青 研 究 员 顾 乃 杰 教 授 完 成 时 间 : 二 一 二 年 五 月

Secret University of Science and Technology of China A dissertation for doctor s degree The System Software Optimization of Memory Access and Synchronization in Multicore Environment Author s Name: Lin Chuanwen Speciality: Supervisor: Computer Application Technology Researcher Wu Manqing Professor Gu Naijie Finished time: May 2012

中 国 科 学 技 术 大 学 学 位 论 文 原 创 性 声 明 本 人 声 明 所 呈 交 的 学 位 论 文, 是 本 人 在 导 师 指 导 下 进 行 研 究 工 作 所 取 得 的 成 果 除 已 特 别 加 以 标 注 和 致 谢 的 地 方 外, 论 文 中 不 包 含 任 何 他 人 已 经 发 表 或 撰 写 过 的 研 究 成 果 与 我 一 同 工 作 的 同 志 对 本 研 究 所 做 的 贡 献 均 已 在 论 文 中 作 了 明 确 的 说 明 作 者 签 名 : 签 字 日 期 : 中 国 科 学 技 术 大 学 学 位 论 文 授 权 使 用 声 明 作 为 申 请 学 位 的 条 件 之 一, 学 位 论 文 著 作 权 拥 有 者 授 权 中 国 科 学 技 术 大 学 拥 有 学 位 论 文 的 部 分 使 用 权, 即 : 学 校 有 权 按 有 关 规 定 向 国 家 有 关 部 门 或 机 构 送 交 论 文 的 复 印 件 和 电 子 版, 允 许 论 文 被 查 阅 和 借 阅, 可 以 将 学 位 论 文 编 入 有 关 数 据 库 进 行 检 索, 可 以 采 用 影 印 缩 印 或 扫 描 等 复 制 手 段 保 存 汇 编 学 位 论 文 本 人 提 交 的 电 子 文 档 的 内 容 和 纸 质 论 文 的 内 容 相 一 致 保 密 的 学 位 论 文 在 解 密 后 也 遵 守 此 规 定 公 开 保 密 ( 年 ) 作 者 签 名 : 导 师 签 名 : 签 字 日 期 : 签 字 日 期 :

摘 要 摘 要 多 核 架 构 以 其 性 能 和 功 耗 方 面 的 综 合 优 势, 已 经 成 为 微 处 理 器 的 主 流 结 构 多 核 架 构 通 过 在 单 个 芯 片 上 集 成 多 个 处 理 器 核 来 提 升 处 理 器 的 性 能 多 核 处 理 器 强 大 的 计 算 能 力 需 要 通 过 并 行 程 序 充 分 利 用 但 是, 由 于 访 存 和 同 步 等 因 素 的 制 约 使 得 并 行 应 用 程 序 很 难 充 分 利 用 多 核 处 理 器 的 计 算 能 力 其 中, 存 储 器 系 统 的 延 迟 和 带 宽 很 难 匹 配 多 核 处 理 器 强 大 的 计 算 能 力 ; 低 效 的 同 步 机 制 则 往 往 会 导 致 某 些 处 理 器 核 等 待 而 产 生 停 顿, 进 而 降 低 了 多 核 处 理 器 的 计 算 资 源 利 用 率 针 对 上 述 问 题, 系 统 软 件 需 要 在 访 存 和 同 步 方 面 进 行 优 化, 充 分 利 用 多 核 处 理 器 提 供 的 硬 件 资 源, 提 高 并 行 应 用 程 序 的 运 行 性 能 针 对 系 统 软 件 的 访 存 和 同 步 优 化 问 题, 本 文 主 要 研 究 编 译 器 和 Java 虚 拟 机 中 的 访 存 优 化 问 题, 以 及 Java 虚 拟 机 中 的 同 步 机 制 优 化 问 题 本 文 的 主 要 工 作 和 创 新 如 下 : 1) 分 簇 结 构 数 字 信 号 处 理 器 的 SIMD 编 译 优 化 针 对 数 字 信 号 处 理 应 用, 本 文 提 出 分 簇 结 构 数 字 信 号 处 理 器 的 SIMD 编 译 优 化 框 架 主 要 工 作 包 括 : 针 对 数 字 信 号 处 理 应 用 的 特 点, 提 出 基 于 访 存 指 令 的 SIMD 指 令 识 别 算 法 ; 针 对 分 簇 结 构 SIMD 指 令 的 特 点, 提 出 基 于 SIMD 指 令 的 指 令 分 簇 和 寄 存 器 分 配 算 法 ; 并 且 在 BWDSP100 编 译 器 中 实 现 了 上 述 优 化 算 法 实 验 结 果 表 明, 本 文 提 出 的 SIMD 优 化 方 法 能 够 在 分 簇 结 构 上 识 别 并 生 成 高 效 的 SIMD 代 码, 可 以 极 大 地 提 高 BWDSP100 处 理 器 上 应 用 程 序 的 带 宽 利 用 率 和 运 行 性 能 2) Java 虚 拟 机 中 的 动 态 锁 cache 优 化 基 于 编 译 方 法 的 调 用 规 律, 本 文 给 出 Java 虚 拟 机 中 的 动 态 锁 cache 优 化 方 法 主 要 工 作 包 括 : 通 过 分 析 Java 虚 拟 机 中 编 译 方 法 的 调 用 规 律, 得 到 编 译 方 法 的 活 跃 时 间 段 平 均 大 小 和 内 存 分 布 情 况 ; 根 据 编 译 方 法 的 上 述 规 律, 在 Java 虚 拟 机 进 行 动 态 的 锁 cache 优 化, 将 活 跃 的 编 译 方 法 锁 在 cache 中 实 验 结 果 表 明, 本 文 提 出 的 锁 cache 优 化 方 法 只 需 要 将 较 小 的 内 存 区 域 锁 在 cache 中, 就 能 够 在 Java 虚 拟 机 运 行 时 获 得 较 大 的 cache 性 能 提 升 3) Java 虚 拟 机 中 的 只 读 锁 优 化 针 对 只 读 临 界 区 的 特 点, 本 文 提 出 Java 虚 拟 机 中 的 只 读 锁 优 化 框 架 主 要 工 作 包 括 : 提 出 即 时 编 译 器 中 的 只 读 临 界 区 识 别 算 法 ; 提 出 基 于 MIPS 体 系 结 构 LL/SC 同 步 指 令 的 轻 量 级 只 读 锁 优 化 算 法 ; 提 出 重 量 级 只 读 锁 优 化 算 法 轻 量 级 只 读 锁 优 化 算 法 可 以 在 没 有 线 程 竞 争 的 情 况 下 降 低 同 步 操 作 的 开 销 ; 重 量 I

摘 要 级 只 读 锁 优 化 算 法 则 可 以 允 许 多 个 线 程 同 时 进 入 只 读 临 界 区, 提 高 线 程 竞 争 情 况 下 同 步 操 作 的 性 能 实 验 结 果 表 明, 本 文 提 出 的 只 读 锁 优 化 方 法 可 以 极 大 降 低 线 程 进 入 和 退 出 只 读 临 界 区 的 开 销, 提 高 Java 虚 拟 机 的 同 步 性 能 基 于 国 产 处 理 器 的 软 硬 件 平 台, 本 文 在 系 统 软 件 的 访 存 和 同 步 优 化 问 题 研 究 中 取 得 了 一 系 列 有 价 值 的 成 果, 有 效 地 提 高 了 国 产 处 理 器 上 应 用 软 件 的 性 能, 进 而 推 动 国 产 处 理 器 芯 片 的 市 场 化 关 键 词 : 多 核 处 理 器 分 簇 结 构 编 译 优 化 单 指 令 流 多 数 据 流 Java 虚 拟 机 锁 cache 即 时 编 译 器 只 读 锁 同 步 机 制 II

Abstract Abstract With the advantages of performance and power, the multicore architecture has become the mainstream structure of microprocessors. Multicore architecture integrates multiple processor cores on a single chip to improve the performance of processor. The parallel program is used to take advantage of the computing power provided by multicore processors. However, the constraints of memory access and synchronization make it difficult for parallel programs to play the full effectiveness of multicore processors. Latency and bandwidth of the memory system are difficult to match the powerful computing performance of multicore processors; and inefficient synchronization mechanisms often lead to some processor cores waiting, thus reducing the resource utilization of multicore processor. In order to overcome the above problems, it is necessary to do the optimization of memory access and synchronization in system softwares. This can take full advantage of hardware resources provided by multicore processors and improve the performance of parallel applications. For the optimization of memory access and synchronization in system softwares, this paper focuses on the research of memory access optimization in the compiler and Java Virtual Machine, and synchronization optimization in the Java Virtual Machine. The main work and innovations are as follows: 1) SIMD optimization for clustered VLIW DSP For digital signal processing applications, this paper proposes a SIMD compiler optimization framework based on clustered DSP. The main work include: a SIMD instruction identification algorithm is presented for the features of digital signal processing applications; a new cluster assignment algorithm and register allocation algorithm are given for the features of SIMD instructions on the cluster architecture and the above algorithms have been implemented on the BWDSP100 compiler. The experimental results show that the SIMD optimization methods mentioned above can effectively identify and generate efficient SIMD code on the clustered DSP, and greatly improve the bandwidth utilization and performance of the applications on BWDSP100 processor. 2) Dynamic cache locking optimization in Java Virtual Machine Based on the calling parttern of compiled methods, a dynamic cache locking optimization algorithm in JVM is presented. The main work include: according to III

Abstract analyzing the calling parttern of the compiled methods in JVM, the calling distribution parttern, average size and memory distribution of compiled methods can be obtained; based on the above partterns of compiled methods, the dynamic cache locking optimization is implemented in JVM to lock the active compiled methods in cache. The experimental results show that this cache locking method improves the run-time cache performance of JVM, just by locking a small memory area in the cache. 3) Read-Only Lock Optimization in Java Virtual Machine For the features of read-only critical section, this paper presents a read-only lock optimization framework in JVM. The main work include: a recognition algorithm of read-only critical sections in JIT; a lightweight read-only lock optimization algorithm, based on the LL/SC synchronization instructions; and a heavyweight read-only lock optimization algorithm. The read-only optimization algorithm of the lightweight lock can reduce the overhead of synchronous operations, in case there is no competition between threads; and the read-only optimization algorithm of the heavyweight lock can allow multiple threads simultaneously access to the read-only critical sections, when several threads compete at the same time. The experimental results show that the read-only lock optimization method significantly reduces the overhead when the threads enter and exit read-only critical section, and improve the synchronization performance of JVM. Based on the hardware and software platforms of domestic processors, this thesis achieves some valuable innovations in the memory access and synchronization optimization of system softwares. These can effectively improve the performance of applications in the domestic processors, and promote the marketization of the domestic processors. Key Words: Multicore Processors, Cluster Architecture, Compiler Optimization, SIMD, Java Virtual Machine, Cache Locking, Just-In-Time Compiler, Read-Only Lock, Synchronization Mechanism IV

目 录 目 录 摘 要... I 第 1 章 绪 论... 1 1.1 研 究 背 景... 2 1.1.1 多 核 处 理 器... 2 1.1.2 多 核 处 理 器 的 存 储 系 统... 3 1.1.3 多 核 处 理 器 的 核 间 同 步... 6 1.2 国 内 外 研 究 现 状... 7 1.2.1 系 统 软 件 中 访 存 优 化 相 关 研 究... 7 1.2.2 系 统 软 件 中 同 步 机 制 优 化 相 关 研 究... 9 1.3 本 文 的 研 究 内 容... 11 1.4 本 文 的 组 织 结 构... 13 第 2 章 BWDSP100 编 译 器 与 龙 芯 JAVA 虚 拟 机 研 究 平 台... 15 2.1 引 言... 15 2.2 BWDSP100 体 系 结 构... 15 2.3 BWDSP100 编 译 器... 17 2.3.1 IMPACT 编 译 器... 17 2.3.2 BWDSP100 编 译 器 的 开 发... 18 2.4 龙 芯 高 性 能 处 理 器 体 系 结 构... 22 2.4.1 GS464 处 理 器 核 的 基 本 结 构... 22 2.4.2 龙 芯 3 号 4 核 处 理 器 的 基 本 结 构... 23 2.5 龙 芯 JAVA 虚 拟 机... 24 2.5.1 Openjdk Java 虚 拟 机... 24 2.5.2 龙 芯 Java 虚 拟 机 的 开 发... 26 2.6 本 文 使 用 的 性 能 测 试 程 序... 27 2.7 本 章 小 结... 28 第 3 章 分 簇 VLIW DSP 的 SIMD 编 译 优 化... 31 3.1 引 言... 31 3.2 相 关 工 作... 32 3.3 BWDSP100 的 分 簇 结 构 SIMD 指 令... 33 V

目 录 3.4 基 于 访 存 指 令 的 SIMD 指 令 识 别 算 法... 35 3.4.1 循 环 检 测... 36 3.4.2 循 环 展 开... 36 3.4.3 常 规 优 化... 36 3.4.4 变 量 重 命 名... 36 3.4.5 循 环 不 变 量 和 累 加 变 量 扩 展... 37 3.4.6 合 成 SIMD 指 令... 37 3.4.7 实 例 分 析... 39 3.5 基 于 SIMD 指 令 的 指 令 分 簇 算 法... 40 3.6 基 于 SIMD 指 令 的 寄 存 器 分 配 算 法... 41 3.7 实 验 结 果... 42 3.7.1 循 环 展 开 因 子 的 确 定... 43 3.7.2 SIMD 优 化 效 果... 44 3.8 本 章 小 结... 46 第 4 章 JAVA 虚 拟 机 中 的 动 态 锁 CACHE 优 化... 47 4.1 引 言... 47 4.2 相 关 工 作... 48 4.2.1 提 高 程 序 确 定 性 的 锁 cache 优 化 相 关 研 究... 48 4.2.2 提 高 程 序 性 能 的 锁 cache 优 化 相 关 研 究... 49 4.3 龙 芯 3A 的 锁 CACHE 机 制... 50 4.4 JAVA 虚 拟 机 的 即 时 编 译 系 统... 51 4.5 JAVA 虚 拟 机 的 编 译 方 法 调 用 规 律... 53 4.5.1 编 译 方 法 的 调 用 分 布... 53 4.5.2 编 译 方 法 的 大 小... 54 4.5.3 编 译 方 法 的 内 存 分 布... 55 4.6 JAVA 虚 拟 机 中 的 动 态 锁 CACHE 优 化 算 法... 56 4.7 实 验 结 果 和 分 析... 58 4.7.1 Java 虚 拟 机 的 运 行 时 cache 命 中 率 提 升... 58 4.7.2 Java 虚 拟 机 的 运 行 时 性 能 提 升... 59 4.8 本 章 小 结... 60 第 5 章 JAVA 虚 拟 机 中 的 只 读 锁 优 化... 61 5.1 引 言... 61 5.2 相 关 工 作... 62 5.3 JAVA 虚 拟 机 HOTSPOT 的 锁 机 制 简 介... 63 5.4 即 时 编 译 器 中 的 只 读 临 界 区 识 别 算 法... 65 VI

目 录 5.5 JAVA 虚 拟 机 中 的 只 读 锁 优 化 方 法... 66 5.5.1 Java 虚 拟 机 的 只 读 锁 优 化 框 架... 66 5.5.2 基 于 LL/SC 同 步 指 令 的 轻 量 级 只 读 锁 优 化 算 法... 68 5.5.3 Java 虚 拟 机 中 的 重 量 级 只 读 锁 优 化 算 法... 70 5.6 实 验 结 果 和 分 析... 71 5.6.1 单 线 程 Java 程 序 的 性 能 提 升... 72 5.6.2 多 线 程 Java 程 序 的 性 能 提 升... 73 5.6.3 与 Openjdk 读 写 锁 的 性 能 对 比... 74 5.6.4 SPECjvm2008 测 试 用 例 的 性 能 提 升... 75 5.7 本 章 小 结... 76 第 6 章 总 结... 77 6.1 引 言... 77 6.2 本 文 工 作 总 结... 77 6.3 本 文 的 主 要 创 新... 78 6.4 下 一 步 研 究 工 作... 79 参 考 文 献... 81 致 谢... 91 在 读 期 间 发 表 的 学 术 论 文 与 取 得 的 研 究 成 果... 93 VII

目 录 图 目 录 图 1.1 处 理 器 中 晶 体 管 数 量 的 增 长 曲 线... 2 图 1.2 处 理 器 与 存 储 器 的 性 能 差 距... 4 图 1.3 存 储 器 系 统 的 层 次 结 构... 4 图 1.4 龙 芯 4 核 架 构 的 cache 层 次 结 构... 5 图 1.5 Intel 4 核 Sandy Bridge 架 构 的 cache 层 次 结 构... 5 图 1.6 英 特 尔 的 单 芯 片 云 计 算 机 架 构... 7 图 2.1 BWDSP100 的 基 本 结 构... 16 图 2.2 IMPACT 编 译 器 的 基 本 框 架... 18 图 2.3 BWDSP100 编 译 器 的 代 码 生 成 模 块... 20 图 2.4 GS464 处 理 器 核 的 基 本 结 构... 23 图 2.5 龙 芯 3A 处 理 器 的 基 本 结 构... 24 图 2.6 HotSpot 虚 拟 机 的 基 本 体 系 结 构... 25 图 2.7 HotSpot 虚 拟 机 的 执 行 引 擎 基 本 结 构... 26 图 3.1 BWDSP100 的 SIMD 汇 编 代 码 段... 34 图 3.2 BWDSP100 中 SIMD 指 令 的 执 行 过 程... 35 图 3.3 BWSIMD 算 法 构 架... 35 图 3.4 SIMD 指 令 识 别 的 实 例... 39 图 3.5 SIMD_RegAlloc 算 法 流 程... 42 图 3.6 convolution 实 验 结 果... 44 图 3.7 dot_product 实 验 结 果... 44 图 3.8 DSPstone 实 验 结 果... 45 图 4.1 Java 虚 拟 机 的 即 时 编 译 系 统... 52 图 4.2 Java 虚 拟 机 中 编 译 方 法 的 执 行 频 率... 54 图 4.3 Java 虚 拟 机 中 编 译 方 法 的 本 地 代 码 段 大 小... 55 图 4.4 Java 虚 拟 机 运 行 时 编 译 方 法 的 内 存 分 布... 56 图 4.5 Java 虚 拟 机 中 的 动 态 锁 cache 优 化 算 法... 57 图 4.6 动 态 锁 cache 优 化 前 后 直 接 读 内 存 操 作 对 比... 59 图 4.7 动 态 锁 cache 优 化 前 后 SPECjvm2008 的 性 能 对 比... 60 图 5.1 HotSpot 中 标 记 字 的 状 态... 63 图 5.2 HotSpot 虚 拟 机 中 的 同 步 状 态 转 换... 64 图 5.3 只 读 临 界 区 识 别 算 法... 66 图 5.4 HotSpot 虚 拟 机 锁 操 作 的 层 次 结 构... 67 图 5.5 Java 虚 拟 机 只 读 锁 操 作 的 层 次 结 构... 68 图 5.6 轻 量 级 锁 只 读 锁 申 请... 69 图 5.7 轻 量 级 锁 只 读 锁 释 放... 69 图 5.8 重 量 级 锁 只 读 优 化 算 法... 71 图 5.9 重 量 级 锁 只 读 优 化 算 法... 71 图 5.10 单 线 程 Java 测 试 用 例 运 行 时 间 对 比... 72 图 5.11 只 读 锁 优 化 前 后 多 线 程 Java 测 试 用 例 的 性 能 加 速 比... 73 图 5.12 Java 虚 拟 机 只 读 锁 与 Openjdk 读 写 锁 的 性 能 加 速 比... 74 VIII

目 录 图 5.13 SPECjvm2008 中 锁 操 作 的 频 率... 75 图 5.14 只 读 锁 优 化 前 后 SPECjvm2008 性 能 对 比... 76 IX

目 录 表 目 录 表 2.1 DSPstone 测 试 程 序 的 功 能 描 述... 29 表 2.2 SPECjvm2008 测 试 程 序 功 能 描 述... 29 表 4.1 二 级 Cache 的 锁 窗 口 寄 存 器 组... 51 X