香 港 大 学 结 点 建 设 课 题 名 称 : 网 格 自 适 应 服 务 技 术 研 究 2005 年 12 月 香 港 大 学 网 格 结 点 正 式 挂 牌 狄 盛 ( 香 港 大 学 ) 王 卓 立 教 授 ( 香 港 大 学 ) 依 托 单 位 : 清 华 大 学 Dec. 3, 2007
Outline 总 体 目 标 目 前 进 度 主 要 研 究 进 展 2
Objectives 高 性 能 环 境 支 持 o 课 题 1: 扩 大 和 升 级 香 港 大 学 网 格 结 点 的 资 源 o 课 题 2: 实 现 自 适 应 的 Java 计 算 环 境 o 课 题 3: 基 于 SLIM-VM 的 网 格 部 署 方 案 o 课 题 4: 普 适 化 智 能 网 格 接 入 四 大 应 用 o 应 用 1: 基 于 Tomcat 的 商 业 Web 应 用 o 应 用 2:AlphaMiner ( 智 能 商 业 数 据 挖 掘 ) o 应 用 3: 物 理 网 格 (Physics Grid) o 应 用 4: 并 行 图 像 渲 染 ( 风 格 化 油 画 生 成 ) 3
o 香 港 大 学 最 新 资 源 列 表 (2007, Dec.1) 资 源 单 位 结 点 数 目 系 统 配 置 网 络 状 况 理 论 计 算 峰 值 HPC Power Cluster HKUCC 178 356 Xeon processors,2gb RAM, 40GB IDE 硬 盘 Gideon 300 Cluster HKUCS 300 Pentium 4@ 2.0 GHz, 512-2GB RAM, 40GB IDE 硬 盘 Dell PowerEdge HKUCS 20 Intel P3 1400MHz, 512MB RAM /node, 37GB SCSI disk Spartan 100 (2008 年 1 月 ) HKUCS 100 Intel P4 2.26GHz, 512MB RAM, 40GB hard disk Gigabit Ethernet (CISCO 4506 switch x 2) Fast-Ethernet Fast Ethernet x 4 per node Gigabit Ethernet 2.045Tflops 0.6 Tflops 29.4 Gflops 452 Gflops 理 论 计 算 峰 值 : (2.045 + 0.6 + 0.0294 +0.452)Tflops = 3.126Tflops 2008 年 底 的 理 论 计 算 峰 值 有 希 望 再 增 加 2Tflops ( 含 200 个 结 点 ), 总 的 理 论 结 算 峰 值 有 望 达 到 : 5.126Tflops 4
( 课 题 重 点 1) 扩 大 和 升 级 香 港 大 学 网 格 结 点 的 资 源 Remote job submission 采 用 GOS3 将 CS Department 和 Computer Center 的 计 算 资 源 连 接 起 来, 实 现 资 源 透 明 化 访 问 和 整 合. 开 发 支 持 GOS3 的 高 性 能 网 格 应 用. Gatekeeper: GOS3 Portal (147.8.178.192/147.8.178.193) GOS 网 格 系 统 软 件 - 基 础 服 务 (Scheduling, Monitoring, etc.) Grid middleware -GOS 3.0 -glite Job scheduling - 基 础 服 务 : 批 作 业 服 务 -OpenPBS HPCPower (2.045T) Programming -HPF, Fortran 90 -C, C++, Java with MPI -JESSICA3 DJVM (HKU) Gideon 300 (0.6T) Spartan 100 (0.45T) PowerEdge (glite) Communication Lib -MPICH-G2 1.2.3 Campus Network 5
香 港 教 育 主 干 网 : HARNET ( 香 港 学 术 研 究 机 构 网 ) 港 大 校 园 主 干 网 已 提 升 为 10Gbs 以 太 网 (Oct. 2006). 华 为 -3Com's Quidway S8512 HARNET 在 香 港 的 大 学 之 间 提 供 10G 网 络 互 联 (Oct. 2006) 香 港 大 学 是 香 港 教 育 主 干 网 连 接 到 国 际 网 的 交 换 结 点 CS CC 6
7
( 课 题 重 点 2) 实 现 自 适 应 的 Java 计 算 环 境 G-JavaMPI Version 2.0 整 合 G-JavaMPI 和 JESSICA3 轻 量 级 Java 进 程 / 线 程 迁 移 使 用 Java 虚 拟 机 工 具 接 口 java Virtual Machine Tool Interface (JVMTI) Java MPI MPI_Send and MPI_Recv Java MPI Java MPI MPI_Send and MPI_Recv Java MPI 迁 移 策 略 : 解 决 结 点 负 载 超 载 问 题, 解 决 不 可 避 免 的 可 能 的 不 可 预 料 的 管 理 因 素, 为 实 现 更 优 的 资 源 调 度, 任 务 可 能 重 新 映 射. 8
香 港 大 学 开 放 日 中 国 国 家 网 格 操 作 演 示 HKU Open Day: G-JavaMPI Screen Wall 演 示,Oct. 27&28, 2007 9
JESSICA2 体 系 结 构 A Multithreaded Java Program JIT Compiler Mode Java Enabled Single System Image Computing Architecture Thread Migration Portable Java Frame JESSICA2 JVM JESSICA2 JVM JESSICA2 JVM JESSICA2 JVM JESSICA2 JVM JESSICA2 JVM Master Worker Worker Worker 支 持 对 象 一 致 性 10
( 课 题 重 点 3) 基 于 SLIM-VM 网 格 部 署 1. 快 速 安 装 操 作 系 统 镜 像 2. 网 格 虚 拟 化 : 在 一 个 计 算 结 点 上 同 时 执 行 各 种 不 同 网 格 的 计 算 任 务. 在 最 大 的 范 围 内 实 现 资 源 的 高 效 共 享 Application GOS 3 GOS 3 GOS 3 SLIM loader VMWare Application Linux OS Windows XP x86 architecture SLIM loader Application VMWare Linux OS Application Applications Linux Xen Domain U SLIM Loader Linux on Xen Domain 0 SLIM Loader Xen Hypervisor x86 architecture Application glite Linux OS SLIM loader x86 architecture Ongoing tasks SLIM server (Linux) X86 architecture PXE network boot
( 课 题 重 点 4) 普 适 化 智 能 网 格 接 入 越 来 越 多 的 访 问 点 (WiFi) 用 户 在 任 何 地 点 任 合 时 刻 都 可 以 方 便 无 缝 的 访 问 网 格 即 插 即 用 的 网 格 服 务 普 适 化 智 能 网 格 接 入 (Grid Mobile Access) Context Awareness: Ontology-based Context Modeling Location Awareness (GPS + RFID) Mobile Code : Dynamic Grid stub downloading Intelligent cache proxy (HKU Sparkle project) Other Features (not available yet) Virtual Disk Notification Mechanism 目 前 已 经 利 用 Context-aware 成 功 实 现 了 一 个 动 态 访 问 移 动 计 算 Demo 原 型 Interface Grid-GOS3 Access and Compute Proxy Virtual Disk Cache Sparklebased Sparklebased Notification Mechanism Code- Mobility Contextaware Code Database Ontology 12
应 用 1: 基 于 Tomcat 的 商 业 Web 应 用 目 标 : 利 用 并 行 Tomcat 及 JESSICA2 的 细 粒 度 线 程 技 术 实 现 高 可 靠 性 高 性 能 的 商 业 应 用 状 态 : 已 经 设 计 并 开 发 了 底 层 的 并 行 分 布 式 Tomcat 环 境, 并 实 现 的 示 范 性 商 业 应 用 包 括 实 时 股 票 报 价 (Stock Quotes) 电 子 书 店 (TPC-W bookstore) 等 演 示 : 电 子 书 店 (TPC-W bookstore) 股 票 报 价 (Stock Quotes) Sv C Master JVM (node 0) T OS Hardware 电 子 书 店 K S A K K K K S OS Hardware A S T K OS Hardware Sv C T OS Hardware
Tomcat on JESSICA2 性 能 评 估 9 25 Speedup 8 7 6 5 4 3 2 1 Bible-quote Stock-quote Stock-quote/RSA SOAP-order TPC-W Bulletin-search Ideal Throughput (1,000 req/min) 20 15 10 5 Original Tomcat on DJVM Modified Tomcat on DJVM Existing Tomcat Clustering Performance Improvement 0 0 2 4 6 8 Number of Nodes 0 Bible-quote TPC-W Stockquote Stockquote/RSA SOAPorder Bulletinsearch K. T. Lam, Y. Luo, and C. L. Wang. Clustering Web Application Servers on Distributed JVM: Challenges and Experiences. In preparation. 14
Tomcat/JESSICA2 股 票 报 价 股 票 报 价 作 业 提 交 界 面 查 看 结 果 作 业 成 功 提 交
应 用 2: 数 据 挖 掘 应 用 2: 智 能 商 业 数 据 挖 掘 目 标 : 该 计 划 是 一 个 科 学 计 算 数 据 挖 掘 应 用, 支 持 各 种 数 据 挖 掘 计 算 状 态 : 目 前 主 要 是 基 于 Weka (Alpha Miner 原 始 核 心 软 件 ) 进 行 改 进, 实 现 对 Decision Tree 和 K- means clustering 两 种 算 法 的 分 布 式 数 据 挖 掘 的 分 析 和 处 理 Speedup 5 4 3 2 1 k-means PRISM Scalability 0 0 2 4 6 8 Number of Nodes
应 用 3: 校 园 物 理 网 格 (Physics Grid) 状 态 : 计 算 机 中 心 已 经 通 过 TW- CA 的 认 证 接 入 EGEE(gLite) 未 来 计 划 :08 年 1 月 10 号 前 配 合 OMII-CNGrid 联 合 培 训 完 成 glite 教 学 平 台 17 17
应 用 4: 风 格 化 油 画 生 成 (painting synthesis with style) 面 向 普 通 用 户 推 广 发 布 一 些 有 娱 乐 性 网 格 应 用 可 将 任 意 的 数 码 图 像, 进 行 重 新 渲 染, 生 成 具 各 种 风 格 的 油 画 版 本 通 过 开 发 高 效 的 并 行 算 法, 让 用 户 能 够 通 过 网 格 服 务 的 形 式 参 与, 对 网 格 计 算 有 亲 身 的 体 会, 起 到 良 好 的 推 广 与 示 范 作 用 人 人 是 画 家 - 我 是 畢 卡 索
主 要 研 究 进 展 Thanks! 1) 实 现 网 格 环 境 下 负 载 均 衡 的 进 程 迁 移 调 度 策 略 2) 实 现 Group-based 的 大 规 模 信 息 传 递 系 统 的 Checkpoint/Restart 机 制 3) 实 现 轻 量 级 进 程 迁 移 和 内 存 预 取 (Memory page prefetching) 机 制 4) 实 现 并 行 环 境 下 的 进 程 漫 步 (Process Roaming) 机 制 5) 在 JESSICA2 Java 虚 拟 机 上 实 现 Tomcat Web 应 用 服 务 的 集 群 应 用 环 境 Publications: 1) Lin Chen, Cho-Li Wang, Francis Lau, Process Reassignment with Reduced Migration Cost in Grid Load Rebalancing, to appear in The Seventeenth International Heterogeneity in Computing Workshop (HCW), 2008. 2) Justin Ho, Cho-Li Wang, Francis Lau, Scalable Group-based Checkpoint/Restart for Large-Scale Message-passing Systems, to appear in IPDPS'08. 3) Roy Ho, Cho-Li Wang, Francis Lau, Lightweight Process Migration and Memory Prefetching on openmosix, to appear in IPDPS'08. 4) Roy Ho, Cho-Li Wang, Francis Lau, Process Roaming: Design and implementation, submitted to ICDCS'08. 5) K. T. Lam, Y. Luo, and C. L. Wang. Clustering Web Application Servers on Distributed JVM: Challenges and Experiences. In preparation.