<4D F736F F D2039A3A D0C25FC1D6D7D3D3EA2C3139D2B35F2DD3C5CFC8B3F6B0E6434E4B492E646F63>

Size: px
Start display at page:

Download "<4D F736F F D2039A3A D0C25FC1D6D7D3D3EA2C3139D2B35F2DD3C5CFC8B3F6B0E6434E4B492E646F63>"

Transcription

1 软件学报 ISSN , CODEN RUXUEW Journal of Software,2012,23(5): [doi: /SP.J ] 中国科学院软件研究所版权所有. Tel/Fax: 云数据库研究 林子雨 1, 赖永炫 2+, 林琛 1, 谢怡 1 1, 邹权 1 ( 厦门大学计算机科学系, 福建厦门 ) 2 ( 厦门大学软件学院, 福建厦门 ) Research on Cloud Databases LIN Zi-Yu 1, LAI Yong-Xuan 2+, LIN Chen 1, XIE Yi 1, ZOU Quan 1 1 (Department of Computer Science, Xiamen University, Xiamen , China) 2 (School of Software, Xiamen University, Xiamen , China) + Corresponding author: laiyx@xmu.edu.cn Lin ZY, Lai YX, Lin C, Xie Y, Zou Q. Research on cloud databases. Journal of Software, 2012,23(5): Abstract: With the recent development of cloud computing, the importance of cloud databases has been widely acknowledged. Here, the features, influence and related products of cloud databases are first discussed. Then, research issues of cloud databases are presented in detail, which include data model, architecture, consistency, programming model, data security, performance optimization, benchmark, and so on. Finally, some future trends in this area are discussed. Key words: cloud computing; cloud database; key-value store; transaction consistency 摘要 : 随着云计算的发展, 云数据库的重要性和价值日益显现. 介绍了云数据库的特性 影响 相关产品. 详细讨论了云数据库领域的研究问题, 包括数据模型 系统体系架构 事务一致性 编程模型 数据安全 性能优化和测试基准等. 最后讨论了云数据库未来的研究方向. 关键词 : 云计算 ; 云数据库 ; 键值存储 ; 事务一致性中图法分类号 : TP311 文献标识码 : A 云计算 (cloud computing) [1] 是 IT 技术发展的最新趋势, 正受到业界和学术界的广泛关注 [2,3]. 云计算是在分布式处理 并行处理和网格计算等技术的基础上发展起来的, 是一种新兴的共享基础架构的方法. 它可以自我维护和管理庞大的虚拟计算资源 ( 包括计算服务器 存储服务器 宽带资源等等 ), 从而提供各种 IT 服务. 用户在使用云计算提供的服务时按需付费, 这不仅降低了使用门槛, 也极大地节省了开销. 由于云计算存在着巨大的潜在市场,Google,IBM,Microsoft,Amazon,Sun,HP,Yahoo,Oracle 等国际知名大公司都已经涉足云计算. 云计算也开始在电信 金融等需要大规模并行处理的领域得到应用, 比如中国移动研究院开发的云数据挖掘平台 BC- 基金项目 : 厦门大学基础创新科研基金 ( 中央高校基本科研业务费专项资金 )( , ); 国家自然科学基金 ( , ); 福建省自然科学基金 (2011J05156, 2011J05158) 收稿时间 : ; 修改时间 : , ; 定稿时间 : ; jos 在线出版时间 : CNKI 网络优先出版 : :43,

2 林子雨等 : 云数据库研究 1149 PDM [4] 和云数据库产品 HugeTable [5]. 随着云计算技术的不断升温, 它对各个技术领域的影响开始显现, 其中比较典型的包括数据库领域 [6 10]. 截止到 2011 年 6 月, 传统的数据库厂商, 比如 Oracle,Teradata,IBM,Microsoft 等, 都已经推出了基于云计算环境的相关数据库产品. 原来没有从事数据库产品开发的知名大公司, 比如 Amazon 和 Google 等, 也发布了 SimpleDB 和 BigTable [11] 等产品. 迅速发展的云数据库市场极大地影响着数据库技术的未来发展方向, 甚至出现了关系数据库是否已经没落的争议. 与此同时, 许多云数据库的相关问题开始被关注, 比如云数据库的体系架构 数据模型 事务一致性 数据安全和性能优化等等. 由于云数据库是一个比较新的研究领域, 目前还很少有相关研究对这个领域进行全面概括的介绍. 因此, 本文将结合我们在过去两年中已经进行的大量调研成果, 对云数据库及其相关研究进行综合阐述. 本文第 1 节介绍云数据库, 包括云数据库的特性 影响 云数据库与传统分布式数据库的区别. 第 2 节介绍相关的云数据库产品. 第 3 节阐述云数据库领域的研究问题. 第 4 节是本文的结论, 并给出未来研究展望. 1 云数据库概述云数据库是在 SaaS(software-as-a-service: 软件即服务 ) 成为应用趋势的大背景下发展起来的云计算技术, 它极大地增强了数据库的存储能力, 消除了人员 硬件 软件的重复配置, 让软 硬件升级变得更加容易, 同时也虚拟化了许多后端功能. 云数据库具有高可扩展性 高可用性 采用多租形式和支持资源有效分发等特点. 可以说, 云数据库是数据库技术的未来发展方向. 目前, 对于云数据库的概念界定不尽相同, 本文采用的云数据库定义是 : 云数据库是部署和虚拟化在云计算环境中的数据库 [12]. 如图 1 所示, 在云数据库应用中, 客户端不需要了解云数据库的底层细节, 所有的底层硬件都已经被虚拟化, 对客户端而言是透明的. 它就像在使用一个运行在单一服务器上的数据库一样, 非常方便 容易, 同时又可以获得理论上近乎无限的存储和处理能力. 客户端 云数据库数据节点 物理磁盘 云数据库管理器 Fig.1 A diagram showing the application of cloud databases 图 1 云数据库应用示意图 1.1 云数据库的特性云数据库具有以下特性 : (1) 动态可扩展 : 理论上, 云数据库具有无限可扩展性, 可以满足不断增加的数据存储需求. 在面对不断变化的条件时, 云数据库可以表现出很好的弹性. 例如, 对于一个从事产品零售的电子商务公司, 会存在季节性或突发性的产品需求变化 ; 或者对于类似 Animoto 的网络社区站点, 可能会经历一个指数级的增长阶段. 这时, 就可以分配额外的数据库存储资源来处理增加的需求, 这个过程只需要几分钟. 一旦需求过去以后, 就可以立即释放这些资源. (2) 高可用性 : 不存在单点失效问题. 如果一个节点失效了, 剩余的节点就会接管未完成的事务. 而且在云数

3 1150 Journal of Software 软件学报 Vol.23, No.5, May 2012 据库中, 数据通常是复制的, 在地理上也是分布的. 诸如 Google,Amazon 和 IBM 等大型云计算供应商具有分布在世界范围内的数据中心, 通过在不同地理区间内进行数据复制, 可以提供高水平的容错能力. 例如,Amazon SimpleDB 会在不同的区间内进行数据复制, 因此, 即使整个区域内的云设施发生失效, 也能保证数据继续可用. (3) 较低的使用代价 : 通常采用多租户 (multi-tenancy) 的形式, 这种共享资源的形式对于用户而言可以节省开销 ; 而且用户采用按需付费的方式使用云计算环境中的各种软 硬件资源, 不会产生不必要的资源浪费. 另外, 云数据库底层存储通常采用大量廉价的商业服务器, 这也大幅度降低了用户开销. (4) 易用性 : 使用云数据库的用户不必控制运行原始数据库的机器, 也不必了解它身在何处. 用户只需要一个有效地链接字符串就可以开始使用云数据库. (5) 大规模并行处理 : 支持几乎实时的面向用户的应用 科学应用和新类型的商务解决方案. 1.2 云数据库是海量存储需求的必然选择云数据库在当前数据爆炸的时代具有广阔的应用前景. 根据 IDC 的研究报告, 在未来的 5 年中, 企业对结构化数据的存储需求会每年增加 20% 左右, 而对非结构化数据的存储需求将会每年增加 60% 左右. 在小规模应用的情况下, 系统负载的变化可以由系统空闲的多余资源来处理 ; 但是在大规模应用的情况下, 不仅存在海量的数据存储需求, 而且应用对资源的需求也是动态变化的, 这意味着大量虚拟机器的增加或减少. 对于这种情形, 传统的关系数据库已经无法满足要求, 云数据库成为必然的选择. 换句话说, 海量存储催生了云数据库. 1.3 云数据库与传统的分布式数据库分布式数据库是计算机网络环境中各场地或节点上的数据库的逻辑集合. 逻辑上它们属于同一系统, 而物理上它们分散在用计算机网络连接的多个节点, 并统一由一个分布式数据库管理系统管理. 分布式数据库已经存在很多年, 它可以用来管理大量的分布存储的数据, 并且通常采用非共享的体系架构. 云数据库和传统的分布式数据库具有相似之处, 比如, 都把数据存放到不同的节点上. 但是, 分布式数据库在可扩展性方面是无法与云数据库相比的. 由于需要考虑数据同步和分区失败等开销, 前者随着节点的增加会导致性能快速下降. 而后者则具有很好的可扩展性, 因为后者在设计时就已经避免了许多会影响到可扩展性的因素, 比如采用更加简单的数据模型 对元数据和应用数据进行分离以及放松对一致性的要求等等 [13]. 另外, 在使用方式上, 云数据库也不同于传统的分布式数据库. 云数据库通常采用多租户模式, 即多个租户共用一个实例, 租户的数据既有隔离又有共享, 从而解决数据存储的问题, 同时也降低了用户使用数据库的成本. 1.4 云数据库的影响云数据库的影响主要体现在以下几个方面 : (1) 极大地改变企业管理数据的方式.Forrester Research 分析师 Yuhanna 指出,18% 的企业正在把目光投向云数据库. 对于中小企业而言, 云数据库可以允许他们在 Web 上快速搭建各类数据库应用, 越来越多的本地数据和服务将逐渐被转移到云中. 企业用户在任意地点通过简单的终端设备, 就可以对企业数据进行全面的管理. 此外, 云数据库可以很好地支持企业开展一些短期项目, 降低开销, 而不需要企业为某个项目单独建立昂贵的数据中心. 但是, 云数据库的成熟仍然需要一段时间. 中小企业会更多地采用云数据库产品, 但是对于大企业而言, 云数据库并非首选, 因为大企业通常自己建造数据中心. (2) 催生新一代的数据库技术.IDC 的数据库分析师 Olofson 认为, 云模型提供了无限的处理能力以及大量的 RAM, 因此, 云模型将会极大地改变数据库的设计方式, 将会出现第三代数据库技术. 第一代是 20 世纪 70 年代的早期关系数据库, 第二代是 20 世纪 80 年代 ~90 年代的更加先进的关系模型. 第三代的数据库技术, 要求数据库能够灵活处理各种类型的数据, 而不是强制让数据去适应预先定制的数据结构. 事实上, 从目前云数据库产品中的数据模型设计方式来看, 已经有些产品 ( 比如 SimpleDB,Hbase,Dynamo,BigTable) 放弃传统的行存储方式, 而采用键 / 值存储, 从而可以在分布式的云环境中获得更好的性能. 可以预期的是, 云数据库将会吸引越来越多的学术界的目光, 该领域的相关问题也将成为未来一段时间内数据库研究的重点内容, 比如云数据库的体系架构和数据模型等等.

4 林子雨等 : 云数据库研究 1151 (3) 数据库市场份额面临重新分配. 在过去的几十年里, 数据库市场一直被诸如 Teradata,Oracle,IBM DB2, Microsoft SQL Server,Sybase 等传统数据库厂商所垄断. 随着云数据库的出现和不断发展, 市场将面临重新洗牌. 首先,Amazon 和 Google 等原本并不从事数据库业务的国际知名企业, 也乘着云计算的东风, 开发了云中的数据库产品, 加入这场新兴市场的角逐. 实际上, 对于云数据库市场而言,Amazon SimpleDB 和 Google BigTable 这类产品扮演了引领者的角色, 传统的数据库厂商已经成为跟进者 ; 其次, 一些新的云数据库厂商开始出现, 并且推出了具有影响力的产品, 比如 Vertica 的 Analytic Database for the Cloud 和 EnterpriseDB 的 Postgres Plus in the Cloud. 因此, 数据库市场份额的重新分配不可避免. 2 云数据库产品云数据库供应商主要分为 3 类 : 传统的数据库厂商 :Teradata,Oracle,IBM DB2 和 Microsoft SQL Server; 涉足数据库市场的云供应商 :Amazon,Google 和 Yahoo; 新兴小公司 :Vertica,LongJump 和 EnterpriseDB. 就目前阶段而言, 虽然一些云数据库产品, 如 Google BigTable,SimpleDB 和 HBase, 在一定程度上实现了对于海量数据的管理, 但是这些系统暂时还不完善, 只是云数据库的雏形. 让这些系统支持更加丰富的操作以及更加完善的数据管理功能 ( 比如复杂查询和事务处理 ) 以满足更加丰富的应用, 仍然需要研究人员的不断努力. 表 1 给出了目前市场上常见的云数据库产品, 对于其中一些主要产品, 下面我们会作简要介绍. 企业 Amazon Google Microsoft Oracle Yahoo! Vertica EnerpriseDB 开源项目其他 Table 1 Cloud database products 表 1 云数据库产品产品 Dynamo, SimpleDB, RDS BigTable, FusionTable Microsoft SQL Server Data Services 或 SQL Azure Oracle Cloud PNUTS Analytic Database v3.0 for the Cloud Postgres Plus in the Cloud Hbase, Hypertable EnerpriseDB, FathomDB, ScaleDB, Objectivity/DB, M/DB:X 2.1 Amazon 的云数据库产品 Amazon 是云数据库市场的先行者.Amazon 除了提供著名的 S3 存储服务和 EC2 计算服务以外, 还提供基于云的数据库服务 Dynamo [14].Dynamo 采用 键 / 值 存储, 其所存储的数据是非结构化数据, 不识别任何结构化数据, 需要用户自己完成对值的解析.Dynamo 系统中的键 (key) 不是以字符串的方式进行存储, 而是采用 md5_key( 通过 md5 算法转换后得到 ) 的方式进行存储, 因此, 它只能根据 key 去访问, 不支持查询.SimpleDB 是 Amazon 公司开发的一个可供查询的分布数据存储系统, 它是 Dynamo 键 / 值 存储的补充和丰富. 顾名思义, SimpleDB 的目的是作为一个简单的数据库来使用, 它的存储元素 ( 属性和值 ) 是由一个 id 字段来确定行的位置. 这种结构可以满足用户基本的读 写和查询功能.SimpleDB 提供易用的 API 来快速地存储和访问数据. 但是, SimpleDB 不是一个关系型数据库, 传统的关系型数据库采用行存储, 而 SimpleDB 采用了 键 / 值 存储, 它主要是服务于那些不需要关系数据库的 Web 开发者. Amazon RDS(Amazon relational database service) 是 Amazon 开发的一种 Web 服务, 它可以让用户在云环境中建立 操作关系型数据库 ( 目前支持 MySQL 和 Oracle 数据库 ). 用户只需要关注应用和业务层面的内容, 而不需要在繁琐的数据库管理工作上耗费过多的时间. 此外,Amazon 和其他数据库厂商开展了很好的合作,Amazon EC2 应用托管服务已经可以部署很多种数据库产品, 包括 SQL Server,Oracle 11g,MySQL 和 IBM DB2 等主流数据库平台, 以及其他一些数据库产品, 比如

5 1152 Journal of Software 软件学报 Vol.23, No.5, May 2012 EnerpriseDB. 作为一种可扩展的托管环境, 开发者可以在 EC2 环境中开发并托管自己的数据库应用. 2.2 Google 的云数据库产品 Google BigTable 是一种满足弱一致性要求的大规模数据库系统.Google 设计 BigTable 的目的, 是为了处理 Google 内部大量的格式化及半格式化数据. 目前, 许多 Google 应用都是建立在 BigTable 上的, 比如 Web 索引 Google Earth Google Finance Google Maps 和 Search History. 文献 [15] 描述了 BigTable 提供的简单数据模型, 它允许客户端对数据部署和格式进行动态控制, 并且描述了 BigTable 的设计和实现方法.BigTable 是构建在其他几个 Google 基础设施之上的 : 首先,BigTable 使用了分布式 Google 文件系统 GFS(Google file system) [16] 来存储日志和数据文件 ; 其次,BigTable 依赖一个高可用的 持久性的分布式锁服务 Chubby [17] ; 再次,BigTable 依赖一个簇管理系统来调度作业 在共享机器上调度资源 处理机器失败和监督机器状态. 但是, 与 Amazon SimpleDB 类似, 目前来说,BigTable 实际上还不是真正的 DBMS(database management system), 它无法提供事务一致性 数据一致性. 这些产品基本上可以被看成是云环境中的表单. Google 开发的另一款云计算数据库产品是 Fusion Tables [18]. 它采用了基于数据空间的技术. 该技术在上世纪 90 年代就已经出现.Google 充分利用了该技术的潜力.Fusion Tables 是一个与传统数据库完全不同的数据库, 可以弥补传统数据库的很多缺陷. 比如通过采用数据空间技术, 它能够简单地解决 RDBMS 中管理不同类型数据的麻烦, 以及排序整合等常见操作的性能问题.Fusion Tables 可以上传 100MB 的表格文件, 同时支持 CSV 和 XLS 格式, 并且具有处理大规模数据的能力. 2.3 Microsoft 的云数据库产品 2008 年 3 月, 微软通过 SQL Data Service(SDS) 提供 SQL Server 的 RDBMS 功能, 这使得微软成为云数据库市场上的第一个大型数据库厂商. 此后, 微软对 SDS 功能进行了扩充, 并且重新命名为 SQL Azure. 微软的 Azure 平台提供了一个 WEB 服务集合, 可以允许用户通过网络在云中创建 查询和使用 SQL SERVER 数据库, 云中的 SQL SERVER 服务器的位置对于用户而言是透明的. 对于云计算而言, 这是一个重要的里程碑.SQL Azure 具有以下特性 : 属于关系型数据库 : 支持使用 TSQL(transact structured query language) 来管理 创建和操作云数据库 ; 支持存储过程 : 它的数据类型 存储过程和传统的 SQL Server 具有很大的相似性, 因此, 应用可以在本地进行开发, 然后部署到云平台上 ; 支持大量数据类型 : 包含了几乎所有典型的 SQL Server 2008 的数据类型 ; 支持云中的事务 : 支持局部事务, 但是不支持分布式事务. 2.4 开源云数据库产品 HBase [19] 和 Hypertable 利用开源 MapReduce 平台 Hadoop, 提供了类似于 BigTable 的可伸缩数据库实现. MapReduce [20] 是 Google 开发的 用来运行大规模并行计算的框架. 采用 MapReduce 的应用更像一个人提交的批处理作业, 但是这个批处理作业不是在单个服务器上运行, 应用和数据都是分布在多个服务器上.Hadoop 是由 Yahoo 资助的一个开源项目, 是 MapReduce 的开源实现, 从本质上来说, 它提供了一个使用大量节点来处理大规模数据集的方式. HBase 已经成为 Apache Hadoop 项目的重要组成部分, 并且已经在生产系统中得到应用 [5]. 与 HBase 类似的是 Hypertable. 不过,HBase 的开发语言是 Java, 而 Hypertable 则采用 C/C++ 开发. 与 HBase 相比,Hypertable 具有更高的性能. 但是,HBase 不支持 SQL(structual query language) 类型的查询语言. 甲骨文开源数据库产品 BerkelyDB 也提供了云计算环境中的实现. 2.5 其他云数据库产品 Yahoo! PNUTS [21] 是一个为网页应用开发的 大规模并行的 地理分布的数据库系统, 它是 Yahoo! 云计算平台重要的一部分.Vertica Systems 在 2008 年发布了云版本的数据库.10Gen 公司的 Mongo AppJet 的 AppJet

6 林子雨等 : 云数据库研究 1153 数据库也都提供了相应的云数据库版本.M/DB:X 是一种云中的 XML 数据库, 它通过 HTTP/REST 访问. FathomDB 旨在满足基于 Web 的公司提出的高传输要求, 它所提供的服务更倾向于在线事务处理而不是在线分析处理.IBM 投资的 EnerpriseDB 也提供了一个运行在 Amazon EC2 上的云版本.LongJump 是一个与 Salesforce. com 竞争的新公司, 它推出了基于开源数据库 PostgreSQL 的云数据库产品.Intuit QuickBase 也提供了自己的云数据库系列. 麻省理工学院研制的 Relational Cloud [22] 可以自动区分负载的类型, 并把类型近似的负载分配到同一个数据节点上, 而且采用了基于图的数据分区策略, 对于复杂的事务型负载也具有很好的可扩展性. 此外, 它还支持在加密的数据上运行 SQL 查询. 3 云数据库领域的研究问题对于学术界而言, 要想在云数据库中提供类似于现有 DBMS 的丰富功能, 比如查询 索引和事务处理, 仍然有许多亟待解决的问题. 云数据库领域中的研究问题主要包括 : 云数据库中数据模型设计 编程模型 服务器体系架构设计 事务一致性 基于云数据库的容灾和 SLA(service level agreement) 监控 云数据的访问控制和授权管理 云应用数据访问体系的调优 云数据生命周期管理 云数据库与本地数据库的协同和联邦设计 测试基准等. 下面将介绍一些典型问题的研究现状. 3.1 数据模型云数据库的设计可以采用不同的数据模型, 不同的数据模型可以满足不用应用类型的需求, 主要包括 : 键 / 值模型和关系模型 键 / 值模型 BigTable,Dynamo,SimpleDB,PNUTS,HBase 等产品都采用了键 / 值模型存储数据. 下面我们以 Google BigTable 的数据模型为例来介绍键 / 值模型. Google BigTable 的数据模型 :BigTable 和它的同类开源产品 HBase, 提供了一个不同于以往的简单的 动态的 非关系型的数据模型.BigTable 采用了键 / 值数据模型. 在 BigTable 中, 包括行列以及相应的时间戳在内的所有数据都存放在表格的单元里.BigTable 的内容按照行来划分, 多个行组成一个小表 (Tablet), 保存到某一个服务器节点中. 这就意味着, 每个 Tablet 包含了位于某个区间内的所有数据. 对于 BigTable 而言, 一个数据簇中存储了许多表, 其中每个表都是一个 Tablet 集合. 在最初阶段, 每个表只包含 1 个 Tablet. 随着表的增长, 它会被自动分解成许多 Tablet, 每个 Tablet 默认尺寸大约是 100MB~200MB.BigTable 使用一个类似于 B+ 树的 3 层架构来存储 Tablet 位置信息 [11]. 由于 BigTable 采用了键 / 值数据模型, 因此不存在表间的联接操作, 这也使得数据分区操作相对简单, 只需要根据键的区间来划分即可. 一个 BigTable 实际上就是一个稀疏的 分布的 永久的多维排序图, 它采用行键盘 (row key) 列键 (column key) 和时间戳 (timestamp) 对图进行索引. 图中的每个值都是未经解释的字节数组 [15] : 行键 :BigTable 在行键上根据字典顺序对数据进行维护. 对于一个表而言, 行区间是根据行键的值进行动态划分的. 每个行区间称为一个 Tablet, 它是负载均衡和数据分发的基本单位, 这些 Tablet 会被分发到不同的数据服务器上. 列键 : 被分组成许多 列家族 的集合, 它是基本的访问控制单元. 存储在一个列家族当中的所有数据, 通常都属于同一种数据类型, 这通常意味着具有更高的压缩率. 数据可以被存放到列家族的某个列键下面, 但是在把数据存放到这个列家族的某个列键下面之前, 必须首先创建这个列家族. 在创建完成一个列家族以后, 就可以使用同一个家族当中的列键. 时间戳 : 在 BigTable 中的每个单元格当中都包含相同数据的多个版本, 这些版本采用时间戳进行索引.BitTable 时间戳是 64 位整数. 一个单元格的不同版本是根据时间戳降序的顺序进行存储的, 这样, 最新的版本可以被最先读取. 这里以文献 [15] 中的一个实例来阐释 BigTable 的数据模型. 图 2 显示了存储了网页数据的 WebTable 的一个片段. 行名称是反转的 URL,contents 列家族包含了网页内容,anchor 列家族包含了任何引用这个页面的

7 1154 Journal of Software 软件学报 Vol.23, No.5, May 2012 anchor 文本.CNN 的主页被 Sports Illustrated 和 MY-look 主页同时引用, 因此, 这里的行包含了名称为 anchor: cnnsi.com 和 anchor:my.look.ca 的列. 每个 anchor 单元格都只有 1 个版本,contents 列有 3 个版本, 分别对应于时间戳 t 3,t 5 和 t 6. content: anchor:cnnsi.com anchor:my.look.ca com.cnn.www html html html t 3 t 5 t 9 CNN CNN.com t 8 t 6 Fig.2 An example of the data model of BigTable 图 2 BigTable 数据模型的一个实例 HBase [19] 和 BigTable 一样, 也采用了键 / 值数据模型, 它是一个开放源码 分布式 面向列 多维 高可用 高性能的存储技术, 采用 JAVA 语言编写. 作为一个使用了 Hadoop 的分布式数据库,HBase 可以实现结构化数据的可靠存储. 就像 Google BigTable 充分利用 Google File System 提供的分布式数据存储功能一样,HBase 的目的就是在 HDFS(hadoop distributed file system) 上提供类似 BigTable 的功能.HBase 采用多层索引表来执行键 / 值映射, 获得了优越的主键查询性能. Hbase,BigTable 中的数据库模式和关系型模式有很大的区别 : 第一, 不存在表间的联接操作 ; 第二, 整个模式也只有 1 个索引 行键. 与 RDBMS(relational database management system) 不同的是, 开发者不需要使用 WHERE 从句的等价表达形式. 通过设计,HBase 中的所有访问方法或者通过行键访问, 或者通过行键扫描, 从而使得整个系统不会慢下来. 由于 HBase 位于 Hadoop 框架之上,MapReduce 就可以用来生成索引表 [19]. HBase 列家族可以被配置成支持不同类型的访问模式. 一个家族也可以被设置成放入内存当中, 以消耗内存为代价, 从而换取更好的响应性能. 此外,Amazon Dynamo,SimpleDB 也都和 BigTable 一样采用了键 / 值存储.SimpleDB 中包含 3 个概念 : domain,item 和 attribute. 其中,domain 相当于一个 table;item 相当于一行 ;attribute 相当于一列, 一列可以有多个值. 但是,SimpleDB 和 BigTable 在数据划分的方式上存在一些差别 : SimpleDB 的数据划分 : 采用静态数据划分方法, 利用哈希函数把数据分发到多个数据节点, 这使得 SimpleDB 更像一个哈希系统. 这种方法的优点是实现难度小 ; 但是缺点也很明显, 即用户的一些 domain 存放不连续. 为了降低不连续数据存放对用户查询性能带来的负面影响,SimpleDB 对用户 domain 的大小进行限制, 比如一个 domain 大小不超过 10GB. BigTable 的数据划分 : 采用动态划分方法, 一个用户的数据可能会被划分成多个 Tablet, 分发到不同的数据节点上. 这种方法的优点是可以很好地支持负载均衡, 缺点是需要相关的 Tablet 分拆与合并机制. BigTable,Dynamo,SimpleDB,PNUTS,HBase 等产品虽然都采用了键 / 值模型存储数据, 但是这些系统在进行数据访问的时候都是以单个键作为访问粒度, 这种方式对于一些网页应用而言无法取得好的性能, 比如在线游戏 社区网络 合作编辑等包含合作性质的应用, 这些应用需要对一个键组 (key group) 进行一致性的访问. 由此, 文献 [23] 设计了名为 G-Store 的键 / 值系统, 并提出 键组协议 来对一组键进行一致的 高效的访问. 也就是说, 在该系统中, 数据访问的粒度不再是单个的键, 而是一个键组 关系模型微软的 SQL Azure 云数据库采用了关系模型, 它的数据分区方式和 BigTable 有些不同. 关系型云数据库的数据模型涉及行组和表组等相关概念. 一个表是一个逻辑关系, 它包含一个分区键, 用来对表进行分区. 具有相同分区键的多个表的集合称为表组. 在表组中, 具有相同分区键值的多个行的集合称为行组. 一个行组中包含的行总是被分配到同一个数据节点

8 林子雨等 : 云数据库研究 1155 上. 每个表组会包含多个行组, 这些行组会被分配到不同的数据节点上. 一个数据分区包含了多个行组. 因此, 每 个数据节点都存储了位于某个分区键值区间内的所有行. 这里以一个实例来解释关系型云数据库的数据模型. 如图 3 所示, 一个表组包含了两个相关的表, 即图 3 中 的表 1 和表 2. 表 1 和表 2 分别包含了一个分区键列, 每个分区键列是由多个分区键值组成的, 这两个分区键列 具有相同类型的分区键, 都是 ID 类型的数值型数据. 表 1 中的 ID 列和表 2 中的 ID 列存在主外键关联. 因此, 表 1 中和表 2 中的 ID 列值为 27 的 3 个行 ( 图中用灰色底纹表示, 并且用虚线框包围的部分 ) 就属于一个行组. 从图中 也可以看出, 表组被分割成多个分区. 而且, 同一行组中的 内容都位于同一个数据分区内. 表组 一个表组通常包含那些会被某个应用同时使用的多 表 1 表 2 个表, 因此需要把这些表存储在一起, 从而加快查询效率 比如, 有两个表 STUDENT_INFO 和 BOOKBORROWING_ INFO, 前者记录的信息包括名字 性别 年龄 电话等等, 后者记录了借书的相关信息. 当图书馆管理员查询一个人的借书记录时, 通常需要同时查看借阅者姓名 年龄 电话 借书数量 借书时间等信息, 这就需要在 STUDENT_INFO 和 BOOKBORROWING_INFO 这两个表之间进行联接操作. 显然, 如果把这两个表存储在同一个数据节点上, 联接操作则会快很多 类似地, 把一个行组中的多个行存储在一个数据分区内也具有明显的好处. 比如, 图 3 中表 1 和表 2 中的 ID 分区键列 行组 为 27 的的多个行构成一个行组, 它们之间存在主外键关联, 把它们存放在一起可以加快查询的效率. Fig.3 Data model of relational cloud databases 图 3 关系型云数据库的数据模型 支持多种数据模型 SQL Azure 等云数据库产品采用了关系模型,BigTable 等产品采用了键 / 值模型, 而文献 [24] 中描述的 CloudDB 则可以同时支持关系模型和键 / 值模型, 甚至可以采用列式存储 (columnar store) [25].CloudDB 可以同时 维护 3 种不同类型的数据存储, 从而有效处理各种不同类型的负载. 在 CloudDB 中, 针对一个具体的应用而言, 采用何种存储类型, 取决于应用环境 负载类型特点和 SLA 需求等因素. 3.2 系统体系架构 这里主要讨论在存储层面采用非共享架构的云数据库. 我们将阐述其体系架构和数据访问方法, 并介绍几个系统实例 体系架构这里将以 HBase 和 SQL Azure 为例, 分别介绍采用键 / 值数据模型和关系数据模型的具有代表性的云数据库体系架构 采用键 / 值数据模型的云数据库体系架构 HBase [19] 作为 BigTable 的一个开源实现, 基本采用了和 BigTable 类似的架构. 如图 4 所示,HBase 体系架构中包括 Client,Zookeeper,Hmaster,HRegionServer 和 Store, 具体功能如下 [26] : Client: 访问 HBase 的接口. Zookeeper: 存储了 HBase 的数据库模式和所有 HRegion 的寻址入口, 实时监控 HRegionServer 的状态. HMaster: 管理用户对 Table 的增 删 改 查操作, 管理 HRegionServer 的负载均衡, 调整 Region 分布等. HRegionServer: 负责响应用户 I/O 请求, 向 HDFS 文件系统中读写数据, 是 HBase 中最核心的模块. Store: 是 HBase 存储的核心, 由 MemStore 和 StoreFiles 两部分组成. 用户写入的数据首先会放入 MemStore, 当 MemStore 满了以后会被存放到一个 StoreFile 中,StoreFile 将被存放在 HDFS 文件系统的 分区

9 1156 Journal of Software 软件学报 Vol.23, No.5, May 2012 HFile 中. Client Zookeeper HMaster HRegionServer HRegionServer HRegion HLog Store StoreFile HFile MemStore StoreFile HFile Store MemStore StoreFile HFile Fig.4 Architecture of HBase 图 4 HBase 的体系架构 采用关系数据模型的云数据库体系架构 [27] 如图 5 所示,SQL Azure 的体系架构中包含了一个虚拟机簇, 可以根据工作负载的变化, 动态增加或减少虚拟机的数量. 每台虚拟机 SQL Server VM(virtual machine) 安装了 SQL Server 2008 数据库管理系统, 以关系模型存储数据. 通常, 一份数据库会被散存储到 3 台 ~5 台 SQL Server VM 中. 每台 SQL Server VM 同时安装了 SQL Azure Fabric 和 SQL Azure 管理服务, 后者负责对每个数据库间的数据复写工作, 以保障 SQL Azure 的基本高可用性要求. 不同 SQL Server VM 内的 SQL Azure Fabric 和管理服务之间会彼此交换监控信息, 以保持整体服务的可监控性. SQL Azure Fabric SQL Azure Fabric SQL Azure Fabric SQL server 实例 SQL server 实例... SQL server 实例 管理服务 管理服务 管理服务 SQL Azure Fabric 连接到位于另一台机器上的 SQL Azure Fabric SQL server 实例 数据库 管理服务 连接到位于另一台机器上的 SQL Azure 管理服务 Fig.5 Architecture of SQL Azure 图 5 SQL Azure 的体系架构

10 林子雨等 : 云数据库研究 数据访问方法这里以一个实例来阐释云数据库的数据访问方法. 如图 6 所示, 当客户端请求数据时, 它首先向管理器请求一份分区映射图, 管理器向客户端发送分区映射图 ; 客户端收到以后, 在图中进行搜寻, 根据键值找到自己所需数据的存储位置 ; 然后, 客户端到指定的数据节点请求数据 ; 最后, 由该数据节点把数据返回给客户端. 实际上, 为了改进性能, 同时也为了避免管理器的性能瓶颈, 通常会在客户端缓存常用的分区映射图. 这样, 客户端在很多情况下不必与管理器交互就可以直接访问相应的数据节点. 3. 根据分区映射图找到数据存储位置客户端 5. 返回数据 4. 请求数据 1. 请求分区映射图 2. 返回分区映射图 1~ ~ ~ ~ ~500 云数据库数据节点云数据库管理器 Fig.6 Data accessing method in cloud databases 图 6 云数据库中的数据访问方法 系统实例在 BigTable 中, 数据节点服务器称为 Tablet 服务器, 管理器称为主服务器. 主服务器负责把 Tablet 分配到 Tablet 服务器, 探测 Tablet 服务器的信息, 进行 Table 服务器的负载均衡, 以及 GFS 文件系统中的垃圾收集 ( 数据分区被存储在 GFS 文件中 ). 此外, 它还处理模式变化, 比如表和列家族创建. 就像许多单服务器分布式存储系统一样, 客户端并不是直接从主服务器读取数据, 而是直接从 Tablet 服务器上读取数据. 因为客户端函数库会缓存 Tablet 位置信息, 所以 BigTable 客户端并不依赖于主服务器来获得 Tablet 的位置信息, 因而大多数客户端从来不和主服务器通信, 这就使得在实际应用中主服务器的负载很小. HBase [19] 采用了和 BigTable 类似的实现方法, 不同的是, 它的数据分区存储在 HDFS 中. 一个数据分区是由一个表中排序的行构成的, 从而使得所有的表行都包含在一个数据分区的集合中.HBase 依赖于 Zookeeper (Zookeeper 和 BigTable 一样, 依赖于 Chubby [17] ) 来保证在任何时候都有总有一个主服务器可以用来存储 HBase 数据的位置引导信息, 这些信息可以帮助发现数据分区服务器的位置. 采用单个主服务器的设置很简单, 但是可能会导致较差的可用性. HugeTable [5] 是一个分布式结构化数据库系统, 它采用了标准的 SQL 语言查询接口, 支持高性能的全局索引, 并且在设计上采用了多主服务器机制 TabletServer 持续服务保证以及可靠的 Zookeeper 系统, 已经被完全避免了类似 HBase 系统中的单点失效问题.HugeTable 的基本框架包含 4 个层次 : 应用层 ODBC/JDBC 驱动层 SQL 服务层和 Hadoop 云基础层. 在应用层,HugeTable 支持朴素应用接口 ( 它支持使用批更新的直接数据访问 ) 和标准的 SQL 接口.ODBC/JDBC 驱动层就位于应用层的下面, 它为上面的 SQL 应用提供了 JDBC/ODBC 驱动. SQL 服务层会分析所有到达的 SQL 语句, 并生成相应的并行查询过程.Hadoop 云基础层包括一些基本的系统架构组件, 比如 MapReduce [20],DFS,Zookeeper 和 HBase [19],HugeTable 依赖这些组件来实现自己的功能. 3.3 事务一致性 2000 年,UC Berkeley 的 Brewer 教授提出了著名的 CAP 理论 [28], 后来,Gilbert 和 Lynch 两人证明了 CAP 理论的正确性 [29]. 所谓的 CAP 指的是 :

11 1158 Journal of Software 软件学报 Vol.23, No.5, May 2012 C: Consistency( 一致性 ): 任何一个读操作总是能读取到之前完成的写操作结果 ; A: Availability( 可用性 ): 每一个操作总是能够在确定的时间内返回 ; P: Tolerance of network Partition( 分布性 ): 在出现网络分区的情况下, 仍然能够满足一致性和可用性. CAP 理论告诉我们, 一个分布式系统不可能同时满足一致性 可用性和分区容错性这 3 个需求, 最多只能同时满足 2 个. 因此, 根据 CAP 理论, 我们在设计一个系统时可以有几种选择 : 第 1 种 : 放弃分布性. 把所有与事务相关的东西都放置到同一台机器上. 显然, 这种方法可扩展性很差. 第 2 种 : 放弃可用性. 比如, 可以把所有的数据都放置到一个节点上, 当其他节点存在访问请求时, 都被转向到该节点. 显然, 这方方案存在明显的单点性能瓶颈问题. 第 3 种 : 放弃一致性. 由于不同用户对数据的一致性要求不一样, 当用户的这种要求不高时, 就要果断考虑放弃一致性. 传统的数据库提供强一致性保证, 可以保证调用时序的一致性. 在分布式的云环境中, 维护事务的一致性具有很大的难度, 通常代价很高. 很多现有的云数据库产品在实现时, 为了获得 CAP 理论中的可用性和分布性, 都放松了对事务 ACID(atomicity,consistency,isolation,durability) 四性的要求. 比如,Google BigTable 就弱化了事务的原子性要求, 只支持单行事务, 可以允许对存储在某个行键下面的数据执行原子的 读 - 修改 - 写 操作. BigTable 当前不支持通用的跨行键的事务, 虽然它在客户端提供了跨行键批量写入数据的接口 [11]. 类似地, Amazon SimpleDB 等都没有实现通用的事务 [30]. 比如,Amazon SimpleDB 放松了对事务的一致性和隔离性的要求, 转而采用最终一致性 ( 用户 B 虽然不能立即看到用户 A 修改的信息, 但是用户 B 最终会看到用户 A 的修改信息 ), 使得所有副本不必都获得数据副本的当前最新值. 但是,SimpleDB 可以支持强一致读以及基于条件更新或者删除的乐观锁机制, 并提供了简单的 SQL Select 子集支持.Amazon Dynamo [14] 也采用了最终一致性.Yahoo! PNUTS 考虑到大部分 WEB 应用对一致性并没有非常严格的要求, 因此在设计上放弃了对强一致性的追求 ( 采用时间线一致性 ), 转而追求更高的可用性 容错能力和更快的响应等 [21]. 文献 [31] 提出了一种基于树的一致性方法, 并为云数据库引入了部分一致性和完整一致性的概念, 从而有效减少不同数据副本之间的依赖性, 极大地降低了事务失败的概率. [32] Chohan 等人认为, 支持对分布在不同数据库中的多行数据进行并发式地原子更新 ( 要么全部更新, 要么都不更新 ), 可以极大推动云数据库的商业化应用. 因此, 该文针对键 / 值模型的云数据库提出了称为 DAT (database agnostic transactions) 的事务处理方法. 该方法采用了一个单独的 独立于数据库的软件层, 并采用了 Zookeeper 服务 ( 云计算和其他分布式环境中使用的一种开源的锁服务 ), 只需要底层的云数据库提供行级别的原子更新支持, 就可以实现针对多行数据更新的原子性 一致性 隔离性和持久性.Chohan 等人在 HBase 和 HyperTable 等云数据库产品上对 DAT 进行了事务处理性能的测试, 取得了较好的效果. 实际上, 分布式环境下的事务一致性并不是云数据库才面临的问题, 云存储系统也同样存在该问题. 文献 [33] 研究了在 Amazon S3 中的一种新的事务模型, 它不仅允许设计者在事务级水平定义数据的一致性保障水平, 而且允许在运行时自动切换一致性保障水平, 并且提出了许多技巧, 它允许系统通过监督数据和收集数据时间统计信息来自动地调整一致性水平. 相信这方面的研究会给云数据库的相关研究带来一定的启示. 事务型数据管理系统当中存在维护分布式环境下的事务一致性的开销, 在分析型数据管理系统当中就没有这个问题. 对于事务型的工作负载, 一个 DBMS 可以从一个失败中恢复, 而不会丢失任何数据 ; 并且在分布式数据库环境中, 即使在面临节点失效的情况下, 系统也可以成功地提交事务, 这其中涉及各种保障机制的设计和相关开销. 对于分析型负载当中的只读查询, 根本不包含需要提交的写事务, 也不必担心节点失效时会丢失更新操作. 因此, 一个分析型 DBMS 只是一个非常简单的 DBMS, 当查询涉及的某个节点失效时, 不需要让查询重启. 这也是分析型数据库管理系统更适合部署在云环境中的原因. 文献 [34] 提出把云环境下数据库中的事务服务从数据管理组件中单独分离出来. 传统的 DBMS 都存在一个事务存储管理器, 它包含相互紧密结合的 4 个组件 :(1) 负责并发控制的锁管理器 ;(2) 负责恢复的日志管理器 ;

12 林子雨等 : 云数据库研究 1159 (3) 进行分批 I/O 处理的数据缓冲池 ;(4) 负责如何在磁盘上存放数据的访问控制方法. 云计算时代的到来, 产生了对事务服务和数据管理进行分离的需求. 该文献把存储引擎分成两个部分, 即事务组件 (transactional component) 和数据组件 (data component). 事务组件只在逻辑层面工作, 即它知道事务以及事务的逻辑并发控制和恢复, 但是并不知道的底层存储页 (page) 的结构 ( 比如可能采用 B- 树 ); 数据组件知道物理存储结构, 它可以支持面向记录的原子访问操作, 但是不知道事务. 这种分离方法支持在云数据库中实现比较灵活的事务处理. 3.4 编程模型 云数据库存储了海量数据, 涉及到大量的数据运算, 如果仍然采用传统的数据处理方法, 则将无法充分发挥云环境的优势. 因此, 采用一种机制简单而又具有高可扩展性的编程方法就显得尤为重要. 查询这种大型的数据集, 可以采用 Google 发明的一种新的编程模型, 称为 MapReduce [20]. MapReduce 编程模型用来处理跨越成百上千个机器的大规模数据集, 该软件架构隐藏了并行计算 数据分布和失败处理的细节. 它背后的思想是, 在分布式环境下处理数据, 总是包括两个基本步骤 :(1) 映射所需的数据 ;(2) 对这些数据进行聚集 (aggregate) 操作. 它让用户定义一个映射函数, 这个映射函数把一个 key/value 对的集合转换成一个中间临时的 key/value 对的集合, 然后使用一个 reduce 函数把所有那些与同一个键相关的中间临时值都进行合并. 许多现实世界的任务都可以采用这个模型来表达.MapReduce 可以运行在大规模商用服务器簇上, 并且具有很高的可扩展性 [20]. 一个典型的 MapReduce 计算会在成千上万的机器上处理许多 TB 的数据. 但是, 传统的关系型数据库和 MapReduce 对数据的处理方式存在很大的区别, 因此需要把关系数据库中的一些操作转换成 MapReduce 操作, 这其中一类典型的操作就是联接 (join) 操作. 总的来说, 在 MapReduce 环境下执行两个关系的联接操作的方法如下 [35] : 假设关系 R(A,B) 和 S(B,C) 都存储在一个文件中. 为了联接这些关系, 必须把来自每个关系的各个元组都与一个 key 关联, 这个 key 就是属性 B 的值. 可以使用一个 Map 进程集合把来自 R 的每个元组 (a,b) 转换成一个 key-value 对, 其中的 key 就是 b, 值就是 (a,r). 注意, 这里把关系 R 包含到 value 中. 这样做使得我们可以在 Reduce 阶段, 只把那些来自 R 的元组和来自 S 的元组进行匹配. 类似地, 可以使用一个 Map 进程集合把来自 S 的每个元组 (b,c) 转换成一个 key-value 对,key 是 b,value 是 (c,s). 这里把关系名字包含在属性值中, 可以使得在 Reduce 阶段只把那些来自不同关系的元组进行合并.Reduce 进程的任务就是把来自关系 R 和 S 的具有共同属性 B 值的元组进行合并. 这样, 所有具有特定 B 值的元组必须被发送到同一个 Reduce 进程. 假设使用 k 个 Reduce 进程. 这里选择一个哈希函数 h, 它可以把属性 B 的值映射到 k 个哈希桶, 每个哈希值对应一个 Reduce 进程. 每个 Map 进程把 key 是 b 的 key-value 对都发送到与哈希值 h(b) 对应的 Reduce 进程.Reduce 进程把联接后的元组 (a,b,c) 写到一个单独的输出文件中. 虽然采用 MapReduce 可以带来很多收益, 但并不是说可以不要任何代价. 实际上, 它有时也会影响到数据库其他方面的性能. 文献 [36] 开展了一系列实验, 对 Hadoop 和几个性能优秀的并行数据库进行性能比较. 实验结果表明, 对于一些分析型的负载,MapReduce 不仅没有性能优势, 而且要比并行数据库慢 3.1 倍 ~6.5 倍. 针对这个问题, 文献 [13] 的研究发现, 当云数据库中的数据节点数量众多 ( 几千个节点 ), 并且是经常需要动态分发资源的分析型应用时,MapReduce 可以带来很好的性能. 此外, 类似 BSP(bulk synchronous parallel) [37] 和 MapReduce Online [38] 等并行编程框架也将在云数据库中发挥重要作用.BSP 包含了许多通过通信网络连接起来的处理器, 每个处理器都有非常快速的局部内存, 可以开展多线程计算.MapReduce Online 是一种针对 MapReduce 的改进框架.MapReduce 只能支持批作业处理, 每个 MapReduce 任务的输出都会首先被存储到磁盘然后才被使用 ; 而 MapReduce Online 可以对各种操作进行流水线化处理, 提高了并行性, 大量降低作业完成时间, 提高了系统的利用率. 3.5 数据安全 云数据库的安全性也是影响其普及与应用的关键因素. 云数据库虽然提供了对海量数据的存储, 但同时也对数据的保密性和访问控制等安全问题提出了新的挑战 : 一方面, 一些敏感的数据, 比如企业财务数据 医疗机构的病例档案 政府机构的文件等, 必须经过加密才能放到云数据库中 ; 另一方面, 针对众多的用户, 必须设置不

13 1160 Journal of Software 软件学报 Vol.23, No.5, May 2012 同的访问控制级别, 保证不同层次的用户只能授权访问限定范围内的数据. 因此, 如何在云数据库中对数据实行加密和应用不同等级的访问控制约束规则, 就成为新的研究热点. 文献 [12] 提出了衡量云计算环境的各种资源的私有性的有效方法, 并且通过采用基于元数据和特权访问控制的方法来实现对云数据库资源的可信授权访问. 该文献为每个 VMM(virtual machine memory) 中的授权策略和云数据库中的资源都构建成以图表示的特权链, 用来进行访问和安全控制. 文献 [10] 重点研究了支持多个用户在加密云数据库上执行 SQL 查询, 并允许数据库管理员对不同用户设置不同级别的访问权限. 为了实现只有授权用户才能对数据进行访问, 文中采用 KP-ABE(key-policy attribute based encryption) 加密策略, 即每条策略都和用户的解密密钥关联, 分配给每个用户的访问策略就被内嵌到该用户的解密密钥中. 因此, 只有当一个用户的解密密钥中包含的访问策略允许该用户访问某个数据时, 该用户才可以访问该数据. 此外, 同态加密也是云数据库安全领域未来的重点研究方向. 同态加密是基于数学难题的计算复杂性理论的密码学技术. 对经过同态加密的数据进行处理得到一个输出, 将这一输出进行解密, 其结果与用同一方法处理未加密的原始明文数据得到的输出结果是一样的. 同态加密不同于传统的数据加密, 它允许在没有解密算法和解密密钥的条件下对加密的数据进行运算. 3.6 性能优化云计算是一个虚拟机器环境, 在虚拟机器环境中部署软件的一个公共模型是虚拟器具 (virtual appliance) 模型. 一个虚拟器具是一个 VM(virtual machine) 镜像, 具有预装和配置的应用. 配置一个应用, 只需把这个 VM 镜像拷贝到一个物理机器上面, 启动这个 VM, 然后执行配置任务即可. 随着虚拟化和云计算的日益普及, 我们期望可以采用一种更加普遍的方式来提供数据库服务, 也就是通过部署在云当中的数据库器具来提供数据库服务, 这是云数据库的一种实现方式. 例如,Amazon 在 EC2 平台上提供了 MySQL,ORACLE 和 Microsoft SQL Server 数据库服务. 由于云环境中的负载模式是不断变化的, 这就会导致各种资源的动态分配. 如何在这种动态环境下获得最好的数据库性能, 是一个值得研究的问题. 文献 [39] 讨论了在云中部署数据库器具的一些性能优化方面的挑战, 并给出了相应的解决方案 ; 并以一个在不同的数据库器件之间分配 CPU 处理能力的例子阐述了虚拟环境调优方案. 文献 [7] 简单讨论了在云计算的虚拟化环境下, 如何根据资源使用情况对数据库实例进行迁移, 从而达到资源最大化利用, 优化数据库服务性能. 文献 [40] 提出了 Albatross, 可以用较小的代价处理面向 OLTP 应用的云数据库中的数据库实例动态迁移问题, 从而实现有效的负载均衡 ;Albatross 在迁移过程中可以记录数据库缓存和活跃事务状态, 迁移结束后相关事务可以继续执行, 从而使得对事务的影响最小化. 文献 [41] 设计了名为 Dolly 的原型系统, 它采用 VM 克隆技术和自定义代价模型, 可以根据不同应用情况调整数据库配置策略. 文献 [42] 研究了如何在云数据库中为多个用户所使用的资源进行智能化管理和分配, 从而实现整体性能优化. 该文提出了一个名为 SmartSLA 的系统, 它包含两个模块 : 系统建模模块和资源分配决策模块. 前者可以利用机器学习算法为不同资源分配模式构建代价模型, 进行代价和收益评估 ; 后者可以根据代价评估结果动态决定资源分配, 使得整个云数据库系统实现收益最大化. 文献 [43] 研究了在给定查询负载和满足 QoS(quality of service) 的情况下, 为不同的云数据库实例分配资源, 实现系统性能的最优化. 文中提出了两种方法, 即白盒方法和黑盒方法. 前者对负载所消耗的系统资源进行精细地评估, 而后者则只进行粗略评估. 文中把两种方法等价变换成多维装箱 (bin-packing) 问题, 并使用通用约束求解器 (generic constraint solver) 来解决该问题. 3.7 测试基准在云数据库逐渐走向成熟时, 有很多企业开始考虑是否要将自己的企业应用搬到云环境中. 由于云数据库市场存在种类繁多的相关产品, 企业必须决定究竟要选择哪个厂商的产品. 企业做出决定需要首先考虑的一个因素是, 是否可以取得更好的性能和更低的代价. 因此, 这里就需要一个测试不同云数据库产品性能的测试基准 (benchmark).

14 林子雨等 : 云数据库研究 1161 目前, 已经有一些可以使用的测试基准, 比如 : Google s BigTable 采用的性能测试方法 [15] : 可以对那些不支持结构化查询语言的系统进行性能评估. Hadoop 采用的性能评估方法 : 可以对一些结构化查询的性能进行评估. Yahoo! Cloud Serving Benchmark (YCSB) [44] : 支持在测试时采用不同类型负载的组合, 包括插入 读取 更新和扫描等 ; 该测试主要针对类似 PNUTS 的系统, 因为这些系统主要提供对数据的在线读写访问. 其他 : 比如文献 [36] 采用的方法. 但是, 上述性能测试方法都没有体现当采用不同的系统实现方法时对系统整体性能的影响. 实际上, 系统实现方法多种多样, 比如存储体系架构 数据模型 一致性和可用性水平等等, 都不尽相同. 因此, 文献 [45] 对多个系统采用不同的实现方法进行了详尽的性能指标测试, 可以作为评估不同系统性能的参考. 文献 [46] 则采用 TPC-W 测试基准对采用不同架构 ( 比如分区 复制 分布式控制和缓存等 ) 的多种云数据库产品的性能进行了比较和分析, 比较的产品包括 AWS MySQL,AWS MySQL/R,AWS RDS,AWS SimpleDB, MS Azure 等. 总体而言, 该文侧重于对事务型操作 ( 比如读和更新操作 ) 的性能分析, 而没有针对 OLAP(on-line analytical processing) 操作进行分析. 3.8 其他研究文献 [13] 描述了如何在云环境中提供高效可扩展的数据库服务, 并介绍了作者开发的一个新系统 epic, 它可以根据负载类型的需求, 同时支持 OLAP 和 OLTP(on-line transaction processing) 类型的存储. 在 epic 中,OLAP 查询是通过并行扫描的方式进行处理, 而 OLTP 查询则采用索引和局部查询优化. 文献 [47] 描述了 epic 系统所采用的多维数据索引方法 RT-CAN, 它可以大大改善查询的性能. 文献 [48] 重点研究了数据库之间的动态数据迁移技术, 可以有效支持云数据库环境下的动态负载均衡. 该文结合了按需拉取 (on-demand pull) 和异步推给 (asynchronous push), 从而实现在最小的时间间隔内迁移数据库实例. 通过使用轻量级的同步, 不仅极大地减小了数据迁移过程中的失败操作数量, 也极大地减小了迁移操作所涉及的数据量. 数据质量也是云数据库在设计和应用中需要考虑的重要问题. 数据质量问题一般都是由于脏数据 (dirty data) 造成的. 这里所谓的脏数据, 包括不一致性 不准确性 错误性 冗余性和过期数据. 在云数据库这种海量数据环境下, 更容易产生脏数据, 这里主要有两个方面的原因 : 一是由于在大规模数据环境下, 一个错误会传播到许多数据中 ; 另一方面, 在大规模数据环境下, 数据不一致性的概率进一步增大. 数据清洗是传统的处理脏数据的方法, 但是在云数据库的海量数据环境下, 数据清洗的代价很高, 会影响系统的效率. 为此, 文献 [49] 没有采用基于清洗的脏数据处理方法, 而是直接在脏数据上进行查询, 同时能够取得很好的查询效率和质量. 文中提出了针对云数据库的脏数据库的存储架构, 把相似的元组分成多个簇, 脏数据被分布到多个节点上. 为了保证在脏数据上进行查询也可以取得好的性能, 文中采用了 3 层索引结构 :(1) 代表层 : 同一个簇中的元组都由一个元组来统一代表, 查询直接作用于这个元组代表, 从而极大地缩减了扫描真实数据的开销 ;(2) 数据索引层 : 为代表元组中的列建立索引, 从而使得查询能够快速找到相应的元组 ;(3) 节点索引层 : 可以快速定位那些可能包括查询相关结果的节点. 文献 [8] 提出了采用数据分裂 (data fission) 和数据融合 (data fusion) 的方法, 在云计算环境下设计可扩展的数据库管理体系架构. 该文献采用低代价的数据库迁移来支持轻量级的可伸缩性, 并且设计了全自动的控制器, 避免了人工操作. 4 结束语及未来研究展望云数据库伴随着云计算技术的成熟而迅速发展, 并且越来越受到业界和学术界的关注. 本文阐述了云数据库的特性及其影响, 并根据大量调研结果对相关的云数据库产品进行了归类和介绍 ; 针对围绕云数据库的一些争议, 我们做了简要分析, 并给出了结论 ; 同时, 我们列出了云数据库领域的相关研究. 综合过去两年对云计算和云数据库的关注和研究, 我们认为, 在未来几年, 数据模型 体系架构 编程模型

15 1162 Journal of Software 软件学报 Vol.23, No.5, May 2012 性能优化等方面将会有更多的研究成果出现. 同时, 以下问题是云数据及其相关研究领域的重点 : (1) 事务一致性. 目前, 只有 SQL Azure 等少数关系型云数据库能够支持严格的事务四性.BigTable 和 HBase 等采用了键 / 值模型的云数据库, 都采用放松对 ACID 四性的要求, 以保证系统的性能. 事务型系统是企业应用中的一个重要部分, 若要使云数据库很好地支持事务处理, 必须设计相应机制, 既能实现事务处理, 又能够不对系统性能造成严重影响. 类似于文献 [34] 中的事务服务和数据管理进行分离的方法, 是一种可行的研究方向. (2) 企业本地数据库和云数据库中数据的有效融合机制. 经过几十年的应用, 企业本地数据库存储了大量数据, 纵然云数据库能够带来诸多好处, 但是企业全面步入云数据库仍然需要一个过程, 这期间, 必然有一个长期的本地数据和云数据并存的局面. 这就需要设计有效的机制, 实现本地数据库和云数据库的有效融合, 支持对两种数据库的统一管理. 一种思路是, 采用视图的机制, 在逻辑层面对两种数据库进行整合. 对于用户而言, 看到的只是一个统一的逻辑数据视图, 并不知道数据的物理存储地点 ; 但是在物理层面, 这些数据分布在企业本地数据库和云数据库中. 如果采用视图机制, 将会涉及数据模型的统一构建和来自不同数据源的数据的快速合并机制等方面的研究. (3) 向云数据库中迁移数据. 目前, 大多数企业数据库都存储在企业内部的数据库里. 在云数据库不断发展的过程中, 如何把这些数据迁移到云中, 是一个具有挑战性的问题. 尤其是一些包含海量数据的科学数据库, 可能无法直接迁移到云中, 需要做一些模式和设置上的修改才可以. 而且, 科学数据库通常需要使用一些 DBMS 提供的高级管理功能, 比如用户自定义函数和存储过程等, 要在云数据库中实现所有这些高级功能, 从目前来看还 [50] 存在一定的困难.Thakar 等人在一个基于 SQL SERVER 的天文数据库上进行了大量实验, 结果表明, 在当前技术条件下, 把如此复杂的数据库迁移到云数据库中几乎是不可能实现的. 因此, 需要研究向云数据库中迁移数据的有效方法. 这里需要重点研究企业已采用的不同数据模型 ( 比如面向对象或者关系模型 ) 到云数据库产品所采用数据模型 ( 比如键 / 值模型 ) 的转换. 文献 [51] 在这个方面做了初步的探索与尝试, 总结了一些困难挑战和可能的解决方法. (4) 云数据库的容灾. 云数据库的数据存储在分布式环境中, 不同的云数据库产品可能采用不同的存储平台. 比如 :Oracle 云数据库托管在 Amazon EC2 平台上, 使用了 Amazon S3 存储服务 ; 而 SQL Azure 则可以直接使用微软自己的数据中心. 这些云环境已经设计了相应的容灾机制, 但它们都是针对通用的文件存储情形, 而云数据库由于涉及事务处理, 对故障的处理要更加复杂. 因此, 云数据库的容灾是一个需要重点研究的内容. 一种比较新的尝试是, 把灾难处理作为云环境中的一种服务提供给各种应用 ( 包括云数据库 ) 使用. (5) 云数据库性能优化. 云数据库同时为多个用户提供服务, 不同用户的负载类型各不相同. 如何根据用户的负载类型为不同用户合理分配资源, 从而既能满足用户的处理要求, 又能实现云数据库整体性能最大化, 是一个需要继续深入研究的问题. 我们认为, 可以从 3 个方面开展相关研究 : 研究智能资源管理模型, 采用代价函数有效评估不同资源分配方法的代价, 发现最优的资源分配方法. 比如, 文献 [43] 把这类问题转换成多维装箱问题, 并使用通用约束求解器来解决, 是一个可行的思路 ; 再比如, 文献 [22] 采用的方法也很典型, 它可以自动区分负载的类型, 并把类型近似的负载分配到同一个数据节点上, 实现资源的合理分配. 研究结合经济效益的负载均衡方法. 一种好的负载均衡方法, 应该使得服务器总体开销最小化. 具体来说, 候选服务器节点可能来自企业内部, 例如内部私有云 ; 也可能来自企业外部, 例如公共云计算服务供应商. 当采用企业内部服务器时, 不同的服务器显然具备不同的负载处理开销. 当采用企业外部服务器资源时, 比如 Amazon,Google 和 Microsoft 等公司提供的公共云计算资源, 同样需要考虑价格因素. 这些云计算资源采取租赁的方式, 按照 CPU 和带宽使用情况计费. 当企业对 IT 资源需求量增加时, 可以随时租赁更多的 IT 资源 ; 而当企业需求减少时, 又可以及时退租多余的 IT 资源. 通过这种方式, 可以使得企业最小化 IT 建设和维护开销. 不同云计算服务提供商的服务水平和租赁价格通常各不相同, 因此在处理负载均衡问题时, 为了实现开销最小化, 无论使用内部服务器资源还是外部服务器资源, 都需要考虑经济因素. 而现有的负载均衡方法在选择目标服务器时无法考虑经济因素. 我们认为, 可以考虑采用基于

16 林子雨等 : 云数据库研究 1163 市场机制和 Agent 的负载均衡方法. 市场机制是经济学领域非常成熟的资源分配方法, 并且已经被计算机研究人员引入解决资源分配问题, 但是还没有用市场机制解决云数据库负载均衡的相关研究. 研究动态数据迁移方法. 云数据库的负载分布是一个动态变化的过程, 为了保持性能最优, 需要动态进行负载均衡和资源再分配. 其中将涉及数据的动态迁移问题, 即如何把数据从一个服务器节点迁移到另一个节点. 数据迁移必须保证服务间断时间尽可能短, 对系统性能的影响尽可能地小, 这就对相关的算法提出了很高的效率要求. 比如, 文献 [48] 重点研究了数据库之间的动态数据迁移技术, 可以有效地支持云数据库环境下的动态负载均衡. (6) 云数据库测试基准. 众多的云数据库产品可以满足不同类型的用户的应用需求. 对于用户而言, 在选择具体产品时, 必须基于可靠的产品性能评测结果. 因此, 必须继续深入研究针对不同类型负载特点的测试基准, 能够清晰呈现不同产品在不同负载类型下的性能变化. (7) 云数据库相关标准. 由于现阶段包括云数据库在内的各种云计算技术都是由各大厂商独立发展的, 彼此都没有遵循统一的规范, 这就造成了数据共享和迁移的诸多障碍, 不利于网络数据应用的实现. 当这个技术领域逐渐成熟时, 将会出现各种云数据库标准, 例如云数据库的 SQL 语言 云数据库的应用模型 云数据库的安全标准等等. 比如,AtomPub 已经成为基于云的数据存储的事实访问标准, 可以让不同的存储平台之间 ( 包括云数据库 ) 具有统一的访问方法. 随着市场的发展和云数据库的不断成熟, 一些围绕云数据库的问题将逐渐得到解决, 一些争议也将会有更加明晰的结果. 可以说, 云数据库是数据库技术在未来一段时间内的发展趋势, 该领域的相关问题也将成为数据库研究的重点内容. 云数据库的发展 成熟与应用需要学术界和业界人员的共同努力. References: [1] Chen K, Zheng WM. Cloud computing: System instances and current research. Journal of Software, 2009,20(5): (in Chinese with English abstract). [doi: /SP.J ] [2] Dash D, Kantere V, Ailamaki A. An economic model for self-tuned cloud caching. In: Ioannidis YE, Lee DL, Ng RT, eds. Proc. of the 25th Int l Conf. on Data Engineering (ICDE 2009). New York: IEEE Computer Society Press, [doi: / ICDE ] [3] Feng DG, Zhang M, Zhang Y, Xu Z. Study on cloud computing security. Journal of Software, 2011,22(1):71 83 (in Chinese with English abstract). [doi: /SP.J ] [4] Xu M, Gao D, Deng C, Luo ZG, Sun SL. Cloud computing boosts business intelligence of telecommunication industry. In: Jaatun MG, Zhao GS, Rong CM, eds. Proc. of the 1st Int l Conf. on Cloud Computing (CloudCom 2009). Berlin: Springer-Verlag, [doi: / _20] [5] Qi J, Qian L, Luo ZG. Distributed structured database system HugeTable. In: Jaatun MG, Zhao GS, Rong CM, eds. Proc. of the 1st Int l Conf. on Cloud Computing (CloudCom 2009). Berlin: Springer-Verlag, [doi: / _31] [6] Abouzeid A, Bajda-Pawlikowski K, Abadi DJ, Silberschatz A, Rasin A. HadoopDB: An architectural hybrid of MapReduce and DBMS technologies for analytical workloads. PVLDB, 2009,2(1): [7] Ahrens M, Alonso G. Relational databases, virtualization, and the cloud. In: Abiteboul S, Böhm K, Koch C, Tan KL, eds. Proc. of the 27th Int l Conf. on Data Engineering (ICDE 2011). New York: IEEE Computer Society Press, [doi: /ICDE ] [8] Agrawal D, Abbadi AE, Das S, Elmore AJ. Database scalability, elasticity, and autonomy in the cloud (extended abstract). In: Yu JX, Kim MH, Unland R, eds. Proc. of the 16th Int l Conf. on Database Systems for Advanced Applications (DASFAA 2011). Berlin: Springer-Verlag, [doi: / _2] [9] Soares L, Pereira J. Improving the scalability of cloud-based resilient database servers. In: Felber P, Rouvoy R, eds. Proc. of the 11th IFIP WG 6.1 Int l Conf. on Distributed Applications and Interoperable Systems (DAIS 2011). Berlin: Springer-Verlag, [doi: / _11]

17 1164 Journal of Software 软件学报 Vol.23, No.5, May 2012 [10] Ion M, Russello G, Crispo B. Enforcing multi-user access policies to encrypted cloud databases. In: Proc. of the IEEE Int l Symp. on Policies for Distributed Systems and Networks (POLICY 2011). New York: IEEE Computer Society Press, [doi: /POLICY ] [11] Chang F, Dean J, Ghemawat S, Hsieh WC, Wallach DA, Burrows M, Chandra T, Fikes A, Gruber RE. Bigtable: A distributed storage system for structured data. ACM Trans. on Computer Systems, 2008,26(2):1 26. [doi: / ] [12] Yoon JP. Access control and trustiness for resource management in cloud databases. In: Fiore S, Aloisio G, eds. Proc. of the Int l Conf. on Grid and Cloud Database Management. Berlin: Springer-Verlag, [doi: / _6] [13] Chen C, Chen G, Jiang DW, Ooi BC, Vo HT, Wu S, Xu QQ. Providing scalable database services on the cloud. In: Chen L, Triantafillou P, Suel T, eds. Proc. of the 11th Int l Conf. on Web Information Systems Engineering (WISE 2010). Berlin: Springer-Verlag, [doi: / _1] [14] DeCandia G, Hastorun D, Jampani M, Kakulapati G, Lakshman A, Pilchin A, Sivasubramanian S, Vosshall P, Vogels W. Dynamo: Amazon s highly available key-value store. In: Bressoud TC, Kaashoek MF, eds. Proc. of the 21st ACM Symp. on Operating Systems Principles (SOSP 2007). New York: ACM Press, [doi: / ] [15] Chang F, Dean J, Ghemawat S, Hsieh WC, Wallach DA, Burrows M, Chandra T, Fikes A, Gruber RE. Bigtable: A distributed storage system for structured data. In: Proc. of the 7th Symp. on Operating Systems Design and Implementation (OSDI 2006). Seattle: USENIX Association, [16] Ghemawat S, Gobioff H, Leung ST. The Google file system. In: Scott ML, Peterson LL, eds. Proc. of the 19th ACM Symp. on Operating Systems Principles (SOSP 2003). New York: ACM Press, [doi: / ] [17] Burrows M. The Chubby lock service for loosely coupled distributed systems. In: Proc. of the 7th Symp. on Operating Systems Design and Implementation (OSDI 2006). Seattle: USENIX Association, [18] Gonzalez H, Halevy AY, Jensen CS, Langen A, Madhavan J, Shapley R, Shen WR, Goldberg-Kidon J. Google fusion tables: Webcentered data management and collaboration. In: Elmagarmid AK, Agrawal D, eds. Proc. of the ACM SIGMOD Int l Conf. on Management of Data (SIGMOD 2010). New York: ACM Press, [doi: / ] [19] Cryans JD, April A, Abran A. Criteria to compare cloud computing with current database technology. In: Dumke RR, Braungarten R, Büren G, Abran A, Cuadrado-Gallego JJ, eds. Proc. of the Int l Conf. on Software Process and Product Measurement (IWSM/ Metrikon/Mensura 2008). Berlin: Springer-Verlag, [doi: / _11] [20] Dean J, Ghemawat S. MapReduce: Simplified data processing on large clusters. In: Proc. of the 6th Symp. on Operating Systems Design and Implementation (OSDI 2004). Seattle: USENIX Association, [21] Cooper BF, Ramakrishnan R, Srivastava U, Silberstein A, Bohannon P, Jacobsen HA, Puz N, Weaver D, Yerneni R. Pnuts: Yahoo! s hosted data serving platform. Proc. of the VLDB Endowment, 2008,1(2): [doi: / ] [22] Curino C, Jones EPC, Popa RA, Malviya N, Wu E, Madden S, Balakrishnan H, Zeldovich N. Relational cloud: A database service for the cloud. In: Proc. of the 5th Biennial Conf. on Innovative Data Systems Research (CIDR 2011) crdrdb.org [23] Das S, Agrawal D, Abbadi AE. G-Store: A scalable data store for transactional multi key access in the cloud. In: Hellerstein JM, Chaudhuri S, Rosenblum M, eds. Proc. of the 1st ACM Symp. on Cloud Computing (SoCC 2010). New York: ACM Press, [doi: / ] [24] Hacigümüs H, Tatemura J, Hsiung WP, Moon HJ, Po O, Sawires A, Chi Y, Jafarpour H. CloudDB: One size fits all revived. In: Proc. of the 6th World Congress on Services (SERVICES 2010). New York: IEEE Computer Society, [doi: /SERVICES ] [25] Stonebraker M. Technical perspective One size fits all: An idea whose time has come and gone. Communications of the ACM, 2008,51(12):76. [doi: / ] [26] The architecture of HBase. [27] The architecture of SQL Azure. [28] Browne J. Brewer s CAP theorem [29] Gilbert S, Lynch NA. Brewer s conjecture and the feasibility of consistent, available, partition-tolerant Web services. SIGACT News, 2002,33(2): [doi: / ]

18 林子雨等 : 云数据库研究 1165 [30] Abadi DJ. Data management in the cloud: limitations and opportunities. IEEE Data Engineering Bulletin, 2009,32(1):3 12. [31] Islam MA, Vrbsky SV. Tree-Based consistency approach for cloud databases. In: Proc. of the 2nd Int l Conf. on Cloud Computing (CloudCom 2010). New York: IEEE Computer Society, [doi: /CloudCom ] [32] Chohan N, Bunch C, Krintz C, Nomura Y. Database-Agnostic transaction support for cloud infrastructures. In: Liu L, Parashar M, eds. Proc. of the IEEE Int l Conf. on Cloud Computing (CLOUD 2011). New York: IEEE Computer Society, [doi: /CLOUD ] [33] Kraska T, Hentschel M, Alonso G, Kossmann D. Consistency rationing in the cloud: Pay only when it matters. Proc. of the VLDB Endowment, 2009,2(1): [34] Lomet DB, Fekete A, Weikum G, Zwilling MJ. Unbundling transaction services in the cloud. In: Proc. of the 4th Biennial Conf. on Innovative Data Systems Research (CIDR 2009) [35] Afrati FN, Ullman JD. Optimizing joins in a map-reduce environment. In: Manolescu I, Spaccapietra S, Teubner J, Kitsuregawa M, Léger A, Naumann F, Ailamaki A, Özcan F, eds. Proc. of the 13th Int l Conf. on Extending Database Technology (EDBT 2010). New York: ACM Press, [doi: / ] [36] Pavlo A, Paulson E, Rasin A, Abadi DJ, DeWitt DJ, Madden S, Stonebraker M. A comparison of approaches to large-scale data analysis. In: Çetintemel U, Zdonik SB, Kossmann D, Tatbul N, eds. Proc. of the ACM SIGMOD Int l Conf. on Management of Data (SIGMOD 2009). New York: ACM Press, [doi: / ] [37] BSP Worldwide. Co-Ordinating bulk synchronous parallel computing. [38] Condie T, Conway N, Alvaro P, Hellerstein JM, Gerth J, Talbot J, Elmeleegy K, Sears R. Online aggregation and continuous query support in MapReduce. In: Elmagarmid AK, Agrawal D, eds. Proc. of the 2010 ACM SIGMOD Conf. on Management of Data (SIGMOD 2010). New York: ACM Press, [doi: / ] [39] Aboulnaga A, Salem K, Soror AA, Minhas UF, Kokosielis P, Kamath S. Deploying database appliances in the cloud. IEEE Data Engineering Bulletin, 2009,32(1): [40] Das S, Nishimura S, Agrawal D, Abbadi AE. Albatross: Lightweight elasticity in shared storage databases for the cloud using live data migration. Proc. of the VLDB Endowment, 2011,4(8): [41] Cecchet E, Singh R, Sharma U, Shenoy PJ. Dolly: Virtualization-driven database provisioning for the cloud. In: Petrank E, Lea D, eds. Proc. of the 7th Int l Conf. on Virtual Execution Environments (VEE 2011). New York: ACM Press, [doi: / ] [42] Xiong PC, Chi Y, Zhu SH, Moon HJ, Pu C, Hacigümüs H. Intelligent management of virtualized resources for database systems in cloud environment. In: Abiteboul S, Böhm K, Koch C, Tan KL, eds. Proc. of the 27th Int l Conf. on Data Engineering (ICDE 2011). New York: IEEE Computer Society, [doi: /ICDE ] [43] Rogers J, Papaemmanouil O, Çetintemel U. A generic auto-provisioning framework for cloud databases. In: Proc. of the 4th Int l ICDE Workshop on Ranking in Databases (DBRank 2010). New York: IEEE Computer Society, [doi: / ICDEW ] [44] Cooper BF, Silberstein A, Tam E, Ramakrishnan R, Sears R. Benchmarking cloud serving systems with YCSB. In: Hellerstein JM, Chaudhuri S, Rosenblum M, eds. Proc. of the 1st ACM Symp. on Cloud Computing (SoCC 2010). New York: ACM Press, [doi: / ] [45] Shi YJ, Meng XF, Zhao J, Hu XM, Liu BB, Wang HP. Benchmarking cloud-based data management systems. In: Meng XF, Chen Y, Xu JL, Lu JH, eds. Proc. of the 2nd Int l CIKM Workshop on Cloud Data Management (CloudDB 2010). New York: ACM Press, [doi: / ] [46] Kossmann D, Kraska T, Loesing S. An evaluation of alternative architectures for transaction processing in the cloud. In: Elmagarmid AK, Agrawal D, eds. Proc. of the ACM SIGMOD Int l Conf. on Management of Data (SIGMOD 2010). New York: ACM Press, [doi: / ] [47] Wang JB, Wu S, Gao H, Li JZ, Ooi BC. Indexing multi-dimensional data in a cloud system. In: Elmagarmid AK, Agrawal D, eds. Proc. of the ACM SIGMOD Int l Conf. on Management of Data (SIGMOD 2010). New York: ACM Press, [doi: / ]

19 1166 Journal of Software 软件学报 Vol.23, No.5, May 2012 [48] Elmore AJ, Das S, Agrawal D, Abbadi AE. Zephyr: Live migration in shared nothing databases for elastic cloud platforms. In: Sellis TK, Miller RJ, Kementsietsidis A, Velegrakis Y, eds. Proc. of the ACM SIGMOD Int l Conf. on Management of Data (SIGMOD 2011). New York: ACM Press, [doi: / ] [49] Wang HZ, Li JZ, Wang JB, Gao H. Dirty data management in cloud database. In: Fiore S, Aloisio G, eds. Proc. of the Int l Conf. on Grid and Cloud Database Management. Berlin: Springer-Verlag, [doi: / _7] [50] Thakar A, Szalay AS, Church K, Terzis A. Large science databases Are cloud services ready for them? Scientific Programming, 2011,19(2-3): [doi: /SPR ] [51] Thakar A, Szalay AS. Migrating a (large) science database to the cloud. In: Hariri S, Keahey K, eds. Proc. of the 19th ACM Int l Symp. on High Performance Distributed Computing (HPDC 2010). New York: ACM Press, [doi: / ] 附中文参考文献 : [1] 陈康, 郑纬民. 云计算 : 系统实例与研究现状. 软件学报,2009,20(5): [doi: /SP.J ] [3] 冯登国, 张敏, 张妍, 徐震. 云计算安全研究. 软件学报,2011,22(1): [doi: / SP.J ] 林子雨 (1978-), 男, 吉林柳河人, 博士, 讲师,CCF 会员, 主要研究领域为数据库, 实时主动数据仓库, 数据挖掘. 谢怡 (1979-), 女, 博士, 讲师,CCF 会员, 主要研究领域为网络性能优化和安全技术, 系统建模与仿真, 软件开发. 赖永炫 (1981-), 男, 博士, 讲师, 主要研究领域为数据库, 传感器网络数据管理. 邹权 (1982-), 男, 博士, 讲师, 主要研究领域为生物信息学, 大规模数据挖掘. 林琛 (1982-), 女, 博士, 讲师,CCF 会员, 主要研究领域为数据挖掘, 信息检索, 社会网络分析.

水晶分析师

水晶分析师 大数据时代的挑战 产品定位 体系架构 功能特点 大数据处理平台 行业大数据应用 IT 基础设施 数据源 Hadoop Yarn 终端 统一管理和监控中心(Deploy,Configure,monitor,Manage) Master Servers TRS CRYSTAL MPP Flat Files Applications&DBs ETL&DI Products 技术指标 1 TRS

More information

长 安 大 学 硕 士 学 位 论 文 基 于 数 据 仓 库 和 数 据 挖 掘 的 行 为 分 析 研 究 姓 名 : 杨 雅 薇 申 请 学 位 级 别 : 硕 士 专 业 : 计 算 机 软 件 与 理 论 指 导 教 师 : 张 卫 钢 20100530 长安大学硕士学位论文 3 1 3系统架构设计 行为分析数据仓库的应用模型由四部分组成 如图3 3所示

More information

2013_6_3.indd

2013_6_3.indd 中 国 科 技 资 源 导 刊 ISSN 1674-1544 2013 年 11 月 第 45 卷 第 6 期 95-99, 107 CHINA SCIENCE & TECHNOLOGY RESOURCES REVIEW ISSN 1674-1544 Vol.45 No.6 95-99, 107 Nov. 2013 构 建 基 于 大 数 据 的 智 能 高 校 信 息 化 管 理 服 务 系 统

More information

Cloudy computing forEducation

Cloudy computing forEducation 规 模 企 业 的 云 之 旅 姜 大 勇 威 睿 信 息 技 术 ( 中 国 ) 有 限 公 司 2009 VMware Inc. All rights reserved 背 景 说 明 云 计 算 是 一 种 新 型 的 信 息 资 源 管 理 和 计 算 服 务 模 式, 是 继 大 型 计 算 机 个 人 电 脑 互 联 网 之 后 信 息 产 业 的 一 次 革 命 云 计 算 可 将 分

More information

Microsoft Word - 专论综述1.doc

Microsoft Word - 专论综述1.doc 1 高 速 公 路 大 数 据 处 理 现 状 与 挑 战 杨 仁 怀 1, 郎 川 萍 1, 刘 文 美 1 ( 四 川 交 通 职 业 技 术 学 院 计 算 机 工 程 系, 成 都 611130) 2 ( 四 川 省 交 通 运 输 厅 高 速 公 路 监 控 结 算 中 心, 成 都 610041) 2 摘 要 : 高 速 公 路 在 日 常 的 运 营 过 程 中, 产 生 了 海 量

More information

F4

F4 DOI:10.3969/j.issn.1009-6868.2016.01.002 网 络 出 版 地 址 :http://www.cnki.net/kcms/detail/34.1228.tn.20151117.1506.006.html Challenges and Countermeasures of Network Space Security 周 延 森 /ZHOU Yansen 周 琳 娜

More information

工程项目进度管理 西北工业大学管理学院 黄柯鑫博士 甘特图 A B C D E F G 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 甘特图的优点 : 直观明了 ( 图形化概要 ); 简单易懂 ( 易于理解 ); 应用广泛 ( 技术通用 ) 甘特图的缺点 : 不能清晰表示活动间的逻辑关系 WBS 责任分配矩阵 ( 负责〇审批

More information

<4D6963726F736F667420576F7264202D203631372D3632312032303133303430333030312DBACEC0F25FD0A3B6D4B8E55F2DB6FED0A32D2D2DC8A5B5F4CDBCD6D0B5C4BBD8B3B5B7FBBAC52E646F63>

<4D6963726F736F667420576F7264202D203631372D3632312032303133303430333030312DBACEC0F25FD0A3B6D4B8E55F2DB6FED0A32D2D2DC8A5B5F4CDBCD6D0B5C4BBD8B3B5B7FBBAC52E646F63> 第 4 卷 第 2 期 食 品 安 全 质 量 检 测 学 报 Vol. 4 No. 2 2013 年 4 月 Journal of Food Safety and Quality Apr., 2013 何 莉 *, 姜 笑 寒 ( 广 东 省 食 品 药 品 职 业 技 术 学 校, 广 州 510663) 摘 要 : 本 文 通 过 科 学 地 运 用 html5+jsp+sql 技 术, 建

More information

Microsoft Word - A201009-646.doc

Microsoft Word - A201009-646.doc # 中 国 网 络 游 戏 外 挂 问 题 现 状 分 析 * 兰 晓, 尹 杰 ( 中 国 传 媒 大 学 信 息 工 程 学 院 ) 摘 要 : 网 络 游 戏 外 挂 的 泛 滥 严 重 阻 碍 了 中 国 网 络 游 戏 产 业 的 正 常 发 展 本 文 给 出 了 网 络 游 戏 外 挂 的 定 义, 并 对 当 前 中 国 网 络 游 戏 存 在 的 安 全 问 题 进 行 了 分 析,

More information

Microsoft Word - sbs.doc

Microsoft Word - sbs.doc 精 品 资 源 共 享 课 推 荐 表 ( 本 科 类 ) 推 荐 单 位 仲 恺 农 业 工 程 学 院 所 属 学 校 仲 恺 农 业 工 程 学 院 ( 是 否 部 属 ) 否 课 程 名 称 数 据 库 原 理 及 应 用 课 程 类 型 理 论 课 ( 不 含 实 践 ) 理 论 课 ( 含 实 践 ) 实 验 ( 践 ) 课 所 属 一 级 学 科 名 称 所 属 二 级 学 科 名 称

More information

A API Application Programming Interface 见 应 用 程 序 编 程 接 口 ARP Address Resolution Protocol 地 址 解 析 协 议 为 IP 地 址 到 对 应 的 硬 件 地 址 之 间 提 供 动 态 映 射 阿 里 云 内

A API Application Programming Interface 见 应 用 程 序 编 程 接 口 ARP Address Resolution Protocol 地 址 解 析 协 议 为 IP 地 址 到 对 应 的 硬 件 地 址 之 间 提 供 动 态 映 射 阿 里 云 内 A API Application Programming Interface 见 应 用 程 序 编 程 接 口 ARP Address Resolution Protocol 地 址 解 析 协 议 为 IP 地 址 到 对 应 的 硬 件 地 址 之 间 提 供 动 态 映 射 阿 里 云 内 容 分 发 网 络 Alibaba Cloud Content Delivery Network 一

More information

文章首先对 云计算 环境下数字图书馆的概念 特点 原理等进行概述 然后根据 云计算 环境下图书馆数字资源安全性要求 对影响数字图书馆安全的诸多因素进行深入探讨 最后研究了云计算环境下数字图书馆数据安全 应用安全以及虚拟化安全面临的威胁及对策 云计算数字图书馆信息安全对策 本文系甘肃省教育厅 年度科研项目 移动计算环境下的数字图书馆建设研究 批准号 的研究成果之一 马晓亭 女 年生 兰州商学院信息工程学院副教授

More information

Azure_s

Azure_s Azure ? Azure Azure Windows Server Database Server Azure Azure Azure Azure Azure Azure Azure Azure OpenSource Azure IaaS Azure VM Windows Server Linux PaaS Azure ASP.NET PHP Node.js Python MS SQL MySQL

More information

科 研 信 息 化 技 术 与 应 用,2015, 6 (1) of identity and the framework of identity management, this paper analyses the development trend of Identity Management

科 研 信 息 化 技 术 与 应 用,2015, 6 (1) of identity and the framework of identity management, this paper analyses the development trend of Identity Management 科 研 信 息 化 技 术 与 应 用 2015, 6(1): 41 49 应 用 / APPLICATION 身 份 管 理 发 展 趋 势 和 中 国 科 学 院 身 份 管 理 系 统 薛 聪 1,2, 向 继 1 1, 高 能 1. 中 国 科 学 院 信 息 工 程 研 究 所 信 息 安 全 国 家 重 点 实 验 室, 北 京 100093 2. 中 国 科 学 院 大 学, 北 京

More information

Improving the Effectiveness of the Training of Civil Service by Applying Learning Science and Technology: The Case Study of the National Academy of Ci

Improving the Effectiveness of the Training of Civil Service by Applying Learning Science and Technology: The Case Study of the National Academy of Ci 善 用 學 習 科 技 提 升 公 務 人 員 培 訓 之 效 能 : 以 國 家 文 官 學 院 學 習 科 技 之 建 構 與 運 用 為 例 蔡 璧 煌 鍾 廣 翰 摘 要 公 務 人 員 的 素 質 代 表 一 國 國 力, 除 攸 關 國 家 施 政 外, 也 影 響 國 家 整 體 之 發 展, 因 此 如 何 善 用 學 習 科 技 協 助 公 務 人 員 培 訓 與 管 理, 未 來

More information

學 科 100% ( 為 單 複 選 題, 每 題 2.5 分, 共 100 分 ) 1. 請 參 閱 附 圖 作 答 : (A) 選 項 A (B) 選 項 B (C) 選 項 C (D) 選 項 D Ans:D 2. 下 列 對 於 資 料 庫 正 規 化 (Normalization) 的 敘

學 科 100% ( 為 單 複 選 題, 每 題 2.5 分, 共 100 分 ) 1. 請 參 閱 附 圖 作 答 : (A) 選 項 A (B) 選 項 B (C) 選 項 C (D) 選 項 D Ans:D 2. 下 列 對 於 資 料 庫 正 規 化 (Normalization) 的 敘 ITE 資 訊 專 業 人 員 鑑 定 資 料 庫 系 統 開 發 與 設 計 實 務 試 卷 編 號 :IDS101 注 意 事 項 一 本 測 驗 為 單 面 印 刷 試 題, 共 計 十 三 頁 第 二 至 十 三 頁 為 四 十 道 學 科 試 題, 測 驗 時 間 90 分 鐘 : 每 題 2.5 分, 總 測 驗 時 間 為 90 分 鐘 二 執 行 CSF 測 驗 系 統 -Client

More information

支付宝2011年 IT资产与费用预算

支付宝2011年 IT资产与费用预算 OceanBase 支 持 ACID 的 可 扩 展 关 系 数 据 库 qushan@alipay.com 2013 年 04 月 关 系 数 据 库 发 展 1970-72:E.F.Codd 数 据 库 关 系 模 式 20 世 纨 80 年 代 第 一 个 商 业 数 据 库 Oracle V2 SQL 成 为 数 据 库 行 业 标 准 可 扩 展 性 Mainframe: 小 型 机 =>

More information

30 2008,2(1) 基 礎 上, 各 種 數 據 均 以 圖 形 化 方 式 表 達, 因 此 各 級 分 析 結 果 均 可 以 隨 時 檢 驗 另 外, 由 於 系 統 是 以 網 站 形 式 發 佈, 任 何 用 戶 均 可 通 過 網 絡 查 詢 瀏 覽 系 統 中 的 數 據, 因

30 2008,2(1) 基 礎 上, 各 種 數 據 均 以 圖 形 化 方 式 表 達, 因 此 各 級 分 析 結 果 均 可 以 隨 時 檢 驗 另 外, 由 於 系 統 是 以 網 站 形 式 發 佈, 任 何 用 戶 均 可 通 過 網 絡 查 詢 瀏 覽 系 統 中 的 數 據, 因 第 2 卷 第 1 期 澳 門 科 技 大 學 學 報 Vol.2 No.1 2008 年 6 月 30 日 Journal of Macau University of Science and Technology June 30, 2008 29 月 球 探 測 數 據 實 時 管 理 系 統 的 開 發 朱 紅 岷 **, 祝 夢 華, 劉 良 鋼 *, 許 敖 敖 ( 澳 門 科 技 大 學

More information

标题

标题 第 33 卷 摇 第 9 期 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 014 年 9 月 情 摇 报 摇 杂 摇 志 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 JOURNAL OF INTELLIGENCE Vol. 33 摇 No. 9 Sep. 摇 014 基 于 专 利 的 大 数 据 技 术 发 展 情 报 * 分 析 及 战 略 研 究 1 1 李 鹏 飞 摇 卢 摇

More information

Microsoft Word - 201506定版

Microsoft Word - 201506定版 56 Chinese Journal of Library and Information Science for Traditional Chinese Medicine Dec. 2015 Vol. 39 No. 6 综 述 中 医 药 学 语 言 系 统 研 究 综 述 于 彤, 贾 李 蓉, 刘 静, 杨 硕 *, 董 燕, 朱 玲 中 国 中 医 科 学 院 中 医 药 信 息 研 究 所,

More information

CNAIS 2011

CNAIS 2011 指 纹 辨 识 云 端 差 勤 薪 资 系 统 之 研 究 朱 慧 德, 李 柏 澄, 林 韦 宇, 黄 予 谦, 林 昱 宏, 许 书 玮, 蔡 欣 融 德 明 财 经 科 技 大 学 信 息 科 技 系, 台 北 11451 摘 要 本 文 开 发 一 套 结 合 指 纹 辨 识 与 云 端 运 算 的 员 工 差 勤 薪 资 系 统, 可 让 员 工 以 指 纹 辨 识 的 方 式, 完 成

More information

目 录 简 介.3 ` 体 系 结 构...4 数 据 层...5 数 据 连 接 器...6 Tableau Server 组 件...7 网 关 / 负 载 平 衡 器...8 客 户 端 :Web 浏 览 器 和 移 动 应 用 程 序...8 客 户 端 :Tableau Desktop..

目 录 简 介.3 ` 体 系 结 构...4 数 据 层...5 数 据 连 接 器...6 Tableau Server 组 件...7 网 关 / 负 载 平 衡 器...8 客 户 端 :Web 浏 览 器 和 移 动 应 用 程 序...8 客 户 端 :Tableau Desktop.. Neelesh Kamkolkar, 产 品 经 理 Ellie Fields, 产 品 营 销 副 总 裁 Marc Rueter, 战 略 解 决 方 案 高 级 总 监 适 用 于 企 业 的 Tableau: IT 概 述 目 录 简 介.3 ` 体 系 结 构...4 数 据 层...5 数 据 连 接 器...6 Tableau Server 组 件...7 网 关 / 负 载 平 衡

More information

Microsoft Word - 103-4 記錄附件

Microsoft Word - 103-4 記錄附件 國 立 虎 尾 技 大 103 年 度 第 4 次 教 務 會 議 記 錄 附 件 中 華 民 國 104 年 6 月 16 日 受 文 者 : 國 立 虎 尾 技 大 發 文 日 期 : 中 華 民 國 104 年 5 月 28 日 發 文 字 號 : 臺 教 技 ( 二 ) 字 第 1040058590 號 速 別 : 最 速 件 密 等 及 解 密 條 件 或 保 密 期 限 : 附 件 :

More information

业 务 与 运 营 Business & Operation (Transform) 加 载 (Load) 至 目 的 端 的 过 程, 该 部 分 在 数 据 挖 掘 和 分 析 过 程 中 为 最 基 础 的 一 部 分 一 个 良 好 的 ETL 系 统 应 该 有 以 下 几 个 功 能 1

业 务 与 运 营 Business & Operation (Transform) 加 载 (Load) 至 目 的 端 的 过 程, 该 部 分 在 数 据 挖 掘 和 分 析 过 程 中 为 最 基 础 的 一 部 分 一 个 良 好 的 ETL 系 统 应 该 有 以 下 几 个 功 能 1 Business & Operation 业 务 与 运 营 大 数 据 技 术 在 精 准 营 销 中 的 应 用 王 小 鹏 北 京 东 方 国 信 科 技 股 份 有 限 公 司 北 京 100102 摘 要 简 要 介 绍 主 流 的 大 数 据 技 术 架 构 和 大 数 据 挖 掘 技 术 ; 阐 述 大 数 据 技 术 在 精 准 营 销 与 维 系 系 统 建 设 中 的 应 用,

More information

Microsoft Word - 专论综述1.doc

Microsoft Word - 专论综述1.doc 2016 年 第 25 卷 第 期 http://www.c-s-a.org.cn 计 算 机 系 统 应 用 1 基 于 节 点 融 合 分 层 法 的 电 网 并 行 拓 扑 分 析 王 惠 中 1,2, 赵 燕 魏 1,2, 詹 克 非 1, 朱 宏 毅 1 ( 兰 州 理 工 大 学 电 气 工 程 与 信 息 工 程 学 院, 兰 州 730050) 2 ( 甘 肃 省 工 业 过 程 先

More information

计 算 机 与 软 件 本 科 人 才 培 养 方 案 开 设 数 比 例 (%) 数 比 例 (%) 1 综 合 必 修 课 % % 2 必 修 课 % % 3 综 合 课 % % 公 共 课 0

计 算 机 与 软 件 本 科 人 才 培 养 方 案 开 设 数 比 例 (%) 数 比 例 (%) 1 综 合 必 修 课 % % 2 必 修 课 % % 3 综 合 课 % % 公 共 课 0 计 算 机 与 软 件 本 科 人 才 培 养 方 案 深 圳 大 网 络 工 程 本 科 人 才 培 养 方 案 2012 级 网 络 工 程 一 培 养 目 标 本 旨 在 培 养 具 有 良 好 的 科 素 养, 系 统 掌 握 计 算 机 基 础 知 识 以 及 计 算 机 网 络 软 硬 件 的 基 本 理 论 基 本 知 识 和 基 本 技 能 与 方 法, 掌 握 各 种 网 络 系

More information

科 研 信 息 化 技 术 与 应 用,2013, 4 (1) 1 背 景 毫 无 疑 问, 数 据 库 是 二 十 世 纪 人 类 科 学 技 术 最 伟 大 的 成 就 之 一 数 据 库 事 务 的 原 子 性 (Atomicity) 一 致 性 (Consistency) 隔 离 性 (Is

科 研 信 息 化 技 术 与 应 用,2013, 4 (1) 1 背 景 毫 无 疑 问, 数 据 库 是 二 十 世 纪 人 类 科 学 技 术 最 伟 大 的 成 就 之 一 数 据 库 事 务 的 原 子 性 (Atomicity) 一 致 性 (Consistency) 隔 离 性 (Is 科 研 信 息 化 技 术 与 应 用 2013, 4(1): 41 48 技 术 / TECHNOLOGY 海 量 结 构 化 数 据 存 储 管 理 系 统 OceanBase 阳 振 坤, 杨 传 辉, 李 震 阿 里 巴 巴, 北 京 100022 摘 要 : 关 键 词 : 数 据 库 是 现 代 社 会 十 分 关 键 的 基 础 设 施, 一 直 以 来, 数 据 库 的 扩 展 以

More information

白 皮 书 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 目 录 要 点 概 述...1 业 务 挑 战...2 Hadoop* 分 发 版 注 意 事 项...3 Hadoop* 基 础 架 构 注 意 事 项

白 皮 书 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 目 录 要 点 概 述...1 业 务 挑 战...2 Hadoop* 分 发 版 注 意 事 项...3 Hadoop* 基 础 架 构 注 意 事 项 IT@Intel 白 皮 书 英 特 尔 IT 部 门 大 数 据 和 商 业 智 能 2013 年 10 月 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 要 点 概 述 仅 在 五 周 之 内, 我 们 就 实 施 了 基 于 Apache Hadoop* 英 特 尔 分 发 版 的 低 成 本 可 完 全 实 现 的 大 数

More information

上海现代设计集团建筑协同设计平台研究与应用

上海现代设计集团建筑协同设计平台研究与应用 邓雪原 苏 昶 孙 朋 王国俭 上海交通大学土木工程系 上海 上海现代建筑设计 集团 有限公司 上海 本文首先分析了建筑 协同设计发展过程中存在的问题 指出建筑 协同设计的发展需要经过二维协同设计向三维协同设计的过渡 接着对适合于大型建筑设计企业的建筑 协同设计平台的关键问题进行了阐述 通过上海现代建筑设计集团一个实际工程项目 详细描述了建筑工程协同设计的方法与过程 然后对建筑协同设计的标准统一 工种协同等特点和高效沟通及超大项目的应用优势进行了讨论

More information

应 用 为 先, 统 筹 规 划 摘 要 : 总 体 上 看, 我 国 的 云 计 算 还 没 有 进 入 良 性 发 展 的 轨 道 目 前 的 形 势 是 政 府 比 企 业 积 极, 企 业 比 用 户 积 极, 大 企 业 比 中 小 企 业 积 极, 建 设 数 据 中 心 比 推 广 应

应 用 为 先, 统 筹 规 划 摘 要 : 总 体 上 看, 我 国 的 云 计 算 还 没 有 进 入 良 性 发 展 的 轨 道 目 前 的 形 势 是 政 府 比 企 业 积 极, 企 业 比 用 户 积 极, 大 企 业 比 中 小 企 业 积 极, 建 设 数 据 中 心 比 推 广 应 国 家 信 息 化 专 家 咨 询 委 员 会 2011 年 课 题 研 究 报 告 信 息 技 术 与 新 兴 产 业 专 业 委 员 会 内 部 资 料 注 意 保 存 应 用 为 先, 统 筹 规 划 对 政 府 引 领 云 计 算 健 康 发 展 的 建 议 国 家 信 息 化 专 家 咨 询 委 员 会 云 计 算 技 术 产 业 与 应 用 研 究 咨 询 课 题 组 二 〇 一 二 年

More information

山东省招生委员会

山东省招生委员会 附 件 2: 2012 年 度 山 东 大 学 精 品 课 程 申 报 表 课 程 名 称 课 程 负 责 人 所 属 院 系 网 站 建 设 与 设 计 连 莉 副 教 授 计 算 机 学 院 课 程 类 型 理 论 课 ( 不 含 实 践 ) 理 论 课 ( 含 实 践 ) 实 践 ( 验 ) 课 所 属 专 业 大 类 所 属 专 业 类 理 工 电 子 信 息 科 学 类 联 系 电 话 13256167020

More information

电力信息化2013年第1期.indb

电力信息化2013年第1期.indb 中图分类号 TP319 文献标志码 B 文章编号 1672-4844(213)1-87-6 摘要 SAP ERP 信息是很多大型企业的核心信息 是企业在进行容灾建设时主要关切的 信息 文章以双活方式运行的特点对 SAP ERP 信息进行了分析 推导出了 SAP ERP 信息以双活模式运行时操作响时间的计算公式 提出了影响操作响时间的主要因素是网 络时延 测试了 SAP ERP 产品以服务器双活模式运行的实际效果和以数据库双活

More information

????????

???????? 深度学习 项目简介 葛丽丽 译 西蒙菲沙大学 教育学院 富有想像力的教育研究中心 电邮 ierg-ed@sfu.ca 网址: http://www.ierg.net 基本思想 开学的第一个星期 每个学生都会接到一个任意布置的主题 从此将围绕这个主题 进行深度学习 这些主题可能包括 鸟 苹果 马戏团 火车 和 太阳系 等内容 在接下来的小学 初中以及高中阶段 除了基本课程以外 学 生将继续深入地学习指定的题目

More information

Microsoft PowerPoint - Big Data rc Sharing掃盲時間.ppt [相容模式]

Microsoft PowerPoint - Big Data rc Sharing掃盲時間.ppt [相容模式] Big Data RC Sharing 大數據掃盲 Service Planner of Enterprise Big Data 大 數 據 服 務 規 劃 師 企 業 大 數 據 課 程 規 劃 依 照 企 業 資 料 流 程 的 特 殊 性, 安 排 合 適 的 課 程 協 助 企 業 導 入 應 用 大 數 據 案 例 :Etu 資 策 會 平 安 保 險 湖 南 國 防 科 技 大 學 等

More information

目錄

目錄 資 訊 素 養 線 上 教 材 單 元 五 資 料 庫 概 論 及 Access 5.1 資 料 庫 概 論 5.1.1 為 什 麼 需 要 資 料 庫? 日 常 生 活 裡 我 們 常 常 需 要 記 錄 一 些 事 物, 以 便 有 朝 一 日 所 記 錄 的 事 物 能 夠 派 得 上 用 場 我 們 能 藉 由 記 錄 每 天 的 生 活 開 銷, 就 可 以 在 每 個 月 的 月 底 知

More information

201406002+大学计算机基础B.doc

201406002+大学计算机基础B.doc 目 录. 大 学 计 算 机 基 础 B( 非 独 立 设 课 ).... 计 算 机 操 作 基 础 ( 独 立 设 课 )...3 3. 程 序 设 计 基 础 ( 非 独 立 设 课 )...5 4. 面 向 对 象 程 序 设 计 ( 非 独 立 设 课 )...8 5. 数 据 库 原 理 ( 非 独 立 设 课 )...0 6. 算 法 设 计 与 分 析 ( 非 独 立 设 课 )...

More information

a b

a b 38 3 2014 5 Vol. 38 No. 3 May 2014 55 Population Research + + 3 100038 A Study on Implementation of Residence Permit System Based on Three Local Cases of Shanghai Chengdu and Zhengzhou Wang Yang Abstract

More information

软 件 工 程 专 业 习 指 南 目 录 一 软 件 工 程 专 业 设 置 背 景 与 发 展 前 景... 3 二 软 件 工 程 专 业 实 践 教 条 件... 4 三 软 件 工 程 专 业 课 程 类 型 及 核 方 式... 6 1. 软 件 工 程 专 业 课 程 类 型...7

软 件 工 程 专 业 习 指 南 目 录 一 软 件 工 程 专 业 设 置 背 景 与 发 展 前 景... 3 二 软 件 工 程 专 业 实 践 教 条 件... 4 三 软 件 工 程 专 业 课 程 类 型 及 核 方 式... 6 1. 软 件 工 程 专 业 课 程 类 型...7 计 算 机 系 软 件 工 程 专 业 习 指 南 广 东 科 技 院 计 算 机 系 2015-9-1 软 件 工 程 专 业 习 指 南 目 录 一 软 件 工 程 专 业 设 置 背 景 与 发 展 前 景... 3 二 软 件 工 程 专 业 实 践 教 条 件... 4 三 软 件 工 程 专 业 课 程 类 型 及 核 方 式... 6 1. 软 件 工 程 专 业 课 程 类 型...7

More information

2011年上海市高校精品课程申报表(本科)

2011年上海市高校精品课程申报表(本科) 2012 年 度 上 海 高 校 市 级 精 品 课 程 申 报 表 ( 本 科 ) 学 校 名 称 课 程 名 称 课 程 类 型 上 海 电 机 学 院 数 据 库 原 理 及 应 用 理 论 课 ( 不 含 实 践 ) 理 论 课 ( 含 实 践 ) 实 验 ( 践 ) 课 所 属 一 级 学 科 名 称 工 学 所 属 二 级 学 科 名 称 课 程 负 责 人 计 算 机 科 学 与 技

More information

报 告 1: 郑 斌 教 授, 美 国 俄 克 拉 荷 马 大 学 医 学 图 像 特 征 分 析 与 癌 症 风 险 评 估 方 法 摘 要 : 准 确 的 评 估 癌 症 近 期 发 病 风 险 和 预 后 或 者 治 疗 效 果 是 发 展 和 建 立 精 准 医 学 的 一 个 重 要 前

报 告 1: 郑 斌 教 授, 美 国 俄 克 拉 荷 马 大 学 医 学 图 像 特 征 分 析 与 癌 症 风 险 评 估 方 法 摘 要 : 准 确 的 评 估 癌 症 近 期 发 病 风 险 和 预 后 或 者 治 疗 效 果 是 发 展 和 建 立 精 准 医 学 的 一 个 重 要 前 东 北 大 学 中 荷 生 物 医 学 与 信 息 工 程 学 院 2016 年 度 生 物 医 学 与 信 息 工 程 论 坛 会 议 时 间 2016 年 6 月 8 日, 星 期 三,9:30 至 16:00 会 议 地 址 会 议 网 址 主 办 单 位 东 北 大 学 浑 南 校 区 沈 阳 市 浑 南 区 创 新 路 195 号 生 命 科 学 大 楼 B 座 619 报 告 厅 http://www.bmie.neu.edu.cn

More information

<4D6963726F736F667420576F7264202D20B5E7D7D3C9CCCEF1D7A8D2B5C5E0D1F8B7BDB0B8D0DEB6C1D6B8C4CFA3A832303136BCB6A3A92E646F63>

<4D6963726F736F667420576F7264202D20B5E7D7D3C9CCCEF1D7A8D2B5C5E0D1F8B7BDB0B8D0DEB6C1D6B8C4CFA3A832303136BCB6A3A92E646F63> 福 州 大 校 训 博 远 志 明 德 至 诚 目 录 福 州 大 大 英 语 课 程 教 实 施 方 案 1 福 州 大 大 信 息 技 术 基 础 分 级 教 实 施 方 案 2 电 子 商 务 专 业 培 养 方 案 3 电 子 商 务 专 业 简 介 10 培 养 方 案 解 读 16 管 理 院 电 子 商 务 专 业 课 程 安 排 表 21 福 州 大 大 英 语 课 程 教 实 施

More information

2

2 自主设置目录外二级学科备案表 2012 11 6 中国地质大学 1 0 4 9 1 0 8 1 8 z 3 地学信息工程 Geosciences Information Engineering 0 8 1 8 地质资源与地质工程 学科概况简要描述 ( 主要包括学科内涵 研究内容 ) 1 2 该学科学术带头人和学术梯队简介 1945-10 19 11 15 8 1975-03 2002-06 7 7

More information

背 景 概 述 企 业 需 要 一 种 灵 活 的 平 台 来 快 速 构 建 测 试 和 扩 展 新 的 应 用 程 序 服 务 并 对 市 场 中 发 生 的 数 字 化 变 革 作 出 反 应 数 字 化 变 革 正 在 加 快 步 伐, 因 为 流 程 和 信 息 的 日 益 融 合 带 来

背 景 概 述 企 业 需 要 一 种 灵 活 的 平 台 来 快 速 构 建 测 试 和 扩 展 新 的 应 用 程 序 服 务 并 对 市 场 中 发 生 的 数 字 化 变 革 作 出 反 应 数 字 化 变 革 正 在 加 快 步 伐, 因 为 流 程 和 信 息 的 日 益 融 合 带 来 白 皮 书 平 台 即 服 务 : 助 力 实 现 数 字 化 转 型 赞 助 商 :Oracle Robert P. Mahowald 2015 年 1 月 Larry Carvalho 执 行 概 要 传 统 业 务 模 式 正 在 受 到 为 客 户 提 供 多 渠 道 数 字 体 验 的 新 业 务 模 式 的 越 来 越 强 烈 的 冲 击 IDC 预 测, 到 2015 年, 在 营 销

More information

Microsoft Word - 资源空间模型-New.doc

Microsoft Word - 资源空间模型-New.doc 人 类 生 活 空 间 与 分 类 互 联 网 资 源 空 间 模 型 诸 葛 海 物 以 类 聚, 人 以 群 分 互 联 网 资 源 应 以 类 来 管 理 并 提 供 有 效 服 务 人 类 生 活 在 一 个 具 有 资 源 多 样 性 的 空 间 里 为 了 有 效 管 理 形 形 色 色 的 资 源, 人 们 使 用 了 多 种 分 类 方 法 并 发 明 了 各 种 分 类 工 具 例

More information

Microsoft Word - 互联网物联网探索-讲习班.doc

Microsoft Word - 互联网物联网探索-讲习班.doc 中 国 计 算 机 学 会 学 科 前 沿 讲 习 班 The CCF Advanced Disciplines Lectures 第 51 期 互 联 网 与 物 联 网 的 新 探 索 2014 年 9 月 19-21 日 上 海 本 期 CCF 学 科 前 沿 讲 习 班 互 联 网 与 物 联 网 的 新 探 索 邀 请 到 了 互 联 网 和 物 联 网 领 域 重 量 级 的 专 家 学

More information

IBM中国高校合作项目新闻

IBM中国高校合作项目新闻 2009 年 5-6 月 IBM 大 学 合 作 项 目 新 闻 双 月 报 大 学 合 作 项 目 新 闻 2009 年 (5-6 月 刊 ) 总 第 15 期 IBM 大 学 合 作 部 E-mail mail: ibmur@cn.ibm.com 联 系 电 话 : 010-63612203 热 点 新 闻 IBM 大 中 华 区 董 事 长 周 伟 焜 先 生 拜 访 教 育 部 周 济 部

More information

标题

标题 012 Journal of Library Science in China 嘉 兴 模 式 的 延 伸 与 深 化 : 从 总 分 馆 体 系 到 图 书 馆 服 务 体 系 李 超 平 摘 要 嘉 兴 模 式 包 含 两 个 体 系 : 一 是 以 总 分 馆 为 核 心 的 公 共 图 书 馆 服 务 体 系, 二 是 跨 系 统 的 图 书 馆 服 务 联 盟 体 系 研 究 发 现, 从

More information

旅游科学

旅游科学 旅 游 科 学 王春雷 会展专业人才培养模式是一个院校对于会展办学的整体设计 因而需要进行系统性的构建 但目前这方面的研究成果不多 更缺乏实证性的研究 本 文基于文献综述的发现和会展专业的特点 从理论上构建了一个项目驱动型会展 专业人才培养模式的基本框架 进而以上海师范大学会展经济与管理专业为例 侧重从教育理念 培养目标 培养过程 培养制度和培养评价等方面进行了实证研究 项目驱动型 会展专业 人才培养模式

More information

Microsoft Word - 王彬_已修改_.doc

Microsoft Word - 王彬_已修改_.doc 第 39 卷 第 1 期 应 用 科 技 Vol.39, No.1 2012 年 2 月 Applied Science and Technology Feb. 2012 doi:10.3969/j.issn.1009-671x.201110009 基 于 J2EE 网 络 教 学 系 统 的 设 计 与 实 现 李 静 梅, 王 彬, 彭 晴 晴 哈 尔 滨 工 程 大 学 计 算 机 科 学 与

More information

2013国际营销科学与信息技术大会(MSIT2013)

2013国际营销科学与信息技术大会(MSIT2013) 2013 国 际 营 销 科 学 与 信 息 技 术 大 会 (MSIT2013) 邀 请 函 随 着 全 球 市 场 环 境 的 不 断 变 化 和 网 络 信 息 技 术 的 日 新 月 异, 营 销 科 学 和 营 销 方 式 的 创 新 对 于 企 业 的 发 展 起 着 越 来 越 大 的 作 用 为 了 进 一 步 推 动 国 内 外 营 销 学 者 的 学 术 交 流 与 合 作, 促

More information

第 02 期 1 医 疗 信 息 现 状 20% EMR Electronic Medical Record HIS HIS [1-2] 40 2011 张 肖 等 : 基 于 大 数 据 的 医 疗 健 康 创 新 应 用 2 大 数 据 环 境 下 医 疗 数 据 特 征 分 析 PC [3]

第 02 期 1 医 疗 信 息 现 状 20% EMR Electronic Medical Record HIS HIS [1-2] 40 2011 张 肖 等 : 基 于 大 数 据 的 医 疗 健 康 创 新 应 用 2 大 数 据 环 境 下 医 疗 数 据 特 征 分 析 PC [3] 电 子 科 学 技 术 电 第 02 子 科 卷 学 第 技 02 术 期 Electronic 2015 年 Science 3 月 & Technology Electronic Science & Technology Vol.02 No.02 Mar.2015 年 基 于 大 数 据 的 医 疗 健 康 创 新 应 用 张 肖, 杨 锦 洲, 王 志 勇 ( 中 国 联 通 研 究 院, 北

More information

é ê

é ê 廖光洪 朱小华 杨成浩 徐晓华 基于南海 年夏季调查航次诊断计算的流函数场 选取越南以东偶极子发生海域 进行 不同的声层析观测站位设置实验 模拟计算声线传播时间信息 然后应用基函数重建方法进行了 流函数场的模拟反演研究 讨论了不同随机观测误差对反演结果的影响 研究结果表明该方法是 可行的 在所选取的约 海域内 在观测海域外围配置 个声层析观测站位就能够很好地重构原流函数场 空间分辨率约为 可以分辨模拟海域中尺度涡场结构

More information

人民邮电

人民邮电 第 3 章 云 端 漫 步 云 计 算 是 一 种 全 新 网 络 服 务 方 式, 将 传 统 的 以 桌 面 为 核 心 的 任 务 处 理 转 变 为 以 网 络 为 核 心 的 任 务 处 理, 利 用 互 联 网 实 现 自 己 想 要 完 成 的 一 切 处 理 任 务, 使 网 络 成 为 传 递 服 务 计 算 力 和 信 息 的 综 合 媒 介, 真 正 实 现 按 需 计 算 多

More information

,,.,, : 1),,,,, 2),,,,, 3),,,,,,,,,, [6].,,, ( ),, [9], : 1), 2),,,,, 3),,, 2.,, [10].,,,,,,,,, [11]. 2.1,, [12],, ;, ; Fig. 1 1 Granular hier

,,.,, : 1),,,,, 2),,,,, 3),,,,,,,,,, [6].,,, ( ),, [9], : 1), 2),,,,, 3),,, 2.,, [10].,,,,,,,,, [11]. 2.1,, [12],, ;, ; Fig. 1 1 Granular hier 36 7 Vol. 36, No. 7 2010 7 ACTA AUTOMATICA SINICA July, 2010 1, 2 1, 2, 3 1, 2,,,,,,, DOI,,, 10.3724/SP.J.1004.2010.00923 Distributed Simulation System Hierarchical Design Model Based on Quotient Space

More information

% %

% % 兼论 上海城市人文历史地图的制作和运用 苏智良! 吴俊范 #! 由于地理学与历史学之间存在着学科分野的界限 致使已往的 景观概念缺乏全面性 其结果是 不仅地理学的景观研究缺少历史的底蕴与含量 而且历史学领域内系统的景观史研究也一直处于缺失状态 本文分别从宏观的理论角度和以 上海城市人文历史地图为中心例证 探讨在新的景观概念基础上和现代科学技术条件下 研究区域景观史的必要性 可行性以及具体的研究路径与操作方法

More information

理 成 可 做 關 聯 分 析 的 格 式, 再 應 用 統 計 統 計 計 算 軟 體 R (R Core Team, 2013) 中 的 延 伸 套 件 arules (Hahsler, Gruen, and Hornik, 2005; Hahsler, Buchta, Gruen, and H

理 成 可 做 關 聯 分 析 的 格 式, 再 應 用 統 計 統 計 計 算 軟 體 R (R Core Team, 2013) 中 的 延 伸 套 件 arules (Hahsler, Gruen, and Hornik, 2005; Hahsler, Buchta, Gruen, and H 連 鎖 輕 食 店 之 產 品 關 聯 分 析 - 以 茗 人 為 例 Association Analysis of Deli Chain Example of MingZen 摘 要 所 謂 關 聯 分 析, 就 是 從 商 店 銷 售 交 易 資 料 庫 中, 找 出 項 目 之 間 的 關 聯 性, 並 探 勘 出 在 資 料 間 具 有 相 關 性 的 隱 藏 規 則 有 趣 的 是, 商

More information

计 算 机 系 统 应 用 http://www.c-s-a.org.cn 2016 年 第 25 卷 第 1 期 的 编 程 语 言 Giotto [9] 编 写 控 制 程 序, 可 以 方 便 的 控 制 程 序 的 逻 辑 执 行 时 间, 从 而 使 得 任 务 时 间 的 依 赖 关 系

计 算 机 系 统 应 用 http://www.c-s-a.org.cn 2016 年 第 25 卷 第 1 期 的 编 程 语 言 Giotto [9] 编 写 控 制 程 序, 可 以 方 便 的 控 制 程 序 的 逻 辑 执 行 时 间, 从 而 使 得 任 务 时 间 的 依 赖 关 系 1 基 于 PRET 的 编 程 模 型 李 晓 飞, 陈 香 兰 ( 中 国 科 学 技 术 大 学 计 算 机 学 院, 合 肥 230039) 摘 要 : 时 间 可 预 测 性 在 信 息 物 理 系 统 设 计 领 域 正 变 得 越 来 越 重 要, 目 前 时 间 可 预 测 性 系 统 的 设 计 分 为 编 程 模 型 和 体 系 结 构 两 个 层 次, 编 程 模 型 的 研

More information

标题

标题 2016 年 5 月 西 南 民 族 大 学 学 报 ( 自 然 科 学 版 ) 第 423 卷 期 第 3 期 Journal 谢 of 琪 Southwest ꎬ 等 :C++ University 程 序 设 计 for 实 Nationalities( 验 教 学 微 课 Natural 的 设 计 Science 与 实 现 Edition) May 2016 Vol 42 No 3 doi:10

More information

孟 祥 萍, 等 HBase 在 智 能 电 网 异 构 数 据 同 步 中 的 应 用 - 123 - 步 最 后, 对 异 构 数 据 同 步 到 数 据 中 心 的 性 能 进 行 了 测 试, 验 证 了 本 文 所 提 方 案 的 可 行 性, 在 探 索 未 来 智 能 电 网 大 数

孟 祥 萍, 等 HBase 在 智 能 电 网 异 构 数 据 同 步 中 的 应 用 - 123 - 步 最 后, 对 异 构 数 据 同 步 到 数 据 中 心 的 性 能 进 行 了 测 试, 验 证 了 本 文 所 提 方 案 的 可 行 性, 在 探 索 未 来 智 能 电 网 大 数 第 43 卷 第 24 期 电 力 系 统 保 护 与 控 制 Vol.43 No.24 2015 年 12 月 16 日 Power System Protection and Control Dec. 16, 2015 HBase 在 智 能 电 网 异 构 数 据 同 步 中 的 应 用 孟 祥 萍 1, 周 来 2, 王 晖 1, 纪 秀 (1. 长 春 工 程 学 院 电 气 与 信 息

More information

中国媒体发展研究报告

中国媒体发展研究报告 中 国 媒 体 发 展 研 究 报 告 (2005 年 卷 ) 武 汉 大 学 媒 体 发 展 研 究 中 心 武 汉 大 学 新 闻 与 传 播 学 院 武 汉 大 学 新 闻 传 播 与 媒 介 化 社 会 创 新 基 地 主 办 编 委 会 成 员 主 编 罗 以 澄 张 金 海 单 波 执 行 主 编 张 金 海 强 月 新 编 委 ( 以 姓 氏 笔 画 为 序 ) 王 松 茂 石 义 彬

More information

填 写 要 求 一 以 word 文 档 格 式 如 实 填 写 各 项 二 表 格 文 本 中 外 文 名 词 第 一 次 出 现 时, 要 写 清 全 称 和 缩 写, 再 次 出 现 时 可 以 使 用 缩 写 三 涉 密 内 容 不 填 写, 有 可 能 涉 密 和 不 宜 大 范 围 公

填 写 要 求 一 以 word 文 档 格 式 如 实 填 写 各 项 二 表 格 文 本 中 外 文 名 词 第 一 次 出 现 时, 要 写 清 全 称 和 缩 写, 再 次 出 现 时 可 以 使 用 缩 写 三 涉 密 内 容 不 填 写, 有 可 能 涉 密 和 不 宜 大 范 围 公 2013 年 度 上 海 高 校 市 级 精 品 课 程 申 报 表 ( 本 科 ) 学 校 名 称 东 华 大 学 课 程 名 称 计 算 机 系 统 与 网 络 技 术 课 程 类 型 理 论 课 ( 不 含 实 践 ) 理 论 课 ( 含 实 践 ) 实 验 ( 践 ) 课 所 属 一 级 学 科 名 称 所 属 二 级 学 科 名 称 课 程 负 责 人 申 报 日 期 工 科 计 算 机

More information

untitled

untitled 1. 95 年 度 2 老 2 老 8 10 11 理 4 2007.3.12 2. 更 Cisco 2960 switch 路 更 路 更 路 更 更 NIS 狀 料 兩 數 Visual Studio Standard.net 2005 老 2007.4.19 Panel talk 行 95 年 度 良 老 葉 羅 老 45 參 行 領 力 立 C 行 力 行 路 力 95 年 度 路 97 年

More information

# # # # # # # # #

# # # # # # # # # 实现政治问责的三条道路 马 骏 建立一个对人民负责的政府是现代国家治理的核心问题 实现这一目标 需要解决两个最基本的问题 谁来使用权力 如何使用权力 选举制度是解决前一问题相对较好的制度 而预算制度是解决第二个问题最好的制度 通过历史比较分析 可以总结出三条实现政治问责的道路 世纪的欧洲道路 从建国到进步时代改革的美国道路以及雏形初现的中国道路 这意味着 西方经验并不是唯一的实现政治问责的道路 相对于西方经验来说

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 Hadoop 生 态 技 术 在 阿 里 全 网 商 品 搜 索 实 战 阿 里 巴 巴 - 王 峰 自 我 介 绍 真 名 : 王 峰 淘 宝 花 名 : 莫 问 微 博 : 淘 莫 问 2006 年 硕 士 毕 业 后 加 入 阿 里 巴 巴 集 团 淘 及 搜 索 事 业 部 ( 高 级 技 术 与 家 ) 目 前 负 责 搜 索 离 线 系 统 团 队 技 术 方 向 : 分 布 式 计 算

More information

2. 2001-2008 IT 3. 2008 1. 2008 2. ebay PayPal B2B B2C ebay ebay 3 120 20 Paypal 3. 4 2014 9

2. 2001-2008 IT 3. 2008 1. 2008 2. ebay PayPal B2B B2C ebay ebay 3 120 20 Paypal 3. 4 2014 9 2014 9 * 200020 F713. 36 A 1005-1309 2014 09-0003 - 016 cross-border electronic commerce 2008 2012 150 30% 1. 1998-2001 2014-08 - 28 * 2014 3 2. 2001-2008 IT 3. 2008 1. 2008 2. ebay PayPal B2B B2C ebay

More information

XXX专业本科人才培养方案

XXX专业本科人才培养方案 计 算 机 科 学 与 技 术 专 业 本 科 人 才 培 养 方 案 (Computer Science and Technology 080901) 一 培 养 目 标 本 专 业 培 养 德 智 体 美 全 面 发 展, 具 有 良 好 的 科 学 与 人 文 素 养, 熟 悉 经 济 管 理 法 律 等 相 关 基 础 知 识, 系 统 地 掌 握 计 算 机 硬 件 软 件 方 面 的 基

More information

Microsoft Word - 1-編者的話

Microsoft Word - 1-編者的話 民 國 105 年 06 月 pp.91-100 創 新 服 務 模 式 的 均 衡 膳 食 智 能 配 膳 創 新 服 務 模 式 的 均 衡 膳 食 智 能 配 膳 Innovative Service Model of Smart Dietitians 邱 麗 玲 1 Li-Ling Chiu 1 長 庚 學 校 財 團 法 人 長 庚 科 技 大 學 民 生 學 院 保 健 營 養 系 暨

More information

Total Internet Connectivity in a Single Chip

Total Internet Connectivity in a Single Chip 基 于 SX 微 处 理 器 的 嵌 入 式 Internet 技 术 乐 德 广 及 其 应 用 系 统 的 设 计 1 1, 郭 东 辉, 刘 瑞 堂 1, Gerard Parr 2 1. 厦 门 大 学 技 术 物 理 研 究 所 厦 门 361005 2. 英 国 Ulster 大 学 信 息 学 院 N.Ireland, BT52 1SA 摘 要 : SX 微 处 理 器 是 美 国 Scenix

More information

Reducing Client Incidents through Big Data Predictive Analytics

Reducing Client Incidents through Big Data Predictive Analytics IT@lntel 白 皮 书 英 特 尔 IT 部 门 IT 最 佳 实 践 大 数 据 预 测 分 析 2013 年 12 月 通 过 大 数 据 预 测 分 析 减 少 客 户 端 事 故 总 体 概 述 相 比 过 去 的 被 动 反 应, 我 们 现 在 能 够 更 容 易 主 动 找 出 客 户 端 问 题, 并 及 时 将 其 修 复 以 免 问 题 扩 大, 从 而 为 企 业 节 约

More information

小论文草稿2_邓瀚

小论文草稿2_邓瀚 城 市 轨 道 交 通 列 车 运 行 控 制 系 统 仿 真 分 析 平 台 的 设 计 邓 瀚 1 赵 霞 1 张 琼 燕 2 刘 循 2 (1. 上 海 交 通 大 学 自 动 化 系, 系 统 控 制 与 信 息 处 理 教 育 部 重 点 实 验 室, 上 海,200240;2. 上 海 申 通 地 铁 股 份 有 限 公 司, 上 海,201103) 摘 要 文 章 设 计 了 一 种

More information

PureSCM enhances competitive advantage with an integrated approach to IT service level management

PureSCM enhances competitive advantage with an integrated approach to IT service level management ఱઓ߅ ښ PureSCM 使用集成的 IT 服 务级别管理方法增强竞争 优势 行业 IT 服务 公司 PureSCM 员工 40 收入 400 万美元 ఱઓ ቲጓǖIT 服务 ǖpurescm Ꮛ ǖ40 ၃ ǖ400 万美元 ጓᇗ PureSCM 是一家服务级别 管理专业公司和软件开发 公司 办事处设在加拿 大 美国和哥伦比亚 ᄞᐵ 为了帮助客户解决他们的 业务挑战 PureSCM 需要 提供集成的

More information

<4D6963726F736F667420576F7264202D20B8BDBCFE3220BDCCD3FDB2BFD6D8B5E3CAB5D1E9CAD2C4EAB6C8BFBCBACBB1A8B8E6A3A8C4A3B0E5A3A92E646F6378>

<4D6963726F736F667420576F7264202D20B8BDBCFE3220BDCCD3FDB2BFD6D8B5E3CAB5D1E9CAD2C4EAB6C8BFBCBACBB1A8B8E6A3A8C4A3B0E5A3A92E646F6378> 批 准 立 项 年 份 2007 通 过 验 收 年 份 2013 教 育 部 重 点 实 验 室 年 度 报 告 ( 2015 年 1 月 2015 年 12 月 ) 实 验 室 名 称 : 机 器 智 能 与 先 进 计 算 教 育 部 重 点 实 验 室 实 验 室 主 任 : 张 军 实 验 室 联 系 人 / 联 系 电 电 : 詹 志 辉 /13826089486 E-mail 地 址

More information

ebook 132-2

ebook 132-2 2 SQL Server 7.0 SQL Server SQL Server 7 SQL Server 7 5 2.1 SQL Server 7 SQL Server 7 SQL Server SQL Server SQL Server 2.1.1 SQL Server Windows NT/2000 Windows 95/98 ( r a n d o m access memory R A M )

More information

Microsoft Word - A201308-574_1378309423.doc

Microsoft Word - A201308-574_1378309423.doc 5 10 15 20 25 # 基 于 代 码 生 成 的 web 快 速 开 发 平 台 设 计 陈 中 举, 罗 蓉 蓉 ( 长 江 大 学 计 算 机 科 学 学 院, 湖 北 荆 州 434023) 摘 要 : 基 于 数 据 模 型 驱 动 的 代 码 生 成 技 术, 设 计 和 实 现 了 一 个 web 快 速 开 发 平 台 平 台 具 有 较 强 的 通 用 性 和 扩 展 性,

More information

01

01 ZEBRA 技术白皮书 条码编码 101 相关知识介绍 引言 20 70 数据 80 20 90 (JIT) AIAG EIA HIBCC HAZMAT 条码的优势提高数据准确性 99% 85% / / 提升效率 / 2 Zebra Technologies 保持一致性 ID 改进库存和资产管理 成本 / 效益分析 ID ID ID (ERP) RFID Zebra Technologies 3 ID

More information

Microsoft Word - 793-797 tb20150504赵宏宇s-高校教改纵横.doc

Microsoft Word - 793-797 tb20150504赵宏宇s-高校教改纵横.doc 微 生 物 学 通 报 Microbiology China tongbao@im.ac.cn Apr. 20, 2016, 43(4): 793 797 http://journals.im.ac.cn/wswxtbcn DOI: 10.13344/j.microbiol.china.150504 高 校 教 改 纵 横 生 物 工 程 专 业 发 酵 课 程 群 建 设 探 索 * 赵 宏 宇

More information

132 包 装 工 程 2016 年 5 月 网 产 品 生 命 周 期 是 否 有 与 传 统 产 品 生 命 周 期 曲 线 相 关 的 类 似 趋 势 旨 在 抛 砖 引 玉, 引 起 大 家 对 相 关 问 题 的 重 视, 并 为 进 一 步 研 究 处 于 不 同 阶 段 的 互 联 网

132 包 装 工 程 2016 年 5 月 网 产 品 生 命 周 期 是 否 有 与 传 统 产 品 生 命 周 期 曲 线 相 关 的 类 似 趋 势 旨 在 抛 砖 引 玉, 引 起 大 家 对 相 关 问 题 的 重 视, 并 为 进 一 步 研 究 处 于 不 同 阶 段 的 互 联 网 第 37 卷 第 10 期 包 装 工 程 2016 年 5 月 PACKAGING ENGINEERING 131 传 统 产 品 生 命 周 期 曲 线 对 互 联 网 产 品 适 应 性 探 究 田 姣, 刘 吉 昆 ( 清 华 大 学, 北 京 100084) 摘 要 : 目 的 探 讨 传 统 产 品 生 命 周 期 曲 线 对 于 互 联 网 产 品 生 命 周 期 是 否 依 然 适

More information

标题

标题 第 41 卷 第 6 期 应 用 科 技 Vol.41.6 2014 年 12 月 Applied Science and Technology Dec. 2014 doi: 10.3969 / j.issn.1009 671X.201403012 Web 浏 览 器 下 的 智 能 视 频 数 据 库 设 计 与 开 发 刘 丽 斐 1 1, 2, 赵 龙 1. 北 京 航 空 航 天 大 学 数

More information

Partition Key: 字 符 串 类 型, 表 示 当 前 Entity 的 分 区 信 息 这 个 Property 对 于 Table Service 自 动 纵 向 和 横 向 扩 展 至 关 重 要 Row Key: 字 符 串 类 型, 在 给 定 Partition Key 的

Partition Key: 字 符 串 类 型, 表 示 当 前 Entity 的 分 区 信 息 这 个 Property 对 于 Table Service 自 动 纵 向 和 横 向 扩 展 至 关 重 要 Row Key: 字 符 串 类 型, 在 给 定 Partition Key 的 4.2 使 用 Table Service Table Service 相 对 来 说 是 三 个 Storage Service 中 最 好 理 解 和 最 易 于 接 受 的, 它 主 要 用 来 存 储 结 构 化 数 据 但 是 Table Service 却 并 不 是 一 个 关 系 型 数 据 库 Table Service 由 两 个 部 分 组 成 :Table 和 Entity

More information

untitled

untitled LBS Research and Application of Location Information Management Technology in LBS TP319 10290 UDC LBS Research and Application of Location Information Management Technology in LBS , LBS PDA LBS

More information

CH01.indd

CH01.indd 3D ios Android Windows 10 App Apple icloud Google Wi-Fi 4G 1 ( 3D ) 2 3 4 5 CPU / / 2 6 App UNIX OS X Windows Linux (ios Android Windows 8/8.1/10 BlackBerry OS) 7 ( ZigBee UWB) (IEEE 802.11/a/b/g/n/ad/ac

More information

附3

附3 普 通 高 等 学 校 本 科 专 业 设 置 申 请 表 ( 备 案 专 业 适 用 ) 080910T 3-6 2 016 7 6 4884878 目 录 填 表 说 明 ⒈ ⒉ ⒊ ⒋ ⒌ 1. 普 通 高 等 学 校 增 设 本 科 专 业 基 本 情 况 表 080910T 3-6 1978 36 ( 1978) ( 2008) 2017 60 120 / S J ⒉ 学 校 基 本 情

More information

抗日战争研究 # 年第 期 % % % # % % % % # # # # # #

抗日战争研究 # 年第 期 % % % # % % % % # # # # # # 林 星 在以往的抗战内迁研究中 人们多关注中国沿海地区政府机构 工厂 学校 银行等向西南地区的迁移及其影响 但内迁还有一个重要构成部分 即在本省范围内的迁移 抗战爆发 后 随着省会迁往内地山区 东南沿海省份的工厂 学校 银行等纷纷迁移到本省内地山区 给当地 社会发展注入了新的活力 对内地城市现代化以及本省区域内城市体系的变动产生了深远的影响 为抗战的最终胜利提供了支持 然而内地城市的这种发展随着抗战结束后的回迁而又趋于沉寂

More information

76 34 2. 1. 1 Fig. 1 1 a-a b-b a-a σ ma = 74. 4 MPa σ a = 15. 74 MPa σ 0a =90. 15 MPa 0. 9 σ t =135 MPa b-b σ mb = 21. 77 MPa τ b = 13. 789 MPa σ 0b =

76 34 2. 1. 1 Fig. 1 1 a-a b-b a-a σ ma = 74. 4 MPa σ a = 15. 74 MPa σ 0a =90. 15 MPa 0. 9 σ t =135 MPa b-b σ mb = 21. 77 MPa τ b = 13. 789 MPa σ 0b = 34 11 2012 11 SHIP SCIENCE AND TECHNOLOGY Vol. 34 No. 11 Nov. 2012 0 430064 GB150-98 ASME THR3 +. 4 A 1672-7649 2012 11-0075 - 07 doi 10. 3404 /j. issn. 1672-7649. 2012. 11. 017 Stress and fatigue analysis

More information

中文模板

中文模板 软 件 学 报 doi: 10.13328/j.cnki.jos.004932 中 文 公 众 事 件 信 息 熵 计 算 方 法 靳 锐 +, 张 宏 莉, 张 玥, 王 星 ( 哈 尔 滨 工 业 大 学 计 算 机 科 学 与 技 术 学 院, 哈 尔 滨 150001) Calculation Method of Chinese Public Event Information Entropy

More information

1. 课 程 负 责 人 情 况 姓 名 蒋 效 宇 性 别 男 出 生 年 月 基 本 信 息 最 终 学 历 研 究 生 职 称 副 教 授 电 话 学 位 博 士 职 务 无 传 真 研 究 方 向 MIS 系 统 整 合 电 子

1. 课 程 负 责 人 情 况 姓 名 蒋 效 宇 性 别 男 出 生 年 月 基 本 信 息 最 终 学 历 研 究 生 职 称 副 教 授 电 话 学 位 博 士 职 务 无 传 真 研 究 方 向 MIS 系 统 整 合 电 子 北 京 服 装 学 院 精 品 课 程 建 设 立 项 申 报 表 课 程 名 称 管 理 信 息 系 统 所 属 部 门 商 学 院 课 程 类 型 理 论 课 ( 不 含 实 践 ) 理 论 课 ( 含 实 践 ) 实 验 ( 践 ) 课 所 属 一 级 学 科 名 称 所 属 二 级 学 科 名 称 课 程 负 责 人 管 理 科 学 与 工 程 管 理 信 息 系 统 蒋 效 宇 申 报 日

More information

University of Science and Technology of China A dissertation for master s degree Research of e-learning style for public servants under the context of

University of Science and Technology of China A dissertation for master s degree Research of e-learning style for public servants under the context of 中 国 科 学 技 术 大 学 硕 士 学 位 论 文 新 媒 体 环 境 下 公 务 员 在 线 培 训 模 式 研 究 作 者 姓 名 : 学 科 专 业 : 导 师 姓 名 : 完 成 时 间 : 潘 琳 数 字 媒 体 周 荣 庭 教 授 二 一 二 年 五 月 University of Science and Technology of China A dissertation for

More information

云端信息密文域内检索机制的研究

云端信息密文域内检索机制的研究 Software Engineering and Applications 软 件 工 程 与 应 用, 2015, 4(6), 129-135 Published Online December 2015 in Hans. http://www.hanspub.org/journal/sea http://dx.doi.org/10.12677/sea.2015.46017 Research on

More information

孙 蓝等 基于目标导向的研究生英语学习模式创新

孙 蓝等 基于目标导向的研究生英语学习模式创新 第 期 总第 期 年 月 研究生教育研究 以中国科技大学研究生英语学习公共服务平台建设为例 孙 蓝 陈纪梁 邢鸿飞 刘海清 万洪英 中国科学技术大学外语系 安徽合肥 中国科学技术大学研究生院 安徽合肥 研究生英语教学的使命是培养学生在当今多元社会中进行有效沟通的能力 英语语言教育者的任务不是去寻求更好的教学法 而是要探索一套能够满足学生需求且与学生学习体验相一致的教与学的策略 为此 有必要构建研究生英语学习公共服务平台

More information

目 党 建 研 究 录 059 提 高 党 执 成 效 : 探 索 挑 战 与 策 纪 强 治 与 法 研 究 065 土 地 换 保 障 : 总 体 现 状 及 区 域 差 异 ( ) 张 新 文 杜 春 林 071 审 法 官 责 任 制 论 逻 辑 与 制 度 设 计 石 东

目 党 建 研 究 录 059 提 高 党 执 成 效 : 探 索 挑 战 与 策 纪 强 治 与 法 研 究 065 土 地 换 保 障 : 总 体 现 状 及 区 域 差 异 ( ) 张 新 文 杜 春 林 071 审 法 官 责 任 制 论 逻 辑 与 制 度 设 计 石 东 目 录 纪 念 邓 小 平 诞 辰 110 周 年 005 邓 小 平 扶 贫 开 发 贡 献 文 建 龙 011 邓 小 平 解 决 领 土 问 题 战 略 思 考 及 当 代 价 值 刘 海 潮 哲 研 究 017 自 由 与 制 度 : 马 克 思 解 释 历 史 二 维 向 度 赵 峰 022 麦 克 斯 阿 德 勒 马 克 思 哲 观 探 析 孟 飞 026 近 年 来 历 史 虚 无 思

More information

2015-6-2.indd

2015-6-2.indd 中 国 科 技 资 源 导 刊 ISSN 1674-1544 2015 年 11 月 第 47 卷 第 6 期 18-22 CHINA SCIENCE & TECHNOLOGY RESOURCES REVIEW ISSN 1674-1544 Vol.47 No.6 18-22, Nov. 2015 科 技 人 员 创 新 创 业 政 策 制 定 相 关 因 素 分 析 李 玲 等 安 冉 储 节 旺

More information

第 1 期 常 壮 等 : 基 于 RS-485 总 线 的 舰 船 损 管 训 练 平 台 控 系 统 研 究 87 能 : 1) 损 管 基 本 理 论 的 学 习 帮 助 舰 员 熟 悉 舰 艇 舱 室 相 关 规 章 制 度 损 管 施 分 布 和 使 用 不 沉 性 文 件 等 ) 损 管

第 1 期 常 壮 等 : 基 于 RS-485 总 线 的 舰 船 损 管 训 练 平 台 控 系 统 研 究 87 能 : 1) 损 管 基 本 理 论 的 学 习 帮 助 舰 员 熟 悉 舰 艇 舱 室 相 关 规 章 制 度 损 管 施 分 布 和 使 用 不 沉 性 文 件 等 ) 损 管 第 6 卷 第 1 期 011 年 月 Chinese 中 国 Journal 舰 of船 Ship研 Research 究 Vol.6 No.1 Feb. 第 011 6 卷 doi: 10. 3969 / j. issn. 1673-3185. 011. 01. 017 基 于 RS-485 总 线 的 舰 船 损 管 训 练 平 台 控 系 统 研 究 常 壮 1 邱 金 水 刘 伯 运 1

More information

56 包 装 工 程 1.2 眼 动 跟 踪 技 术 介 入 APP 图 形 用 户 界 面 可 用 性 评 估 眼 动 仪 是 基 于 眼 动 轨 迹 跟 踪 的 装 置, 用 于 测 量 眼 睛 的 位 置 和 眼 球 运 动 眼 动 仪 是 用 于 人 类 视 觉 系 统 心 理 学 认 知

56 包 装 工 程 1.2 眼 动 跟 踪 技 术 介 入 APP 图 形 用 户 界 面 可 用 性 评 估 眼 动 仪 是 基 于 眼 动 轨 迹 跟 踪 的 装 置, 用 于 测 量 眼 睛 的 位 置 和 眼 球 运 动 眼 动 仪 是 用 于 人 类 视 觉 系 统 心 理 学 认 知 第 36 卷 第 8 期 包装工程 PACKAGING ENGINEERING 55 基于眼动仪的智能手机 APP 图形用户界面设计可用性评估 常方圆 上海出版印刷高等专科学校 上海 200093 摘要 目的 用眼动追踪技术对APP用户图形界面设计原型进行可用性评估 方法 方法 采用创新的图形要素 分离概念 设计 3 组不同的平行设计测试 以兴趣区为范围 使用眼动仪收集主要眼动轨迹数据 如首次 进入时间

More information

业 务 与 运 营 社 交 网 络 行 为 将 对 网 络 流 量 造 成 较 大 影 响 3) 即 时 通 信 类 业 务 包 括 微 信 QQ 等, 该 类 业 务 属 于 典 型 的 小 数 据 包 业 务, 有 可 能 带 来 较 大 的 信 令 开 呼 叫 建 立 的 时 延 销 即 时

业 务 与 运 营 社 交 网 络 行 为 将 对 网 络 流 量 造 成 较 大 影 响 3) 即 时 通 信 类 业 务 包 括 微 信 QQ 等, 该 类 业 务 属 于 典 型 的 小 数 据 包 业 务, 有 可 能 带 来 较 大 的 信 令 开 呼 叫 建 立 的 时 延 销 即 时 移 动 互 联 网 业 务 在 LTE 时 代 的 发 展 分 析 及 业 务 建 模 刘 琪 王 蕴 实 盛 煜 李 轶 群 中 国 联 通 网 络 技 术 研 究 院 北 京 100084 摘 要 LTE 时 代 的 到 来 为 移 动 互 联 网 业 务 的 发 展 提 供 了 新 的 平 台, 也 给 运 营 商 带 来 巨 大 的 挑 战 文 章 探 讨 了 移 动 互 联 网 业 务 在

More information

... ELECTRIC POWER IT Business Strategic PlanningBSP ITSP IS IT 2 传 统 IT 规 划 方 法 分 析 IT IT 20 IT IBM [2] 2 IT IT 20 80 [4] John Handerson 1994 IT 3 特

... ELECTRIC POWER IT Business Strategic PlanningBSP ITSP IS IT 2 传 统 IT 规 划 方 法 分 析 IT IT 20 IT IBM [2] 2 IT IT 20 80 [4] John Handerson 1994 IT 3 特 电 网 企 业 信 息 化 规 划 方 法 与 应 用 1 2 2 1 4500522 453002 0 引 言 IT 1 IT 规 划 相 关 概 念 介 绍 IT IT planning IT [1] IT IS Information System Strategic Planning ISSPIT Information Technology Strategic Planning ITSP

More information

高 可 用 (high availability). 通 常 使 用 特 別 的 衝 突 解 決 (conflict resolution) 程 式 來 管 理 更 新 衝 突 (update conflict). Farsite[2] 是 一 個 沒 有 使 用 任 何 中 心 伺 服 器 的 分

高 可 用 (high availability). 通 常 使 用 特 別 的 衝 突 解 決 (conflict resolution) 程 式 來 管 理 更 新 衝 突 (update conflict). Farsite[2] 是 一 個 沒 有 使 用 任 何 中 心 伺 服 器 的 分 Cassandra - 一 個 分 散 的 結 構 化 存 儲 系 統 本 文 翻 譯 自 Facebook 員 工 在 LADIS 大 會 上 發 佈 的 論 文.Cassandra A Decentralized Structured Storage System 這 篇 論 文 中, 兩 位 作 者 詳 細 介 紹 了 Cassandra 的 系 統 架 構, 它 的 設 計 初 衷, 設 計

More information

Microsoft Word - A201101-1519.doc

Microsoft Word - A201101-1519.doc 5 10 15 20 25 30 基 于 ASP+ACCESS 的 辽 宁 工 程 技 术 大 学 考 试 网 的 设 计 与 开 发 董 强 1, 宋 喜 义 2 2**, 黄 培 泉 (1. 辽 宁 工 程 技 术 大 学 安 全 科 学 与 工 程 学 院, 辽 宁 阜 新 123000; 2. 辽 宁 工 程 技 术 大 学 实 验 实 训 中 心, 辽 宁 阜 新 123000) 摘 要

More information

untitled

untitled http://idc.hust.edu.cn/~rxli/ 1.1 1.2 1.3 1.4 1.5 1.6 2 1.1 1.1.1 1.1.2 1.1.3 3 1.1.1 Data (0005794, 601,, 1, 1948.03.26, 01) (,,,,,) 4 1.1.1 Database DB 5 1.1.1 (DBMS) DDL ( Create, Drop, Alter) DML(

More information

基于任务的实验项目管理平台

基于任务的实验项目管理平台 Computer Science and Application 计 算 机 科 学 与 应 用, 2012, 2, 132-137 http://dx.doi.org/10.12677/csa.2012.23024 Published Online August 2012 (http://www.hanspub.org/journal/csa.html) An New Experiment Project

More information

幻灯片 1

幻灯片 1 沈 阳 工 业 大 学 2014 年 6 月 第 7 章 数 据 库 技 术 基 础 主 要 内 容 : 7.1 数 据 库 概 述 数 据 库 基 本 概 念 数 据 模 型 逻 辑 数 据 模 型 数 据 库 系 统 的 产 生 和 发 展 常 用 的 数 据 库 管 理 系 统 7.2 Access 2010 数 据 库 创 建 及 维 护 创 建 Access 2010 数 据 库 创 建

More information