大数据技术原理与应用

Size: px
Start display at page:

Download "大数据技术原理与应用"

Transcription

1 大数据技术原理与应用 ( 第 2 版 ) 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第 4 章分布式数据库 HBase (PPT 版本号 :2017 年 2 月版本 ) 林子雨厦门大学计算机科学系 ziyulin@xmu.edu.cn 主页 : 大数据技术原理与应用厦门大学计算机科学系 ( 第 2 版 ) 厦门大学计算机科学系林子雨 2017 年 2 月版本 ziyulin@xmu.edu.cn

2 本章配套教学视频 大数据技术原理与应用 ( 第 2 版 ) 第 4 章分布式数据库 HBase 在线视频观看地址

3 提纲 4.1 概述 4.2 HBase 访问接口 4.3 HBase 数据模型 4.4 HBase 的实现原理 4.5 HBase 运行机制 4.6 HBase 应用方案 4.7 HBase 编程实践 本 PPT 是如下教材的配套讲义 : 大数据技术原理与应用 概念 存储 处理 分析与应用 (2017 年 2 月第 2 版 ) ISBN: 厦门大学林子雨编著, 人民邮电出版社 欢迎访问 大数据技术原理与应用 教材官方网站 :

4 4.1 概述 从 BigTable 说起 HBase 简介 HBase 与传统关系数据库的对比分析 大数据技术原理与应用 ( 第 2 版 ) 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

5 4.1.1 从 BigTable 说起 BigTable 是一个分布式存储系统 BigTable 起初用于解决典型的互联网搜索问题 建立互联网索引 1 爬虫持续不断地抓取新页面, 这些页面每页一行地存储到 BigTable 里 2 MapReduce 计算作业运行在整张表上, 生成索引, 为网络搜索应用做准备 搜索互联网 3 用户发起网络搜索请求 4 网络搜索应用查询建立好的索引, 从 BigTable 得到网页 5 搜索结果提交给用户 网页在 BigTable 中的存储样例

6 4.1.1 从 BigTable 说起 BigTable 是一个分布式存储系统 利用谷歌提出的 MapReduce 分布式并行计算模型来处理海量数据 使用谷歌分布式文件系统 GFS 作为底层数据存储 采用 Chubby 提供协同服务管理 可以扩展到 PB 级别的数据和上千台机器, 具备广泛应用性 可扩展性 高性能和高可用性等特点 谷歌的许多项目都存储在 BigTable 中, 包括搜索 地图 财经 打印 社交网站 Orkut 视频共享网站 YouTube 和博客网站 Blogger 等

7 Zookeeper 大数据技术原理与应用 ( 第 2 版 ) 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn Avro HBase 简介 HBase 是一个高可靠 高性能 面向列 可伸缩的分布式数据库, 是谷歌 BigTable 的开源实现, 主要用来存储非结构化和半结构化的松散数据 HBase 的目标是处理非常庞大的表, 可以通过水平扩展的方式, 利用廉价计算机集群处理由超过 10 亿行数据和数百万列元素组成的数据表 Hadoop 生态系统 ETL 工具 BI 报表 RDBMS Pig Hive Sqoop MapReduce HBase HDFS (Hadoop Distributed File System) 图 4-1 Hadoop 生态系统中 HBase 与其他部分的关系

8 4.1.2 HBase 简介 表 4-1 HBase 和 BigTable 的底层技术对应关系 BigTable HBase 文件存储系统 GFS HDFS 海量数据处理 MapReduce Hadoop MapReduce 协同服务管理 Chubby Zookeeper

9 4.1.2 HBase 简介 关系数据库已经流行很多年, 并且 Hadoop 已经有了 HDFS 和 MapReduce, 为什么需要 HBase? Hadoop 可以很好地解决大规模数据的离线批量处理问题, 但是, 受限于 Hadoop MapReduce 编程框架的高延迟数据处理机制, 使得 Hadoop 无法满足大规模数据实时处理应用的需求 HDFS 面向批量访问模式, 不是随机访问模式 传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题 ( 分库分表也不能很好解决 ) 传统关系数据库在数据结构变化时一般需要停机维护 ; 空列浪费存储空间 因此, 业界出现了一类面向半结构化数据存储和处理的高可扩展 低写入 / 查询延迟的系统, 例如, 键值数据库 文档数据库和列族数据库 ( 如 BigTable 和 HBase 等 ) HBase 已经成功应用于互联网服务领域和传统行业的众多在线式数据分析处理系统中

10 4.1.3 HBase 与传统关系数据库的对比分析 HBase 与传统的关系数据库的区别主要体现在以下几个方面 : (1) 数据类型 : 关系数据库采用关系模型, 具有丰富的数据类型和存储方式,HBase 则采用了更加简单的数据模型, 它把数据存储为未经解释的字符串 (2) 数据操作 : 关系数据库中包含了丰富的操作, 其中会涉及复杂的多表连接 HBase 操作则不存在复杂的表与表之间的关系, 只有简单的插入 查询 删除 清空等, 因为 HBase 在设计上就避免了复杂的表和表之间的关系 (3) 存储模式 : 关系数据库是基于行模式存储的 HBase 是基于列存储的, 每个列族都由几个文件保存, 不同列族的文件是分离的

11 4.1.3 HBase 与传统关系数据库的对比分析 HBase 与传统的关系数据库的区别主要体现在以下几个方面 : (4) 数据索引 : 关系数据库通常可以针对不同列构建复杂的多个索引, 以提高数据访问性能 HBase 只有一个索引 行键, 通过巧妙的设计,HBase 中的所有访问方法, 或者通过行键访问, 或者通过行键扫描, 从而使得整个系统不会慢下来 (5) 数据维护 : 在关系数据库中, 更新操作会用最新的当前值去替换记录中原来的旧值, 旧值被覆盖后就不会存在 而在 HBase 中执行更新操作时, 并不会删除数据旧的版本, 而是生成一个新的版本, 旧有的版本仍然保留 (6) 可伸缩性 : 关系数据库很难实现横向扩展, 纵向扩展的空间也比较有限 相反,HBase 和 BigTable 这些分布式数据库就是为了实现灵活的水平扩展而开发的, 能够轻易地通过在集群中增加或者减少硬件数量来实现性能的伸缩

12 4.2 HBase 访问接口 表 4-2 HBase 访问接口 类型特点场合 Native Java API HBase Shell 最常规和高效的访问方式适合 Hadoop MapReduce 作业并行批处理 HBase 表数据 HBase 的命令行工具, 最简单的接口 Thrift Gateway 利用 Thrift 序列化技术, 支持 C++ PHP Python 等多种语言 适合 HBase 管理使用 适合其他异构系统在线访问 HBase 表数据 REST Gateway 解除了语言限制 支持 REST 风格的 Http API 访问 HBase Pig 使用 Pig Latin 流式编程语言来处理 HBase 中的数据 适合做数据统计 Hive 简单 当需要以类似 SQL 语言方式来 访问 HBase 的时候

13 4.3 HBase 数据模型 数据模型概述 数据模型相关概念 数据坐标 概念视图 物理视图 面向列的存储 大数据技术原理与应用 ( 第 2 版 ) 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

14 4.3.1 数据模型概述 HBase 是一个稀疏 多维度 排序的映射表, 这张表的索引是行键 列族 列限定符和时间戳 每个值是一个未经解释的字符串, 没有数据类型 用户在表中存储数据, 每一行都有一个可排序的行键和任意多的列 表在水平方向由一个或者多个列族组成, 一个列族中可以包含任意多个列, 同一个列族里面的数据存储在一起 列族支持动态扩展, 可以很轻松地添加一个列族或列, 无需预先定义列的数量以及类型, 所有列均以字符串形式存储, 用户需要自行进行数据类型转换 HBase 中执行更新操作时, 并不会删除数据旧的版本, 而是生成一个新的版本, 旧有的版本仍然保留 ( 这是和 HDFS 只允许追加不允许修改的特性相关的 )

15 4.3.2 数据模型相关概念 表 :HBase 采用表来组织数据, 表由行和列组成, 列划分为若干个列族 行 : 每个 HBase 表都由若干行组成, 每个行由行键 (row key) 来标识 列族 : 一个 HBase 表被分组成许多 列族 (Column Family) 的集合, 它是基本的访问控制单元 列限定符 : 列族里的数据通过列限定符 ( 或列 ) 来定位 单元格 : 在 HBase 表中, 通过行 列族和列限定符确定一个 单元格 (cell ), 单元格中存储的数据没有数据类型, 总被视为字节数组 byte[] 时间戳 : 每个单元格都保存着同一份数据的多个版本, 这些版本采用时间戳进行索引

16 4.3.3 数据坐标 HBase 中需要根据行键 列族 列限定符和时间戳来确定一个单元格, 因此, 可以视为一个 四维坐标, 即 [ 行键, 列族, 列限定符, 时间戳 ] 键 [ , Info, , ] [ , Info, , ] 值 xie@qq.com you@163.com

17 4.3.4 概念视图 表 4-4 HBase 数据的概念视图 行键 时间戳 列族 contents 列族 anchor t5 anchor:cnnsi.com= CNN t4 anchor:my.look.ca="cnn.com" "com.cnn.www" t3 t2 contents:html="< html>" contents:html="< html>" t1 contents:html="< html>"

18 4.3.5 物理视图 行键 "com.cnn.www" 表 4-5 HBase 数据的物理视图列族 contents 时间戳 t3 t2 t1 列族 anchor 列族 contents contents:html="<html>" contents:html="<html>" contents:html="<html>" 行键 "com.cnn.www" 时间戳 t5 t4 列族 anchor anchor:cnnsi.com= CNN anchor:my.look.ca="cnn.com"

19 4.3.6 面向列的存储 图 4-3 行式数据库和列式数据库示意图

20 SQL 大数据技术原理与应用 ( 第 2 版 ) 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 行 3 3 Tom 38 M Logout 面向列的存储 SQL 模式采用面向行的存储 Log 模式 Log_id user Marry Bob Tom Linda age sex F M M F ip action Logout New_tweet Logout Logout 图 4-4 行式存储结构和列式存储结构 采用面向列的存储

21 4.3.6 面向列的存储 行式存储 行 1 行 2 行 3 1 Marry 34 F Logout 2 Bob 18 M New_tweet 3 Tom 38 M Logout

22 4.3.6 面向列的存储.252 采用面向列的存储 列式存储 列 1:user 列 2:age 列 3:sex 列 4:ip 列 5:action Marry Bob Tom Linda F M M F Logout New_tweet Logout Logout

23 4.4 HBase 的实现原理 HBase 功能组件 表和 Region Region 的定位 大数据技术原理与应用 ( 第 2 版 ) 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

24 4.4.1 HBase 功能组件 HBase 的实现包括三个主要的功能组件 : (1) 库函数 : 链接到每个客户端 (2) 一个 Master 主服务器 (3) 许多个 Region 服务器 主服务器 Master 负责管理和维护 HBase 表的分区信息, 维护 Region 服务器列表, 分配 Region, 负载均衡 Region 服务器负责存储和维护分配给自己的 Region, 处理来自客户端的读写请求 客户端并不是直接从 Master 主服务器上读取数据, 而是在获得 Region 的存储位置信息后, 直接从 Region 服务器上读取数据 客户端并不依赖 Master, 而是通过 Zookeeper 来获得 Region 位置信息, 大多数客户端甚至从来不和 Master 通信, 这种设计方式使得 Master 负载很小 大数据技术原理与应用 ( 第 2 版 ) 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

25 4.4.2 表和 Region 按照行键字典序 表 Region Region... Region 开始只有一个 Region, 后来不断分裂 Region 拆分操作非常快, 接近瞬间, 因为拆分之后的 Region 读取的仍然是原存储文件, 直到 合并 过程把存储文件异步地写到独立的文件之后, 才会读取新文件 表 Region 分裂 表 Region Region Region 图 4-5 一个 HBase 表被划分成多个 Region Region Region Region 图 4-6 一个 Region 会分裂成多个新的 Region

26 4.4.2 表和 Region 每个 Region 默认大小是 100MB 到 200MB(2006 年以前的硬件配置 ) 每个 Region 的最佳大小取决于单台服务器的有效处理能力 目前每个 Region 最佳大小建议 1GB-2GB(2013 年以后的硬件配置 ) 同一个 Region 不会被分拆到多个 Region 服务器 每个 Region 服务器存储 个 Region 表 1 Region Region Region 表 2 Region Region Region Region 服务器 Region Region 图 4-7 不同的 Region 可以分布在不同的 Region 服务器上 大数据技术原理与应用 ( 第 2 版 ) 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

27 4.4.3 Region 的定位 元数据表, 又名.META. 表, 存储了 Region 和 Region 服务器的映射关系 当 HBase 表很大时,.META. 表也会被分裂成多个 Region 根数据表, 又名 -ROOT- 表, 记录所有元数据的具体位置 -ROOT- 表只有唯一一个 Region, 名字是在程序中被写死的 Zookeeper 文件记录了 -ROOT- 表的位置 ZooKeeper 文件 -ROOT- 表.META. 表 用户数据表 用户数据表 图 4-8 HBase 的三层结构

28 4.4.3 Region 的定位 表 4-6 HBase 的三层结构中各层次的名称和作用 层次名称作用 第一层 Zookeeper 文件 第二层 -ROOT- 表 记录了 -ROOT- 表的位置信息 记录了.META. 表的 Region 位置信息 -ROOT- 表只能有一个 Region 通过 -ROOT- 表, 就可以访问.META. 表中的数据 第三层.META. 表记录了用户数据表的 Region 位置信息,.META. 表可以有多个 Region, 保存了 HBase 中所有用户数据表的 Region 位置信息

29 4.4.3 Region 的定位 为了加快访问速度,.META. 表的全部 Region 都会被保存在内存中 假设.META. 表的每行 ( 一个映射条目 ) 在内存中大约占用 1KB, 并且每个 Region 限制为 128MB, 那么, 上面的三层结构可以保存的用户数据表的 Region 数目的计算方法是 : (-ROOT- 表能够寻址的.META. 表的 Region 个数 ) ( 每个.META. 表的 Region 可以寻址的用户数据表的 Region 个数 ) 一个 -ROOT- 表最多只能有一个 Region, 也就是最多只能有 128MB, 按照每行 ( 一个映射条目 ) 占用 1KB 内存计算,128MB 空间可以容纳 128MB/1KB=2 17 行, 也就是说, 一个 -ROOT- 表可以寻址 2 17 个.META. 表的 Region 同理, 每个.META. 表的 Region 可以寻址的用户数据表的 Region 个数是 128MB/1KB=2 17 最终, 三层结构可以保存的 Region 数目是 (128MB/1KB) (128MB/1KB) = 2 34 个 Region ZooKeeper 文件 -ROOT- 表.META. 表 用户数据表 用户数据表

30 4.4.3 Region 的定位 客户端访问数据时的 三级寻址 为了加速寻址, 客户端会缓存位置信息, 同时, 需要解决缓存失效问题 寻址过程客户端只需要询问 Zookeeper 服务器, 不需要连接 Master 服务器 ZooKeeper 文件 -ROOT- 表.META. 表 用户数据表 用户数据表 大数据技术原理与应用 ( 第 2 版 ) 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

31 4.5 HBase 运行机制 HBase 系统架构 Region 服务器工作原理 Store 工作原理 HLog 工作原理 大数据技术原理与应用 ( 第 2 版 ) 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

32 4.5.1 HBase 系统架构 客户端 Zookeeper Master Region 服务器 Region 服务器 HBase Region Region Region Region Region Region HDFS Hadoop 数据节点 数据节点 数据节点 数据节点 图 4-9 HBase 的系统架构

33 4.5.1 HBase 系统架构 1. 客户端 客户端包含访问 HBase 的接口, 同时在缓存中维护着已经访问过的 Region 位置信息, 用来加快后续数据访问过程 2. Zookeeper 服务器 Zookeeper 可以帮助选举出一个 Master 作为集群的总管, 并保证在任何时刻总有唯一一个 Master 在运行, 这就避免了 Master 的 单点失效 问题 Zookeeper 是一个很好的集群管理工具, 被大量用于分布式计算, 提供配置维护 域名服务 分布式同步 组服务等 大数据技术原理与应用 ( 第 2 版 ) 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

34 4.5.1 HBase 系统架构 3. Master 主服务器 Master 主要负责表和 Region 的管理工作 : 管理用户对表的增加 删除 修改 查询等操作 实现不同 Region 服务器之间的负载均衡 在 Region 分裂或合并后, 负责重新调整 Region 的分布 对发生故障失效的 Region 服务器上的 Region 进行迁移 4. Region 服务器 Region 服务器是 HBase 中最核心的模块, 负责维护分配给自己的 Region, 并响应用户的读写请求

35 4.5.2 Region 服务器工作原理 Region 服务器集群 Region 服务器 Region 服务器 Region 服务器 Region Region Region 1. 用户读写数据过程 2. 缓存的刷新 3. StoreFile 的合并 Store Store Store MemStore MemStore MemStore HLog StoreFile StoreFile StoreFile StoreFile StoreFile StoreFile StoreFile StoreFile StoreFile StoreFile StoreFile StoreFile HFile HFile HFile HFile HFile 图 4-10 Region 服务器向 HDFS 文件系统中读写数据 大数据技术原理与应用 ( 第 2 版 ) 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

36 4.5.2 Region 服务器工作原理 1. 用户读写数据过程 用户写入数据时, 被分配到相应 Region 服务器去执行 用户数据首先被写入到 MemStore 和 Hlog 中 只有当操作写入 Hlog 之后,commit() 调用才会将其返回给客户端 当用户读取数据时,Region 服务器会首先访问 MemStore 缓存, 如果找不到, 再去磁盘上面的 StoreFile 中寻找

37 4.5.2 Region 服务器工作原理 2. 缓存的刷新 系统会周期性地把 MemStore 缓存里的内容刷写到磁盘的 StoreFile 文件中, 清空缓存, 并在 Hlog 里面写入一个标记 每次刷写都生成一个新的 StoreFile 文件, 因此, 每个 Store 包含多个 StoreFile 文件 每个 Region 服务器都有一个自己的 HLog 文件, 每次启动都检查该文件, 确认最近一次执行缓存刷新操作之后是否发生新的写入操作 ; 如果发现更新, 则先写入 MemStore, 再刷写到 StoreFile, 最后删除旧的 Hlog 文件, 开始为用户提供服务

38 4.5.2 Region 服务器工作原理 3. StoreFile 的合并 每次刷写都生成一个新的 StoreFile, 数量太多, 影响查找速度 调用 Store.compact() 把多个合并成一个 合并操作比较耗费资源, 只有数量达到一个阈值才启动合并

39 4.5.3 Store 工作原理 Store 是 Region 服务器的核心 多个 StoreFile 合并成一个 单个 StoreFile 过大时, 又触发分裂操作,1 个父 Region 被分裂成两个子 Region StoreFile1:64M StoreFile2:64M StoreFile3:64M 合并 StoreFile5:256M 分裂 StoreFile5A:128M StoreFile5B:128M StoreFile6:128M StoreFile7:128M StoreFile4:64M 图 4-11 StoreFile 的合并和分裂过程

40 4.5.4 HLog 工作原理 分布式环境必须要考虑系统出错 HBase 采用 HLog 保证系统恢复 HBase 系统为每个 Region 服务器配置了一个 HLog 文件, 它是一种预写式日志 (Write Ahead Log) 用户更新数据必须首先写入日志后, 才能写入 MemStore 缓存, 并且, 直到 MemStore 缓存内容对应的日志已经写入磁盘, 该缓存内容才能被刷写到磁盘

41 4.5.4 HLog 工作原理 Zookeeper 会实时监测每个 Region 服务器的状态, 当某个 Region 服务器发生故障时,Zookeeper 会通知 Master Master 首先会处理该故障 Region 服务器上面遗留的 HLog 文件, 这个遗留的 HLog 文件中包含了来自多个 Region 对象的日志记录 系统会根据每条日志记录所属的 Region 对象对 HLog 数据进行拆分, 分别放到相应 Region 对象的目录下, 然后, 再将失效的 Region 重新分配到可用的 Region 服务器中, 并把与该 Region 对象相关的 HLog 日志记录也发送给相应的 Region 服务器 Region 服务器领取到分配给自己的 Region 对象以及与之相关的 HLog 日志记录以后, 会重新做一遍日志记录中的各种操作, 把日志记录中的数据写入到 MemStore 缓存中, 然后, 刷新到磁盘的 StoreFile 文件中, 完成数据恢复 共用日志优点 : 提高对表的写操作性能 ; 缺点 : 恢复时需要分拆日志

42 4.6 HBase 应用方案 HBase 实际应用中的性能优化方法 HBase 性能监视 在 HBase 之上构建 SQL 引擎 构建 HBase 二级索引

43 4.6.1 HBase 实际应用中的性能优化方法 行键 (Row Key) 行键是按照字典序存储, 因此, 设计行键时, 要充分利用这个排序特点, 将经常一起读取的数据存储到一块, 将最近可能会被访问的数据放在一块 举个例子 : 如果最近写入 HBase 表中的数据是最可能被访问的, 可以考虑将时间戳作为行键的一部分, 由于是字典序排序, 所以可以使用 Long.MAX_VALUE - timestamp 作为行键, 这样能保证新写入的数据在读取时可以被快速命中

44 4.6.1 HBase 实际应用中的性能优化方法 InMemory 创建表的时候, 可以通过 HColumnDescriptor.setInMemory(true) 将表放到 Region 服务器的缓存中, 保证在读取的时候被 cache 命中 Max Version 创建表的时候, 可以通过 HColumnDescriptor.setMaxVersions(int maxversions) 设置表中数据的最大版本, 如果只需要保存最新版本的数据, 那么可以设置 setmaxversions(1) Time To Live 创建表的时候, 可以通过 HColumnDescriptor.setTimeToLive(int timetolive) 设置表中数据的存储生命期, 过期数据将自动被删除, 例如如果只需要存储最近两天的数据, 那么可以设置 settimetolive(2 * 24 * 60 * 60)

45 4.6.2 HBase 性能监视 Master-status( 自带 ) Ganglia OpenTSDB Ambari

46 Master-status HBase Master 默认基于 Web 的 UI 服务端口为 60010,HBase region 服务器默认基于 Web 的 UI 服务端口为 如果 master 运行在名为 master.foo.com 的主机中, mater 的主页地址就是 用户可以通过 Web 浏览器输入这个地址查看该页面 可以查看 HBase 集群的当前状态

47 Ganglia Ganglia 是 UC Berkeley 发起的一个开源集群监视项目, 用于监控系统性能

48 OpenTSDB OpenTSDB 可以从大规模的集群 ( 包括集群中的网络设备 操作系统 应用程序 ) 中获取相应的 metrics 并进行存储 索引以及服务, 从而使得这些数据更容易让人理解, 如 web 化, 图形化等

49 Ambari Ambari 的作用就是创建 管理 监视 Hadoop 的集群

50 4.6.3 在 HBase 之上构建 SQL 引擎 NoSQL 区别于关系型数据库的一点就是 NoSQL 不使用 SQL 作为查询语言, 至于为何在 NoSQL 数据存储 HBase 上提供 SQL 接口, 有如下原因 : 1. 易使用 使用诸如 SQL 这样易于理解的语言, 使人们能够更加轻松地使用 HBase 2. 减少编码 使用诸如 SQL 这样更高层次的语言来编写, 减少了编写的代码量 方案 : 1.Hive 整合 HBase 2.Phoenix

51 4.6.3 在 HBase 之上构建 SQL 引擎 1.Hive 整合 HBase Hive 与 HBase 的整合功能从 Hive0.6.0 版本已经开始出现, 利用两者对外的 API 接口互相通信, 通信主要依靠 hive_hbase-handler.jar 工具包 (Hive Storage Handlers) 由于 HBase 有一次比较大的版本变动, 所以并不是每个版本的 Hive 都能和现有的 HBase 版本进行整合, 所以在使用过程中特别注意的就是两者版本的一致性 2.Phoenix Phoenix 由 Salesforce.com 开源, 是构建在 Apache HBase 之上的一个 SQL 中间层, 可以让开发者在 HBase 上执行 SQL 查询

52 4.6.4 构建 HBase 二级索引 HBase 只有一个针对行健的索引访问 HBase 表中的行, 只有三种方式 : 通过单个行健访问 通过一个行健的区间来访问 全表扫描 使用其他产品为 HBase 行健提供索引功能 : Hindex 二级索引 HBase+Redis HBase+solr 原理 : 采用 HBase0.92 版本之后引入的 Coprocessor 特性

53 4.6.4 构建 HBase 二级索引 Coprocessor 构建二级索引 Coprocessor 提供了两个实现 :endpoint 和 observer,endpoint 相当于关系型数据库的存储过程, 而 observer 则相当于触发器 observer 允许我们在记录 put 前后做一些处理, 因此, 而我们可以在插入数据时同步写入索引表 优点 : 非侵入性 : 引擎构建在 HBase 之上, 既没有对 HBase 进行任何改动, 也不需要上层应用做任何妥协 缺点 : 每插入一条数据需要向索引表插入数据, 即耗时是双倍的, 对 HBase 的集群的压力也是双倍的

54 Hindex 二级索引 Hindex 是华为公司开发的纯 Java 编写的 HBase 二级索引, 兼容 Apache HBase 当前的特性如下 : 多个表索引 多个列索引 基于部分列值的索引

55 HBase+Redis Redis+HBase 方案 Coprocessor 构建二级索引 Redis 做客户端缓存 将索引实时更新到 Redis 等 KV 系统中, 定时从 KV 更新索引到 HBase 的索引表中

56 Solr+HBase Solr 是一个高性能, 采用 Java5 开发, 基于 Lucene 的全文搜索服务器 同时对其进行了扩展, 提供了比 Lucene 更为丰富的查询语言, 同时实现了可配置 可扩展并对查询性能进行了优化, 并且提供了一个完善的功能管理界面, 是一款非常优秀的全文搜索引擎 Solr+HBase Solr 保存索引 根据 RowKey 查询

57 4.7 HBase 编程实践 HBase 的安装与配置 HBase 常用 Shell 命令 HBase 常用 Java API 及应用实例 HBase 上机实践, 请参考厦门大学数据库实验室建设的中国高校大数据课程公共服务平台的技术文章 : 大数据原理与应用第四章分布式数据库 HBase 学习指南

58 4.7.1 HBase 的安装与配置 1. HBase 安装 下载安装包 hbase bin.tar.gz 解压安装包 hbase bin.tar.gz 至路径 /usr/local 配置系统环境, 将 hbase 下的 bin 目录添加到系统的 path 中 备注 : 第 2 章安装完 Hadoop 时, 只包含 HDFS 和 MapReduce 等核心组件, 并不包含 HBase, 因此,HBase 需要单独安装 2. HBase 配置 HBase 有三种运行模式, 单机模式 伪分布式模式 分布式模式 以下先决条件很重要, 比如没有配置 JAVA_HOME 环境变量, 就会报错 JDK Hadoop( 单机模式不需要, 伪分布式模式和分布式模式需要 ) SSH 启动关闭 Hadoop 和 HBase 的顺序一定是 : 启动 Hadoop > 启动 HBase > 关闭 HBase > 关闭 Hadoop HBASE_MANAGES_ZK=true, 则由 HBase 自己管理 Zookeeper 否则, 启动独立的 Zookeeper 建议 : 单机版 HBase, 使用自带 Zookeeper; 集群安装 HBase 则采用单独 Zookeeper 集群

59 4.7.2 HBase 常用 Shell 命令 create: 创建表 list: 列出 HBase 中所有的表信息 例子 1: 创建一个表, 该表名称为 temptable, 包含 3 个列族 f1,f2 和 f3 备注 : 后面的例子都在此基础上继续操作

60 4.7.2 HBase 常用 Shell 命令 put: 向表 行 列指定的单元格添加数据一次只能为一个表的一行数据的一个列添加一个数据 scan: 浏览表的相关信息 例子 2: 继续向表 temptable 中的第 r1 行 第 f1:c1 列, 添加数据值为 hello,dblab 在添加数据时,HBase 会自动为添加的数据添加一个时间戳, 当然, 也可以在添加数据时人工指定时间戳的值

61 4.7.2 HBase 常用 Shell 命令 get: 通过表名 行 列 时间戳 时间范围和版本号来获得相应单元格的值 例子 3: (1) 从 temptable 中, 获取第 r1 行 第 f1:c1 列的值 (2) 从 temptable 中, 获取第 r1 行 第 f1:c3 列的值 备注 :f1 是列族,c1 和 c3 都是列 从运行结果可以看出 : temptable 中第 r1 行 第 f1:c3 列的值当前不存在

62 4.7.2 HBase 常用 Shell 命令 enable/disable: 使表有效或无效 drop: 删除表 例子 4: 使表 temptable 无效 删除该表

63 4.7.3 HBase 常用 Java API 及应用实例 HBase 是 Java 编写的, 它的原生的 API 也是 Java 开发的, 不过, 可以使用 Java 或其他语言调用 API 来访问 HBase 首先要在工程中导入一下 jar 包 : 这里只需要导入 hbase 安装目录中的 lib 文件中的所有 jar 包, 此处不用再导入第三章 Hadoop 中的 jar 包, 避免由于 Hadoop 和 HBase 的版本冲突引起错误 备注 : 使用的 HBase 版本号为 1.1.2

64 4.7.3 HBase 常用 Java API 及应用实例 任务要求 : 创建表 插入数据 浏览数据创建一个学生信息表, 用来存储学生姓名 ( 姓名作为行键, 并且假设姓名不会重复 ) 以及考试成绩, 其中, 考试成绩是一个列族, 分别存储了各个科目的考试成绩 逻辑视图如表 4-18 所示 name 表 4-18 学生信息表的表结构 score English Math Computer 表 4-19 需要添加的数据 name score English Math Computer zhangsan lisi

65 4.7.3 HBase 常用 Java API 及应用实例 import org.apache.hadoop.conf.configuration; import org.apache.hadoop.hbase.*; import org.apache.hadoop.hbase.client.*; import org.apache.hadoop.hbase.util.bytes; import java.io.ioexception; public class Chapter4{ public static Configuration configuration; public static Connection connection; public static Admin admin; public static void main(string[] args)throws IOException{ createtable( student,new String[]{ score }); insertdata( student, zhangsan, score, English, 69 ); insertdata( student, zhangsan, score, Math, 86 ); insertdata( student, zhangsan, score, Computer, 77 ); getdata( student, zhangsan, score, English ); } public static void init(){ }// 建立连接 public static void close(){ }// 关闭连接 public static void createtable(){ }// 创建表 public static void insertdata() { }// 插入数据 public static void getdata{ }// 浏览数据 }

66 4.7.3 HBase 常用 Java API 及应用实例 建立连接, 关闭连接 // 建立连接 public static void init(){ configuration = HBaseConfiguration.create(); configuration.set("hbase.rootdir","hdfs://localhost:9000/hbase"); try{ connection = ConnectionFactory.createConnection(configuration); admin = connection.getadmin(); }catch (IOException e){ e.printstacktrace(); } } 备注 : hbase-site.xml <configuration> <property> <name>hbase.rootdir</name> <value>hdfs://localhost:9000/hbase</value> </property> </configuration> ( 单机版 )file:///directory/hbase

67 4.7.3 HBase 常用 Java API 及应用实例 建立连接, 关闭连接 // 关闭连接 public static void close(){ try{ if(admin!= null){ admin.close(); } if(null!= connection){ connection.close(); } }catch (IOException e){ e.printstacktrace(); } }

68 4.7.3 HBase 常用 Java API 及应用实例 1 创建表创建一个学生信息表, 用来存储学生姓名 ( 姓名作为行键, 并且假设姓名不会重复 ) 以及考试成绩, 其中, 考试成绩是一个列族, 分别存储了各个科目的考试成绩 逻辑视图如表 4-18 所示 name 表 4-18 学生信息表的表结构 score English Math Computer

69 4.7.3 HBase 常用 Java API 及应用实例 在运行程序时, 需要指定参数 mytablename 为 student,colfamily 为 { score } 程序的运行效果与如下 HBase Shell 命令等效 : create student, score /* 创建表 */ /** mytablename 表名 colfamily 列族数组 Exception */ public static void createtable(string mytablename,string[] colfamily) throws IOException { } TableName tablename = TableName.valueOf(myTableName); if(admin.tableexists(tablename)){ System.out.println("table exists!"); }else { HTableDescriptor htabledescriptor = new HTableDescriptor(tableName); for(string str: colfamily){ HColumnDescriptor hcolumndescriptor = new HColumnDescriptor(str); htabledescriptor.addfamily(hcolumndescriptor); } admin.createtable(htabledescriptor); }

70 4.7.3 HBase 常用 Java API 及应用实例 2 添加数据现在向表 student 中添加如表 4-19 所示的数据 表 4-19 需要添加的数据 表 4-19 需要添加的数据 name score English Math Computer zhangsan lisi

71 4.7.3 HBase 常用 Java API 及应用实例 /* 添加数据 */ /** tablename 表名 rowkey 行键 colfamily 列族 col 列限定符 val 数据 Exception */ public static void insertdata(string tablename, String rowkey, String colfamily, String col, String val) throws IOException { Table table = connection.gettable(tablename.valueof(tablename)); Put put = new Put(Bytes.toBytes(rowkey)); put.addcolumn(bytes.tobytes(colfamily), Bytes.toBytes(col), Bytes.toBytes(val)); table.put(put); table.close(); }

72 4.7.3 HBase 常用 Java API 及应用实例 添加数据时, 需要分别设置参数 mytablename rowkey colfamily col val 的值, 然后运行上述代码例如添加表 4-19 第一行数据时, 为 insertdata() 方法指定相应参数, 并运行如下 3 行代码 : insertdata("student","zhangsan","score","english","69"); insertdata("student","zhangsan","score","math","86"); insertdata("student","zhangsan","score","computer","77"); 上述代码与如下 HBase Shell 命令等效 : put 'student', zhangsan, score:english, 69 ; put 'student', zhangsan, score:math, 86 ; put 'student', zhangsan, score:computer, 77 ;

73 3 浏览数据 HBase 常用 Java API 及应用实例 /* 获取某单元格数据 */ /** tablename 表名 rowkey 行键 colfamily 列族 col 列限定符 IOException */ public static void getdata(string tablename,string rowkey,string colfamily,string col)throws IOException{ Table table = connection.gettable(tablename.valueof(tablename)); Get get = new Get(Bytes.toBytes(rowkey)); get.addcolumn(bytes.tobytes(colfamily),bytes.tobytes(col)); // 获取的 result 数据是结果集, 还需要格式化输出想要的数据才行 Result result = table.get(get); System.out.println(new String(result.getValue(colFamily.getBytes(),col==null?null:col.getBytes()))); table.close(); }

74 4.7.3 HBase 常用 Java API 及应用实例 比如, 现在要获取姓名为 zhangsan 在 English 上的数据, 就可以在运行上述代码时, 指定参数 tablename 为 student rowkey 为 zhangsan colfamily 为 score col 为 English getdata("student", "zhangsan", "score", "English"); 上述代码与如下 HBase Shell 命令等效 : get student','zhangsan',{column=>'score:english'}

75 本章小结 本章详细介绍了 HBase 数据库的知识 HBase 数据库是 BigTable 的开源实现, 和 BigTable 一样, 支持大规模海量数据, 分布式并发数据处理效率极高, 易于扩展且支持动态伸缩, 适用于廉价设备 HBase 可以支持 Native Java API HBase Shell Thrift Gateway REST Gateway Pig Hive 等多种访问接口, 可以根据具体应用场合选择相应访问方式 HBase 实际上就是一个稀疏 多维 持久化存储的映射表, 它采用行键 列键和时间戳进行索引, 每个值都是未经解释的字符串 本章介绍了 HBase 数据在概念视图和物理视图中的差别 HBase 采用分区存储, 一个大的表会被分拆许多个 Region, 这些 Region 会被分发到不同的服务器上实现分布式存储 HBase 的系统架构包括客户端 Zookeeper 服务器 Master 主服务器 Region 服务器 客户端包含访问 HBase 的接口 ;Zookeeper 服务器负责提供稳定可靠的协同服务 ;Master 主服务器主要负责表和 Region 的管理工作 ; Region 服务器负责维护分配给自己的 Region, 并响应用户的读写请求 本章最后详细介绍了 HBase 运行机制和编程实践的知识

76 3.1.1 计算机集群结构 分布式文件系统把文件分布存储到多个计算机节点上, 成千上万的计算机节点构成计算机集群 与之前使用多个处理器和专用高级硬件的并行化处理装置不同的是, 目前的分布式文件系统所采用的计算机集群, 都是由普通硬件构成的, 这就大大降低了硬件上的开销 交换机 网络互联 节点 x Node 节点 y Node Node x Node y Node x Node y 机架 1 机架 2 机架 n 图 3-1 计算机集群的基本架构

77 附录 : 主讲教师林子雨简介 主讲教师 : 林子雨 单位 : 厦门大学计算机科学系 ziyulin@xmu.edu.cn 个人网页 : 数据库实验室网站 : 扫一扫访问个人主页 林子雨, 男,1978 年出生, 博士 ( 毕业于北京大学 ), 现为厦门大学计算机科学系助理教授 ( 讲师 ), 曾任厦门大学信息科学与技术学院院长助理 晋江市发展和改革局副局长 中国计算机学会数据库专业委员会委员, 中国计算机学会信息系统专业委员会委员, 荣获 2016 中国大数据创新百人 称号 中国高校首个 数字教师 提出者和建设者, 厦门大学数据库实验室负责人, 厦门大学云计算与大数据研究中心主要建设者和骨干成员,2013 年度厦门大学奖教金获得者 主要研究方向为数据库 数据仓库 数据挖掘 大数据 云计算和物联网, 并以第一作者身份在 软件学报 计算机学报 和 计算机研究与发展 等国家重点期刊以及国际学术会议上发表多篇学术论文 作为项目负责人主持的科研项目包括 1 项国家自然科学青年基金项目 (No ) 1 项福建省自然科学青年基金项目 (No.2013J05099) 和 1 项中央高校基本科研业务费项目 (No ), 同时, 作为课题负责人完成了国家发改委城市信息化重大课题 国家物联网重大应用示范工程区域试点泉州市工作方案 2015 泉州市互联网经济调研等课题 中国高校首个 数字教师 提出者和建设者,2009 年至今, 数字教师 大平台累计向网络免费发布超过 100 万字高价值的研究和教学资料, 累计网络访问量超过 100 万次 打造了中国高校大数据教学知名品牌, 编著出版了中国高校第一本系统介绍大数据知识的专业教材 大数据技术原理与应用, 并成为京东 当当网等网店畅销书籍 ; 建设了国内高校首个大数据课程公共服务平台, 为教师教学和学生学习大数据课程提供全方位 一站式服务, 年访问量超过 50 万次 具有丰富的政府和企业信息化培训经验, 厦门大学管理学院 EDP 中心 浙江大学管理学院 EDP 中心 厦门大学继续教育学院 泉州市科技培训中心特邀培训讲师, 曾给中国移动通信集团公司 福州马尾区政府 福建龙岩卷烟厂 福建省物联网科学研究院 石狮市物流协会 厦门市物流协会 浙江省中小企业家 四川泸州企业家 江苏沛县企业家等开展信息化培训, 累计培训人数达 3000 人以上

78 附录 : 大数据技术原理与应用 教材 大数据技术原理与应用 概念 存储 处理 分析与应用 ( 第 2 版 ), 由厦门大学计算机科学系林子雨博士编著, 是中国高校第一本系统介绍大数据知识的专业教材 扫一扫访问教材官网 全书共有 15 章, 系统地论述了大数据的基本概念 大数据处理架构 Hadoop 分布式文件系统 HDFS 分布式数据库 HBase NoSQL 数据库 云数据库 分布式并行编程模型 MapReduce Spark 流计算 图计算 数据可视化以及大数据在互联网 生物医学和物流等各个领域的应用 在 Hadoop HDFS HBase 和 MapReduce 等重要章节, 安排了入门级的实践操作, 让读者更好地学习和掌握大数据关键技术 本书可以作为高等院校计算机专业 信息管理等相关专业的大数据课程教材, 也可供相关技术人员参考 学习 培训之用 欢迎访问 大数据技术原理与应用 概念 存储 处理 分析与应用 教材官方网站 :

79 附录 : 中国高校大数据课程公共服务平台 扫一扫访问平台主页 扫一扫观看 3 分钟 FLASH 动画宣传片

80 Department of Computer Science, Xiamen University, 2017 大数据技术原理与应用 ( 第 2 版 ) 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn

大数据技术原理与应用

大数据技术原理与应用 分布式数据库厦门大学云计算与大数据研究中心 HBase 厦门大学云计算与大数据研究中心林子雨 2015 ziyulin@xmu.edu.cn 年版 大数据技术公开课 大数据概念 技术与应用 2015 年 10 月 13 日山东大学 第 4 讲分布式数据库 HBase 林子雨博士 / 助理教授厦门大学计算机科学系厦门大学云计算与大数据研究中心 E-mail: ziyulin@xmu.edu.cn 山东大学公开课主页

More information

大数据技术原理与应用

大数据技术原理与应用 分布式数据库厦门大学云计算与大数据研究中心 HBase 厦门大学云计算与大数据研究中心林子雨 2015 ziyulin@xmu.edu.cn 年版 大数据专题技术型公开课 第 2 讲分布式数据库 HBase 林子雨博士 / 助理教授厦门大学计算机科学系厦门大学云计算与大数据研究中心 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu

More information

大数据技术原理与应用

大数据技术原理与应用 分布式数据库厦门大学云计算与大数据研究中心 HBase 厦门大学云计算与大数据研究中心林子雨 2015 ziyulin@xmu.edu.cn 年版 大数据技术公开课 ( 专题技术型 ) 第 2 讲分布式数据库 HBase 林子雨博士 / 助理教授厦门大学计算机科学系厦门大学云计算与大数据研究中心 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用 http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第四章分布式数据库 HBase (PPT 版本号 :2016 年 3 月 10 日版本 ) 林子雨厦门大学计算机科学系 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用厦门大学计算机科学系 ( 第 2 版 ) 厦门大学计算机科学系林子雨 2017 年 2 月版本 ziyulin@xmu.edu.cn 大数据技术原理与应用 ( 第 2 版 ) http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 课程介绍 (PPT 版本号 :2017 年 2 月版本

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用 http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第四章分布式数据库 HBase (PPT 版本号 :2016 年 1 月 28 日版本 ) 林子雨厦门大学计算机科学系 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用 http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第四章分布式数据库 HBase (PPT 版本号 :2016 年 3 月 6 日版本 ) 林子雨厦门大学计算机科学系 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用 厦门大学计算机科学系厦门大学计算机科学系林子雨 2015 年版 ziyulin@xmu.edu.cn 大数据技术原理与应用 http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第二章大数据处理架构 Hadoop (PPT 版本号 :2015 年 6 月第 1.0 版 ) 林子雨厦门大学计算机科学系

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 Hadoop 生 态 技 术 在 阿 里 全 网 商 品 搜 索 实 战 阿 里 巴 巴 - 王 峰 自 我 介 绍 真 名 : 王 峰 淘 宝 花 名 : 莫 问 微 博 : 淘 莫 问 2006 年 硕 士 毕 业 后 加 入 阿 里 巴 巴 集 团 淘 及 搜 索 事 业 部 ( 高 级 技 术 与 家 ) 目 前 负 责 搜 索 离 线 系 统 团 队 技 术 方 向 : 分 布 式 计 算

More information

大数据技术原理与应用

大数据技术原理与应用 大数据导论 ( 通识课版 ) 教材官网 : http://dblab.xmu.edu.cn/post/bigdataintroduction/ 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 大数据导论 ( 通识课版 ) 课程介绍 (PPT 版本号 :2019 年秋季学期 ) 林子雨厦门大学计算机科学系 扫一扫访问教材官网 E-mail: ziyulin@xmu.edu.cn

More information

SDK 概要 使用 Maven 的用户可以从 Maven 库中搜索 "odps-sdk" 获取不同版本的 Java SDK: 包名 odps-sdk-core odps-sdk-commons odps-sdk-udf odps-sdk-mapred odps-sdk-graph 描述 ODPS 基

SDK 概要 使用 Maven 的用户可以从 Maven 库中搜索 odps-sdk 获取不同版本的 Java SDK: 包名 odps-sdk-core odps-sdk-commons odps-sdk-udf odps-sdk-mapred odps-sdk-graph 描述 ODPS 基 开放数据处理服务 ODPS SDK SDK 概要 使用 Maven 的用户可以从 Maven 库中搜索 "odps-sdk" 获取不同版本的 Java SDK: 包名 odps-sdk-core odps-sdk-commons odps-sdk-udf odps-sdk-mapred odps-sdk-graph 描述 ODPS 基础功能的主体接口, 搜索关键词 "odpssdk-core" 一些

More information

ABOUT ME AGENDA 唐建法 / TJ MongoDB 高级方案架构师 MongoDB 中文社区联合发起人 Spark 介绍 Spark 和 MongoDB 案例演示

ABOUT ME AGENDA 唐建法 / TJ MongoDB 高级方案架构师 MongoDB 中文社区联合发起人 Spark 介绍 Spark 和 MongoDB 案例演示 完整的大数据解決方案 ABOUT ME AGENDA 唐建法 / TJ MongoDB 高级方案架构师 MongoDB 中文社区联合发起人 Spark 介绍 Spark 和 MongoDB 案例演示 Dataframe Pig YARN Spark Stand Alone HDFS Spark Stand Alone Mesos Mesos Spark Streaming Hive Hadoop

More information

培 训 机 构 介 绍 中 科 普 开 是 国 内 首 家 致 力 于 IT 新 技 术 领 域 的 领 航 者, 专 注 于 云 计 算 大 数 据 物 联 网 移 动 互 联 网 技 术 的 培 训, 也 是 国 内 第 一 家 开 展 Hadoop 云 计 算 的 培

培 训 机 构 介 绍  中 科 普 开 是 国 内 首 家 致 力 于 IT 新 技 术 领 域 的 领 航 者, 专 注 于 云 计 算 大 数 据 物 联 网 移 动 互 联 网 技 术 的 培 训, 也 是 国 内 第 一 家 开 展 Hadoop 云 计 算 的 培 Hadoop 2.0 培 训 Hadoop 2.0Training Hadoop 2.0 运 维 与 开 发 实 战 培 训 邀 请 函 培 训 机 构 介 绍 www.zkpk.org 中 科 普 开 是 国 内 首 家 致 力 于 IT 新 技 术 领 域 的 领 航 者, 专 注 于 云 计 算 大 数 据 物 联 网 移 动 互 联 网 技 术 的 培 训, 也 是 国 内 第 一 家 开

More information

白 皮 书 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 目 录 要 点 概 述...1 业 务 挑 战...2 Hadoop* 分 发 版 注 意 事 项...3 Hadoop* 基 础 架 构 注 意 事 项

白 皮 书 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 目 录 要 点 概 述...1 业 务 挑 战...2 Hadoop* 分 发 版 注 意 事 项...3 Hadoop* 基 础 架 构 注 意 事 项 IT@Intel 白 皮 书 英 特 尔 IT 部 门 大 数 据 和 商 业 智 能 2013 年 10 月 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 要 点 概 述 仅 在 五 周 之 内, 我 们 就 实 施 了 基 于 Apache Hadoop* 英 特 尔 分 发 版 的 低 成 本 可 完 全 实 现 的 大 数

More information

长 安 大 学 硕 士 学 位 论 文 基 于 数 据 仓 库 和 数 据 挖 掘 的 行 为 分 析 研 究 姓 名 : 杨 雅 薇 申 请 学 位 级 别 : 硕 士 专 业 : 计 算 机 软 件 与 理 论 指 导 教 师 : 张 卫 钢 20100530 长安大学硕士学位论文 3 1 3系统架构设计 行为分析数据仓库的应用模型由四部分组成 如图3 3所示

More information

获取 Access Token access_token 是接口的全局唯一票据, 接入方调用各接口时都需使用 access_token 开发者需要进行妥善保存 access_token 的存储至少要保留 512 个字符空间 access_token 的有效期目前为 2 个小时, 需定时刷新, 重复

获取 Access Token access_token 是接口的全局唯一票据, 接入方调用各接口时都需使用 access_token 开发者需要进行妥善保存 access_token 的存储至少要保留 512 个字符空间 access_token 的有效期目前为 2 个小时, 需定时刷新, 重复 获取 Access Token access_token 是接口的全局唯一票据, 接入方调用各接口时都需使用 access_token 开发者需要进行妥善保存 access_token 的存储至少要保留 512 个字符空间 access_token 的有效期目前为 2 个小时, 需定时刷新, 重复 获取将导致上次获取的 access_token 失效 接入方可以使用 AppID 和 AppSecret

More information

PowerPoint Presentation

PowerPoint Presentation 大数据技术基础 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 2013 年新版 2013 年 9 月第一版 厦门大学计算机科学系研究生课程 大数据技术基础 第 7 章 HBase (2013 年新版 ) 林子雨厦门大学计算机科学系 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu 课程提要 Hbase

More information

KV-cache 1 KV-cache Fig.1 WorkflowofKV-cache 2.2 Key-value Key ; Key Mem-cache (FIFO) Value Value Key Mem-cache ( Value 256B 100 MB 20%

KV-cache 1 KV-cache Fig.1 WorkflowofKV-cache 2.2 Key-value Key ; Key Mem-cache (FIFO) Value Value Key Mem-cache ( Value 256B 100 MB 20% 38 11 2013 11 GeomaticsandInformationScienceofWuhanUniversity Vol.38No.11 Nov.2013 :1671-8860(2013)11-1339-05 :A GIS Key-value 1 1 1 1 (1 129 430079) : 设计了一种基于 Key-value 结构的缓存 KV-cache 旨在简化数据结构 高效管理缓存数据

More information

使用MapReduce读取XML文件

使用MapReduce读取XML文件 使用 MapReduce 读取 XML 文件 XML( 可扩展标记语言, 英语 :extensible Markup Language, 简称 : XML) 是一种标记语言, 也是行业标准数据交换交换格式, 它很适合在系统之间进行数据存储和交换 ( 话说 Hadoop H ive 等的配置文件就是 XML 格式的 ) 本文将介绍如何使用 MapReduce 来读取 XML 文件 但是 Had oop

More information

帝国CMS下在PHP文件中调用数据库类执行SQL语句实例

帝国CMS下在PHP文件中调用数据库类执行SQL语句实例 帝国 CMS 下在 PHP 文件中调用数据库类执行 SQL 语句实例 这篇文章主要介绍了帝国 CMS 下在 PHP 文件中调用数据库类执行 SQL 语句实例, 本文还详细介绍了帝国 CMS 数据库类中的一些常用方法, 需要的朋友可以参考下 例 1: 连接 MYSQL 数据库例子 (a.php)

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用厦门大学计算机科学系 ( 第 2 版 ) 厦门大学计算机科学系林子雨 2017 年 2 月版本 ziyulin@xmu.edu.cn 大数据技术原理与应用 ( 第 2 版 ) http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第 1 章大数据概述 (PPT 版本号 :2017 年

More information

1.JasperReport ireport JasperReport ireport JDK JDK JDK JDK ant ant...6

1.JasperReport ireport JasperReport ireport JDK JDK JDK JDK ant ant...6 www.brainysoft.net 1.JasperReport ireport...4 1.1 JasperReport...4 1.2 ireport...4 2....4 2.1 JDK...4 2.1.1 JDK...4 2.1.2 JDK...5 2.1.3 JDK...5 2.2 ant...6 2.2.1 ant...6 2.2.2 ant...6 2.3 JasperReport...7

More information

Azure_s

Azure_s Azure ? Azure Azure Windows Server Database Server Azure Azure Azure Azure Azure Azure Azure Azure OpenSource Azure IaaS Azure VM Windows Server Linux PaaS Azure ASP.NET PHP Node.js Python MS SQL MySQL

More information

Spark读取Hbase中的数据

Spark读取Hbase中的数据 Spark 读取 Hbase 中的数据 Spark 和 Flume-ng 整合, 可以参见本博客 : Spark 和 Flume-ng 整合 使用 Spark 读取 HBase 中的数据 如果想及时了解 Spark Hadoop 或者 Hbase 相关的文章, 欢迎关注微信公共帐号 :iteblog_hadoop 大家可能都知道很熟悉 Spark 的两种常见的数据读取方式 ( 存放到 RDD 中 ):(1)

More information

<4D6963726F736F667420576F7264202D204861646F6F70B4F3CAFDBEDDBCB0BAA3C1BFCAFDBEDDCDDABEF2D3A6D3C3B9A4B3CCCAA6C5E0D1B5B0E056312E332E646F63>

<4D6963726F736F667420576F7264202D204861646F6F70B4F3CAFDBEDDBCB0BAA3C1BFCAFDBEDDCDDABEF2D3A6D3C3B9A4B3CCCAA6C5E0D1B5B0E056312E332E646F63> 关 于 举 办 Hadoop 大 数 据 及 海 量 数 据 挖 掘 应 用 工 程 师 培 训 班 的 通 知 随 着 云 时 代 的 来 临, 大 数 据 技 术 将 具 有 越 来 越 重 要 的 战 略 意 义 大 数 据 分 析 与 挖 掘 技 术 已 经 渗 透 到 每 一 个 行 业 和 业 务 职 能 领 域, 逐 渐 成 为 重 要 的 生 产 要 素, 人 们 对 于 海 量 数

More information

大数据技术基础(2013版)

大数据技术基础(2013版) 大数据技术基础 厦门大学计算机科学系厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 2013 年新版 2013 年 9 月第一版 厦门大学计算机科学系研究生课程 大数据技术基础 第 11 章云数据库 (2013 年新版 ) 林子雨 厦门大学计算机科学系 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu 提纲

More information

Kubenetes 系列列公开课 2 每周四晚 8 点档 1. Kubernetes 初探 2. 上 手 Kubernetes 3. Kubernetes 的资源调度 4. Kubernetes 的运 行行时 5. Kubernetes 的 网络管理理 6. Kubernetes 的存储管理理 7.

Kubenetes 系列列公开课 2 每周四晚 8 点档 1. Kubernetes 初探 2. 上 手 Kubernetes 3. Kubernetes 的资源调度 4. Kubernetes 的运 行行时 5. Kubernetes 的 网络管理理 6. Kubernetes 的存储管理理 7. Kubernetes 包管理理 工具 Helm 蔺礼强 Kubenetes 系列列公开课 2 每周四晚 8 点档 1. Kubernetes 初探 2. 上 手 Kubernetes 3. Kubernetes 的资源调度 4. Kubernetes 的运 行行时 5. Kubernetes 的 网络管理理 6. Kubernetes 的存储管理理 7. Kubernetes

More information

本章学习目标 小风 Java 实战系列教程 SpringMVC 简介 SpringMVC 的入门案例 SpringMVC 流程分析 配置注解映射器和适配器 注解的使用 使用不同方式的跳转页面 1. SpringMVC 简介 Spring web mvc

本章学习目标 小风 Java 实战系列教程 SpringMVC 简介 SpringMVC 的入门案例 SpringMVC 流程分析 配置注解映射器和适配器 注解的使用 使用不同方式的跳转页面 1. SpringMVC 简介 Spring web mvc 本章学习目标 SpringMVC 简介 SpringMVC 的入门案例 SpringMVC 流程分析 配置注解映射器和适配器 配置视图解析器 @RequestMapping 注解的使用 使用不同方式的跳转页面 1. SpringMVC 简介 Spring web mvc 和 Struts2 都属于表现层的框架, 它是 Spring 框架的一部分, 我们可 以从 Spring 的整体结构中看得出来 :

More information

业 务 与 运 营 Business & Operation (Transform) 加 载 (Load) 至 目 的 端 的 过 程, 该 部 分 在 数 据 挖 掘 和 分 析 过 程 中 为 最 基 础 的 一 部 分 一 个 良 好 的 ETL 系 统 应 该 有 以 下 几 个 功 能 1

业 务 与 运 营 Business & Operation (Transform) 加 载 (Load) 至 目 的 端 的 过 程, 该 部 分 在 数 据 挖 掘 和 分 析 过 程 中 为 最 基 础 的 一 部 分 一 个 良 好 的 ETL 系 统 应 该 有 以 下 几 个 功 能 1 Business & Operation 业 务 与 运 营 大 数 据 技 术 在 精 准 营 销 中 的 应 用 王 小 鹏 北 京 东 方 国 信 科 技 股 份 有 限 公 司 北 京 100102 摘 要 简 要 介 绍 主 流 的 大 数 据 技 术 架 构 和 大 数 据 挖 掘 技 术 ; 阐 述 大 数 据 技 术 在 精 准 营 销 与 维 系 系 统 建 设 中 的 应 用,

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用 http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第八讲基于 Hadoop 的数据仓库 Hive (PPT 版本号 :2016 年 4 月 6 日版本 ) 林子雨厦门大学计算机科学系 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu

More information

大数据技术原理与应用

大数据技术原理与应用 厦门大学研究生课程 大数据处理技术 Spark http://dblab.xmu.edu.cn/post/7659/ 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第 4 章 Spark 安装和使用方法 (PPT 版本号 :2017 年春季学期 ) 林子雨厦门大学计算机科学系 扫一扫访问班级主页 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu

More information

大数据技术原理与应用

大数据技术原理与应用 Spark 编程基础 (Python 厦门大学计算机科学系版 ) 厦门大学计算机科学系林子雨 2019 版 ziyulin@xmu.edu.cn Spark 编程基础 (Python 版 ) 教材官网 : http://dblab.xmu.edu.cn/post/spark-python/ 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第 5 章 Spark SQL (PPT

More information

通过Hive将数据写入到ElasticSearch

通过Hive将数据写入到ElasticSearch 我在 使用 Hive 读取 ElasticSearch 中的数据 文章中介绍了如何使用 Hive 读取 ElasticSearch 中的数据, 本文将接着上文继续介绍如何使用 Hive 将数据写入到 ElasticSearch 中 在使用前同样需要加入 elasticsearch-hadoop-2.3.4.jar 依赖, 具体请参见前文介绍 我们先在 Hive 里面建个名为 iteblog 的表,

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 大数据分析工具介绍 主讲 : 王建明 手机 :13940975206 QQ:564250480( 微信 ) 2/39 大数据的基本特征 特征 Volume 数据体量巨大 PB 级 -> EB 级 -> ZB 级 速度要求快数据输入输出的速度 Velocity Big Data Varity 数据类型多样文本 图像 视频 音频 Veracity 价值密度低商业价值高 Hadoop 生态系统介绍 ( 离线

More information

大数据技术基础

大数据技术基础 获取教材和讲义 PPT 等各种课程资料请访问 http://dblab.xmu.edu.cn/node/422 = 课程教材由林子雨老师根据网络资料编著 = 厦门大学计算机科学系教师林子雨编著 http://www.cs.xmu.edu.cn/linziyu 2013 年 9 月 1 / 38 前言 本教程由厦门大学计算机科学系教师林子雨编著, 可以作为计算机专业研究生课程 大数据技术基础 的辅助教材

More information

Reducing Client Incidents through Big Data Predictive Analytics

Reducing Client Incidents through Big Data Predictive Analytics IT@lntel 白 皮 书 英 特 尔 IT 部 门 IT 最 佳 实 践 大 数 据 预 测 分 析 2013 年 12 月 通 过 大 数 据 预 测 分 析 减 少 客 户 端 事 故 总 体 概 述 相 比 过 去 的 被 动 反 应, 我 们 现 在 能 够 更 容 易 主 动 找 出 客 户 端 问 题, 并 及 时 将 其 修 复 以 免 问 题 扩 大, 从 而 为 企 业 节 约

More information

幻灯片 1

幻灯片 1 高校大数据应用与学科人才培养研讨会 厦门大学林子雨博士 / 助理教授 ziyulin@xmu.edu.cn 2017 年 8 月 3 日山东. 烟台 内容提要 大数据课程公共服务平台 大数据技术原理与应用课程建设经验 大数据处理技术 Spark 课程建设经验 大数据课程公共服务平台 大数据课程公共服务平台 建设周期四年 (2013-2017) 投入资金 100 万 + 大数据课程公共服务平台 打造

More information

水晶分析师

水晶分析师 大数据时代的挑战 产品定位 体系架构 功能特点 大数据处理平台 行业大数据应用 IT 基础设施 数据源 Hadoop Yarn 终端 统一管理和监控中心(Deploy,Configure,monitor,Manage) Master Servers TRS CRYSTAL MPP Flat Files Applications&DBs ETL&DI Products 技术指标 1 TRS

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用厦门大学计算机科学系 ( 第 2 版 ) 厦门大学计算机科学系林子雨 2017 年 2 月版本 ziyulin@xmu.edu.cn 大数据技术原理与应用 ( 第 2 版 ) http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第 2 章大数据处理架构 Hadoop (PPT 版本号

More information

提纲 2 / 1

提纲 2 / 1 小米 HBase 实践 刘绍辉 小米云存储组 China Hadoop Summit 2013 提纲 2 / 1 提纲 3 / 1 HBase 是什么? Google Bigtable 系统的开源实现 分布式的, 可扩展的, 一致性的, 半结构化数据存储系统 稀疏的, 一致性的, 分布式的, 多维有序的映射表 4 / 1 数据模型 表 行 列簇 列 版本 ( 时间戳 ) 多维映射表 : ( 行 key,

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 Apache Spark 与 多 数 据 源 的 结 合 田 毅 @ 目 录 为 什 么 会 用 到 多 个 数 据 源 Spark 的 多 数 据 源 方 案 有 哪 些 已 有 的 数 据 源 支 持 Spark 在 GrowingIO 的 实 践 分 享 为 什 么 会 用 到 多 个 数 据 源 从 数 据 本 身 来 看 大 数 据 的 特 性 之 一 :Variety 数 据 的 多 样

More information

Hive:用Java代码通过JDBC连接Hiveserver

Hive:用Java代码通过JDBC连接Hiveserver Hive: 用 Java 代码通过 JDBC 连接 Hiveserver 我们可以通过 CLI Client Web UI 等 Hive 提供的用户接口来和 Hive 通信, 但这三种方式最常用的是 CLI;Client 是 Hive 的客户端, 用户连接至 Hive Server 在启动 Client 模式的时候, 需要指出 Hive Server 所在节点, 并且在该节点启动 Hive Server

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用厦门大学计算机科学系 ( 第 2 版 ) 厦门大学计算机科学系林子雨 2017 年 2 月版本 ziyulin@xmu.edu.cn 大数据技术原理与应用 ( 第 2 版 ) http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第 3 章分布式文件系统 HDFS (PPT 版本号 :2017

More information

1 1 大概思路 创建 WebAPI 创建 CrossMainController 并编写 Nuget 安装 microsoft.aspnet.webapi.cors 跨域设置路由 编写 Jquery EasyUI 界面 运行效果 2 创建 WebAPI 创建 WebAPI, 新建 -> 项目 ->

1 1 大概思路 创建 WebAPI 创建 CrossMainController 并编写 Nuget 安装 microsoft.aspnet.webapi.cors 跨域设置路由 编写 Jquery EasyUI 界面 运行效果 2 创建 WebAPI 创建 WebAPI, 新建 -> 项目 -> 目录 1 大概思路... 1 2 创建 WebAPI... 1 3 创建 CrossMainController 并编写... 1 4 Nuget 安装 microsoft.aspnet.webapi.cors... 4 5 跨域设置路由... 4 6 编写 Jquery EasyUI 界面... 5 7 运行效果... 7 8 总结... 7 1 1 大概思路 创建 WebAPI 创建 CrossMainController

More information

停止混流接口 请注意 : 该功能需要联系 ZEGO 技术支持开通 1 接口调用说明 http 请求方式 : POST/FORM, 需使用 https 正式环境地址 access_token=access_token (http

停止混流接口 请注意 : 该功能需要联系 ZEGO 技术支持开通 1 接口调用说明 http 请求方式 : POST/FORM, 需使用 https 正式环境地址   access_token=access_token (http 停止混流接口 请注意 : 该功能需要联系 ZEGO 技术支持开通 1 接口调用说明 http 请求方式 : POST/FORM, 需使用 https 正式环境地址 https://webapi.zego.im/cgi/stop-mix? access_token=access_token (https://webapi.zego.im/cgi/stop-mix? access_token=access_token)

More information

Microsoft Word - 《Hadoop大数据技术与应用》教学大纲.doc

Microsoft Word - 《Hadoop大数据技术与应用》教学大纲.doc Hadoop 大数据技术原理与应用 课程教学大纲 ( 课程英文名称 ) 课程编号 :201800522062 学分 :5 学分学时 :63 学时 ( 其中 : 讲课学时 51 上机学时 :12) 先修课程 : 后续课程 :Spark 适用专业 : 大数据应用技术开课部门 : 一 课程的性质与目标 Hadoop 大数据技术原理与应用 是互联网 + 创业教育学院软件工程 ( 大数据 人工智能 ) 专业的一门校定必修专业课

More information

大数据分析技术 [13] 1.1 大数据 Big Data [2] IBM 5V Volume Velocity Variety Value Veracity Volume Velocity Variety Value Veracity 表 1 大数据特征表 Tab.1

大数据分析技术 [13] 1.1 大数据 Big Data [2] IBM 5V Volume Velocity Variety Value Veracity Volume Velocity Variety Value Veracity 表 1 大数据特征表 Tab.1 2016 2016, Vol. 37, No. 01 37 01 COMPUTER ENGINEERING & SOFTWARE IT 大数据在输变电设备状态评估中的研究 周广 1, 闫丹凤 1, 许光可 2, 李笋 1. 100876 2. 250001 2 摘要 : 电网的高速发展带来海量数据的存储和分析问题, 传统的数据管理和分析工具不再适用 本文主要对大数据分析的相关技术在输变电设备状态评估中的应用进行了研究

More information

大云在电子政务的推广应用,探索商业服务的落地模式

大云在电子政务的推广应用,探索商业服务的落地模式 HBase Coprocessor 优化与实验 郭磊涛 2012 年 12 月 1 HBase 简介 HBase 是在 Hadoop 之上构建的非关系型 面向列存储的开源分布式结构化 数据存储系统 HBase 表分区与索引管理 将 Table 中的数据根据 rowkey 字段划分为多个 H H 分配给 Server 管理 三级元数据 : - MetaTable: 与 Server 的映 射信息 -

More information

大数据技术原理与应用

大数据技术原理与应用 NoSQL 数据库 厦门大学云计算与大数据研究中心厦门大学云计算与大数据研究中心林子雨 2015 ziyulin@xmu.edu.cn 年版 大数据知识体系型公开课 大数据概念 技术与应用 第 5 讲 NoSQL 数据库 林子雨博士 / 助理教授厦门大学计算机科学系厦门大学云计算与大数据研究中心 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu

More information

雲端 Cloud Computing 技術指南 運算 應用 平台與架構 10/04/15 11:55:46 INFO 10/04/15 11:55:53 INFO 10/04/15 11:55:56 INFO 10/04/15 11:56:05 INFO 10/04/15 11:56:07 INFO

雲端 Cloud Computing 技術指南 運算 應用 平台與架構 10/04/15 11:55:46 INFO 10/04/15 11:55:53 INFO 10/04/15 11:55:56 INFO 10/04/15 11:56:05 INFO 10/04/15 11:56:07 INFO CHAPTER 使用 Hadoop 打造自己的雲 8 8.3 測試 Hadoop 雲端系統 4 Nodes Hadoop Map Reduce Hadoop WordCount 4 Nodes Hadoop Map/Reduce $HADOOP_HOME /home/ hadoop/hadoop-0.20.2 wordcount echo $ mkdir wordcount $ cd wordcount

More information

册子0906

册子0906 IBM SelectStack ( PMC v2.0 ) 模块化私有云管理平台 是跨主流虚拟化技术的统一资源云管理平台 01 亮点 : 快速可靠地实现集成化 私有云管理平台 02/03 丰富的功能支持企业数据中心云计算 扩展性强 : 简单易用 : 04/05 功能丰富 : 06/07 为什么选择 IBM SelectStack (PMC v2.0)? 快速实现价值 提高创新能力 降低 IT 成本 降低复杂度和风险

More information

Guava学习之Resources

Guava学习之Resources Resources 提供提供操作 classpath 路径下所有资源的方法 除非另有说明, 否则类中所有方法的参数都不能为 null 虽然有些方法的参数是 URL 类型的, 但是这些方法实现通常不是以 HTTP 完成的 ; 同时这些资源也非 classpath 路径下的 下面两个函数都是根据资源的名称得到其绝对路径, 从函数里面可以看出,Resources 类中的 getresource 函数都是基于

More information

目 录(目录名)

目  录(目录名) 目录 目录...1-1 1.1 域名解析配置命令... 1-1 1.1.1 display dns domain... 1-1 1.1.2 display dns dynamic-host... 1-1 1.1.3 display dns server... 1-2 1.1.4 display ip host... 1-3 1.1.5 dns domain... 1-4 1.1.6 dns resolve...

More information

Apache CarbonData集群模式使用指南

Apache CarbonData集群模式使用指南 我们在 Apache CarbonData 快速入门编程指南 文章中介绍了如何快速使用 Apache CarbonData, 为了简单起见, 我们展示了如何在单机模式下使用 Apache CarbonData 但是生产环境下一般都是使用集群模式, 本文主要介绍如何在集群模式下使用 Apache CarbonData 启动 Spark shell 这里以 Spark shell 模式进行介绍,master

More information

<4D6963726F736F667420506F776572506F696E74202D20332D322E432B2BC3E6CFF2B6D4CFF3B3CCD0F2C9E8BCC6A1AAD6D8D4D8A1A2BCCCB3D0A1A2B6E0CCACBACDBEDBBACF2E707074>

<4D6963726F736F667420506F776572506F696E74202D20332D322E432B2BC3E6CFF2B6D4CFF3B3CCD0F2C9E8BCC6A1AAD6D8D4D8A1A2BCCCB3D0A1A2B6E0CCACBACDBEDBBACF2E707074> 程 序 设 计 实 习 INFO130048 3-2.C++ 面 向 对 象 程 序 设 计 重 载 继 承 多 态 和 聚 合 复 旦 大 学 计 算 机 科 学 与 工 程 系 彭 鑫 pengxin@fudan.edu.cn 内 容 摘 要 方 法 重 载 类 的 继 承 对 象 引 用 和 拷 贝 构 造 函 数 虚 函 数 和 多 态 性 类 的 聚 集 复 旦 大 学 计 算 机 科 学

More information

C++ 程序设计 告别 OJ1 - 参考答案 MASTER 2019 年 5 月 3 日 1

C++ 程序设计 告别 OJ1 - 参考答案 MASTER 2019 年 5 月 3 日 1 C++ 程序设计 告别 OJ1 - 参考答案 MASTER 2019 年 月 3 日 1 1 INPUTOUTPUT 1 InputOutput 题目描述 用 cin 输入你的姓名 ( 没有空格 ) 和年龄 ( 整数 ), 并用 cout 输出 输入输出符合以下范例 输入 master 999 输出 I am master, 999 years old. 注意 "," 后面有一个空格,"." 结束,

More information

HBase_train_Stark

HBase_train_Stark 大数据快速入门培训 08/13/2016 HBase 大纲 HBase 介绍及特点 HBase 系统架构 HBase 集群搭建 HBase 存储结构 HBase 关键流程 HBase 使用及开发 HBase 起源 Google 三大论文中的 BigTable 2007 年 Powerset 上最早应用 2008 年成为 Hadoop 的一个子项目, 放于 contrib 目录下 Top-level-project

More information

第 06 期 李祥池 : 基于 ELK 和 Spark Streaming 的日志分析系统设计与实现 1 日志 1.1 日志定义 IT 1.2 日志处理方案演进 v1.0 v2.0 Hadoop Storm Spark Hadoop/Storm/Spark v3.0 TB Splunk ELK SI

第 06 期 李祥池 : 基于 ELK 和 Spark Streaming 的日志分析系统设计与实现 1 日志 1.1 日志定义 IT 1.2 日志处理方案演进 v1.0 v2.0 Hadoop Storm Spark Hadoop/Storm/Spark v3.0 TB Splunk ELK SI 电子科学技术第 02 卷第 06 期 2015 年 11 月 Electronic Science & Technology Vol.02 No.06 Nov.2015 年 基于 ELK 和 Spark Streaming 的日志分析系统设计与实现 李祥池 ( 杭州华三通信技术有限公司北京研究所, 北京,100085) 摘要 : 在大数据时代 对数据平台各组件的运行状态实时监控与运行分析具有重要意义

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用 厦门大学计算机科学系厦门大学计算机科学系林子雨 2016 年版 ziyulin@xmu.edu.cn 大数据技术原理与应用 http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第一章大数据概述 (PPT 版本号 :2016 年 1 月 24 日版本 ) 林子雨厦门大学计算机科学系

More information

1: public class MyOutputStream implements AutoCloseable { 3: public void close() throws IOException { 4: throw new IOException(); 5: } 6:

1: public class MyOutputStream implements AutoCloseable { 3: public void close() throws IOException { 4: throw new IOException(); 5: } 6: Chapter 15. Suppressed Exception CH14 Finally Block Java SE 7 try-with-resources JVM cleanup try-with-resources JVM cleanup cleanup Java SE 7 Throwable getsuppressed Throwable[] getsuppressed() Suppressed

More information

OOP with Java 通知 Project 4: 4 月 18 日晚 9 点 关于抄袭 没有分数

OOP with Java 通知 Project 4: 4 月 18 日晚 9 点 关于抄袭 没有分数 OOP with Java Yuanbin Wu cs@ecnu OOP with Java 通知 Project 4: 4 月 18 日晚 9 点 关于抄袭 没有分数 复习 类的复用 组合 (composition): has-a 关系 class MyType { public int i; public double d; public char c; public void set(double

More information

ChinaBI企业会员服务- BI企业

ChinaBI企业会员服务- BI企业 商业智能 (BI) 开源工具 Pentaho BisDemo 介绍及操作说明 联系人 : 杜号权苏州百咨信息技术有限公司电话 : 0512-62861389 手机 :18616571230 QQ:37971343 E-mail:du.haoquan@bizintelsolutions.com 权限控制管理 : 权限控制管理包括 : 浏览权限和数据权限 ( 权限部分两个角色 :ceo,usa; 两个用户

More information

新・解きながら学ぶJava

新・解きながら学ぶJava 481! 41, 74!= 40, 270 " 4 % 23, 25 %% 121 %c 425 %d 121 %o 121 %x 121 & 199 && 48 ' 81, 425 ( ) 14, 17 ( ) 128 ( ) 183 * 23 */ 3, 390 ++ 79 ++ 80 += 93 + 22 + 23 + 279 + 14 + 124 + 7, 148, 16 -- 79 --

More information

Partition Key: 字 符 串 类 型, 表 示 当 前 Entity 的 分 区 信 息 这 个 Property 对 于 Table Service 自 动 纵 向 和 横 向 扩 展 至 关 重 要 Row Key: 字 符 串 类 型, 在 给 定 Partition Key 的

Partition Key: 字 符 串 类 型, 表 示 当 前 Entity 的 分 区 信 息 这 个 Property 对 于 Table Service 自 动 纵 向 和 横 向 扩 展 至 关 重 要 Row Key: 字 符 串 类 型, 在 给 定 Partition Key 的 4.2 使 用 Table Service Table Service 相 对 来 说 是 三 个 Storage Service 中 最 好 理 解 和 最 易 于 接 受 的, 它 主 要 用 来 存 储 结 构 化 数 据 但 是 Table Service 却 并 不 是 一 个 关 系 型 数 据 库 Table Service 由 两 个 部 分 组 成 :Table 和 Entity

More information

六域链联盟 SDChain-Matrix 节点搭建指南 2018/07/26 Version : 1.0.0

六域链联盟 SDChain-Matrix 节点搭建指南 2018/07/26 Version : 1.0.0 SDChain-Matrix 节点搭建指南 目录 1 环境要求... 3 2 软件下载... 4 3 安装部署... 4 3.1 部署可执行程序目录... 4 3.2 部署配置文件目录... 4 3.3 部署数据库文件目录... 4 3.4 部署日志文件目录... 4 3.5 部署依赖库文件目录... 4 4 配置参数... 5 5 启动运行... 7 5.1 普通模式启动... 7 5.2 加载启动模式...

More information

“百企入校——广西青年企业家协会高校

“百企入校——广西青年企业家协会高校 百 企 入 校 广 西 青 年 企 业 家 协 会 高 校 毕 业 生 就 业 专 场 招 聘 会 信 息 简 介 时 间 :2016 年 6 月 12 日 9:00 14:00 地 点 : 广 西 财 经 学 院 明 秀 校 区 东 区 篮 球 场 ( 南 宁 市 西 乡 塘 区 明 秀 西 路 100 号 ) 面 向 对 象 : 1.2016 届 高 校 毕 业 生 往 届 毕 业 生 2. 服

More information

旅游科学

旅游科学 旅 游 科 学 王春雷 会展专业人才培养模式是一个院校对于会展办学的整体设计 因而需要进行系统性的构建 但目前这方面的研究成果不多 更缺乏实证性的研究 本 文基于文献综述的发现和会展专业的特点 从理论上构建了一个项目驱动型会展 专业人才培养模式的基本框架 进而以上海师范大学会展经济与管理专业为例 侧重从教育理念 培养目标 培养过程 培养制度和培养评价等方面进行了实证研究 项目驱动型 会展专业 人才培养模式

More information

2

2 2 3 4 5 6 1 1 1 1 3 1 2 7 13... 2... 4 1... 6... 8... 20... 22... 26 Chapter 01 contents 14 contents... 29... 33... 37 Column... 40... 42... 44... 47 Chapter 02 15... 54... 59... 66 S... 68... 72... 74...

More information

气溶胶光学厚度 的测量原理 Ê

气溶胶光学厚度 的测量原理 Ê 肖钟湧 江洪 余树全 周国模 陈然 宋晓东 焦荔 洪盛茂 常杰 江波 南京大学国际地球系统科学研究所 南京 浙江林学院国际空间生态与生态系统生态研究中心 杭州 杭州市环境监测总站 杭州 浙江大学生命科学学院 杭州 浙江省林业科学研究院 杭州 气溶胶光学厚度 的测量原理 Ê 仪器和观测 实验场地 数据处理 气溶胶光学厚度的高光谱反演 浑浊度系数 波长指数 Ê Ê 精度检验 气溶胶光学厚度 浑浊度系数

More information

目 录 1 不 断 开 发 工 具 以 管 理 大 数 据...2 1.1 Hadoop* 简 介 : 支 持 从 大 数 据 中 获 得 出 色 价 值 的 可 靠 框 架... 2 1.2 大 数 据 技 术 的 行 业 生 态 系 统... 2 2 在 关 键 组 件 中 实 现 平 衡...

目 录 1 不 断 开 发 工 具 以 管 理 大 数 据...2 1.1 Hadoop* 简 介 : 支 持 从 大 数 据 中 获 得 出 色 价 值 的 可 靠 框 架... 2 1.2 大 数 据 技 术 的 行 业 生 态 系 统... 2 2 在 关 键 组 件 中 实 现 平 衡... 白 皮 书 英 特 尔 固 态 硬 盘 英 特 尔 以 太 网 融 合 网 络 英 特 尔 Hadoop* 发 行 版 软 件 应 用 大 数 据 技 术 获 得 近 实 时 分 析 巨 大 成 效 1 平 衡 的 基 础 设 施 使 工 作 负 载 完 成 时 间 从 4 小 时 缩 短 为 7 如 今, 基 于 广 泛 可 用 的 计 算 存 储 和 网 络 组 件 的 改 进, 商 业 学 术

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用 厦门大学计算机科学系厦门大学计算机科学系林子雨 2015 年版 ziyulin@xmu.edu.cn 大数据技术原理与应用 http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第 5 章 NoSQL 数据库 (PPT 版本号 :2015 年 6 月第 1.0 版 ) 林子雨厦门大学计算机科学系

More information

Java java.lang.math Java Java.util.Random : ArithmeticException int zero = 0; try { int i= 72 / zero ; }catch (ArithmeticException e ) { // } 0,

Java java.lang.math Java Java.util.Random : ArithmeticException int zero = 0; try { int i= 72 / zero ; }catch (ArithmeticException e ) { // } 0, http://debut.cis.nctu.edu.tw/~chi Java java.lang.math Java Java.util.Random : ArithmeticException int zero = 0; try { int i= 72 / zero ; }catch (ArithmeticException e ) { // } 0, : POSITIVE_INFINITY NEGATIVE_INFINITY

More information

Hadoop&Spark解决二次排序问题(Hadoop篇)

Hadoop&Spark解决二次排序问题(Hadoop篇) Hadoop&Spark 解决二次排序问题 (Spark 篇 ) 问题描述 二次排序就是 key 之间有序, 而且每个 Key 对应的 value 也是有序的 ; 也就是对 MapReduce 的输出 (KEY, Value(v 1,v 2,v 3,...,v n )) 中的 Value(v 1,v 2,v 3,...,v n ) 值进行排序 ( 升序或者降序 ), 使得 Value(s 1,s 2,s

More information

エスポラージュ株式会社 住所 : 東京都江東区大島 東急ドエルアルス大島 HP: ******************* * 关于 Java 测试试题 ******

エスポラージュ株式会社 住所 : 東京都江東区大島 東急ドエルアルス大島 HP:  ******************* * 关于 Java 测试试题 ****** ******************* * 关于 Java 测试试题 ******************* 問 1 运行下面的程序, 选出一个正确的运行结果 public class Sample { public static void main(string[] args) { int[] test = { 1, 2, 3, 4, 5 ; for(int i = 1 ; i System.out.print(test[i]);

More information

Flume-ng与Mysql整合开发

Flume-ng与Mysql整合开发 Flume-ng 与 Mysql 整合开发 我们知道,Flume 可以和许多的系统进行整合, 包括了 Hadoop Spark Kafka Hbase 等等 ; 当然, 强悍的 Flume 也是可以和 Mysql 进行整合, 将分析好的日志存储到 Mysql( 当然, 你也可以存放到 pg oracle 等等关系型数据库 ) 不过我这里想多说一些 :Flume 是分布式收集日志的系统 ; 既然都分布式了,

More information

天津天狮学院关于修订2014级本科培养方案的指导意见

天津天狮学院关于修订2014级本科培养方案的指导意见 目 录 天 津 天 狮 院 关 于 修 订 2014 级 本 科 培 养 方 案 的 指 导 意 见...1 金 融 类 专 业...9 金 融 专 业 培 养 方 案...9 保 险 专 业 培 养 方 案...14 人 力 资 源 管 理 专 业 培 养 方 案...19 劳 动 与 社 会 保 障 专 业 培 养 方 案...24 工 商 管 理 类 专 业...29 市 场 营 销 专 业

More information

厦门大学辅助国内高校开设大数据课程公益项目 一 项目名称厦门大学辅助国内高校开设大数据课程公益项目二 项目介绍大数据时代的到来, 迫切需要高校及时建立大数据技术课程体系, 为社会培养和输送一大批具备大数据专业素养的高级人才, 满足社会对大数据人才日益旺盛的需求 本项目旨在为高校教师开设入门级大数据课

厦门大学辅助国内高校开设大数据课程公益项目 一 项目名称厦门大学辅助国内高校开设大数据课程公益项目二 项目介绍大数据时代的到来, 迫切需要高校及时建立大数据技术课程体系, 为社会培养和输送一大批具备大数据专业素养的高级人才, 满足社会对大数据人才日益旺盛的需求 本项目旨在为高校教师开设入门级大数据课 说 明 书 厦门大学数据库实验室 2015 年 9 月 1 日 厦门大学辅助国内高校开设大数据课程公益项目 一 项目名称厦门大学辅助国内高校开设大数据课程公益项目二 项目介绍大数据时代的到来, 迫切需要高校及时建立大数据技术课程体系, 为社会培养和输送一大批具备大数据专业素养的高级人才, 满足社会对大数据人才日益旺盛的需求 本项目旨在为高校教师开设入门级大数据课程提供全流程辅助, 大力推进高校大数据课程建设

More information

MASQUERADE # iptables -t nat -A POSTROUTING -s / o eth0 -j # sysctl net.ipv4.ip_forward=1 # iptables -P FORWARD DROP #

MASQUERADE # iptables -t nat -A POSTROUTING -s / o eth0 -j # sysctl net.ipv4.ip_forward=1 # iptables -P FORWARD DROP # iptables 默认安全规则脚本 一 #nat 路由器 ( 一 ) 允许路由 # iptables -A FORWARD -i eth0 -o eth1 -j ACCEPT ( 二 ) DNAT 与端口转发 1 启用 DNAT 转发 # iptables -t nat -A PREROUTING -p tcp -d 192.168.102.37 dprot 422 -j DNAT to-destination

More information

目录 1 本期内容 HBase 简介 HBase 体系结构 Client Zookeeper HMaster HRegion HRegion Server

目录 1 本期内容 HBase 简介 HBase 体系结构 Client Zookeeper HMaster HRegion HRegion Server 细细品味 Hadoop Hadoop 集群 ( 第 11 期 ) 精华集锦 csaxp http://www.xiapistudio.com/ 2012 年 3 月 17 日 目录 1 本期内容... 2 1.1 HBase 简介... 2 1.2 HBase 体系结构... 3 1.2.1 Client... 3 1.2.2 Zookeeper... 3 1.2.3 HMaster... 4 1.2.4

More information

目录 1 IPv6 快速转发 IPv6 快速转发配置命令 display ipv6 fast-forwarding aging-time display ipv6 fast-forwarding cache ipv6 fas

目录 1 IPv6 快速转发 IPv6 快速转发配置命令 display ipv6 fast-forwarding aging-time display ipv6 fast-forwarding cache ipv6 fas 目录 1 IPv6 快速转发 1-1 1.1 IPv6 快速转发配置命令 1-1 1.1.1 display ipv6 fast-forwarding aging-time 1-1 1.1.2 display ipv6 fast-forwarding cache 1-1 1.1.3 ipv6 fast-forwarding aging-time 1-3 1.1.4 ipv6 fast-forwarding

More information

PowerPoint Presentation

PowerPoint Presentation MATLAB 与 Spark/Hadoop 相集成 : 实现大数据的处理和价值挖 马文辉 2015 The MathWorks, Inc. 1 内容 大数据及其带来的挑战 MATLAB 大数据处理 tall 数组 并行与分布式计算 MATLAB 与 Spark/Hadoop 集成 MATLAB 访问 HDFS(Hadoop 分布式文件系统 ) 在 Spark/Hadoop 集群上运行 MATLAB

More information

操作指南产品文档

操作指南产品文档 云数据库 Hbase 操作指南 产品文档 版权声明 2015-2016 腾讯云版权所有 本文档著作权归腾讯云单独所有, 未经腾讯云事先书面许可, 任何主体不得以任何形式复制 修改 抄袭 传 播全部或部分本文档内容 商标声明 及其它腾讯云服务相关的商标均为腾讯云计算 ( 北京 ) 有限责任公司及其关联公司所有 本文档涉及的第三方 主体的商标, 依法由权利人所有 服务声明 本文档意在向客户介绍腾讯云全部或部分产品

More information

chp6.ppt

chp6.ppt Java 软 件 设 计 基 础 6. 异 常 处 理 编 程 时 会 遇 到 如 下 三 种 错 误 : 语 法 错 误 (syntax error) 没 有 遵 循 语 言 的 规 则, 出 现 语 法 格 式 上 的 错 误, 可 被 编 译 器 发 现 并 易 于 纠 正 ; 逻 辑 错 误 (logic error) 即 我 们 常 说 的 bug, 意 指 编 写 的 代 码 在 执 行

More information

Java ¿ª·¢ 2.0: Óà Hadoop MapReduce ½øÐдóÊý¾Ý·ÖÎö

Java ¿ª·¢ 2.0: Óà Hadoop MapReduce ½øÐдóÊý¾Ý·ÖÎö 中 文 登 录 ( 或 注 册 ) 技 术 主 题 软 件 下 载 社 区 技 术 讲 座 搜 索 developerworks developerworks 技 术 主 题 Java technology 文 档 库 Java 开 发 2.0: 用 Hadoop MapReduce 进 行 大 数 据 分 析 成 堆 的 数 据 如 何 变 成 信 息 金 矿 Andrew Glover, 作 家

More information

合集

合集 Ver 1.0 版 本 目 录 第 一 章 当 大 数 据 遇 上 SSD 01 第 二 章 广 东 移 动 运 用 Hadoop 创 新 应 用 04 第 三 章 第 四 章 第 五 章 第 六 章 第 七 章 第 八 章 第 九 章 第 十 章 如 何 利 用 大 数 据 分 析 提 升 垃 圾 短 信 过 滤 效 果 广 东 电 信 用 大 数 据 重 构 室 内 网 优 大 数 据 提 升

More information

chapter 2 HTML5 目錄iii HTML HTML HTML HTML HTML canvas

chapter 2 HTML5 目錄iii HTML HTML HTML HTML HTML canvas Contents 目錄 chapter 1 1-1... 1-2 1-2... 1-3 HTML5... 1-3... 1-5 1-3... 1-9 Web Storage... 1-9... 1-10 1-4 HTML5... 1-14... 1-14... 1-15 HTML5... 1-15... 1-15... 1-16 1-5... 1-18 Apps... 1-18 HTML5 Cache

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用厦门大学计算机科学系 ( 第 2 版 ) 厦门大学计算机科学系林子雨 2017 年 2 月版本 ziyulin@xmu.edu.cn 大数据技术原理与应用 ( 第 2 版 ) http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第 13 章大数据在不同领域的应用 (PPT 版本号 :2017

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 The BitCoin Scripting Language 交易实例 交易结构 "result": { "txid": "921a dd24", "hash": "921a dd24", "version": 1, "size": 226, "locktime": 0, "vin": [ ], "vout": [ ], "blockhash": "0000000000000000002c510d

More information

使用Apache Beam读写HDFS上的文件

使用Apache Beam读写HDFS上的文件 Apache Beam( 原名 Google DataFlow) 是 Google 在 2016 年 2 月份贡献给 Apache 基金会的 Apache 孵化项目, 被认为是继 MapReduce,GFS 和 BigQuery 等之后,Google 在大数据处理领域对开源社区的又一个非常大的贡献 Apache Beam 的主要目标是统一批处理和流处理的编程范式, 为无限, 乱序,web-scale

More information

JavaIO.PDF

JavaIO.PDF O u t p u t S t ream j a v a. i o. O u t p u t S t r e a m w r i t e () f l u s h () c l o s e () public abstract void write(int b) throws IOException public void write(byte[] data) throws IOException

More information

Chapter #

Chapter # 第三章 TCP/IP 协议栈 本章目标 通过本章的学习, 您应该掌握以下内容 : 掌握 TCP/IP 分层模型 掌握 IP 协议原理 理解 OSI 和 TCP/IP 模型的区别和联系 TCP/IP 介绍 主机 主机 Internet TCP/IP 早期的协议族 全球范围 TCP/IP 协议栈 7 6 5 4 3 应用层表示层会话层传输层网络层 应用层 主机到主机层 Internet 层 2 1 数据链路层

More information

untitled

untitled 4.1AOP AOP Aspect-oriented programming AOP 來說 AOP 令 理 Cross-cutting concerns Aspect Weave 理 Spring AOP 來 AOP 念 4.1.1 理 AOP AOP 見 例 來 例 錄 Logging 錄 便 來 例 行 留 錄 import java.util.logging.*; public class HelloSpeaker

More information

云数据库 RDS SDK

云数据库 RDS SDK 云数据库 RDS SDK SDK SDK 下载 SDK 下载 最新版本 java_sdk.zip python_sdk.zip php_sdk.zip c#_sdk.zip 历史版本 2015-11-3 java_sdk.zip python_sdk.zip php_sdk.zip c#_sdk.zip JAVA 教程 JAVA 创建 Access Key 登陆阿里云账号 打开 我的 Access

More information

PowerPoint Presentation

PowerPoint Presentation 利用 Oracle Big Data Connectors 将 Hadoop 与 Oracle 集成 罗海雄甲骨文公司资深技术顾问 1 Copyright 2011, Oracle and/or its affiliates. All rights 以下内容旨在概述产品的总体发展方向 该内容仅供参考, 不可纳入任何合同 该内容不构成提供任何材料 代码或功能的承诺, 并且不应该作为制定购买决策的依据

More information

第 03 期 刘高军等 : 基于 CNONIX 的 XML 与 EXCEL 相互转换技术研究 XML XML CNONIX XML EXCEL EXCEL EXCEL EXCEL CNONIXEXCEL XML EXCEL CNONIX XML EXCEL CNONIX 1 CNONIX 数据元分析

第 03 期 刘高军等 : 基于 CNONIX 的 XML 与 EXCEL 相互转换技术研究 XML XML CNONIX XML EXCEL EXCEL EXCEL EXCEL CNONIXEXCEL XML EXCEL CNONIX XML EXCEL CNONIX 1 CNONIX 数据元分析 电子科学技术电子科学技术第 02 卷第 03 期 Electronic 2015 年 Science 5 月 & Technology Electronic Science & Technology Vol.02 No.03 May.2015 年 基于 CNONIX 的 XML 与 EXCEL 相互转换技术研究 刘高军, 李丹, 程利伟, 钱程, 段然 ( 北方工业大学计算机学院, 北京,100144)

More information

FileMaker 15 ODBC 和 JDBC 指南

FileMaker 15 ODBC 和 JDBC 指南 FileMaker 15 ODBC JDBC 2004-2016 FileMaker, Inc. FileMaker, Inc. 5201 Patrick Henry Drive Santa Clara, California 95054 FileMaker FileMaker Go FileMaker, Inc. / FileMaker WebDirect FileMaker, Inc. FileMaker

More information

09 (File Processes) (mkdir) 9-3 (createnewfile) 9-4 (write) 9-5 (read) 9-6 (deletefile) 9-7 (deletedir) (Exercises)

09 (File Processes) (mkdir) 9-3 (createnewfile) 9-4 (write) 9-5 (read) 9-6 (deletefile) 9-7 (deletedir) (Exercises) 09 (File Processes) 9-1 9-2 (mkdir) 9-3 (createnewfile) 9-4 (write) 9-5 (read) 9-6 (deletefile) 9-7 (deletedir) (Exercises) Java Servlet 9-1 Servlet (File Processes) Client Servlet Servlet Java Java (Stream)

More information

胡 鑫 陈兴蜀 王海舟 刘 磊 利用基于协议分析和逆向工程的主动测量方法对 点播系统进行了研究 通过对 点播协议进行分析 获悉该协议的通信格式和语义信息 总结出了 点播系统的工作原理 在此基础上设计并实现了基于分布式网络爬虫的 点播系统主动测量平台 并对该平台获取的用户数据进行统计分析 获得了 点播系统部分用户行为特征 研究结果对 点播系统的监控及优化提供了研究方法 点播 协议分析 爬虫 主动测量

More information

Learning Java

Learning Java Java Introduction to Java Programming (Third Edition) Prentice-Hall,Inc. Y.Daniel Liang 2001 Java 2002.2 Java2 2001.10 Java2 Philip Heller & Simon Roberts 1999.4 Java2 2001.3 Java2 21 2002.4 Java UML 2002.10

More information