目录 1 本期内容 HBase 简介 HBase 体系结构 Client Zookeeper HMaster HRegion HRegion Server

Size: px
Start display at page:

Download "目录 1 本期内容 HBase 简介 HBase 体系结构 Client Zookeeper HMaster HRegion HRegion Server"

Transcription

1 细细品味 Hadoop Hadoop 集群 ( 第 11 期 ) 精华集锦 csaxp 年 3 月 17 日

2 目录 1 本期内容 HBase 简介 HBase 体系结构 Client Zookeeper HMaster HRegion HRegion Server HBase 存储格式 ROOT 表和 META 表 MapReduce On HBase HBase 数据模型 逻辑模型 概念模型 HBase 分布式安装 先决条件 集群环境 安装 HBase 启动 HBase 关闭 HBase HBase 用户界面 Master 页面 ZooKeeper 页面 User Tables 页面 Region 服务器页面 参考文献 打赏小编 中国 北京 虾皮工作室 ( 编辑 : 虾皮 1

3 Hadoop 集群 ( 第 11 期 ) HBase 简介及安装 1 本期内容 1.1 HBase 简介 HBase 是一个高可靠性 高性能 面向列 可伸缩的分布式存储系统, 利用 HBase 技术可在廉价 PC Server 上搭建起大规模结构化存储集群 HBase 的目标是存储并处理大型的数据, 更具体来说是仅需使用普通的硬件配置, 就能够处理由成千上万的行和列所组成的大型数据 HBase 是 Google Bigtable 的开源实现, 但是也有很多不同之处 比如 :Google Bigtable 利用 GFS 作为其文件存储系统,HBase 利用 Hadoop HDFS 作为其文件存储系统 ;Google 运行 MapReduce 来处理 Bigtable 中的海量数据,HBase 同样利用 Hadoop MapReduce 来处理 HBase 中的海量数据 ;Google Bigtable 利用 Chubby 作为协同服务,HBase 利用 Zookeeper 作为对应 图 1-1 Hadoop 生态系统结构上图描述了 Hadoop EcoSystem 中的各层系统, 其中 HBase 位于结构化存储层,Hadoop HDFS 为 HBase 提供了高可靠性的底层存储支持,Hadoop MapReduce 为 HBase 提供了高性能的计算能力,Zookeeper 为 HBase 提供了稳定服务和 failover 机制 此外,Pig 和 Hive 还为 HBase 提供了高层语言支持, 使得在 HBase 上进行数据统计处理变的非常简单 Sqoop 则为 HBase 提供了方便的 RDBMS 数据导入功能, 使得传统数据库数据向 HBase 中迁移变的非常方便 另外,HBase 存储的是松散型数据 具体来说,HBase 存储的数据介于映射 (key/value) 和关系型数据之间 进一步讲,HBase 存储的数据可以理解为一种 key 和 value 的映射关系, 但又不是简简单单的映射关系 除此之外它还有许多其他的特性 HBase 存储的数据从逻辑上来看就像一张很大的表, 并且它的数据列可以根据需要动态增加 除此之外, 每个 cell( 由 中国 北京 虾皮工作室 ( 编辑 : 虾皮 2

4 行和列所确定的位置 ) 中的数据又可以具有多个版本 ( 通过时间戳来区别 ) 1.2 HBase 体系结构 HBase 的服务器体系结构遵从简单的主从服务器架构, 它由 HRegin 服务器 (HRegion Server) 群和 HBase Master 服务器 (HBase Master Server) 构成 HBase Master 服务器负责管理所有的 HRegion 服务器, 而 HBase 中所有的服务器都是通过 ZooKeeper 来进行协调, 并处理 HBase 服务器运行期间可能遇到的错误 HBase Master Server 本身并不存储 HBase 中的任何数据,HBase 逻辑上的表可能会被划分成多个 HRegion, 然后存储到 HRegion Server 群中 HBase Master Server 中存储的是从数据到 HRegion Server 的映射 因此,HBase 体系结构如图 2-1 所示 图 2-1 HBase 体系结构 Client HBase Client 使用 HBase 的 RPC 机制与 HMaster 和 HRegionServer 进行通信, 对于 管理类操作,Client 与 HMaster 进行 RPC; 对于数据读写类操作,Client 与 HRegionServer 进行 RPC Zookeeper Zookeeper Quorum 中除了存储了 -ROOT- 表的地址和 HMaster 的地址,HRegionServer 也会把自己以 Ephemeral 方式注册到 Zookeeper 中, 使得 HMaster 可以随时感知到各个 HRegionServer 的健康状态 此外,Zookeeper 也避免了 HMaster 的单点问题 中国 北京 虾皮工作室 ( 编辑 : 虾皮 3

5 1.2.3 HMaster 每台 HRegion Server 都会 HMaster 通信,HMaster 的主要任务就是要告诉每台 HRegion Server 它要维护那些 HRegion 当一台新的 HRegion Server 登录到 HMaster 时,HMaster 会告诉它等待分配数据 而当一台 HRegion 死机时,HMaster 会把它负责的 HRegion 标记为未分配, 然后再把它们分配到其他 HRegion Server 中 HMaster 没有单点问题 (SPFO),HBase 中可以启动多个 HMaster, 通过 Zookeeper 的 Master Election 机制保证总有一个 Master 运行,HMaster 在功能上主要负责 Table 和 Region 的管理工作 : 管理用户对 Table 的增 删 改 查操作 ; 管理 HRegion Server 的负载均衡, 调整 Region 分布 ; 在 Region Split 后, 负责新 Region 的分配 ; 在 HRegion Server 停机后, 负责失效 HRegion Server 上的 Regions 迁移 HRegion 当表的大小超过设置值的时候,HBase 会自动地将表划分为不同的区域, 每个区域包含所有行的一个子集 对用户来说, 每个表是一堆数据的集合, 靠主键来区分 从物理上来说, 一张表被拆分成了多块, 每一块就是一个 HRegion 我们用表名 + 开始 / 结束主键, 来区分每一个 HRegion, 一个 HRegion 会保存一个表里面某段连续的数据, 从开始主键到结束主键, 一张完整的表格是保存在多个 HRegion 上面 图 Table 分裂上图表示当 Table 随着记录数不断增加而变大后, 会逐渐分裂成多份 splits, 成为 regions, 一个 region 由 [startkey,endkey] 表示, 不同的 region 会被 Master 分配给相应的 RegionServer 进行管理 中国 北京 虾皮工作室 ( 编辑 : 虾皮 4

6 1.2.5 HRegion Server 所有的数据库数据一般是保存在 Hadoop HDFS 分布式文件系统上面, 用户通过一系列 HRegion Server 获取这些数据, 一台机器上面一般只运行一个 HRegion Server, 且每一个区 段的 HRegion 也只会被一个 HRegion Server 维护 下面是 HRegion Server 数据存储关系图 图 HRegion Server 数据存储关系 HRegion Server 主要负责响应用户 I/O 请求, 向 HDFS 文件系统中读写数据, 是 HBase 中最核心的模块 HRegion Server 内部管理了一系列 HRegion 对象, 每个 HRegion 对应了 Table 中的一个 Region,HRegion 中由多个 HStore 组成 每个 HStore 对应了 Table 中的一个 Column Family 的存储, 可以看出每个 Column Family 其实就是一个集中的存储单元, 因此最好将具备共同 IO 特性的 column 放在一个 Column Family 中, 这样最高效 HStore 存储是 HBase 存储的核心了, 其中由两部分组成, 一部分是 MemStore, 一部分是 StoreFiles MemStore 是 Sorted Memory Buffer, 用户写入的数据首先会放入 MemStore, 当 MemStore 满了以后会 Flush 成一个 StoreFile( 底层实现是 HFile), 当 StoreFile 文件数量增长到一定阈值, 会触发 Compact 合并操作, 将多个 StoreFiles 合并成一个 StoreFile, 合并过程中会进行版本合并和数据删除, 因此可以看出 HBase 其实只有增加数据, 所有的更新和删除操作都是在后续的 compact 过程中进行的, 这使得用户的写操作只要进入内存中就可以立即返回, 保证了 HBase I/O 的高性能 当 StoreFiles Compact 后, 会逐步形成越来越大的 StoreFile, 当单个 StoreFile 大小超过一定阈值后, 会触发 Split 操作, 同时把当前 Region Split 成 2 个 Region, 父 Region 会下线, 新 Split 出的 2 个孩子 Region 会被 HMaster 分配到相应的 HRegionServer 上, 使得原先 1 个 Region 的压力得以分流到 2 个 Region 上 下图描述了 Compaction 和 Split 的过程 图 Compaction 和 Split 的过程 中国 北京 虾皮工作室 ( 编辑 : 虾皮 5

7 在理解了上述 HStore 的基本原理后, 还必须了解一下 HLog 的功能, 因为上述的 HStore 在系统正常工作的前提下是没有问题的, 但是在分布式系统环境中, 无法避免系统出错或者宕机, 因此一旦 HRegion Server 意外退出,MemStore 中的内存数据将会丢失, 这就需要引入 HLog 了 每个 HRegion Server 中都有一个 HLog 对象,HLog 是一个实现 Write Ahead Log 的类, 在每次用户操作写入 MemStore 的同时, 也会写一份数据到 HLog 文件中 (HLog 文件格式见后续 ),HLog 文件定期会滚动出新的, 并删除旧的文件 ( 已持久化到 StoreFile 中的数据 ) 当 HRegion Server 意外终止后,HMaster 会通过 Zookeeper 感知到,HMaster 首先会处理遗留的 HLog 文件, 将其中不同 Region 的 Log 数据进行拆分, 分别放到相应 region 的目录下, 然后再将失效的 region 重新分配, 领取到这些 region 的 HRegion Server 在 Load Region 的过程中, 会发现有历史 HLog 需要处理, 因此会 Replay HLog 中的数据到 MemStore 中, 然后 flush 到 StoreFiles, 完成数据恢复 HBase 存储格式 HBase 中的所有数据文件都存储在 Hadoop HDFS 文件系统上, 主要包括上述提出的两种文件类型 : HFile,HBase 中 KeyValue 数据的存储格式,HFile 是 Hadoop 的二进制格式文件, 实际上 StoreFile 就是对 HFile 做了轻量级包装, 即 StoreFile 底层就是 HFile HLog File,HBase 中 WAL(Write Ahead Log) 的存储格式, 物理上是 Hadoop 的 Sequence File 1)HFile 详细描述下图是 HFile 的存储格式 : 图 HFile 存储格式首先 HFile 文件是不定长的, 长度固定的只有其中的两块 :Trailer 和 File Info 正如图中所示的,Trailer 中有指针指向其他数据块的起始点 File Info 中记录了文件的一些 Meta 信息, 例如 : AVG_KEY_LEN, AVG_VALUE_LEN, LAST_KEY, COMPARATOR, MAX_SEQ_ID_KEY 等 Data Index 和 Meta Index 块记录了每个 Data 块和 Meta 块的起始点 Data Block 是 HBase I/O 的基本单元, 为了提高效率,HRegion Server 中有基于 LRU 的 Block Cache 机制 每个 Data 块的大小可以在创建一个 Table 的时候通过参数指定, 大号的 Block 有利于顺序 Scan, 小号 Block 利于随机查询 每个 Data 块除了开头的 Magic 以外就是一个个 KeyValue 对拼接而成,Magic 内容就是一些随机数字, 目的是防止数据损坏 后面会详细介绍每个 KeyValue 对的内部构造 HFile 里面的每个 KeyValue 对就是一个简单的 byte 数组 但是这个 byte 数组里面包含中国 北京 虾皮工作室 ( 编辑 : 虾皮 6

8 了很多项, 并且有固定的结构 我们来看看里面的具体结构 : 图 KeyValue 具体结构开始是两个固定长度的数值, 分别表示 Key 的长度和 Value 的长度 紧接着是 Key, 开始是固定长度的数值, 表示 RowKey 的长度, 紧接着是 RowKey, 然后是固定长度的数值, 表示 Family 的长度, 然后是 Family, 接着是 Qualifier, 然后是两个固定长度的数值, 表示 Time Stamp 和 Key Type(Put/Delete) Value 部分没有这么复杂的结构, 就是纯粹的二进制数据了 2)HLogFile 详细描述其实 HLog 文件就是一个普通的 Hadoop Sequence File,Sequence File 的 Key 是 HLogKey 对象,HLogKey 中记录了写入数据的归属信息, 除了 table 和 region 名字外, 同时还包括 sequence number 和 timestamp,timestamp 是 写入时间,sequence number 的起始值为 0, 或者是最近一次存入文件系统中 sequence number HLog Sequece File 的 Value 是 HBase 的 KeyValue 对象, 即对应 HFile 中的 KeyValue, 可参见上文描述 下图中示意了 HLog 文件的结构 : 图 HLogFile 结构 ROOT 表和 META 表 用户表的 Regions 元数据被存储在.META. 表中, 随着 Region 的增多,.META. 表中的数据也会增大, 并分裂成多个 Regions 为了定位.META. 表中各个 Regions 的位置, 把.META. 表中所有 Regions 的元数据保存在 -ROOT- 表中, 最后由 ZooKeeper 记录 -ROOT- 表的位置信息 所有客户端访问用户数据前, 需要首先访问 ZooKeeper 获得 -ROOT- 的位置, 然后访问 -ROOT- 表获得.META. 表的位置, 最后根据.META. 表中的信息确定用户数据存放的位置, 中国 北京 虾皮工作室 ( 编辑 : 虾皮 7

9 如图 所示 : 图 Region 定位示意图 -ROOT- 表永远不会被分割, 它只有一个 Region, 这样可以保证最多需要三次跳转就可以定位任意一个 Region 为了加快访问速度,.META. 表的 Regions 全部保存在内存中, 如果.META. 表中的每一行在内存中大约占 1KB, 且每个 Region 限制为 128MB, 那么上图所示的三层结构可以保存的 Regions 数目为 :(128MB/1KB)*(128/1KB)=2 34 个 客户端会将查询过的位置信息缓存起来, 且缓存不会主动失效 如果客户端根据缓存信息还访问不到数据, 则询问只有相关.META. 表的 Region 服务器, 试图获取数据的位置, 如果还是失败, 则询问 -ROOT- 表相关的.META. 表在哪里 最后, 如果前面的信息全部失效, 则通过 ZooKeeper 重新定位 Region 的信息 所以如果客户端上的缓存全部是失效, 则需要进行 6 次网络来回, 才能定位到正确的 Region MapReduce On HBase 在 HBase 系统上运行批处理运算, 最方便和实用的模型依然是 MapReduce, 如下图 : 图 MapReduce On HBase HBase Table 和 Region 的关系, 比较类似 HDFS File 和 Block 的关系,HBase 提供了配套的 TableInputFormat 和 TableOutputFormat API, 可以方便的将 HBase Table 作为 Hadoop MapReduce 的 Source 和 Sink, 对于 MapReduce Job 应用开发人员来说, 基本不需要关注中国 北京 虾皮工作室 ( 编辑 : 虾皮 8

10 HBase 系统自身的细节 1.3 HBase 数据模型 HBase 是一个类似于 BigTable 的分布式数据库, 它是一个稀疏的长期存储的 ( 存在硬盘上 ) 多维度的 排序的映射表 这张表的索引是行关键字 列关键字和时间戳 HBase 的数据都是字符串, 没有类型 用户在表格中存储数据, 每行都有一个可排序的主键和任意多的列 由于是稀松存储, 所以同一张表里面的每行数据都可以由截然不同的列 列名字的格式是 <family>:<qualifier> ( < 列族 >:< 限定符 >), 都是又字符串组成的 每一张表有一个列族 (family) 集合, 这个集合是固定不变的, 只能通过改变表结构来改变 但是限定符 (qualifier) 的值相对于每一行来说都是可以改变的 HBase 把同一个列族里面的数据存储在同一个目录底下, 并且 HBase 的写操作时锁行的, 每一行来说都是一个原子元素, 都可以加锁 HBase 所有数据库的更新都有一个时间戳标记, 每个更新都是一个新的版本,HBase 会保留一定数量的版本, 这个值是可以设定的 客户端可以选择获取距离某个时间点最近的版本单元的值, 或者一次获取所有版本单元的值 逻辑模型 我们可以将一个表想象成一个大的映射关系, 通过行健 行健 + 时间戳或行健 + 列 ( 列族 : 列修饰符 ), 就可以定位特定数据 由于 HBase 是稀疏存储数据的, 所以某些列可以空白的 表 给出了 网站的数据存放逻辑视图, 表中仅有一行数据, 行的唯一标 识为 com.cnn.www, 对这行数据的每一次逻辑修改都有一个时间戳关联对应 表中共有 四列 :contents:html anchor:cnnsi.com anchor:my.look.ca mime:type, 每一行以前缀的方式 给出其所属的列族 表 数据存储逻辑视图 行健 时间戳 列族 :contents 列族 :anchor 列族 :mime t9 achor:cnnsi.com= CNN t8 achor:my.lock.ca= CNN.com com.cnn.www t6 contents:html= <html> mime:type= text/html t5 contents:html= <html> t3 contents:html= <html> 行健是数据行在表中的唯一标识, 并作为检索记录的主键 在 HBase 中访问表中的行只有三种方式 : 通过当个行健访问 ; 给定行健的范围访问 ; 全表扫描 行健可以任意字符串 ( 最大长度 64KB) 并按照字典序进行存储 对于那些经常一起读取的行, 需要对 key 值精心设计, 以便它们能放在一起存储 概念模型 HBase 是按照列存储的稀疏行 / 列矩阵, 物理模型实际上就是把概念模型中的一行进行 中国 北京 虾皮工作室 ( 编辑 : 虾皮 9

11 切割, 并按照列族存储, 这点在进行数据设计和程序开发的时候必须牢记 上面的逻辑视图在物理存储的时候应该表现成下面的样子, 如表 所示 表 物理上的存储方式 行健 时间戳 列族 :contents t6 contents:html= <html> com.cnn.www t5 contents:html= <html> t3 contents:html= <html> 行健 时间戳 列族 :anchor com.cnn.www t9 achor:cnnsi.com= CNN t8 achor:my.lock.ca= CNN.com 行健 时间戳 列族 :mime com.cnn.www t6 mime:type= text/html 从表中可以看出表中的空值是不被存储的, 所以查询时间戳为 t8 的 contents:html 将返回 null, 同样查询时间戳为 t9, anchor:my.lock.ca 的项也返回 null 如果没有指明时间戳, 那么应该返回指定列的最新数据值, 并且最新的值在表格里也是最先找到的, 因为它们是按照时间排序的 所以, 如果查询 contents: 而不指明时间戳, 将返回 t6 时刻的数据 ; 查询 anchor: 的 my.look.ca 而不指明时间戳, 将返回 t8 时刻的数据 这种存储结构还有一个优势, 可以随时向表中的任何一个列族添加新列, 而不需要是事先说明 1.4 HBase 分布式安装 先决条件 HBase 有三种运行模式, 其中单机模式的配置非常简单, 几乎不用对安装文件做任何修改就可以使用, 所以我们这里不再介绍 HBase 的单机模式的安装 从前面的讲解中, 我们知道如果要运行分布式模式,Hadoop 是必不可少的 另外在对 HBase 的某些文件进行配置之前, 还需要具备以下先决条件 : Java: 需要是 Java1.6.x 以上的版本 Hadoop: 由于 HBase 架构基于其他文件存储系统之上, 因此在分布式模式下安装 Hadoop 是必须的, 但是, 如果运行在单机模式下, 此条件则可以省略 SSH: 需要注意的是,SSH 是必须安装的, 并且要保证用户可以 SSH 到系统的其他节点 ( 包括本地节点 ) 因为, 我们需要使用 Hadoop 来管理远程的 Hadoop 和 HBase 守护进程 备注 : 在安装 Hadoop 的时候, 要注意 HBase 的版本 也就是说, 需要注意 Hadoop 和 HBase 之间的版本关系, 如果不匹配, 很可能会影响 HBase 系统的稳定性, 在 HBase 的 lib 目录下可以看到对应的 Hadoop 的 jar 文件 默认情况下,HBase 的 lib 文件下对应的 Hadoop 版本相对稳定 如果用户想要使用其他的 Hadoop 版本, 那么需要将 Hadoop 系统安装目录下的 hadoop-core-*.*.*.jar 文件和 hadoop-test-*.*.*.jar 文件拷贝到 HBase 的 lib 文件夹下, 以替换其他版本的 Hadoop 文件 中国 北京 虾皮工作室 ( 编辑 : 虾皮 10

12 1.4.2 集群环境 下面为当前 Hadoop 集群的环境情况, 务必确保在配置 Hadoop 时已配置好 hosts 文件的 内容, 否则在 HBase 的配置文件中使用主机名代替 IP 地址时会出现错误 Java 版本 :jdk-6u31-linux-i586 Linux 版本 :CentOS-6.0-i386 HBase 版本 :hbase Hadoop 版本 :hadoop Hadoop 集群 : 表 Hadoop 集群信息 机器名称 IP 地址 守护进程 Master.Hadoop NameNode SecondaryNameNode JobTracker Salve1.Hadoop DataNode TaskTracker Salve2.Hadoop DataNode TaskTracker Salve3.Hadoop DataNode TaskTracker 下面所示为即将安装的 HBase 集群的运行情况 表 HBase 集群信息 机器名称 IP 地址 守护进程 Master.Hadoop HMaster Salve1.Hadoop HQuorumPeer HRegionServer Salve2.Hadoop HQuorumPeer HRegionServer Salve3.Hadoop HQuorumPeer HRegionServer 备注 : 我们使用的 HBase 和 Hadoop 版本经过查看是相吻合的, 不需要进行任何修改 安装 HBase 第一步 :FTP 上传 HBase 安装文件 用 FlashFXP 把 HBase 安装文件上传到 Master.Hadoop 机器上 中国 北京 虾皮工作室 ( 编辑 : 虾皮 11

13 用 SecureCRT 进行查看结果如下 : 第二步 : 安装 HBase 数据库 首先切换到 root 用户下, 我们这次之前安装 JDK 和 Hadoop 一样, 我们都安装在 /usr 目录下面 然后把 hbase tar.gz 复制到 /usr 下面 cp /home/hadoop/hbase tar.gz /usr 接着进入 /usr 目录下, 用下面命令把 hbase tar.gz 进行解压, 并将其命名 为 hbase, 把该文件夹的权限分配给普通用户 hadoop, 然后删除 hbase tar.gz 安 装包 cd /usr # 进入 /usr 目录 tar zxvf hbase tar.gz # 解压 hbase tar.gz 安装包 mv hbase hbase # 将 hbase 文件夹重命名 hbase chown R hadoop:hadoop hbase # 将文件夹 hbase 权限分配给 hadoop 用户 中国 北京 虾皮工作室 ( 编辑 : 虾皮 12

14 rm rf hbase tar.gz # 删除 hbase tar.gz 安装包 解压之后, 然后重命名 中国 北京 虾皮工作室 ( 编辑 : 虾皮 13

15 把 /usr/hbase 的权限分配给 hadoop 用户 ( 非常重要 ) 删除 hbase tar.gz 安装包 第三步 : 编辑 HBase 配置文件 1) 配置 hbase-env.sh 该文件 hbase-env.sh 位于 /usr/hbase/conf 目录下 在文件的尾部添加下面的内容 # set hbase environment export JAVA_HOME=/usr/java/jdk1.6.0_31 export HBASE_MANAGES_ZK=true export HBASE_CLASSPATH=/usr/hadoop/conf #Java 安装位置 # 由 HBase 负责启动和关闭 ZooKeeper #HBase 类路径 中国 北京 虾皮工作室 ( 编辑 : 虾皮 14

16 其实上面的变量在 hbase-env.sh 就已经存在了, 只是注释掉了, 但是我们不在原来的基础改, 主要是把添加的变量集中管理 2) 配置 hbase-site.xml 该文件 hbase-site.xml 位于 /usr/hbase/conf 目录下 <configuration> <property> <name>hbase.master</name> <value>master.hadoop:60000</value> </property> <property> <name>hbase.master.maxclockskew</name> <value>180000</value> </property> <property> <name>hbase.rootdir</name> <value>hdfs://master.hadoop:9000/hbase</value> </property> <property> <name>hbase.cluster.distributed</name> <value>true</value> </property> <property> <name>hbase.zookeeper.quorum</name> <value>slave1.hadoop,slave2.hadoop,slave3.hadoop</value> </property> <property> <name>hbase.zookeeper.property.datadir</name> <value>/home/ ${user.name} /tmp/zookeeper</value> </property> </configuration> 上面的这张配置单中用蓝色颜色标识的 hbase.rootdir 和 hbase.cluster.distributed 两个参数对于 HBase 来说是必需的 通过 hbase.rootdir 来指定 HBase 的存储目录, 它的 中国 北京 虾皮工作室 ( 编辑 : 虾皮 15

17 值必须与 core-site.xml 配置文件中 fs.default.name 保持一致, 如果你 Hadoop 的 hdfs 使用了其它端口, 请在这里也修改 通过 hbase.cluster.distributed 来说明其运行模式 :true 为全分布式模式 ;false 为单机模式或伪分布模式 将 hbase.zookeeper.quorum 设置为所有 ZooKeeper 节点的主机名, 默认为 localhost, 它的值必须是奇数 属性 hbase.zookeeper.property.datadir 表示 ZooKeeper 的目录, 默认为 /tmp, 系统重启后会被清空 参数 hbase.master.maxclockskew 是用来防止 hbase 结点之间时间不一致造成 regionserver 启动失败, 默认的值为 30000, 现改为 备注 :HBase 对 hbase-site.xml 中某些选项并不识别机器 IP, 为了保险起见都设成了机器主机名, 前提是在 Hadoop 集群中的机器 /etc/hosts 添加上 [IP 和 HostName], 这个我们在安装 Hadoop 时已经设置了 如果忘了的记得要设置, 不然无法解析主机名 3) 配置 regionservers 该文件 regionservers 位于 /usr/hbase/conf 目录下 regionservers 文件列出了所有运行 HBase 的机器 ( 即 HRegionServer) 此文件的配置和 Hadoop 的 Slaves 文件十分类似, 每一行指定一台机器 当 HBase 启动的时候, 会将此文件中列出的所有机器启动 ; 同样, 当 HBase 关闭的时候, 也会同时关闭它们 在该 regionservers 内容设置为 : Slave1.Hadoop Slave2.Hadoop Slave3.Hadoop 中国 北京 虾皮工作室 ( 编辑 : 虾皮 16

18 这就意味着,HBase RegionServer 运行在 Slave1.Hadoop Slave2.Hadoop Slave3.Hadoop 三台机器上 第四步 : 添加 HBase 环境变量 在 /etc/profile 文件的尾部添加以下内容, 并使其有效 (source /etc/profile): # set hbase environment export HBASE_HOME=/usr/hadoop export PATH=$PATH :$ HBASE_HOME /bin 从上图中得知, 我们还可以看到之前设置的 Java 和 Hadoop 的环境变量 第五步 : 复制 HBase 到其他节点将 Master 上配置好的 hadoop 所在文件夹 /usr/hbase 复制到所有的 Slave 的 /usr 目录下, 用下面命令格式进行 scp -r /usr/hbase root@ 服务器 IP:/usr/ 例如 : 从 Master.Hadoop 到 Slave1.Hadoop 复制配置 HBase 的文件 上图中以 root 用户进行复制, 用 root 进行 scp 时, 扔提示让你输入 Slave1.Hadoop 服务器用户 root 的密码 中国 北京 虾皮工作室 ( 编辑 : 虾皮 17

19 查看 Slave1.Hadoop 服务器的 /usr 目录下是否已经存在 hbase 文件夹, 确认 已经复制成功 查看结果如下 : 从上图中知道,hbase 文件夹确实已经复制了, 但是我们发现 hbase 权限是 root, 所以 我们现在要给 Slave1.Hadoop 服务器上的用户 hadoop 添加对 /usr/hbase 权限 以 root 用户登录 Slave1.Hadoop, 执行下面命令 chown -R hadoop:hadoop( 用户名 : 用户组 ) hbase( 文件夹 ) 接着在 Slave1.Hadoop 上按照 第四步 修改 /etc/profile 文件, 添加完内容之后, 并使其有效 (source /etc/profile) 到此为此在一台 Slave 机器上的 HBase 配置就结束了 剩下的事儿就是照葫芦画瓢把剩余的几台 Slave 机器按照 从 Master.Hadoop 到 Slave1.Hadoop 复制 HBase 的安装包 这个例子进行部署 Hadoop 启动 HBase 在 Master.Hadoop 机器上, 使用用户 hadoop 执行下面命令启动 HBase 数据库 中国 北京 虾皮工作室 ( 编辑 : 虾皮 18

20 start-hbase.sh 加入你忘记了设置 HBase 的环境变量, 用上面命令是不能启动的, 系统会提示你该命 令没有找到 这是你可以用下面方式启动 /usr/hbase/bin/start-hbase.sh HBase 启动如下图所示 : 用 jps 工具测验一下 HBase 集群进程 Master.Hadoop 机器 Slave*.Hadoop 机器 通过 SecureCRT 查看 HBase 在 Hadoop 集群的 HDFS 中是否自动生成了 /hbase 目录, 用于存放数据 查看结果如下所示 中国 北京 虾皮工作室 ( 编辑 : 虾皮 19

21 1.4.5 关闭 HBase 使用下面命令即可关闭 HBase 数据库 stop-hbase.sh HBase 关闭如下图所示 : 1.5 HBase 用户界面 Master 页面 通过地址 可以查看 HBase 的相关信息, 主要包含的信息如下 : (1)Master 属性信息包含了当前集群的详细信息, 从上往下依次为 HBase 的版本及编译信息 Hadoop 的版本及编译信息 HBase 根目录的路径 Region 服务器的平均负载以及 Zookeeper Quorums 的地址 (2) 目录表信息包含两个目录 :-ROOT- 和.META. 中国 北京 虾皮工作室 ( 编辑 : 虾皮 20

22 (3) 用户表信息给出了 HBase 中的表信息及相关属性 备注 : 当系统没有创建用户表时, 不显示任何信息 (4)Region 服务器信息给出了所有 Region 服务器的地址 ZooKeeper 页面 通过 Master 页面中 Master 属性提供的链接, 可以进入 ZooKeeper 页面, 该页面显示了 HBase 的根目录 当前的主 Master 地址 保存 -ROOT- 表的 Region 服务器地址 其他 Region 服务器的地址及 ZooKeeper 的一些内部信息, 如下图所示 中国 北京 虾皮工作室 ( 编辑 : 虾皮 21

23 1.5.3 User Tables 页面 通过 Master 页面中用户表信息提供的链接, 可以进入用户表页面, 如下图所示 该页 面给出了表当前是否可以用以及表在 Region 服务器上的信息 同时还提供了根据行健合并 及拆分表的操作 Region 服务器页面 通过 Master 页面中 Region 服务器信息提供的链接, 可以进入 Region 服务器页面, 该 页面显示了 Region 服务器的基本属性和其上所有 Regions 的信息 如下图所示 中国 北京 虾皮工作室 ( 编辑 : 虾皮 22

24 2 参考文献 感谢以下文章的编写作者, 没有你们的铺路, 我或许会走得很艰难, 参考不分先后, 贡 献同等珍贵 1 Hadoop 实战 陆嘉恒 机械工业出版社 2 实战 Hadoop 刘鹏 电子工业出版社 3 Hadoop Hbase 完全分布式配置地址 : 4 Hbase 安装配置 ( 含分布式 ZooKeeper) 地址 : 5 HBase 分布式模式的安装 配置和使用地址 : 6 HBase 技术介绍地址 : 7 HBase 入门笔记 ( 四 )-- 完全分布式 HBase 集群安装配置地址 : 8 hbase 无法启动问题时间设置地址 : 9 hbase 结点之间时间不一致造成 regionserver 启动失败地址 : 中国 北京 虾皮工作室 ( 编辑 : 虾皮 23

25 3 打赏小编 编辑简介 : 高级软件工程师 (T5), 河北工业大学硕士研究生, 现在就职于百度在线网络技术 ( 北京 ) 有限公司 专注于大数据以及其相关研究, 在离线计算和实时计算方面有较为深入的研究, 积累了丰富的实战经验 热衷于知识分享, 其细细品味系列教程深受网友喜爱 姓名 : 解耀伟 笔名 : 虾皮 扣扣 : 网站 : 博客 : 邮箱 :xieyaowei1986@163.com 从高考复习开始养成了总结的习惯, 习惯于在学习的过程中, 把相关的文章融会贯通, 并加以实践, 结合自己的实际情况把相关的内容整理成册, 便于学习和总结 在这几年里陆陆续续分享了很多细细品味系列文章 每一期文章都耗费了不少的心血, 很多时候都是在星期天业余的时间完成, 现在也建立了自己独立的网站 : 需要一些资金来维持, 同时也可以鼓励我写更多的好东西来分享 如果你看了本文章对自己有用, 可以通过支付宝的形式来进行打赏,1 元 2 元 10 元皆可, 多少并不重要, 只要你感觉文章使你受益即可 温馨提示 : 在转账时, 可以写明 打赏虾皮 或者 打赏虾皮工作室 我的支付宝已 经进行实名认证, 支付宝是的个人头像, 请认准后再支付 中国 北京 虾皮工作室 ( 编辑 : 虾皮 24

PowerPoint 演示文稿

PowerPoint 演示文稿 Hadoop 生 态 技 术 在 阿 里 全 网 商 品 搜 索 实 战 阿 里 巴 巴 - 王 峰 自 我 介 绍 真 名 : 王 峰 淘 宝 花 名 : 莫 问 微 博 : 淘 莫 问 2006 年 硕 士 毕 业 后 加 入 阿 里 巴 巴 集 团 淘 及 搜 索 事 业 部 ( 高 级 技 术 与 家 ) 目 前 负 责 搜 索 离 线 系 统 团 队 技 术 方 向 : 分 布 式 计 算

More information

目录 1 本期内容 系统管理 连接 MySQL 修改新密码 增加新用户 启动停止 MySQL 数据库操作 库操作 表操作... 5

目录 1 本期内容 系统管理 连接 MySQL 修改新密码 增加新用户 启动停止 MySQL 数据库操作 库操作 表操作... 5 细细品味 Hadoop Hadoop 集群 ( 第 10 期副刊 ) 精华集锦 csaxp http://www.xiapistudio.com/ 2012 年 3 月 16 日 目录 1 本期内容... 2 1.1 系统管理... 2 1.1.1 连接 MySQL... 2 1.1.2 修改新密码... 2 1.1.3 增加新用户... 3 1.1.4 启动停止 MySQL... 3 1.2 数据库操作...

More information

PowerPoint Presentation

PowerPoint Presentation 大数据技术基础 厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 2013 年新版 2013 年 9 月第一版 厦门大学计算机科学系研究生课程 大数据技术基础 第 7 章 HBase (2013 年新版 ) 林子雨厦门大学计算机科学系 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu 课程提要 Hbase

More information

Microsoft Word - 在VMWare-5.5+RedHat-9下建立本机QTopia-2.1.1虚拟平台a.doc

Microsoft Word - 在VMWare-5.5+RedHat-9下建立本机QTopia-2.1.1虚拟平台a.doc 在 VMWare-5.5+RedHat-9 下建立 本机 QTopia-2.1.1 虚拟平台 张大海 2008-5-9 一 资源下载 1. 需要以下安装包 : tmake-1.13.tar.gz qtopia-free-source-2.1.1.tar.gz qt-embedded-2.3.10-free.tar.gz qt-x11-2.3.2.tar.gz qt-x11-free-3.3.4.tar.gz

More information

HBase_train_Stark

HBase_train_Stark 大数据快速入门培训 08/13/2016 HBase 大纲 HBase 介绍及特点 HBase 系统架构 HBase 集群搭建 HBase 存储结构 HBase 关键流程 HBase 使用及开发 HBase 起源 Google 三大论文中的 BigTable 2007 年 Powerset 上最早应用 2008 年成为 Hadoop 的一个子项目, 放于 contrib 目录下 Top-level-project

More information

tar -xzf hadoop tar.gz mv hadoop /app 在 Hadoop 目录下创建子目录 在 hadoop 目录下创建 tmp name 和 data 目录 cd /app/hadoop mkdir tmp mkdir

tar -xzf hadoop tar.gz mv hadoop /app 在 Hadoop 目录下创建子目录 在 hadoop 目录下创建 tmp name 和 data 目录 cd /app/hadoop mkdir tmp mkdir Hadoop2.X 64 位环境搭建 本文版权归作者和博客园共有, 欢迎转载, 但未经作者同意必须保留此段声明, 且在文章页面明显位置给出原文连接, 博主为石山园, 博客地址为 http://www.cnblogs.com/shishanyuan 该系列课程是应邀实验楼整理编写的, 这里需要赞一下实验楼提供了学习的新方式, 可以边看博客边上机实验, 课程地址为 https://www.shiyanlou.com/courses/237

More information

ABOUT ME AGENDA 唐建法 / TJ MongoDB 高级方案架构师 MongoDB 中文社区联合发起人 Spark 介绍 Spark 和 MongoDB 案例演示

ABOUT ME AGENDA 唐建法 / TJ MongoDB 高级方案架构师 MongoDB 中文社区联合发起人 Spark 介绍 Spark 和 MongoDB 案例演示 完整的大数据解決方案 ABOUT ME AGENDA 唐建法 / TJ MongoDB 高级方案架构师 MongoDB 中文社区联合发起人 Spark 介绍 Spark 和 MongoDB 案例演示 Dataframe Pig YARN Spark Stand Alone HDFS Spark Stand Alone Mesos Mesos Spark Streaming Hive Hadoop

More information

一 登录 crm Mobile 系统 : 输入 ShijiCare 用户名和密码, 登录系统, 如图所示 : 第 2 页共 32 页

一 登录 crm Mobile 系统 : 输入 ShijiCare 用户名和密码, 登录系统, 如图所示 : 第 2 页共 32 页 第 1 页共 32 页 crm Mobile V1.0 for IOS 用户手册 一 登录 crm Mobile 系统 : 输入 ShijiCare 用户名和密码, 登录系统, 如图所示 : 第 2 页共 32 页 二 crm Mobile 界面介绍 : 第 3 页共 32 页 三 新建 (New) 功能使用说明 1 选择产品 第 4 页共 32 页 2 填写问题的简要描述和详细描述 第 5 页共

More information

提纲 2 / 1

提纲 2 / 1 小米 HBase 实践 刘绍辉 小米云存储组 China Hadoop Summit 2013 提纲 2 / 1 提纲 3 / 1 HBase 是什么? Google Bigtable 系统的开源实现 分布式的, 可扩展的, 一致性的, 半结构化数据存储系统 稀疏的, 一致性的, 分布式的, 多维有序的映射表 4 / 1 数据模型 表 行 列簇 列 版本 ( 时间戳 ) 多维映射表 : ( 行 key,

More information

大数据技术原理与应用

大数据技术原理与应用 分布式数据库厦门大学云计算与大数据研究中心 HBase 厦门大学云计算与大数据研究中心林子雨 2015 ziyulin@xmu.edu.cn 年版 大数据技术公开课 ( 专题技术型 ) 第 2 讲分布式数据库 HBase 林子雨博士 / 助理教授厦门大学计算机科学系厦门大学云计算与大数据研究中心 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu

More information

大数据技术基础

大数据技术基础 获取教材和讲义 PPT 等各种课程资料请访问 http://dblab.xmu.edu.cn/node/422 = 课程教材由林子雨老师根据网络资料编著 = 厦门大学计算机科学系教师林子雨编著 http://www.cs.xmu.edu.cn/linziyu 2013 年 9 月 1 / 38 前言 本教程由厦门大学计算机科学系教师林子雨编著, 可以作为计算机专业研究生课程 大数据技术基础 的辅助教材

More information

在Fedora上部署Hadoop2.2.0伪分布式平台

在Fedora上部署Hadoop2.2.0伪分布式平台 如果你想配置完全分布式平台请参见本博客 Hadoop2.2.0 完全分布式集群平台安装与设置 首先, 你得在电脑上面安装好 jdk7, 如何安装, 这里就不说了, 网上一大堆教程! 然后安装好 ssh, 如何安装请参见本博客 Linux 平台下安装 SSH 并设置好无密码登录 ( Ubuntu 和 CentOS 如何配置 SSH 使得无密码登陆 ) 好了, 上面的前提条件部署好之后, 下面将进入 Hadoop2.2.0

More information

大数据技术原理与应用

大数据技术原理与应用 分布式数据库厦门大学云计算与大数据研究中心 HBase 厦门大学云计算与大数据研究中心林子雨 2015 ziyulin@xmu.edu.cn 年版 大数据技术公开课 大数据概念 技术与应用 2015 年 10 月 13 日山东大学 第 4 讲分布式数据库 HBase 林子雨博士 / 助理教授厦门大学计算机科学系厦门大学云计算与大数据研究中心 E-mail: ziyulin@xmu.edu.cn 山东大学公开课主页

More information

Spark读取Hbase中的数据

Spark读取Hbase中的数据 Spark 读取 Hbase 中的数据 Spark 和 Flume-ng 整合, 可以参见本博客 : Spark 和 Flume-ng 整合 使用 Spark 读取 HBase 中的数据 如果想及时了解 Spark Hadoop 或者 Hbase 相关的文章, 欢迎关注微信公共帐号 :iteblog_hadoop 大家可能都知道很熟悉 Spark 的两种常见的数据读取方式 ( 存放到 RDD 中 ):(1)

More information

<4D6963726F736F667420576F7264202D204861646F6F70B4F3CAFDBEDDBCB0BAA3C1BFCAFDBEDDCDDABEF2D3A6D3C3B9A4B3CCCAA6C5E0D1B5B0E056312E332E646F63>

<4D6963726F736F667420576F7264202D204861646F6F70B4F3CAFDBEDDBCB0BAA3C1BFCAFDBEDDCDDABEF2D3A6D3C3B9A4B3CCCAA6C5E0D1B5B0E056312E332E646F63> 关 于 举 办 Hadoop 大 数 据 及 海 量 数 据 挖 掘 应 用 工 程 师 培 训 班 的 通 知 随 着 云 时 代 的 来 临, 大 数 据 技 术 将 具 有 越 来 越 重 要 的 战 略 意 义 大 数 据 分 析 与 挖 掘 技 术 已 经 渗 透 到 每 一 个 行 业 和 业 务 职 能 领 域, 逐 渐 成 为 重 要 的 生 产 要 素, 人 们 对 于 海 量 数

More information

ChinaBI企业会员服务- BI企业

ChinaBI企业会员服务- BI企业 商业智能 (BI) 开源工具 Pentaho BisDemo 介绍及操作说明 联系人 : 杜号权苏州百咨信息技术有限公司电话 : 0512-62861389 手机 :18616571230 QQ:37971343 E-mail:du.haoquan@bizintelsolutions.com 权限控制管理 : 权限控制管理包括 : 浏览权限和数据权限 ( 权限部分两个角色 :ceo,usa; 两个用户

More information

白 皮 书 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 目 录 要 点 概 述...1 业 务 挑 战...2 Hadoop* 分 发 版 注 意 事 项...3 Hadoop* 基 础 架 构 注 意 事 项

白 皮 书 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 目 录 要 点 概 述...1 业 务 挑 战...2 Hadoop* 分 发 版 注 意 事 项...3 Hadoop* 基 础 架 构 注 意 事 项 IT@Intel 白 皮 书 英 特 尔 IT 部 门 大 数 据 和 商 业 智 能 2013 年 10 月 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 要 点 概 述 仅 在 五 周 之 内, 我 们 就 实 施 了 基 于 Apache Hadoop* 英 特 尔 分 发 版 的 低 成 本 可 完 全 实 现 的 大 数

More information

KV-cache 1 KV-cache Fig.1 WorkflowofKV-cache 2.2 Key-value Key ; Key Mem-cache (FIFO) Value Value Key Mem-cache ( Value 256B 100 MB 20%

KV-cache 1 KV-cache Fig.1 WorkflowofKV-cache 2.2 Key-value Key ; Key Mem-cache (FIFO) Value Value Key Mem-cache ( Value 256B 100 MB 20% 38 11 2013 11 GeomaticsandInformationScienceofWuhanUniversity Vol.38No.11 Nov.2013 :1671-8860(2013)11-1339-05 :A GIS Key-value 1 1 1 1 (1 129 430079) : 设计了一种基于 Key-value 结构的缓存 KV-cache 旨在简化数据结构 高效管理缓存数据

More information

目录 1 编译 HADOOOP 搭建环境 安装并设置 maven 以 root 用户使用 yum 安装 svn 以 root 用户使用 yum 安装 autoconf automake libtool cmake..

目录 1 编译 HADOOOP 搭建环境 安装并设置 maven 以 root 用户使用 yum 安装 svn 以 root 用户使用 yum 安装 autoconf automake libtool cmake.. Spark 编译与部署 ( 中 ) --Hadoop 编译安装 第 1 页共 28 页 目录 1 编译 HADOOOP... 3 1.1 搭建环境... 3 1.1.1 安装并设置 maven... 3 1.1.2 以 root 用户使用 yum 安装 svn... 4 1.1.3 以 root 用户使用 yum 安装 autoconf automake libtool cmake... 5 1.1.4

More information

Linux服务器构建与运维管理

Linux服务器构建与运维管理 1 Linux 服务器构建与运维管理 第 2 章 :Linux 基本命令 阮晓龙 13938213680 / rxl@hactcm.edu.cn http://linux.xg.hactcm.edu.cn http://www.51xueweb.cn 河南中医药大学管理科学与工程学科 2018.3 2 提纲 目录与文件的操作 mkdir touch mv cp rm rmdir file tree

More information

通过Hive将数据写入到ElasticSearch

通过Hive将数据写入到ElasticSearch 我在 使用 Hive 读取 ElasticSearch 中的数据 文章中介绍了如何使用 Hive 读取 ElasticSearch 中的数据, 本文将接着上文继续介绍如何使用 Hive 将数据写入到 ElasticSearch 中 在使用前同样需要加入 elasticsearch-hadoop-2.3.4.jar 依赖, 具体请参见前文介绍 我们先在 Hive 里面建个名为 iteblog 的表,

More information

细细品味 Hadoop Hadoop 集群 ( 第 5 期副刊 ) 精华集锦 csaxp 年 2 月 29 日

细细品味 Hadoop Hadoop 集群 ( 第 5 期副刊 ) 精华集锦 csaxp 年 2 月 29 日 细细品味 Hadoop Hadoop 集群 ( 第 5 期副刊 ) 精华集锦 csaxp http://www.xiapistudio.com/ 2012 年 2 月 29 日 目录 1 本期内容... 2 1.1 Linux 配置 java 环境变量... 2 1.1.1 解压安装 jdk... 2 1.1.2 需要配置的环境变量... 2 1.1.3 三种配置环境变量的方法... 2 1.1.4

More information

目 录 1 不 断 开 发 工 具 以 管 理 大 数 据...2 1.1 Hadoop* 简 介 : 支 持 从 大 数 据 中 获 得 出 色 价 值 的 可 靠 框 架... 2 1.2 大 数 据 技 术 的 行 业 生 态 系 统... 2 2 在 关 键 组 件 中 实 现 平 衡...

目 录 1 不 断 开 发 工 具 以 管 理 大 数 据...2 1.1 Hadoop* 简 介 : 支 持 从 大 数 据 中 获 得 出 色 价 值 的 可 靠 框 架... 2 1.2 大 数 据 技 术 的 行 业 生 态 系 统... 2 2 在 关 键 组 件 中 实 现 平 衡... 白 皮 书 英 特 尔 固 态 硬 盘 英 特 尔 以 太 网 融 合 网 络 英 特 尔 Hadoop* 发 行 版 软 件 应 用 大 数 据 技 术 获 得 近 实 时 分 析 巨 大 成 效 1 平 衡 的 基 础 设 施 使 工 作 负 载 完 成 时 间 从 4 小 时 缩 短 为 7 如 今, 基 于 广 泛 可 用 的 计 算 存 储 和 网 络 组 件 的 改 进, 商 业 学 术

More information

客户端虚拟机使用说明

客户端虚拟机使用说明 Spark 客户端云主机使用手册 更新时间 2016-05-13 目录 1 集群和客户端云主机信息... 3 2 配置主机名解析... 4 3 HDFS 测试... 4 3.1 配置客户端... 4 3.2 查询 HDFS 集群信息... 4 3.3 HDFS 文件和目录操作示例... 5 4 Spark 测试... 6 4.1 启动 spark-shell... 6 4.2 示例 :Pi 估值...

More information

业 务 与 运 营 Business & Operation (Transform) 加 载 (Load) 至 目 的 端 的 过 程, 该 部 分 在 数 据 挖 掘 和 分 析 过 程 中 为 最 基 础 的 一 部 分 一 个 良 好 的 ETL 系 统 应 该 有 以 下 几 个 功 能 1

业 务 与 运 营 Business & Operation (Transform) 加 载 (Load) 至 目 的 端 的 过 程, 该 部 分 在 数 据 挖 掘 和 分 析 过 程 中 为 最 基 础 的 一 部 分 一 个 良 好 的 ETL 系 统 应 该 有 以 下 几 个 功 能 1 Business & Operation 业 务 与 运 营 大 数 据 技 术 在 精 准 营 销 中 的 应 用 王 小 鹏 北 京 东 方 国 信 科 技 股 份 有 限 公 司 北 京 100102 摘 要 简 要 介 绍 主 流 的 大 数 据 技 术 架 构 和 大 数 据 挖 掘 技 术 ; 阐 述 大 数 据 技 术 在 精 准 营 销 与 维 系 系 统 建 设 中 的 应 用,

More information

Ioncube Php Encoder 8 3 Crack 4. llamaba octobre traslado General Search colony

Ioncube Php Encoder 8 3 Crack 4. llamaba octobre traslado General Search colony Ioncube Php Encoder 8 3 Crack 4 ->>->>->> DOWNLOAD 1 / 5 2 / 5 Press..the..General..Tools..category4Encrypt..and..protect..files..with..PHP..encoding,..encryption,..ob fuscation..and..licensing... 2016

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 大数据分析工具介绍 主讲 : 王建明 手机 :13940975206 QQ:564250480( 微信 ) 2/39 大数据的基本特征 特征 Volume 数据体量巨大 PB 级 -> EB 级 -> ZB 级 速度要求快数据输入输出的速度 Velocity Big Data Varity 数据类型多样文本 图像 视频 音频 Veracity 价值密度低商业价值高 Hadoop 生态系统介绍 ( 离线

More information

jdbc:hsqldb:hsql: jdbc:hsqldb:hsqls: jdbc:hsqldb:http: jdbc:hsqldb:https: //localhost //192.0.0.10:9500 / /dbserver.somedomain.com /an_alias /enrollme

jdbc:hsqldb:hsql: jdbc:hsqldb:hsqls: jdbc:hsqldb:http: jdbc:hsqldb:https: //localhost //192.0.0.10:9500 / /dbserver.somedomain.com /an_alias /enrollme sh -x path/to/hsqldb start > /tmp/hstart.log 2>&1 第 4 章 高 级 话 题 4.1 本 章 目 的 许 多 在 论 坛 或 邮 件 组 中 重 复 出 现 的 问 题 将 会 在 本 文 档 中 进 行 解 答 如 果 你 打 算 在 应 用 程 序 中 使 用 HSQLDB 的 话, 那 么 你 应 该 好 好 阅 读 一 下 本 文 章 本 章

More information

六域链联盟 SDChain-Matrix 节点搭建指南 2018/07/26 Version : 1.0.0

六域链联盟 SDChain-Matrix 节点搭建指南 2018/07/26 Version : 1.0.0 SDChain-Matrix 节点搭建指南 目录 1 环境要求... 3 2 软件下载... 4 3 安装部署... 4 3.1 部署可执行程序目录... 4 3.2 部署配置文件目录... 4 3.3 部署数据库文件目录... 4 3.4 部署日志文件目录... 4 3.5 部署依赖库文件目录... 4 4 配置参数... 5 5 启动运行... 7 5.1 普通模式启动... 7 5.2 加载启动模式...

More information

Apache CarbonData集群模式使用指南

Apache CarbonData集群模式使用指南 我们在 Apache CarbonData 快速入门编程指南 文章中介绍了如何快速使用 Apache CarbonData, 为了简单起见, 我们展示了如何在单机模式下使用 Apache CarbonData 但是生产环境下一般都是使用集群模式, 本文主要介绍如何在集群模式下使用 Apache CarbonData 启动 Spark shell 这里以 Spark shell 模式进行介绍,master

More information

Flink快速上手(QuickStart)

Flink快速上手(QuickStart) 安装 : 下载并启动 Flink 可以在 Linux Mac OS X 以及 Windows 上运行 为了能够运行 Flink, 唯一的要求是必须安装 Java 7.x 或者更高版本 对于 Windows 用户来说, 请参考 Flink on Windows 文档, 里面介绍了如何在 Window 本地运行 Flink 下载 从下载页面 (http://flink.apache.org/downloads.html)

More information

目 录(目录名)

目  录(目录名) 目录 目录...1-1 1.1 域名解析配置命令... 1-1 1.1.1 display dns domain... 1-1 1.1.2 display dns dynamic-host... 1-1 1.1.3 display dns server... 1-2 1.1.4 display ip host... 1-3 1.1.5 dns domain... 1-4 1.1.6 dns resolve...

More information

目录 1 IPv6 快速转发 IPv6 快速转发配置命令 display ipv6 fast-forwarding aging-time display ipv6 fast-forwarding cache ipv6 fas

目录 1 IPv6 快速转发 IPv6 快速转发配置命令 display ipv6 fast-forwarding aging-time display ipv6 fast-forwarding cache ipv6 fas 目录 1 IPv6 快速转发 1-1 1.1 IPv6 快速转发配置命令 1-1 1.1.1 display ipv6 fast-forwarding aging-time 1-1 1.1.2 display ipv6 fast-forwarding cache 1-1 1.1.3 ipv6 fast-forwarding aging-time 1-3 1.1.4 ipv6 fast-forwarding

More information

孟 祥 萍, 等 HBase 在 智 能 电 网 异 构 数 据 同 步 中 的 应 用 - 123 - 步 最 后, 对 异 构 数 据 同 步 到 数 据 中 心 的 性 能 进 行 了 测 试, 验 证 了 本 文 所 提 方 案 的 可 行 性, 在 探 索 未 来 智 能 电 网 大 数

孟 祥 萍, 等 HBase 在 智 能 电 网 异 构 数 据 同 步 中 的 应 用 - 123 - 步 最 后, 对 异 构 数 据 同 步 到 数 据 中 心 的 性 能 进 行 了 测 试, 验 证 了 本 文 所 提 方 案 的 可 行 性, 在 探 索 未 来 智 能 电 网 大 数 第 43 卷 第 24 期 电 力 系 统 保 护 与 控 制 Vol.43 No.24 2015 年 12 月 16 日 Power System Protection and Control Dec. 16, 2015 HBase 在 智 能 电 网 异 构 数 据 同 步 中 的 应 用 孟 祥 萍 1, 周 来 2, 王 晖 1, 纪 秀 (1. 长 春 工 程 学 院 电 气 与 信 息

More information

程模型,MapReduce 把任务分为 map( 映射 ) 阶段和 reduce( 化简 ) 由于 MapReduce 工作原理的特性, Hadoop 能以并行的方式访问数据, 从而实现快速访问数据 Hbase--HBase 是一个建立在 HDFS 之上, 面向列的 NoSQL 数据库, 用于快速读

程模型,MapReduce 把任务分为 map( 映射 ) 阶段和 reduce( 化简 ) 由于 MapReduce 工作原理的特性, Hadoop 能以并行的方式访问数据, 从而实现快速访问数据 Hbase--HBase 是一个建立在 HDFS 之上, 面向列的 NoSQL 数据库, 用于快速读 Hadoop1.X 伪分布式安装 本文版权归作者和博客园共有, 欢迎转载, 但未经作者同意必须保留此段声明, 且在文章页面明显位置给出原文连接, 博主为石山园, 博客地址为 http://www.cnblogs.com/shishanyuan 该系列课程是应邀实验楼整理编写的, 这里需要赞一下实验楼提供了学习的新方式, 可以边看博客边上机实验, 课程地址为 https://www.shiyanlou.com/courses/237

More information

SDK 概要 使用 Maven 的用户可以从 Maven 库中搜索 "odps-sdk" 获取不同版本的 Java SDK: 包名 odps-sdk-core odps-sdk-commons odps-sdk-udf odps-sdk-mapred odps-sdk-graph 描述 ODPS 基

SDK 概要 使用 Maven 的用户可以从 Maven 库中搜索 odps-sdk 获取不同版本的 Java SDK: 包名 odps-sdk-core odps-sdk-commons odps-sdk-udf odps-sdk-mapred odps-sdk-graph 描述 ODPS 基 开放数据处理服务 ODPS SDK SDK 概要 使用 Maven 的用户可以从 Maven 库中搜索 "odps-sdk" 获取不同版本的 Java SDK: 包名 odps-sdk-core odps-sdk-commons odps-sdk-udf odps-sdk-mapred odps-sdk-graph 描述 ODPS 基础功能的主体接口, 搜索关键词 "odpssdk-core" 一些

More information

Chapter #

Chapter # 第三章 TCP/IP 协议栈 本章目标 通过本章的学习, 您应该掌握以下内容 : 掌握 TCP/IP 分层模型 掌握 IP 协议原理 理解 OSI 和 TCP/IP 模型的区别和联系 TCP/IP 介绍 主机 主机 Internet TCP/IP 早期的协议族 全球范围 TCP/IP 协议栈 7 6 5 4 3 应用层表示层会话层传输层网络层 应用层 主机到主机层 Internet 层 2 1 数据链路层

More information

目录 1 本期内容 Hadoop 开发环境简介 Hadoop 集群简介 Windows 开发简介 Hadoop Eclipse 简介和使用 Eclipse 插件介绍 Hadoo

目录 1 本期内容 Hadoop 开发环境简介 Hadoop 集群简介 Windows 开发简介 Hadoop Eclipse 简介和使用 Eclipse 插件介绍 Hadoo 细细品味 Hadoop Hadoop 集群 ( 第 7 期 ) 精华集锦 csaxp http://www.xiapistudio.com/ 2012 年 3 月 3 日 目录 1 本期内容... 2 1.1 Hadoop 开发环境简介... 2 1.1.1 Hadoop 集群简介... 2 1.1.2 Windows 开发简介... 2 1.2 Hadoop Eclipse 简介和使用... 2

More information

Reducing Client Incidents through Big Data Predictive Analytics

Reducing Client Incidents through Big Data Predictive Analytics IT@lntel 白 皮 书 英 特 尔 IT 部 门 IT 最 佳 实 践 大 数 据 预 测 分 析 2013 年 12 月 通 过 大 数 据 预 测 分 析 减 少 客 户 端 事 故 总 体 概 述 相 比 过 去 的 被 动 反 应, 我 们 现 在 能 够 更 容 易 主 动 找 出 客 户 端 问 题, 并 及 时 将 其 修 复 以 免 问 题 扩 大, 从 而 为 企 业 节 约

More information

长 安 大 学 硕 士 学 位 论 文 基 于 数 据 仓 库 和 数 据 挖 掘 的 行 为 分 析 研 究 姓 名 : 杨 雅 薇 申 请 学 位 级 别 : 硕 士 专 业 : 计 算 机 软 件 与 理 论 指 导 教 师 : 张 卫 钢 20100530 长安大学硕士学位论文 3 1 3系统架构设计 行为分析数据仓库的应用模型由四部分组成 如图3 3所示

More information

培 训 机 构 介 绍 中 科 普 开 是 国 内 首 家 致 力 于 IT 新 技 术 领 域 的 领 航 者, 专 注 于 云 计 算 大 数 据 物 联 网 移 动 互 联 网 技 术 的 培 训, 也 是 国 内 第 一 家 开 展 Hadoop 云 计 算 的 培

培 训 机 构 介 绍  中 科 普 开 是 国 内 首 家 致 力 于 IT 新 技 术 领 域 的 领 航 者, 专 注 于 云 计 算 大 数 据 物 联 网 移 动 互 联 网 技 术 的 培 训, 也 是 国 内 第 一 家 开 展 Hadoop 云 计 算 的 培 Hadoop 2.0 培 训 Hadoop 2.0Training Hadoop 2.0 运 维 与 开 发 实 战 培 训 邀 请 函 培 训 机 构 介 绍 www.zkpk.org 中 科 普 开 是 国 内 首 家 致 力 于 IT 新 技 术 领 域 的 领 航 者, 专 注 于 云 计 算 大 数 据 物 联 网 移 动 互 联 网 技 术 的 培 训, 也 是 国 内 第 一 家 开

More information

Hadoop 手册

Hadoop 手册 Hadoop 手册 数据服务中心 - 大数据应用 2013-3-5 海南易建科技股份有限公司 李景帆整理 Hadoop 手册... 错误! 未定义书签 1. 大数据理论... 2 2. Hadoop 的背景及知识体系... 4 3. Hadoop 集群的安装... 8 3.1 Hadoop 集群的系统及软件版本... 8 3.2 安装 Hadoop 集群前的准备... 8 3.3 网络配置... 9

More information

Microsoft Word - PS2_linux_guide_cn.doc

Microsoft Word - PS2_linux_guide_cn.doc Linux For $ONY PlayStatioin2 Unofficall General Guide Language: Simplified Chinese First Write By Beter Hans v0.1 Mail: hansb@citiz.net Version: 0.1 本 人 是 菜 鸟 + 小 白 欢 迎 指 正 错 误 之 处, 如 果 您 有 其 他 使 用 心 得

More information

合集

合集 Ver 1.0 版 本 目 录 第 一 章 当 大 数 据 遇 上 SSD 01 第 二 章 广 东 移 动 运 用 Hadoop 创 新 应 用 04 第 三 章 第 四 章 第 五 章 第 六 章 第 七 章 第 八 章 第 九 章 第 十 章 如 何 利 用 大 数 据 分 析 提 升 垃 圾 短 信 过 滤 效 果 广 东 电 信 用 大 数 据 重 构 室 内 网 优 大 数 据 提 升

More information

帝国CMS下在PHP文件中调用数据库类执行SQL语句实例

帝国CMS下在PHP文件中调用数据库类执行SQL语句实例 帝国 CMS 下在 PHP 文件中调用数据库类执行 SQL 语句实例 这篇文章主要介绍了帝国 CMS 下在 PHP 文件中调用数据库类执行 SQL 语句实例, 本文还详细介绍了帝国 CMS 数据库类中的一些常用方法, 需要的朋友可以参考下 例 1: 连接 MYSQL 数据库例子 (a.php)

More information

本章学习目标 小风 Java 实战系列教程 SpringMVC 简介 SpringMVC 的入门案例 SpringMVC 流程分析 配置注解映射器和适配器 注解的使用 使用不同方式的跳转页面 1. SpringMVC 简介 Spring web mvc

本章学习目标 小风 Java 实战系列教程 SpringMVC 简介 SpringMVC 的入门案例 SpringMVC 流程分析 配置注解映射器和适配器 注解的使用 使用不同方式的跳转页面 1. SpringMVC 简介 Spring web mvc 本章学习目标 SpringMVC 简介 SpringMVC 的入门案例 SpringMVC 流程分析 配置注解映射器和适配器 配置视图解析器 @RequestMapping 注解的使用 使用不同方式的跳转页面 1. SpringMVC 简介 Spring web mvc 和 Struts2 都属于表现层的框架, 它是 Spring 框架的一部分, 我们可 以从 Spring 的整体结构中看得出来 :

More information

工银瑞信货币市场证券投资基金2008年度第2季度报告

工银瑞信货币市场证券投资基金2008年度第2季度报告 2016 年 6 月 30 日 基 金 管 理 人 : 华 富 基 金 管 理 有 限 公 司 基 金 托 管 人 : 中 国 建 设 银 行 股 份 有 限 公 司 报 告 送 出 日 期 :2016 年 7 月 21 日 1 重 要 提 示 基 金 管 理 人 的 董 事 会 及 董 事 保 证 本 报 告 所 载 资 料 不 存 在 虚 假 记 载 误 导 性 陈 述 或 重 大 遗 漏, 并

More information

雲端 Cloud Computing 技術指南 運算 應用 平台與架構 10/04/15 11:55:46 INFO 10/04/15 11:55:53 INFO 10/04/15 11:55:56 INFO 10/04/15 11:56:05 INFO 10/04/15 11:56:07 INFO

雲端 Cloud Computing 技術指南 運算 應用 平台與架構 10/04/15 11:55:46 INFO 10/04/15 11:55:53 INFO 10/04/15 11:55:56 INFO 10/04/15 11:56:05 INFO 10/04/15 11:56:07 INFO CHAPTER 使用 Hadoop 打造自己的雲 8 8.3 測試 Hadoop 雲端系統 4 Nodes Hadoop Map Reduce Hadoop WordCount 4 Nodes Hadoop Map/Reduce $HADOOP_HOME /home/ hadoop/hadoop-0.20.2 wordcount echo $ mkdir wordcount $ cd wordcount

More information

目录 1 IPv6 快速转发 IPv6 快速转发配置命令 display ipv6 fast-forwarding aging-time display ipv6 fast-forwarding cache ipv6 fas

目录 1 IPv6 快速转发 IPv6 快速转发配置命令 display ipv6 fast-forwarding aging-time display ipv6 fast-forwarding cache ipv6 fas 目录 1 IPv6 快速转发 1-1 1.1 IPv6 快速转发配置命令 1-1 1.1.1 display ipv6 fast-forwarding aging-time 1-1 1.1.2 display ipv6 fast-forwarding cache 1-1 1.1.3 ipv6 fast-forwarding aging-time 1-3 1.1.4 ipv6 fast-forwarding

More information

Kubenetes 系列列公开课 2 每周四晚 8 点档 1. Kubernetes 初探 2. 上 手 Kubernetes 3. Kubernetes 的资源调度 4. Kubernetes 的运 行行时 5. Kubernetes 的 网络管理理 6. Kubernetes 的存储管理理 7.

Kubenetes 系列列公开课 2 每周四晚 8 点档 1. Kubernetes 初探 2. 上 手 Kubernetes 3. Kubernetes 的资源调度 4. Kubernetes 的运 行行时 5. Kubernetes 的 网络管理理 6. Kubernetes 的存储管理理 7. Kubernetes 包管理理 工具 Helm 蔺礼强 Kubenetes 系列列公开课 2 每周四晚 8 点档 1. Kubernetes 初探 2. 上 手 Kubernetes 3. Kubernetes 的资源调度 4. Kubernetes 的运 行行时 5. Kubernetes 的 网络管理理 6. Kubernetes 的存储管理理 7. Kubernetes

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 A Brief Introduction to HBase & Cassandra 曲直 quzhi@net.pku.edu.cn HDFS OpenSource GFS Typically 64M block NameNode: In memory metadata 3 replication Immutable Hadoop database, a distributed, scalable,

More information

Data Server_new_.doc

Data Server_new_.doc 0i B/C Data Server Windows 2000 Window XP Windows XP FTP FANUC Data Server FTP liwei@beijing-fanuc 1 06-10-8 Content 1. /...3 1.1...3 1.2...3 1.3 CNC...3 2....5 2.1 STORAGE...5 2.2 FTP...6 2.3 BUFFER...7

More information

PowerPoint Presentation

PowerPoint Presentation 利用 Oracle Big Data Connectors 将 Hadoop 与 Oracle 集成 罗海雄甲骨文公司资深技术顾问 1 Copyright 2011, Oracle and/or its affiliates. All rights 以下内容旨在概述产品的总体发展方向 该内容仅供参考, 不可纳入任何合同 该内容不构成提供任何材料 代码或功能的承诺, 并且不应该作为制定购买决策的依据

More information

Microsoft Word - linux命令及建议.doc

Microsoft Word - linux命令及建议.doc Linux 操 作 系 统 命 令 集 1 基 本 命 令 查 看 系 统 信 息 : uname -a 修 改 密 码 : passwd 退 出 : logout(exit) 获 取 帮 助 : man commands 2 文 件 和 目 录 命 令 显 示 当 前 工 作 目 录 : pwd 改 变 所 在 目 录 : cd cd - 切 换 到 上 一 次 使 用 的 目 录 cd 切 换

More information

资源管理软件TORQUE与作业调度软件Maui的安装、设置及使用

资源管理软件TORQUE与作业调度软件Maui的安装、设置及使用 TORQUE Maui hmli@ustc.edu.cn 2008 1 1 TORQUE 2 1.1 TORQUE........................... 2 1.2 TORQUE...................... 2 1.3 TORQUE.......................... 4 1.4 TORQUE........................... 4

More information

手册 doc

手册 doc 1. 2. 3. 3.1 3.2 3.3 SD 3.4 3.5 SD 3.6 3.7 4. 4.1 4.2 4.3 SD 4.4 5. 5.1 5.2 5.3 SD 6. 1. 1~3 ( ) 320x240~704x288 66 (2G SD 320x2401FPS ) 32M~2G SD SD SD SD 24V DC 3W( ) -10~70 10~90% 154x44x144mm 2. DVR106

More information

目 录(目录名)

目  录(目录名) 目录 1 域名解析配置命令... 1-1 1.1 域名解析配置命令...1-1 1.1.1 display dns domain... 1-1 1.1.2 display dns dynamic-host... 1-2 1.1.3 display dns proxy table... 1-2 1.1.4 display dns server... 1-3 1.1.5 display ip host...

More information

静态分析 投放文件 行为分析 互斥量 (Mutexes) 执行的命令 创建的服务 启动的服务 进程 cmd.exe PID: 2520, 上一级进程 PID: 2556 cmd.exe PID: 2604, 上一级进程 PID: 2520 访问的文件 C:\Users\test\AppData\Lo

静态分析 投放文件 行为分析 互斥量 (Mutexes) 执行的命令 创建的服务 启动的服务 进程 cmd.exe PID: 2520, 上一级进程 PID: 2556 cmd.exe PID: 2604, 上一级进程 PID: 2520 访问的文件 C:\Users\test\AppData\Lo 魔盾安全分析报告 分析类型 开始时间 结束时间 持续时间 分析引擎版本 FILE 2016-11-25 00:20:03 2016-11-25 00:22:18 135 秒 1.4-Maldun 虚拟机机器名 标签 虚拟机管理 开机时间 关机时间 win7-sp1-x64 win7-sp1-x64 KVM 2016-11-25 00:20:03 2016-11-25 00:22:18 魔盾分数 0.0

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用 http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第四章分布式数据库 HBase (PPT 版本号 :2016 年 3 月 10 日版本 ) 林子雨厦门大学计算机科学系 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu

More information

目录 一 安装配置步骤 虚拟机的准备工作 安装和配置 JDK 环境 配置 SSH 免密码登录 编辑 etc/hosts 文件 配置 hadoop 将 master 上的 Hadoop 安装包拷

目录 一 安装配置步骤 虚拟机的准备工作 安装和配置 JDK 环境 配置 SSH 免密码登录 编辑 etc/hosts 文件 配置 hadoop 将 master 上的 Hadoop 安装包拷 hadoop 集群部署 ( 部署 ) 目录 一 安装配置步骤... 3 1.1 虚拟机的准备工作... 3 1.2 安装和配置 JDK 环境... 3 1.3 配置 SSH 免密码登录... 4 1.4 编辑 etc/hosts 文件... 6 1.5 配置 hadoop... 7 1.6 将 master 上的 Hadoop 安装包拷贝到数据节点上... 9 1.7 编辑 master 主机的 etc/profile

More information

标题

标题 文学蓝皮书 9 网络文学 趋向主流化 酝酿新格局 摘 要 2015 年的网络文学 在中央重视 政府主导 民间先 行 资本发力等诸多因素联手推动下 呈现出借势发 展和强势进取的良好势头 网络小说创作 在虚构类 的玄幻与仙侠 写实类的历史与都市 都有好的和比 较好的力作佳构联袂而来 主流体制组建网络文学机 构 IP 热 愈演愈烈 都从不同的侧面和层面推动网 络文学进而做大做强 使之成为当代文学中最具成长

More information

1 o o o CPU o o o o o SQL Server 2005 o CPU o o o o o SQL Server o Microsoft SQL Server 2005

1 o o o CPU o o o o o SQL Server 2005 o CPU o o o o o SQL Server o Microsoft SQL Server 2005 1 o o o CPU o o o o o SQL Server 2005 o CPU o o o o o SQL Server o Microsoft SQL Server 2005 1 1...3 2...20 3...28 4...41 5 Windows SQL Server...47 Microsoft SQL Server 2005 DBSRV1 Microsoft SQL Server

More information

使用MapReduce读取XML文件

使用MapReduce读取XML文件 使用 MapReduce 读取 XML 文件 XML( 可扩展标记语言, 英语 :extensible Markup Language, 简称 : XML) 是一种标记语言, 也是行业标准数据交换交换格式, 它很适合在系统之间进行数据存储和交换 ( 话说 Hadoop H ive 等的配置文件就是 XML 格式的 ) 本文将介绍如何使用 MapReduce 来读取 XML 文件 但是 Had oop

More information

投影片 1

投影片 1 FreeBSD A 95/10/11 19:00~21:00 95/10/11 FreeBSD 練 1 Services Setup SSH, lighttpd, PHP, MySQL, FTP, Postfix, phpmyadmin, Blog, Gallery 95/10/11 FreeBSD 練 2 1. 2. # FreeBSD # 3. vi ee joe nano etc 95/10/11

More information

通过动态路由协议实现链路备份

通过动态路由协议实现链路备份 通过动态路由协议实现链路备份 实验名称 通过动态路由协议实现链路备份 实验目的 掌握通过在不同链路上配置不同的路由协议实现链路备份 背景描述 你是公司高级网络管理员, 公司内部有一个很重要的服务器所在网段为 192.168.12.0/24, 平常访问通过 R1,R3 的 OSPF 路由协议, 为了保证该网段随时能够访问, 不能因为链路故障出问题, 要求你实现一个备份冗余的功能, 请给予支持 实现功能

More information

0 配置 Host MIB 设备 V ( 简体版 ) 0 Update: 2016/1/30

0 配置 Host MIB 设备 V ( 简体版 ) 0 Update: 2016/1/30 0 配置 Host MIB 设备 V 1.1.2 ( 简体版 ) 0 Update: 2016/1/30 前言 N-Reporter 支持 Host Resource MIB 监控主机 (Host) 状态, 本文件描述 N-Reporter 用户如何配置 Host MIB 设备 文件章节如下 : 1. 配置 Windows Server 2003... 2 1-1.Windows Server 2003

More information

对于 Hadoop 来说, 在 HDFS 看来, 节点分为 Namenode 和 Datanode, 其中 Namenode 只有一个,Datanode 可以是很多 ; 在 MapReduce 看来, 节点又分为 Jobtracker 和 Tasktracker, 其中 Jobtracker 只有一

对于 Hadoop 来说, 在 HDFS 看来, 节点分为 Namenode 和 Datanode, 其中 Namenode 只有一个,Datanode 可以是很多 ; 在 MapReduce 看来, 节点又分为 Jobtracker 和 Tasktracker, 其中 Jobtracker 只有一 hadoop----- 云计算实验 作者 : 张吉良李菁平邓鹏球 关键词 : hadoop 分布式 云计算 mapreduce 摘要 : 摩尔定律统制下的软件开发时代有一个非常有意思的现象 : Andy giveth, and Bill taketh away. 不管 CPU 的主频有多快, 我们始终有办法来利用它, 而我们也陶醉在机器升级带来的程序性能提高中 我们不知不觉的一直在享受着这样的免费午餐

More information

Hadoop 2.2.0安装和配置lzo

Hadoop 2.2.0安装和配置lzo Hadoop 2.2.0 安装和配置 lzo Hadoop 经常用于处理大量的数据, 如果期间的输出数据 中间数据能压缩存储, 对系统的 I/ O 性能会有提升 综合考虑压缩 解压速度 是否支持 split, 目前 lzo 是最好的选择 LZO(LZO 是 Lempel-Ziv-Oberhumer 的缩写 ) 是一种高压缩比和解压速度极快的编码, 它的特点是解压缩速度非常快, 无损压缩, 压缩后的数据能准确还原,lzo

More information

支付宝2011年 IT资产与费用预算

支付宝2011年 IT资产与费用预算 OceanBase 支 持 ACID 的 可 扩 展 关 系 数 据 库 qushan@alipay.com 2013 年 04 月 关 系 数 据 库 发 展 1970-72:E.F.Codd 数 据 库 关 系 模 式 20 世 纨 80 年 代 第 一 个 商 业 数 据 库 Oracle V2 SQL 成 为 数 据 库 行 业 标 准 可 扩 展 性 Mainframe: 小 型 机 =>

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用 http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第四章分布式数据库 HBase (PPT 版本号 :2016 年 1 月 28 日版本 ) 林子雨厦门大学计算机科学系 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu

More information

第四章 102 图 4唱16 基于图像渲染的理论基础 三张拍摄图像以及它们投影到球面上生成的球面图像 拼图的圆心是相同的 而拼图是由球面图像上的弧线图像组成的 因此我 们称之为同心球拼图 如图 4唱18 所示 这些拼图中半径最大的是圆 Ck 最小的是圆 C0 设圆 Ck 的半径为 r 虚拟相机水平视域为 θ 有 r R sin θ 2 4畅11 由此可见 构造同心球拼图的过程实际上就是对投影图像中的弧线图像

More information

自由軟體教學平台

自由軟體教學平台 NCHC Opensource task force DRBL steven@nchc.gov.tw, c00hkl00@nchc.gov.tw National Center for High-Performance Computing http://www.nchc.gov.tw Jan, 2003 1 2003/1/28 ( ) 09:00-10:30 10:40-12:00 Linux 13:00-14:30

More information

<4D6963726F736F667420576F7264202D20B971B8A3B577C5E9B8CBADD7A441AFC5B2C4A447B3A1A4C039372E342E3232A44AAE77AAA92E646F63>

<4D6963726F736F667420576F7264202D20B971B8A3B577C5E9B8CBADD7A441AFC5B2C4A447B3A1A4C039372E342E3232A44AAE77AAA92E646F63> 電 腦 硬 體 裝 修 乙 級 技 術 士 技 能 檢 定 術 科 測 試 應 檢 人 參 考 資 料 試 題 編 號 :12000-940201~12 審 定 日 期 : 94 年 11 月 30 日 修 訂 日 期 : 96 年 11 月 01 日 修 訂 日 期 : 97 年 01 月 07 日 修 訂 日 期 : 97 年 04 月 22 日 ( 第 二 部 分 ) 電 腦 硬 體 裝 修

More information

要 注 意 的 是,Flume 中 对 事 件 的 处 理 不 需 要 带 状 态, 它 的 Scalability 可 以 很 容 易 实 现 3. Manageability:Flume 利 用 ZooKeeper 和 gossip, 保 证 配 置 数 据 的 一 致 性 高 可 用 同 时,

要 注 意 的 是,Flume 中 对 事 件 的 处 理 不 需 要 带 状 态, 它 的 Scalability 可 以 很 容 易 实 现 3. Manageability:Flume 利 用 ZooKeeper 和 gossip, 保 证 配 置 数 据 的 一 致 性 高 可 用 同 时, Flume 介 绍 安 装 与 应 用 案 例 本 文 版 权 归 作 者 和 博 客 园 共 有, 欢 迎 转 载, 但 未 经 作 者 同 意 必 须 保 留 此 段 声 明, 且 在 文 章 页 面 明 显 位 置 给 出 原 文 连 接, 博 主 为 石 山 园, 博 客 地 址 为 http://www.cnblogs.com/shishanyuan 该 系 列 课 程 是 应 邀 实 验

More information

Partition Key: 字 符 串 类 型, 表 示 当 前 Entity 的 分 区 信 息 这 个 Property 对 于 Table Service 自 动 纵 向 和 横 向 扩 展 至 关 重 要 Row Key: 字 符 串 类 型, 在 给 定 Partition Key 的

Partition Key: 字 符 串 类 型, 表 示 当 前 Entity 的 分 区 信 息 这 个 Property 对 于 Table Service 自 动 纵 向 和 横 向 扩 展 至 关 重 要 Row Key: 字 符 串 类 型, 在 给 定 Partition Key 的 4.2 使 用 Table Service Table Service 相 对 来 说 是 三 个 Storage Service 中 最 好 理 解 和 最 易 于 接 受 的, 它 主 要 用 来 存 储 结 构 化 数 据 但 是 Table Service 却 并 不 是 一 个 关 系 型 数 据 库 Table Service 由 两 个 部 分 组 成 :Table 和 Entity

More information

第 06 期 李祥池 : 基于 ELK 和 Spark Streaming 的日志分析系统设计与实现 1 日志 1.1 日志定义 IT 1.2 日志处理方案演进 v1.0 v2.0 Hadoop Storm Spark Hadoop/Storm/Spark v3.0 TB Splunk ELK SI

第 06 期 李祥池 : 基于 ELK 和 Spark Streaming 的日志分析系统设计与实现 1 日志 1.1 日志定义 IT 1.2 日志处理方案演进 v1.0 v2.0 Hadoop Storm Spark Hadoop/Storm/Spark v3.0 TB Splunk ELK SI 电子科学技术第 02 卷第 06 期 2015 年 11 月 Electronic Science & Technology Vol.02 No.06 Nov.2015 年 基于 ELK 和 Spark Streaming 的日志分析系统设计与实现 李祥池 ( 杭州华三通信技术有限公司北京研究所, 北京,100085) 摘要 : 在大数据时代 对数据平台各组件的运行状态实时监控与运行分析具有重要意义

More information

Microsoft Word - 100118002.htm

Microsoft Word - 100118002.htm 100 年 度 11800 電 腦 軟 體 應 用 乙 級 技 術 士 技 能 檢 定 學 科 測 試 試 題 本 試 卷 有 選 擇 題 80 題, 每 題 1.25 分, 皆 為 單 選 選 擇 題, 測 試 時 間 為 100 分 鐘, 請 在 答 案 卡 上 作 答, 答 錯 不 倒 扣 ; 未 作 答 者, 不 予 計 分 准 考 證 號 碼 : 姓 名 : 選 擇 題 : 1. (3)

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用 ( 第 2 版 ) http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第 4 章分布式数据库 HBase (PPT 版本号 :2017 年 2 月版本 ) 林子雨厦门大学计算机科学系 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu

More information

使用Spark SQL读取Hive上的数据

使用Spark SQL读取Hive上的数据 使用 Spark SQL 读取 Hive 上的数据 Spark SQL 主要目的是使得用户可以在 Spark 上使用 SQL, 其数据源既可以是 RDD, 也可以是外部的数据源 ( 比如 Parquet Hive Json 等 ) Spark SQL 的其中一个分支就是 Spark on Hive, 也就是使用 Hive 中 HQL 的解析 逻辑执行计划翻译 执行计划优化等逻辑, 可以近似认为仅将物理执行计划从

More information

DPark MapReduce (Davies) davies@douban.com 2011/12/07 Velocity China 2011 Douban Douban 5500 Douban 5500 1000G, Douban 5500 1000G, 60+ Douban 5500 1000G, 60+ 200+ Douban 5500 1000G, 60+ 200+ > MooseFS

More information

Oracle 4

Oracle 4 Oracle 4 01 04 Oracle 07 Oracle Oracle Instance Oracle Instance Oracle Instance Oracle Database Oracle Database Instance Parameter File Pfile Instance Instance Instance Instance Oracle Instance System

More information

Azure_s

Azure_s Azure ? Azure Azure Windows Server Database Server Azure Azure Azure Azure Azure Azure Azure Azure OpenSource Azure IaaS Azure VM Windows Server Linux PaaS Azure ASP.NET PHP Node.js Python MS SQL MySQL

More information

三 開啟第一台機器, 點擊右上角網路手動設定, 解除鎖定選擇 eth1 屬性並設定固定 ip( 例如 : ) 第二台機器網路設定要選擇 eth3 設定固定 ip( ) 四 接著編輯 /etc/hosts 輸入 ip 以及主機名稱, 第二台機器也

三 開啟第一台機器, 點擊右上角網路手動設定, 解除鎖定選擇 eth1 屬性並設定固定 ip( 例如 : ) 第二台機器網路設定要選擇 eth3 設定固定 ip( ) 四 接著編輯 /etc/hosts 輸入 ip 以及主機名稱, 第二台機器也 一 操作準備假設有一台主機, 先在實體主機上安裝 virtualbox, 我們利用 virtualbox 來模擬兩台虛擬的機器, 模擬的作業系統選擇 ubuntu-10.04.4 版本 二 安裝虛擬機器 ( 共要安裝兩台虛擬機器, 安裝時要注意使用者名稱及密碼 如果安裝虛擬機器完成之後, 將機器關閉並且完成以下設定 設定第一個虛擬網路介面卡選擇 NAT 模式可以對外連線, 而第二張虛擬網路卡指定為

More information

.. 3 N

.. 3 N 1 .. 3 N9.. 4 5.. 6 7.. 8 20.. 21 23.. 24.. 25 26.. 27.. 28.. 29 2 (Cyber Café) Linux (LAN) Linux Public Home 3 K12LTSP K12LTSPFedora Core 4 (Linux)LTSP Linux (command line interface) (Graphical User Interface,

More information

Pchome

Pchome H Linux Linux Red Hat Linux Fedora 1 DNS Mail WWW Domain tslg.idv.tw IP 192.168.1.254 tslg.idv.tw PChome Seednet ISP http://rs.twnic.net.tw/index2.html Seednet http://rs.seed.net.tw/ Pchome http://myname.pchome.com.tw/

More information

开源软件DSpace的安装和维护(清华_邹荣).ppt

开源软件DSpace的安装和维护(清华_邹荣).ppt 开源软件 DSpace 的安装和维护 清华大学图书馆邹荣 2009 年 9 月 DSpace 的安装 dspace-1.5.2 硬件平台主流 PC 服务器或 UNIX/Linux 服务器, 具体配置可以根据数据规模 保存 备份 性能等方面需求配置 操作系统 UNIX-like OS (Linux, HP/UX etc) Microsoft Windows ( 本馆采用的操作系统是 Linux centos

More information

深圳市亚可信息技术有限公司 NetWeaver 7.3 EhP1 ABAP on Redhat Enterprise Linux Server 62 for Oracle112 High Availability System Installation Created by

深圳市亚可信息技术有限公司 NetWeaver 7.3 EhP1 ABAP on Redhat Enterprise Linux Server 62 for Oracle112 High Availability System Installation Created by NetWeaver 7.3 EhP1 ABAP on Redhat Enterprise Linux Server 62 for Oracle112 High Availability System Installation Created by 13092539@qq.com 1. 安装规划 Parameter Host A Host B Host C For ASCS Database Dialog

More information

计算机网络实验说明

计算机网络实验说明 计算机网络实验说明 龚旭东 电三楼 420 lzgxd@mailustceducn 2011 年 11 月 1 日 龚旭东 (TA) 计算机网络实验说明 2011 年 11 月 1 日 1 / 20 Outline 1 实验系统介绍 实验环境实验流程 2 实验内容编程实验交互实验观察实验 3 一些控制台命令 4 实验报告说明 龚旭东 (TA) 计算机网络实验说明 2011 年 11 月 1 日 2

More information

05_資源分享-NFS及NIS.doc

05_資源分享-NFS及NIS.doc 5 NFS NFS Server NFS Client NIS NIS 5-0 (Network File System, NFS) Unix NFS mount NFS... Network Information Service NIS Linux NIS NIS NIS / / /etc/passwd /etc/group NFS NIS 5-1 NFS 5-1-1 NFS NFS Network

More information

lect03.ppt

lect03.ppt Linux 操 作 系 统 Linux 基 础 主 要 内 容 q 使 用 Linux q Linux 的 两 种 登 录 方 式 q 字 符 操 作 环 境 和 X Windows 系 统 q Linux 图 形 界 面 基 本 操 作 q Linux 命 令 的 使 用 方 式 q Linux 一 些 常 用 命 令 1 2 一 些 基 本 术 语 u 命 令 (Command) 给 计 算 机

More information

ssh-keygen -t rsa

ssh-keygen -t rsa 虚拟并行运算环境 mpi 的配置简介科研菜鸟 v2.0 http://blog.sciencenet.cn/u/sanshiphy 问题 : 有一台电脑,1 cpu, 超线程 8 核, 已安装 Ubuntu 系统 现配置两台虚拟机, 每台虚拟机 1cpu,3 核, 两台虚拟机均安装 Ubuntu server 系统, 并实现 mpi 并行运算 思路 : 利用 vmware 构造虚拟机, 利用 ssh

More information

加 入 网 络 帝 国 的 学 习 狂 欢 仅 1989 年, 互 联 网 缔 造 者 蒂 姆 伯 纳 斯 李 爵 士 将 web 服 务 器 命 名 为 world wide web 开 始, 这 个 www 为 开 场 癿 新 时 代 就 引 収 了 一 连 串 癿 革 命, 幵 迚 而 成 为

加 入 网 络 帝 国 的 学 习 狂 欢 仅 1989 年, 互 联 网 缔 造 者 蒂 姆 伯 纳 斯 李 爵 士 将 web 服 务 器 命 名 为 world wide web 开 始, 这 个 www 为 开 场 癿 新 时 代 就 引 収 了 一 连 串 癿 革 命, 幵 迚 而 成 为 Product Communications SPD 产 品 通 讯 2011 年 8 月 刊 总 第 1 期 创 刊 寄 诧 本 期 目 彔 1 路 在 脚 下 作 者 : 彭 成 宝 创 刊 寄 诧 路 在 脚 下 开 卷 有 益 加 入 网 络 帝 国 癿 学 习 狂 欢 改 版 乀 后 癿 产 品 通 讯 第 一 期 正 式 収 布 了, 这 是 一 件 好 事, 祝 贷 乀 余 还 想 多

More information

2

2 2 3 4 5 6 1 1 1 1 3 1 2 7 13... 2... 4 1... 6... 8... 20... 22... 26 Chapter 01 contents 14 contents... 29... 33... 37 Column... 40... 42... 44... 47 Chapter 02 15... 54... 59... 66 S... 68... 72... 74...

More information

. Outline 编译 Linux 在 QEMU 模拟器上运行制作带 grub 启动的磁盘映像...1 编译 Linux 在 QEMU 模拟器上运行...2 制作带 grub 启动的磁盘映像

. Outline 编译 Linux 在 QEMU 模拟器上运行制作带 grub 启动的磁盘映像...1 编译 Linux 在 QEMU 模拟器上运行...2 制作带 grub 启动的磁盘映像 .... 计算机应用教研室 @ 计算机学院嵌入式系统实验室 @ 苏州研究院中国科学技术大学 Fall 2010 . Outline 编译 Linux 在 QEMU 模拟器上运行制作带 grub 启动的磁盘映像...1 编译 Linux 在 QEMU 模拟器上运行...2 制作带 grub 启动的磁盘映像 . 编译 Linux 在 QEMU 模拟器上运行 qemu+linux-2.6.26.1. 准备模拟器.2.

More information

目 录(目录名)

目  录(目录名) 目录 1 概述 1-1 2 安装说明 2-1 2.1 支持的 Linux 操作系统 2-1 2.2 使用 root 用户安装 Linux inode 2-1 2.3 使用普通用户安装 Linux inode 2-4 3 使用 Linux inode 进行认证 3-1 4 卸载 Linux inode 4-1 5 常见问题 5-1 1-1 1 概述 Linux 版本的 inode 智能客户端 ( 以下简称

More information

《教育信息化前沿》

《教育信息化前沿》 教 育 信 息 化 前 沿 第 13 期 目 录 新 闻 快 递... 1 安 徽 省 亳 州 市 抓 好 五 落 实 为 教 育 信 息 化 提 供 正 能 量...1 梧 州 移 动 推 动 教 育 信 息 化 发 展 举 办 信 息 化 推 介 会... 1 安 徽 省 芜 湖 市 开 展 教 育 信 息 化 试 点 推 动 教 育 现 代 化... 1 山 西 省 晋 中 市 成 为 首 批

More information

大数据技术原理与应用

大数据技术原理与应用 大数据技术原理与应用 http://dblab.xmu.edu.cn/post/bigdata 温馨提示 : 编辑幻灯片母版, 可以修改每页 PPT 的厦大校徽和底部文字 第四章分布式数据库 HBase (PPT 版本号 :2016 年 3 月 6 日版本 ) 林子雨厦门大学计算机科学系 E-mail: ziyulin@xmu.edu.cn 主页 :http://www.cs.xmu.edu.cn/linziyu

More information

PowerPoint 演示文稿

PowerPoint 演示文稿 Apache Spark 与 多 数 据 源 的 结 合 田 毅 @ 目 录 为 什 么 会 用 到 多 个 数 据 源 Spark 的 多 数 据 源 方 案 有 哪 些 已 有 的 数 据 源 支 持 Spark 在 GrowingIO 的 实 践 分 享 为 什 么 会 用 到 多 个 数 据 源 从 数 据 本 身 来 看 大 数 据 的 特 性 之 一 :Variety 数 据 的 多 样

More information

puppet 简介 3 puppet 是什么 3 Hello world 4 puppet 安装 5 debian 系发行版安装 puppet 5 redhat 系发行版安装 puppet 5 源代码安装 puppet 6 配置 c/s 模式的 puppet 试验环境 6 puppet 语法 8 资

puppet 简介 3 puppet 是什么 3 Hello world 4 puppet 安装 5 debian 系发行版安装 puppet 5 redhat 系发行版安装 puppet 5 源代码安装 puppet 6 配置 c/s 模式的 puppet 试验环境 6 puppet 语法 8 资 puppet 入门 puppet 简介 3 puppet 是什么 3 Hello world 4 puppet 安装 5 debian 系发行版安装 puppet 5 redhat 系发行版安装 puppet 5 源代码安装 puppet 6 配置 c/s 模式的 puppet 试验环境 6 puppet 语法 8 资源 8 类和函数 10 节点 11 变量和数组 12 模块 13 几个常用的资源

More information

epub 61-2

epub 61-2 2 Web Dreamweaver UltraDev Dreamweaver 3 We b We b We Dreamweaver UltraDev We b Dreamweaver UltraDev We b We b 2.1 Web We b We b D r e a m w e a v e r J a v a S c r i p t We b We b 2.1.1 Web We b C C +

More information