雲端 Cloud Computing 技術指南 運算 應用 平台與架構 10/04/15 11:55:46 INFO 10/04/15 11:55:53 INFO 10/04/15 11:55:56 INFO 10/04/15 11:56:05 INFO 10/04/15 11:56:07 INFO

Similar documents
使用MapReduce读取XML文件

Java ¿ª·¢ 2.0: Óà Hadoop MapReduce ½øÐдóÊý¾Ý·ÖÎö

1: public class MyOutputStream implements AutoCloseable { 3: public void close() throws IOException { 4: throw new IOException(); 5: } 6:

1.JasperReport ireport JasperReport ireport JDK JDK JDK JDK ant ant...6

詞 彙 表 編 號 詞 彙 描 述 1 預 約 人 資 料 中 文 姓 名 英 文 姓 名 身 份 證 字 號 預 約 人 電 話 性 別 2 付 款 資 料 信 用 卡 別 信 用 卡 號 信 用 卡 有 效 日 期 3 住 房 條 件 入 住 日 期 退 房 日 期 人 數 房 間 數 量 入

三种方法实现Hadoop(MapReduce)全局排序(1)

Microsoft Word - 01.DOC

目 录 1 不 断 开 发 工 具 以 管 理 大 数 据 Hadoop* 简 介 : 支 持 从 大 数 据 中 获 得 出 色 价 值 的 可 靠 框 架 大 数 据 技 术 的 行 业 生 态 系 统 在 关 键 组 件 中 实 现 平 衡...

关于天云趋势 天云趋势由宽带资本和趋势科技共同投资成立于 2010 年 3 月 趋势科技是 Hadoop 的重度使用者 : 2006 年开始使用, 用于处理网页和邮件服务器评级 五个数据中心, 近 1000 个节点, 最大集群约 500 台服务器 日均处理 3.6T 日志数据 亚洲最早, 也是最大的

(TestFailure) JUnit Framework AssertionFailedError JUnit Composite TestSuite Test TestSuite run() run() JUnit

JavaIO.PDF

EJB-Programming-4-cn.doc


Java Access 5-1 Server Client Client Server Server Client 5-2 DataInputStream Class java.io.datainptstream (extends) FilterInputStream InputStream Obj

<4D F736F F F696E74202D20332D322E432B2BC3E6CFF2B6D4CFF3B3CCD0F2C9E8BCC6A1AAD6D8D4D8A1A2BCCCB3D0A1A2B6E0CCACBACDBEDBBACF2E707074>

MapReduce

Hadoop 集 群 ( 第 6 期 ) WordCount 运 行 详 解 1 MapReduce 理 论 简 介 1.1 MapReduce 编 程 模 型 MapReduce 采 用 分 而 治 之 的 思 想, 把 对 大 规 模 数 据 集 的 操 作, 分 发 给 一 个 主 节 点 管

Chapter 9: Objects and Classes

Java java.lang.math Java Java.util.Random : ArithmeticException int zero = 0; try { int i= 72 / zero ; }catch (ArithmeticException e ) { // } 0,

编写简单的Mapreduce程序并部署在Hadoop2.2.0上运行

白 皮 书 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 目 录 要 点 概 述...1 业 务 挑 战...2 Hadoop* 分 发 版 注 意 事 项...3 Hadoop* 基 础 架 构 注 意 事 项

ebook39-6

3.1 num = 3 ch = 'C' 2

untitled

《大话设计模式》第一章

EJB-Programming-3.PDF

Chapter 9: Objects and Classes


201316

SDK 概要 使用 Maven 的用户可以从 Maven 库中搜索 "odps-sdk" 获取不同版本的 Java SDK: 包名 odps-sdk-core odps-sdk-commons odps-sdk-udf odps-sdk-mapred odps-sdk-graph 描述 ODPS 基

untitled

KillTest 质量更高 服务更好 学习资料 半年免费更新服务

使 用 Java 语 言 模 拟 保 险 箱 容 量 门 板 厚 度 箱 体 厚 度 属 性 锁 具 类 型 开 保 险 箱 关 保 险 箱 动 作 存 取 款

2 Java 语 言 程 序 设 计 教 程 简 单 性 Java 语 言 的 语 法 与 C 语 言 和 C++ 语 言 很 接 近, 使 得 大 多 数 程 序 员 很 容 易 学 习 和 使 用 Java 另 一 方 面,Java 丢 弃 了 C++ 中 很 少 使 用 的 很 难

KillTest 质量更高 服务更好 学习资料 半年免费更新服务

三种方法实现Hadoop(MapReduce)全局排序(2)

1. 访 问 最 新 发 行 公 告 信 息 jconnect for JDBC 访 问 最 新 发 行 公 告 信 息 最 新 版 本 的 发 行 公 告 可 以 从 网 上 获 得 若 要 查 找 在 本 产 品 发 布 后 增 加 的 重 要 产 品 或 文 档 信 息, 请 访

, 即 使 是 在 昏 暗 的 灯 光 下, 她 仍 然 可 以 那 么 耀 眼 我 没 有 地 方 去, 你 会 带 着 我 么 杜 晗 像 是 在 嘲 笑 一 般, 嘴 角 的 一 抹 冷 笑 有 着 不 适 合 这 个 年 龄 的 冷 酷 和 无 情, 看 着 江 华 的 眼 神 毫 无 温

Swing-02.pdf

资源管理软件TORQUE与作业调度软件Maui的安装、设置及使用

(Microsoft Word - \272\364\263q\245|\244A_ _\304\254\253\330\336\263__\272\353\302\262\263\370\247i.doc)

javaexample-02.pdf

ABOUT ME AGENDA 唐建法 / TJ MongoDB 高级方案架构师 MongoDB 中文社区联合发起人 Spark 介绍 Spark 和 MongoDB 案例演示

2009年3月全国计算机等级考试二级Java语言程序设计笔试试题

Microsoft Word - linux命令及建议.doc

用手機直接傳值不透過網頁連接, 來當作搖控器控制家電 ( 電視遙控器 ) 按下按鍵發送同時會回傳值來確定是否有送出 問題 :1. 應該是使用了太多 thread 導致在傳值上有問題 2. 一次按很多次按鈕沒辦法即時反應

9, : Java 19., [4 ]. 3 Apla2Java Apla PAR,Apla2Java Apla Java.,Apla,,, 1. 1 Apla Apla A[J ] Get elem (set A) A J A B Intersection(set A,set B) A B A B

第一章

威 福 髮 藝 店 桃 園 市 蘆 竹 區 中 山 里 福 祿 一 街 48 號 地 下 一 樓 50,000 獨 資 李 依 純 105/04/06 府 經 登 字 第 號 宏 品 餐 飲 桃 園 市 桃 園 區 信 光 里 民

(6) 要 求 付 款 管 理 员 从 预 订 表 中 查 询 距 预 订 的 会 议 时 间 两 周 内 的 预 定, 根 据 客 户 记 录 给 满 足 条 件 的 客 户 发 送 支 付 余 款 要 求 (7) 支 付 余 款 管 理 员 收 到 客 户 余 款 支 付 的 通 知 后, 检

Microsoft Word - 2AF63內文.doc

4.1 AMI MQSeries API AMI MQI AMI / / AMI JavaC C++ AMI / AMI AMI - / /

Java

untitled

投影片 1

Reducing Client Incidents through Big Data Predictive Analytics


<4D F736F F D B0EABB79A4E5B8D5C344BBBCB065AAA9>


康體藝術

公共圖書館利用教育方案規劃之研究

目 錄

计 算 机 系 统 应 用 年 第 25 卷 第 4 期 线 程 的 复 用 [2,3]. 通 常 情 况 下, 服 务 器 端 程 序 在 启 动 时 创 建 若 干 数 量 的 线 程 对 象 并 缓 存 起 来, 此 时 它 们 处 于

java2d-4.PDF

建立Android新專案

電機工程系認可證照清單 /7/1

考 試 日 期 :2016/04/24 教 室 名 稱 :602 電 腦 教 室 考 試 時 間 :09: 二 技 企 管 一 胡 宗 兒 中 文 輸 入 四 技 企 四 甲 林 姿 瑄 中 文 輸 入 二 技 企 管 一

内 容 简 介 本 书 是 一 本 关 于 语 言 程 序 设 计 的 教 材, 涵 盖 了 语 言 的 基 本 语 法 和 编 程 技 术, 其 中 包 含 了 作 者 对 语 言 多 年 开 发 经 验 的 总 结, 目 的 是 让 初 学 的 读 者 感 受 到 语 言 的 魅 力, 并 掌

新版 明解C++入門編

chp6.ppt

台 中 市 北 屯 區 東 山 里 橫 坑 9 林 志 明 巷 89-5 菜 豆 菜 大 漿 果 菜 豆 菜 大 漿 果 小 漿 果 核 果 柑 桔 無 陳 錦 生 新 竹 市 香 山 區

菩提道次第廣論

路 上 沒 說 話, 車 子 被 爸 離 去 後 開 走 了, 沒 什 麼 變, 除 了 一 股 淡 淡 的 香 味, 我 不 太 習 慣, 像 空 氣 中 的 粉 塵, 左 飄 右 飄, 光 中 飛 舞 我 沒 提, 看 車 窗 外, 外 面 不 太 有 趣, 我 只 是 沒 事 幹, 我 們 本

繁 華 國 小 101 學 年 母 親 節 感 恩 惜 福 - 跳 蚤 市 場 暨 科 學 闖 關 遊 戲 親 子 活 動 實 施 計 畫 一 依 據 : 本 校 101 學 年 度 校 務 計 畫 及 行 事 曆 二 目 的 : 1. 培 養 學 生 感 恩 惜 物 知 福 惜 福 的 節 儉 觀


育儿小故事(四)

1.5招募说明书(草案)

目录 1 本期内容 MapReduce 理论简介 MapReduce 编程模型 MapReduce 处理过程 运行 WordCount 程序 准备工作 运行例子

培 训 机 构 介 绍 中 科 普 开 是 国 内 首 家 致 力 于 IT 新 技 术 领 域 的 领 航 者, 专 注 于 云 计 算 大 数 据 物 联 网 移 动 互 联 网 技 术 的 培 训, 也 是 国 内 第 一 家 开 展 Hadoop 云 计 算 的 培

FileMaker 16 ODBC 和 JDBC 指南

Cover-3.indd, page Normalize

FP.pdf


人 間 菩 提 Part 1 人 間 菩 提 Part 2 清 涼 菩 提 正 覺 修 行 清 心 發 願 自 重 ----

, 7, Windows,,,, : ,,,, ;,, ( CIP) /,,. : ;, ( 21 ) ISBN : -. TP CIP ( 2005) 1

7521,WARD,SALESMAN,7698,22-2 月 -81,1250,500, ,JONES,MANAGER,7839,02-4 月 -81,2975,, ,MARTIN,SALESMAN,7698,28-9 月 -81,1250,1400, ,BLAK

2005 1

Microsoft Word - Learn Objective-C.doc

<4D F736F F D20D1A7C9FACAD6B2E1B8C4D7EED6D5A3A8B4F8B1EDB8F1BCD3D2B3C2EBB0E6A3A9372E3239>

桂林市劳动和社会保障局关于

第三章 維修及管理

Microsoft Word 年度选拔硕博连读研究生的通知.doc

Learning Java

FY.DOC

D getinitparameternames() 9 下 列 选 项 中, 属 于 Servlet API 中 提 供 的 request 对 象 的 包 装 类 的 是 ( ) A HttpServletRequestWrapper B HttpServletRequest C HttpServ

Microsoft PowerPoint - course2.ppt

攝 心 為 戒, 因 戒 而 生 定, 由 定 而 生 慧

Java 1 Java String Date

北 风 网 讲 师 原 创 作 品 ---- 仅 供 学 员 内 部 交 流 使 用 前 言 吾 尝 终 日 而 思 矣, 不 如 须 臾 之 所 学 也 ; 吾 尝 跂 而 望 矣, 不 如 登 高 之 博 见 也 登 高 而 招, 臂 非 加 长 也, 而 见

利用Java技术编写桌面软件基础

Transcription:

CHAPTER 使用 Hadoop 打造自己的雲 8 8.3 測試 Hadoop 雲端系統 4 Nodes Hadoop Map Reduce Hadoop WordCount 4 Nodes Hadoop Map/Reduce $HADOOP_HOME /home/ hadoop/hadoop-0.20.2 wordcount echo $ mkdir wordcount $ cd wordcount $ echo "Hello World Bye World" >> inputfile1 $ echo "Hello Hadoop Goodbye Hadoop" >> inputfile2 $HADOOP_HOME/bin/hadoop HDFS Map/Reduce $ bin/hadoop dfs -put./wordcount input hadoop-0.20.2-example.jar wordcount wordcount Hadoop NameNode JobTracker hdp0 Map/Reduce DataNodes TaskTracker Hadoop $ bin/hadoop jar hadoop-0.20.2-examples.jar wordcount input output 10/04/15 11:55:44 INFO input.fileinputformat: Total input paths to process : 2 10/04/15 11:55:45 INFO Running job: job_201004150649_0001 8-37

雲端 Cloud Computing 技術指南 運算 應用 平台與架構 10/04/15 11:55:46 INFO 10/04/15 11:55:53 INFO 10/04/15 11:55:56 INFO 10/04/15 11:56:05 INFO 10/04/15 11:56:07 INFO job_201004150649_0001 10/04/15 11:56:07 INFO map map map map Job 0% reduce 0% 50% reduce 0% 100% reduce 0% 100% reduce 100% complete: Counters: 18 執 行 指 令 之 後 你 可 以 清 楚 看 到 Hadoop 雲 端 系 統 正 在 進 行 Map 與 Reduce 的工作進度百分比 另一方面 你也可以透過網頁瀏覽器瀏覽 http:// hdp0:50030 查看目前雲端系統正在進行 Map 與 Reduce 的 Jobs 工作有哪些以 及目前進度 如圖 8-24 所示 圖 8-24 檢視 Hadoop 雲端系統的 Map 與 Reduce 工作 8-38 XP10077.indb 38 2010/6/10 下午 03:10:24

CHAPTER 使用 Hadoop 打造自己的雲 8 Map/Reduce HDFS output Hadoop $ bin/hadoop dfs -get output output $ cd output/ $ cat part-r-0000 Bye 1 GoodBye 1 Hadoop 2 Hello 2 World 2 Hadoop Hadoop MapReduce pi Hadoop $ bin/hadoop jar hadoop-0.20.2-examples.jar pi 4 200000 ( ) Map Reduce Hadoop Hadoop 8-39

雲端運算 Cloud Computing 技術指南 應用 平台與架構 8.4 讓 Hadoop 執行複雜的 MapReduce 運算 Hadoop MapReduce Hadoop Hadoop Mapper Reduer Map Reduce <k1, v1> ( ) map <k2, v2> ( ) reduce <k3, v3> ( ) Mapper input <k1, v1> Key/Value intermediate <k2, v2> Hadoop Key/Value Job Hadoop Node Map 10-100 10TB Hadoop Task blocksize 128MB 82000 Map Reduce intermediate <k2, v2> <k3, v3> Reduce Shuffle Sort Reduce Shuffle HTTP Map Map <k2, v2> Reduce Sort Map <k2, v2> k2 Hadoop Shuffle Sort Reduce <k3, v3> Hadoop Reduce 0.95 1.75 Number of Reduces = Total Nodes * 0.95-1.75 Hadoop Reduce 8-40

CHAPTER 使用 Hadoop 打造自己的雲 8 Hadoop Map Reduce Linux Java Virtual Machine JVM Hadoop hadoop job Map/Reduce $ bin/hadoop job -history output ( Map/Reduce ) Task Summary =================================================================== Kind Total Successful Failed Killed StartTime FinishTime Setup 1 1 0 0 16-Apr-2010 12:03:54 16-Apr-2010 12:03:54 (0sec) Map 2 2 0 0 16-Apr-2010 12:03:55 16-Apr-2010 12:04:00 (5sec) Reduce 1 1 0 0 16-Apr-2010 12:04:02 16-Apr-2010 12:04:12 (9sec) Cleanup 1 1 0 0 16-Apr-2010 12:04:14 16-Apr-2010 12:04:15 (0sec) =================================================================== hadoop job Map Reduce Map/Reduce all Map/Reduce $ bin/hadoop job -history all output ( Map/Reduce ) Map/Reduce Job Control -put MapReduce Hadoop -rmr Hadoop Hadoop $ bin/hadoop dfs -put myjob input ( Hadoop) $ bin/hadoop dfs -rmr input ( Hadoop ) $ bin/hadoop dfs -rmr output ( Hadoop ) MapReduce Hadoop Map/Reduce Hadoop WordCount MapReduce 8-41

雲端運算 Cloud Computing 技術指南 應用 平台與架構 Hadoop HDFS wordcount2 Hadoop $ bin/hadoop dfs -mkdir wordcount2 ( HDFS wordcount2) $ cd wordcount2 $ echo "Hello World, Bye World?" >> input1 $ echo "Hello Hadoop, Goodbye to hadoop." >> input2 Hadoop WordCount Map/Reduce wordcount MapReduce $ bin/hadoop dfs -put./wordcount2 input2 $ bin/hadoop jar hadoop-0.20.2-examples.jar wordcount input2 output2 WordCount MapReduce output2 Key/Value $ bin/hadoop dfs -get output2 output2 $ cd output2/ $ cat part-r-0000 Bye 1 Goodbye 1 Hadoop, 1 Hello 2 World, 1 World? 1 hadoop. 1 to 1 MapReduce Hadoop MapReduce 8-42

CHAPTER 使用 Hadoop 打造自己的雲 8 MapReduce MapReduce 8.5 開發 MapReduce 雲端運算程式 Hadoop MapReduce Hadoop WordCount MapReduce /home/hadoop/hadoop-0.20.2 WordCount.java $ cd /home/hadoop/hadoop-0.20.2/ $ gedit WordCount.java // WordCount.java package org.myorg; import java.io.*; import java.util.*; import org.apache.hadoop.fs.path; import org.apache.hadoop.filecache.distributedcache; import org.apache.hadoop.conf.*; import org.apache.hadoop.io.*; import org.apache.hadoop.mapred.*; import org.apache.hadoop.util.*; public class WordCount extends Configured implements Tool { public static class Map extends MapReduceBase implements Mapper<LongWritable, Text, Text, IntWritable> { 8-43

雲端運算 Cloud Computing 技術指南 應用 平台與架構 static enum Counters { INPUT_WORDS private final static IntWritable one = new IntWritable(1); private Text word = new Text(); private boolean casesensitive = true; private Set<String> patternstoskip = new HashSet<String>(); private long numrecords = 0; private String inputfile; public void configure(jobconf job) { casesensitive = job.getboolean("wordcount.case.sensitive", true); inputfile = job.get("map.input.file"); if (job.getboolean("wordcount.skip.patterns", false)) { Path patternsfiles = new Path 0 ; try { patternsfiles = DistributedCache.getLocalCacheFiles(job); catch (IOException ioe) { System.err.println("Caught exception while getting cached files: " + StringUtils.stringifyException(ioe)); for (Path patternsfile : patternsfiles) { parseskipfile(patternsfile); private void parseskipfile(path patternsfile) { try { BufferedReader fis = new BufferedReader(new FileReader(patternsFile.toString())); String pattern = null; while ((pattern = fis.readline())!= null) { patternstoskip.add(pattern); catch (IOException ioe) { 8-44