PowerPoint Presentation

Similar documents
Big Data - Are You Ready

PowerPoint Presentation

水晶分析师

PowerPoint Presentation

PowerPoint Presentation

¬¬

Reducing Client Incidents through Big Data Predictive Analytics

How to Use the PowerPoint Template

Big Data - Are You Ready

Inception: 云时代的 MySQL 审核工具 Oracle Code 设计与实现 周彦伟极数云舟 CEO Oracle ACE Director for MySQL 8 May 2018 Copyright 2017, Oracle and/or its affiliates. All ri

白 皮 书 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 目 录 要 点 概 述...1 业 务 挑 战...2 Hadoop* 分 发 版 注 意 事 项...3 Hadoop* 基 础 架 构 注 意 事 项

目 录 1 不 断 开 发 工 具 以 管 理 大 数 据 Hadoop* 简 介 : 支 持 从 大 数 据 中 获 得 出 色 价 值 的 可 靠 框 架 大 数 据 技 术 的 行 业 生 态 系 统 在 关 键 组 件 中 实 现 平 衡...

Microsoft Word 電腦軟體設計.doc

业 务 与 运 营 Business & Operation (Transform) 加 载 (Load) 至 目 的 端 的 过 程, 该 部 分 在 数 据 挖 掘 和 分 析 过 程 中 为 最 基 础 的 一 部 分 一 个 良 好 的 ETL 系 统 应 该 有 以 下 几 个 功 能 1


<30312E20B9EFB7C5AF66BEC7A4A4A175A5CDAC7ABE69B3B1A176AABABDD7AA522E706466>

合集

電機工程系認可證照清單 /7/1

大数据带来大机遇

幻灯片 1

Microsoft Word - 《Hadoop大数据技术与应用》教学大纲.doc

11 天 山 区 区 环 卫 清 运 队 机 械 工 程 师 4011 C 1 不 限 不 限 机 电 具 有 两 以 工 作 经 12 天 山 区 乌 鲁 木 齐 市 第 15 小 会 计 4012 C 1 不 限 不 限 会 计 财 会 财 电 算 化 临 床 医 预 防 医 公 共 卫 生 与


近四年网络工程专业培养方案.doc

<BBB6D3ADB7C3CECABFC6D1A7CEC4BBAFC6C0C2DB>

Big Data - Are You Ready

Slide 1

<4D F736F F D F6F70B4F3CAFDBEDDBCB0BAA3C1BFCAFDBEDDCDDABEF2D3A6D3C3B9A4B3CCCAA6C5E0D1B5B0E056312E332E646F63>


ABOUT ME AGENDA 唐建法 / TJ MongoDB 高级方案架构师 MongoDB 中文社区联合发起人 Spark 介绍 Spark 和 MongoDB 案例演示

开 发 领 导 小 组 2016 年 3 月 16 日 发 布 实 8 水 利 部 办 公 厅 中 国 农 业 发 展 银 行 办 公 室 关 于 做 好 抵 押 补 充 贷 款 项 目 库 管 理 工 作 的 通 知 ( 水 利 部 中 国 农 业 发 展 银 行 2016 年 3 月 23 日

恩 典 1 * 课 堂 环 节 持 续 时 间 活 动 所 需 材 料 欢 迎 在 门 口 欢 迎 学 生 ; 倾 听 他 们 的 快 乐 或 烦 恼 预 备 活 动 <10 分 钟 A. 顺 境 或 逆 境 B. 平 衡 书 本 赞 美 和 祈 祷 <10 分 钟 课 堂 教 学 概

目 录

团 契 课 堂 教 学 概 览 课 堂 环 节 持 续 时 间 活 动 所 需 材 料 欢 迎 在 门 口 欢 迎 学 生, 聆 听 他 们 分 享 本 周 开 心 或 烦 恼 的 事 -- 无 预 备 活 动 <10 分 钟 A 味 觉 检 测 赞 美 和 祈 祷 <10 分 钟

服 侍 课 堂 教 学 概 览 课 堂 环 节 持 续 时 间 活 动 所 需 材 料 欢 迎 预 备 活 动 赞 美 祈 祷 圣 经 课 程 <10 分 钟 <10 分 钟 <20 分 钟 在 门 口 欢 迎 学 生, 听 他 们 分 享 开 心 或 不 如 意 的 事 A 时 间 表 B 偶 像

团 契 课 堂 教 学 概 览 课 堂 环 节 持 续 时 间 活 动 所 需 材 料 欢 迎 在 门 口 欢 迎 学 生, 听 他 们 分 享 开 心 或 不 如 意 的 事 A. 种 子 发 芽 无 使 用 上 星 期 的 物 品 1 预 备 活 动 <10 分 钟 B. 种 子 C. 生 长

恩 典 课 堂 教 学 概 览 1 * 欢 迎 课 堂 环 节 持 续 时 间 活 动 所 需 材 料 在 门 口 欢 迎 孩 子 们, 聆 听 他 们 开 心 或 烦 恼 的 事 情 预 备 活 动 <10 分 钟 A. 婴 孩 时 间 赞 美 和 祈 祷 <10 分 钟 B. 耶 稣

Microsoft Word - FINAL CHINESE VER- MOH OOB CODE OF PROFESSIONAL CONDUCT _AMENDED VERSION II_ edited

第 八 条 凡 在 考 评 过 程 中 提 供 虚 假 信 息 的, 一 经 查 实, 视 情 节 轻 重, 扣 除 该 实 验 室 5~10 分, 并 通 报 批 评 第 九 条 文 科 学 院 没 有 实 验 室 的, 其 学 院 年 度 工 作 目 标 管 理 考 核 中 实 验 室 工 作

Untitled


控 制 评 价 结 果 推 测 未 来 内 部 控 制 的 有 效 性 具 有 一 定 的 风 险 二 内 部 控 制 评 价 结 论 根 据 公 司 财 务 报 告 内 部 控 制 重 大 缺 陷 的 认 定 情 况, 于 内 部 控 制 评 价 报 告 基 准 日, 不 存 在 财 务 报 告

窑 缘 愿 窑 意 义 重 大 袁 与 之 相 关 的 表 观 遗 传 学 研 究 主 要 来 自 动 物 实 验 遥 有 学 者 发 现 母 鼠 对 幼 仔 的 舔 舐 和 理 毛 渊 造 蚤 糟 噪 蚤 灶 早 葬 灶 凿 早 则 燥 燥 皂 蚤 灶 早 袁 蕴 郧 冤 及 弓 背 看 护 行

评 估 内 容 与 内 涵 评 估 方 式 评 2.2 管 理 制 度 (10 ) 重 点 制 度 落 实 情 况 4 院 级 和 职 能 部 门 有 明 确 的 会 议 制 度 培 训 制 度 质 量 评 价 制 度 师 资 培 训 制 度 评 价 体 系 等, 并 有 实 施 办 法

评 标 准 扣.4 全 科 医 学 科.4. 建 立 全 科 医 学 科 作 为 培 训 基 地 的 综 合 医 院 独 立 设 置 全 科 医 学 科, 牵 头 承 担 全 科 住 培, 与 相 关 临 床 轮 转 科 室 密 切 协 同, 指 导 帮 助 基 层 实 践 基 地 加 强 带 教

Oracle大数据解决方案概述

Big Data - Are You Ready

培 训 机 构 介 绍 中 科 普 开 是 国 内 首 家 致 力 于 IT 新 技 术 领 域 的 领 航 者, 专 注 于 云 计 算 大 数 据 物 联 网 移 动 互 联 网 技 术 的 培 训, 也 是 国 内 第 一 家 开 展 Hadoop 云 计 算 的 培

Spark读取Hbase中的数据

新 法 评 述 1 关 于 移 动 游 戏 出 版 服 务 管 理 的 通 知 评 述 ( 作 者 : 陈 容 张 艳 冰 ) 2016 年 6 月 2 日, 国 家 新 闻 出 版 广 播 电 影 电 视 总 局 ( 以 下 简 称 广 电 总 局 ) 发 布 关 于 移 动 游 戏 出 版 服

3. 企 业 债 券 : 公 司 债 券 : 5. 证 券 公 司 债 券 : 6. 企 业 短 期 融 资 券 : 7. 中 期 票 据 : 8. 资 产 支 持 证 券 : 9. 国 际 开 发 机 构 人 民 币 债 券 : 10. 中 小 非 金 融 企 业 集 合 票 据 例 题? 判 断

DAGONG PRESS REVIEW world.people.com.cn

Microsoft Word - 電子報5.doc

優質居所 攜手共建

Presentation title goes here

¬¬

个人介绍 思考数据分析系统的基本指标 Hadoop 史前和史后的数据仓库流程 Hadoop 史前和史后的数据分析流程 思考 Hadoop 解决了什么样的根本问题 演讲大纲 Python 如何在构建数据仓库系统的作用 1. 使用 Python 快速构建数据分析模块 ComETL 2. 基于 Pytho

Microsoft PowerPoint - Big Data rc Sharing掃盲時間.ppt [相容模式]

大数据带来大机遇

天津天狮学院关于修订2014级本科培养方案的指导意见

帝国CMS下在PHP文件中调用数据库类执行SQL语句实例

PowerPoint 演示文稿

封面及首頁.doc

PowerPoint Presentation

<33352E20C0B3A5CEB2D5BEC7A7DEB34EB5FBBBF9A4A4C3C4B5C7AC72A9CAAABAACE3A873B669AE692E706466>

中信建投证券股份有限公司

背 景 概 述 企 业 需 要 一 种 灵 活 的 平 台 来 快 速 构 建 测 试 和 扩 展 新 的 应 用 程 序 服 务 并 对 市 场 中 发 生 的 数 字 化 变 革 作 出 反 应 数 字 化 变 革 正 在 加 快 步 伐, 因 为 流 程 和 信 息 的 日 益 融 合 带 来

學 科 100% ( 為 單 複 選 題, 每 題 2.5 分, 共 100 分 ) 1. 請 參 閱 附 圖 作 答 : (A) 選 項 A (B) 選 項 B (C) 選 項 C (D) 選 項 D Ans:D 2. 下 列 對 於 資 料 庫 正 規 化 (Normalization) 的 敘

Autodesk Product Design Suite Standard 系统统需求 典型用户户和工作流 Autodesk Product Design Suite Standard 版本为为负责创建非凡凡产品的设计师师和工程师提供供基本方案设计和和制图工具, 以获得令人惊叹叹的产品

封面.PDF

SDK 概要 使用 Maven 的用户可以从 Maven 库中搜索 "odps-sdk" 获取不同版本的 Java SDK: 包名 odps-sdk-core odps-sdk-commons odps-sdk-udf odps-sdk-mapred odps-sdk-graph 描述 ODPS 基

南京晓庄学院2011年本科教学质量报告

SparkR(R on Spark)编程指南

Conquering Big Data with the Oracle Information Architecture Model

PowerPoint 演示文稿

涓湡鍒嗙孩涓婂美女裸聊平台下载 競鍏徃鏁伴噺缂╂按 楂樿偂鎭搧

通过Hive将数据写入到ElasticSearch



Azure_s




2 控 制 面 板 控 制 面 板 控 制 面 板 显 示 打 印 机 的 工 作 状 态, 并 控 制 打 印 机 的 基 本 操 作 图 2 ZT230 控 制 面 板 图 3 ZT220 控 制 面 板

How to Use the PowerPoint Template

R D B M S O R D B M S R D B M S / O R D B M S R D B M S O R D B M S 4 O R D B M S R D B M 3. ORACLE Server O R A C L E U N I X Windows NT w w

chap-1_NEW.PDF

項 目 重 要 日 程 碩 士 班 ( 含 在 職 專 班 ) 日 期 博 士 班 網 路 報 名 ( 日 )12:00~ ( 三 ) ( 三 )12: ( 三 ) 報 名 繳 費 截 止 日 ( 四 )15:30 免 報 名

投影片 1

一 土 地 市 场 1 土 地 供 应 2016 年 第 19 周 (2016 年 5 月 2 日 2016 年 5 月 8 日 ), 北 京 供 应 土 地 0 宗 2016 年 第 19 周 北 京 房 地 产 市 场 土 地 供 应 一 览 表 地 块 面 积 宗 地 号 / 名 称 交 易

DAT337

苏州科技学院


untitled

廖 家 後 人 在 道 光 28 年 (1848) 重 建 張 廖 祖 廟 繼 述 堂 ( 今 名 崇 遠 堂 ), 據 廟 方 表 示, 明 初 時 廖 姓 有 先 人 名 廖 元 子, 原 本 姓 張 名 愿 仔, 入 贅 廖 家 後 兼 改 姓 名, 因 深 受 岳 父 母 之 恩, 所 以

untitled

Microsoft Word 二專招生簡章_全_.doc

精 神 與 自 然 : 楊 慈 湖 心 學 研 究 趙 燦 鵬 哲 學 博 士 嶺 南 大 學 二 零 零 五 年

使用Spark SQL读取Hive上的数据

2002 Shintoukai Chinese Academy. All rights reserved 2

Transcription:

利用 Oracle Big Data Connectors 将 Hadoop 与 Oracle 集成 罗海雄甲骨文公司资深技术顾问 1 Copyright 2011, Oracle and/or its affiliates. All rights

以下内容旨在概述产品的总体发展方向 该内容仅供参考, 不可纳入任何合同 该内容不构成提供任何材料 代码或功能的承诺, 并且不应该作为制定购买决策的依据 所描述的有关 Oracle 产品的任何特性或功能的开发 发布和时间安排均由 Oracle 自行决定 2 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle 大数据连接器 Oracle Hadoop 装载器 Oracle HDFS 直接连接器 Oracle Data Integrator Hadoop 应用适配器 Oracle R Hadoop 连接器 3 Copyright 2011, Oracle and/or its affiliates. All rights

软硬一体优化集成的 Oracle 大数据综合解决方案 Oracle Big Data Appliance Oracle Exadata Oracle Exalytics InfiniBand InfiniBand 捕获组织分析 决策 4 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle Hadoop 装载器 一个用于装载数据到 Oracle 数据库的最优化的 Map/Reduce 工具 在 Hadoop 上预先完成分区 排序, 数据转换成 Oracle 可读格式, 再进行装载 可选择在线或者离线装载的不同选项 5 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle Hadoop 装载器 : 示意图 输入 1 ORACLE Hadoop 装载器 SHUFFLE /SORT SHUFFLE /SORT 数据库 输入 2 SHUFFLE /SORT SHUFFLE /SORT SHUFFLE /SORT 6 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle Hadoop 装载器 : 在线装载 1. 从数据库中读取目标表的表定义 ORACLE Hadoop 装载器 3. 通过 JDBC/OCI 驱动, 从 reducer 节点连接到数据库, 进行并行装载 SHUFFLE /SORT 2. 读取数据, 并进行分区, 排序, 格式转换 SHUFFLE /SORT 7 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle Hadoop 装载器 : 离线装载 1. 读取目标表的表定义 4. 将生成的文件拷贝到数据库服务器 5. 通过外部表, 在数据库空闲时段进行并行的数据装载 SHUFFLE /SORT 2. 读取数据, 并进行分区, 排序, 格式转换 3. 在 reducer 节点生成 Oracle DataPump 格式文件 4.1 通过 Oracle HDFS 直接连接器访问 SHUFFLE /SORT 8 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle Hadoop 装载器 : 优势 相比起 SQOOP, OraOOP: 将数据库服务器的压力转移到 Hadoop 集群 : 把数据转换成数据库格式 将数据分配到特定分区 根据主键进行排序 生成二进制的 datapump 格式文件 根据 partition 对 reducer 进行负载均衡 9 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle Hadoop 装载器 : 输入数据格式 含分隔符的文本文件 Hive 格式的表 Hive 内部表或者外部表 Hive native 表或者非 native 表 自定义格式 10 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle Hadoop 装载器 : 总结 主要优势 - 多数操作在 Hadoop 集群中完成, 对数据库压力很小 - 提供在线 / 离线装载选项 Oracle Hadoop 装载器不仅仅用于 Oracle 大数据机 11 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle HDFS 直接连接器 以外部表形式直接访问 HDFS 上的数据文件 无需转移文件 12 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle HDFS 直接连接器 : 示意图 1. 创建外部表 SHUFFLE /SORT 2. 生成 location 文件, 指向 HDFS 文件 / 文件集 SQL QUERY HDFS ODCH External Table SHUFFLE /SORT 3. 访问外部表 13 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle HDFS 直接连接器 : 优势 直接访问 HDFS 上的文件 ( 不需要 FUSE 插件 ) 创建指向 HDFS 的外部表 在数据库中直接通过 SQL 访问 HDFS 数据 可以将数据通过 Insert/Select 或者 Create As Select 装载到数据库 快速的数据访问 : 并行 优化 自动负载均衡 数据文件可以是 : 含分隔符的文本文件 Oracle Hadoop 装载器产生的 Datapump 文件 14 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle HDFS 直接连接器 : 总结 主要优势 - 直接访问, 不需要额外步骤 - 支持并行, 负载均衡等特性 Oracle HDFS 直接连接器不止用于 Oracle 大数据机 15 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle Data Integrator 简介 Oracle Data Integrator 是一个数据提取 加载 转换工具 (E-LT) 通过可插入的知识模块方式支持多种数据源和目标 传统数据源 数据仓库 应用程序源 在线数据库 高效的图形化设计工具 支持不同数据源和目标 直接在原有机器上进行处理 计划系统 16 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle Data Integrator Hadoop 应用适配器 Oracle Data Integrator Hadoop 应用适配器主要功能 将本地或者 HDFS 文件加载到 Hive 中 知识模块 -- IKM File to Hive 在 Hive 中进行数据转化和校验知识模块 -- IKM Hive Control Append 知识模块 -- IKM Hive Transform 知识模块 -- RKM Hive 将处理过后的数据导入 Oracle 数据库中知识模块 -- IKM File/Hive to Oracle (OLH) 17 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle Data Integrator Hadoop 适配器 : 示意图 1. 创建数据模型, 包括数据源文件,Hive 表,Oracle 表等 2. 将本地文件或者 HDFS 文件加载到 Hive 中 3. 调用 Hive 脚本, 进行数据转化以及校验 4. 将处理过的数据装载到 Oracle 数据库中 SHUFFLE /SORT ORACLE BASE HDFS ODCH SHUFFLE /SORT 18 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle Data Integrator Hadoop 适配器 : 优势 提高开发 集成的效率 使用统一的 ODI 程序界面 使用与 SQL 类似的 HiveQL, 不需编写 Hadoop MapReduce 脚本 自动协调和调度 Hadoop 的任务 高性能的数据整合 大部分工作在 Hadoop 集群中进行, 充分利用集群机器资源 高性能的 Hive 知识模块 调用高性能的 Oracle Hadoop 装载器 19 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle Data Integrator Hadoop 适配器 : 总结 主要优势 - 集成里现有 ODI 产品里 - 充分利用 Hadoop 集群资源进行数据转换 - 无需编写复杂的 MapReduce 脚本 20 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle R Hadoop 连接器 (ORCH) 通过在 R 中安装 ORCH 包, 可以实现 在 R 中直接访问 Hadoop/HDFS 的文件 在 R 中直接利用 Hadoop 集群运行 R 格式的 MapReduce 脚本 21 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle R Hadoop 连接器 : 示意图 客户端 服务器 ( 如 : 大数据机 ) R 引擎 ORHC ORE 客户端包 测试时在本地运行 MapReduce 任务 Hadoop 软件 Java VM R 引擎 ORHC ORHC 驱动包 ORE 客户端包 Java VM 访问 HDFS 文件访问 Oracle 数据库数据库服务器 ( 如 :Exadata) 在 Hadoop 集群中运行 MapReduce 任务 ORHC MapReduce 节点 JobTracker Hadoop 集群 HDFS 节点目录节点 R 引擎 ORE 包 Oracle 数据库 任务节点 数据节点 ORE 库 任务节点 数据节点 22 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle R Hadoop 连接器 : 优势 R 可以直接访问 HDFS 上的文件 支持超大数据量 R 可以获得更好的文件存取性能 数据可以根据需要在以下地方随意存取和移动 Oracle 数据库 HDFS 文件 本地文件 在 R 中直接利用 Hadoop 集群运行 R 格式的 MapReduce 脚本 R 程序员以 R 的形式写 MapReduce 脚本不需要学习 Java 的 MapReduce 写法 R 程序员不需要了解 Hadoop 运行机制 充分利用 Hadoop 集群的资源进行并行运算 开发测试过程中可以直接使用本地 Hadoop 而不需要 Hadoop 集群 23 Copyright 2011, Oracle and/or its affiliates. All rights

Oracle R Hadoop 连接器 : 总结 主要优势 - 为 R 提供更高性能的文件系统 - 为 R 提供高度可扩展的计算能力 - 数据可以根据需要随意存取和移动 - R 程序员不需要深入学习额外的 Hadoop 技术 24 Copyright 2011, Oracle and/or its affiliates. All rights

25 Copyright 2011, Oracle and/or its affiliates. All rights

26 Copyright 2011, Oracle and/or its affiliates. All rights