SequoiaDB技术简介

Similar documents
水晶分析师

目錄

深入理解otter

PowerPoint 演示文稿

支付宝2011年 IT资产与费用预算

目 录 1 不 断 开 发 工 具 以 管 理 大 数 据 Hadoop* 简 介 : 支 持 从 大 数 据 中 获 得 出 色 价 值 的 可 靠 框 架 大 数 据 技 术 的 行 业 生 态 系 统 在 关 键 组 件 中 实 现 平 衡...

Reducing Client Incidents through Big Data Predictive Analytics

白 皮 书 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 目 录 要 点 概 述...1 业 务 挑 战...2 Hadoop* 分 发 版 注 意 事 项...3 Hadoop* 基 础 架 构 注 意 事 项

业 务 与 运 营 Business & Operation (Transform) 加 载 (Load) 至 目 的 端 的 过 程, 该 部 分 在 数 据 挖 掘 和 分 析 过 程 中 为 最 基 础 的 一 部 分 一 个 良 好 的 ETL 系 统 应 该 有 以 下 几 个 功 能 1

學 科 100% ( 為 單 複 選 題, 每 題 2.5 分, 共 100 分 ) 1. 請 參 閱 附 圖 作 答 : (A) 選 項 A (B) 選 項 B (C) 選 項 C (D) 選 項 D Ans:D 2. 下 列 對 於 資 料 庫 正 規 化 (Normalization) 的 敘

合集

培 训 机 构 介 绍 中 科 普 开 是 国 内 首 家 致 力 于 IT 新 技 术 领 域 的 领 航 者, 专 注 于 云 计 算 大 数 据 物 联 网 移 动 互 联 网 技 术 的 培 训, 也 是 国 内 第 一 家 开 展 Hadoop 云 计 算 的 培

Azure_s

臺銀人壽「98年九至十一職等人員甄試」

<4D F736F F D F6F70B4F3CAFDBEDDBCB0BAA3C1BFCAFDBEDDCDDABEF2D3A6D3C3B9A4B3CCCAA6C5E0D1B5B0E056312E332E646F63>


PowerPoint 演示文稿

PowerPoint Presentation

Microsoft Word doc

季刊9web.indd

信 息 化 研 究

Trafodion Transactional SQL-on-HBase Whitepaper

国 家 图 书 馆 年 鉴 0 重 点 文 化 工 程 一 中 华 古 籍 保 护 计 划 0 年, 国 家 图 书 馆 ( 国 家 古 籍 保 护 中 心 ) 根 据 文 化 部 要 求, 围 绕 习 近 平 总 书 记 关 于 弘 扬 中 华 优 秀 传 统 文 化 系 列 讲 话 精 神, 对

NTSE: Non-Transactional Storage Engine MySQL InnoDB 10 InnoDB +Memcached 5 50% / K C++

幻灯片 1

A API Application Programming Interface 见 应 用 程 序 编 程 接 口 ARP Address Resolution Protocol 地 址 解 析 协 议 为 IP 地 址 到 对 应 的 硬 件 地 址 之 间 提 供 动 态 映 射 阿 里 云 内

温州市政府分散采购

数据存储

2013_6_3.indd

安 联 财 产 保 险 ( 中 国 ) 有 限 公 司 旅 行 人 身 意 外 伤 害 保 险 条 款 (2016 版 ) 1. 合 同 构 成 本 保 险 合 同 由 保 险 条 款 投 保 单 保 险 单 保 险 凭 证 以 及 批 单 等 组 成 凡 涉 及 本 保 险 合 同 的 约 定,

附录八:验收监测表格式

<4D F736F F D20A8CFA952A6A12DAED1ADB1B8EAAEC62E646F63>

看 数 据, 在 人 群 中 找 到 自 己 2015 年 有 749 万 本 科 毕 业 生 估 算 全 国 985 高 校 毕 业 生 人 数 : 约 17 万 占 毕 业 生 人 数 的 2.26%; 估 算 全 国 一 本 高 校 毕 业 生 人 数 : 约 万, 占 毕 业

幻灯片 1

第 02 期 1 医 疗 信 息 现 状 20% EMR Electronic Medical Record HIS HIS [1-2] 张 肖 等 : 基 于 大 数 据 的 医 疗 健 康 创 新 应 用 2 大 数 据 环 境 下 医 疗 数 据 特 征 分 析 PC [3]

一 個 SQL Injection 實 例 的 啟 示 頁 2 / 6 因 此, 在 知 名 網 站 上 看 到 SQL Injection, 讓 人 驚 心, 卻 不 意 外 網 站 專 案 外 包 是 目 前 業 界 的 常 態, 而 在 價 格 取 勝 的 制 度 下, 低 價 得 標 的 S

思 想, 还 是 思 想 才 使 我 们 与 众 不 同 编 辑 部 : 工 业 和 信 息 化 部 赛 迪 研 究 院 通 讯 地 址 : 北 京 市 海 淀 区 万 寿 路 27 号 电 子 大 厦 4 层 邮 政 编 码 : 联 系 人 : 刘 颖 董 凯 联 系 电 话 :010


TopTest_Adminstrator.doc

untitled

目 录 摘 要... 3 MySQL 介 绍... 3 FlashRAID 介 绍... 3 测 试 环 境 介 绍... 4 整 体 测 试 环 境... 4 性 能 测 试 工 具... 4 FlashRAID 配 置... 5 测 试 前 提 条 件... 6 测 试 结 果... 7 MyS

Microsoft PowerPoint - Big Data rc Sharing掃盲時間.ppt [相容模式]

分布式数据库期中作业说明

SAP HANA 最 简 单 的 理 解 ERP CRM SRM BI 列 存 储 2

第6章  数据库技术基础

3.1 SQL Server 2005 Analysis Services Unified Dimension Model (UDM) 3 ( Ad-Hoc) SQL Server 2005 E - R T-SQL(Star Schema) (Data Mart) (ETL) ( Ora

<4D F736F F D20B5E7D7D3C9CCCEF1D7A8D2B5C5E0D1F8B7BDB0B8D0DEB6C1D6B8C4CFA3A BCB6A3A92E646F63>

Microsoft Word - 刘盛ACOUG Library2.docx

1012

数据分析技术介绍

主動學習快樂玩,韻文詩歌我在行

文 学 蓝 皮 书 迅 冯 俐 崔 涛 等 任 副 主 席, 徐 迅 任 秘 书 长 中 国 煤 矿 作 协 成 立 已 30 年, 1983 年 成 立 之 初 为 中 国 煤 矿 文 学 研 究 会, 1995 年 更 名 为 中 国 煤 矿 作 协 煤 炭 系 统 的 作 家 和 广 大 文

(Microsoft Word - 03\300\243\244p.doc)

关于规范区委、区委办公室发文

Microsoft Word - ??山

Microsoft Word - 助理人員教育訓練-會計室.docx


常 见 问 题 FAQ 数 据 迁 移 FAQ (1) 数 据 迁 移 预 检 查 时, 预 检 查 项 schema 不 存 在 失 败 是 什 么 原 因? 如 何 修 复? 目 前 DTS 已 经 支 持 自 动 在 目 标 RDS 实 例 创 建 数 据 库 如 果 在 预 检 查 时 报

<4D F736F F F696E74202D20B5DABEC5D5C220CAFDBEDDBFE2B0B2C8ABD0D42D6E6577>

第 1 期 马 志 强, 等 : SQL 鄄 DFS: 一 种 基 于 HDFS 的 海 量 小 文 件 存 储 系 统 135 式 文 件 系 统 ( Hadoop distributed file system,hdfs) 作 为 Hadoop 的 关 键 技 术 之 一, 其 原 型 来 自

06?????k?g

untitled

PowerPoint 演示文稿

Microsoft PowerPoint - Daniel_Detail_企业版特性 V1.1 for Community.pptx

About Me 田 亚 信 科 技 - 田 毅 Spark 社 区 Contributor 北 京 SparkMeetup 的 发 起 人 主 要 关 注 SparkSQL 与 Spark Streaming

ebook 132-2

OneProxy透明读写分离

Slide 1

01

背 景 概 述 企 业 需 要 一 种 灵 活 的 平 台 来 快 速 构 建 测 试 和 扩 展 新 的 应 用 程 序 服 务 并 对 市 场 中 发 生 的 数 字 化 变 革 作 出 反 应 数 字 化 变 革 正 在 加 快 步 伐, 因 为 流 程 和 信 息 的 日 益 融 合 带 来

<4D F736F F F696E74202D20332ECAFDBEDDBFE2D4C6D2BBCCE5BBFAD4DABDF0C8DA20B1A3CFD5D0D0D2B5B5C4CAB9D3C3B0B8C0FDBCB0D7EEBCD1CAB5BCF9B7D6CFED2E >

幻灯片 1

PowerPoint 演示文稿

02 责任编辑 张晋芬 2 16:06:31

Microsoft Word - 专论综述1.doc

封面PDF-单页

Untitiled

中艺华海修改1.7.indd

北 京 蓝 皮 书 公 共 服 务 相 比 而 言, 养 老 医 疗 失 业 等 保 险 都 早 已 经 由 国 务 院 颁 布 了 相 应 的 立 法 条 例, 在 全 国 范 围 内 形 成 了 统 一 的 制 度 党 的 十 八 届 四 中 全 会, 首 次 以 依 法 治 国 为 主 题,

2006年中央、国家机关公务员录用考试

74 BIG DATA RESEARCH 大 数 据 1 引 言 2 相 关 技 术 简 介 在 全 球 大 数 据 蓬 勃 发 展 的 大 背 景 下, 我 国 也 紧 抓 发 展 机 遇 2015 年 中 国 大 数 据 技 术 大 会 发 布 了 2016 年 大 数 据 技 术 发 展 趋

可视化管理系统在银行业数据中心的应用

展 的 关 键 2015 年 国 内 资 本 市 场 持 续 活 跃, 市 场 交 易 规 模 大 幅 增 长, 带 动 投 资 者 规 模 快 速 增 长 (2) 大 资 管 时 代 到 来, 资 产 管 理 业 务 将 井 喷 式 增 长 自 2012 年 起, 监 管 政 策 放 开, 证 券

閱 讀 素 材 V.S 分 組 方 式 的 差 異 化 教 學 工 具 表 班 級 :( ) 閱 讀 素 材 V.S 分 組 方 式 獨 立 閱 讀 夥 伴 閱 讀 ( 同 質 性 ) 夥 伴 閱 讀 ( 異 質 性 ) 友 善 陪 伴 虛 心 受 教 國 語 日 報 新 聞 生 活 文 藝 兒 童

Microsoft Word - 1HF12序.doc

Microsoft Word - 讀報看科普─人體篇_橫_.doc

鍟嗗搧瑙傚療鈥㈤挗鏉

席 远 杨 一 人 了, 正 当 她 开 枪 时 却 发 现 子 弹 没 了 该 死, 只 能 赤 手 空 拳 了 洛 水 云 与 席 远 杨 交 起 手 来, 洛 水 云 出 手 招 招 致 命 想 那 席 远 杨 也 不 是 泛 泛 之 辈, 很 快 掌 握 了 洛 水 云 出 招 路 数 看

Microsoft Word - 2B802內文.doc

東區校園中法治教育種子師資教學研習營

一步一步教你搞网站同步镜像!|动易Cms

ASP.NET 2.0網頁設計範例教本

操 守, 爱 岗 敬 业 诚 实 守 信 办 事 公 道 服 务 群 众 奉 献 社 会 ; 具 备 从 事 职 业 活 动 所 必 需 的 基 本 能 力 和 管 理 素 质 ; 脚 踏 实 地 严 谨 求 实 勇 于 创 新 3. 人 文 素 养 与 科 学 素 质 : 具 有 融 合 传 统

是 证 券 市 场 的 后 来 者, 但 在 前 景 广 阔 的 道 路 上 前 行, 终 将 成 为 这 个 市 场 的 领 先 者, 这 里 会 给 你 一 个 巨 大 的 舞 台, 这 里 有 你 需 要 的 机 会, 这 里 欢 迎 优 秀 的 你! 二 招 收 条 件 1. 遵 守 国 家

MySQL資料庫教學

nenpou35.pdf

11 天 山 区 区 环 卫 清 运 队 机 械 工 程 师 4011 C 1 不 限 不 限 机 电 具 有 两 以 工 作 经 12 天 山 区 乌 鲁 木 齐 市 第 15 小 会 计 4012 C 1 不 限 不 限 会 计 财 会 财 电 算 化 临 床 医 预 防 医 公 共 卫 生 与

教 学 目 标 描 述 主 要 数 据 库 对 象 创 建 表 描 述 列 定 义 时 可 用 的 数 据 类 型 改 变 表 的 定 义 删 除 改 名 和 截 断 表 描 述 每 个 DML 语 句 插 入 行 到 表 中 更 新 表 中 的 行 从 表 中 删 除 行 描 述 约 束 创 建

根 据 我 们 9 月 份 对 22 个 上 市 公 司 的 调 研 和 行 业 总 体 增 速 判 断, 2014 年 多 数 计 算 机 公 司 增 速 将 在 20% 左 右, 目 前 公 布 的 公 司 基 本 在 20% 以 上 投 资 建 议 计 算 机 目 前 整 体 估 值 水 平

Etu Helps You to Understand 2

Transcription:

SequoiaDB 技术简介 王涛

产品简介 SequoiaDB 自主研发的企业级分布式数据库 由前 IBM DB2 资深研发成员在北美完成原型设计和内核开发 被众多企业用户选择替代 MongoDB 和 HBase 性能高于国际同类产品 www.sequoiadb.com 2

Agenda 1 2 3 4 大数据概况 SequoiaDB 标准 SQL 支持 Hadoop 整合 5 银行应用场景

Big Data, Big World 大数据概况

大数据 : 信息驱动力 3v 海量数据规模 50% 组织拥有和处理 >10TB 数据 10% 已经处理 >1PB 电子商务和 Web 日志可产生每分钟上万的数据项 社交媒体应用每分钟产生百万交互活动 价值 : 提高效率提升客户体验降低风险创造新的商机 高时效性 30% 组织需要每天处理 >100GB 数据 批处理更新从每天提升到每小时, 每分钟, 甚至实时 复杂事件处理能够即时产生信息发送给分析系统 实时流数据处理 volume velocity 多样化 传统的结构化数据依然是最常见的数据 非结构化的情绪表达和客户行为快速增长 企业现存的非结构化数据蕴含大量开放文本 视频音频在业务操作中被使用 博客, 论坛以及评论反映了客户的声音 volume

Hadoop and SequoiaDB (NoSQL) Hadoop 分布式存储 Volume Variety Velocity Yes Yes SequoiaDB Yes Yes 传统关系型数据库 Yes Hadoop 针对海量与多样化数据 NoSQL 针对海量与高时效性数据 Hadoop 与 NoSQL 互为补充, 而非取代

大数据架构参考超越传统的数据仓库概念 传统数据仓库 传统 / 关系型 数据源 Database & Warehouse At-Rest Data Analytics Results 流计算 非传统 / 非关系型 数据源 In-Motion Analytics Ultra Low Latency Results 传统 / 关系型 大数据处理 数据源 Horizontal Scale 非传统 / 非关系型数据源 Data Analytics Data Operations Model Building Results

企业级 NoSQL Database SequoiaDB ( 巨杉数据库 )

SQL 真可以搞定所有事情? 半结构化数据根本无法维护 SQL 能帮我们做所有的事情

应用程序开发早期, 数据模型相对简单

随着越来越多需求的提出, 数据模型逐渐复杂

数据模型的频繁变更造成维护的不便

复杂的数据模型最终导致产品迭代周期延长

SequoiaDB vs MySQL SequoiaDB

SequoiaDB vs MySQL db.user.profile.find ( { user_id : 1021 } ) ; 使用文档结构能够大大简化数据模型的设计与维护

NoSQL 让我们能够 快速开发, 快速迭代 减少新功能发布的停机时间 确保产品能够随时水平扩张

SequoiaDB 为实时查询与分析而建立 应用层 协调层 编目分片 协调节点... 网络层 数据存储层 数据分片数据分片数据分片...

SequoiaDB 物理架构 协调节点 协调节点 协调节点 协调节点协调节点协调节点 数据节点 数据节点 数据节点 数据节点数据节点数据节点 数据节点数据节点数据节点数据节点数据节点数据节点 编目节点编目节点编目节点 cm cm cm cm cm cm 角色协调节点数据节点编目节点 CM 节点 功能胖客户层, 从编目读取数据分布信息, 从数据节点读取数据负责数据表存储, 提供查询 聚集 数据复制功能负责元数据信息存储, 包括组信息 表切割信息负责集群管理, 包括 watchdog, 节点增删启停

数据水平分区 - Database Partitioning 协调节点数据节点协调节点数据节点协调节点数据节点协调节点协调节点协调节点数据节点数据节点数据节点数据节点数据节点数据节点数据节点数据节点数据节点数据表可按照字段哈希或者范围切割到多组服务器上编目节点编目节点编目节点优势 : 容量和性能可线性扩展

数据垂直分区 - Collection Partitioning 数据表可按照字段范围切割到多个逻辑分区中 协调节点 数节据点 数节据点 数节据点 数据分区 数据分区 数据分区 数据分区 优势 : 容量和性能可线性扩展

HA 高可用性 读 写操作 主数据节点 应用程序 只读 从数据节点 异步日志复制 只读 从数据节点 优势 : 高可用性 + 读写分离

HA 高可用性 主数据节点 应用程序 只读 从数据节点 异步日志复制 只读 从数据节点 场景 : 主节点掉电, 从节点立刻感知

HA 高可用性 主数据节点 应用程序 主数据节点 从数据节点 自动选主 场景 : 从节点自动选举出新的主节点

HA 高可用性 节点恢复 应用程序 读 写操作 主数据节点 节点恢复同步 异步日志复制 只读 从数据节点 场景 : 问题节点恢复后自动并入集群, 成为从节点

异构数据复制机制 Primary Repl-log 虚拟复制请求 异步业务请求 w=1 同步业务请求 w=3 差异化的数据可靠性级别 灵活可配置的数据分片 支持同步与异步复制机制 Secondary Repl-log Push 更新通知 Pull 批量 Repl-log Secondary Repl-log Repl-Group LOST-Window COLD-Window HOT-Window Repl-log 相对窗口 优势 : 异构数据复制机制灵活平衡业务性能 可用性和数据可靠性

读写分离 主 主 主 主 实例 1 数据录入类 从 从 从 从 实例 2 Ad-hoc 类 从 从 从 从 实例 3 批量分析类 分区 1 分区 2 分区 3 分区 4 优势 : 细粒度划分, 指定应用程序所使用的实例

在线扩容 存储空间可扩展 在线迁移数据 业务不中断 负载均衡 扩容步骤 : 将新增节点添加到集群中 划分数据分区 系统自动迁移数据

在线扩容优势 传统数据库 (ORACLE 和 DB2) 性能及吞吐量非线性增长 业务中断时间长 SequoiaDB 增加节点可线性提升数据访问性能 无需中断业务在线扩容 性能和吞吐量 1 2 3 4 5 6 7 8 9 10 11 节点数 ( 个 ) SequoiaDB 传统 (ORACLE 和 DB2)

事务支持 跨集合跨节点事务操作 记录锁 提交 回滚 二段提交

记录锁 行级锁 写操作加互斥锁 读操作默认不加锁 读操作允许加互斥锁 db.transbegin(); db.cs.cl.find({a:1}).lock(); db.cs.cl.update({$inc:{a:1}},{a:1}); db.transcommit() ;

SequoiaDB 与 MongoDB 的差异 SequoiaDB MongoDB 事务 有 无 SQL 支持 有 无 性能 高 中 数据压缩 有 无 存储过程 有 弱 JDBC 驱动 有 无 数据可靠性 高 低 记录锁 有 无

SequoiaDB 与 HBase 的差异 SequoiaDB HBase 多索引 有 无 非主键排序 有 无 聚集 有 无 存储过程 有 无 事务 有 无 锁 有 无 SQL/JDBC 有 无 高可用性 强 弱 图形管理界面 有 无 数据更新删除 有 无

MongoDB 的灵活性 +Cassandra 的性能 场景 1: 电信 40 亿条记录 30 TB 8 台物理机 48GB 内存 6 SATA 磁盘 场景 2:YCSB 测试 1 亿条记录 插入 / 更新 / 查询 单用户 / 多用户 最高吞吐量

Scenario 1 compare with HBase hbase sequoiadb note Data load 21hrs,10mins,46sec 20hrs,28mins,29sec 4billions row, 30TB Query on PK 105 21 ms Update on PK 16 13 ms Delete on PK 6 19 ms insert 310 539 row/s Batch insert 311 3257 row/s Query on table scan 15266 4183 sec Update on table scan 3hrs,48mins,26sec 1hrs,9mins,34s Delete on table scan 3hrs,48mins,26sec 1hrs,9mins,43s Query on 2 nd index (hbase has 3hrs,48mins,26sec 21 ms to do table scan) Delete on 2 nd index 3hrs,48mins,26sec 19 ms Update on 2 nd index 3hrs,48mins,26sec 16 ms File size 36.42 23.72 TB

Scenario 1 compare with HBase 120 100 Query on PK,ms 3500 3000 Batch insert, row/s 600 500 insert,row/s 80 2500 400 60 40 20 0 1 2000 hbase sequoiadb 1500 1000 500 0 1 hbase sequoiadb 300 200 100 0 1 hbase sequoiadb 18000 16000 14000 Table scan, sec 18 16 14 Update on PK, ms 25 20 Query on 2 nd index,ms 12000 10000 8000 6000 hbase sequoiadb 12 10 8 6 15 hbase sequoiadb 10 hbase sequoiadb 4000 2000 4 2 5 0 1 0 1 0 1

Scenario 1 compare with MongoDB mongodb sequoiadb note Load data 3h 58m 43s 2h 57m 50s 4 billion rows, 30TB Query on index 23 20 ms Update on index 30 22 ms Delete on index 28 16 ms insert 2994 6419 row/s Batch insert 5257 14996 row/s Query on table scan 3745 3536 sec Update on table scan 3641 3536 sec Delete on table scan 3641 3536 sec insert(multiple thread) 1709 4073 row/s/thread Batch insert(multiple thread) 2315 5027 row/s/thread

Scenario 1 compare with MongoDB 16000 6000 4500 14000 12000 10000 8000 mongodb 6000 sequoiadb 4000 2000 0 Single thread batch insert,rows/second 4000 5000 3500 4000 3000 2500 mongodb 3000 mongodb 2000 sequoiadb sequoiadb 2000 1500 1000 1000 500 0 Multiple threads batch insert,rows/second/thread Multiple 0 thread insert,rows/second/thread 23.5 3800 35 23 22.5 22 21.5 21 20.5 20 19.5 19 mongodb sequoiadb 3750 3700 3650 3600 3550 3500 3450 mongodb sequoiadb 30 25 20 15 10 5 mongodb sequoiadb 18.5 Query with index,ms 3400 Full table scan,second 0 Update with index,ms

35 Scenario 2 single thread 3000.00 2500.00 2000.00 1500.00 1000.00 500.00 0.00 mongodb query sequoiadb query cassandra query mongodb insert sequoiadb insert cassandra insert mongodb update sequoiadb update cassandra update 0 20 40 60 80 100 120 30000.00 25000.00 20000.00 15000.00 10000.00 sequoiadb bulkinsert hbase put 5000.00 0.00 0 10 20 30 40 50 60 70 YCSB Test,8 Boxes,100 millions records,single thread insert/update/query

36 Scenario 2 multi-thread YCSB Test,4 Boxes,100 millions records,multiple threads insert/update/query

Scenario 3 best throughput for batch-insert 140000 135000 130000 125000 120000 115000 110000 105000 100000 95000 90000 85000 80000 75000 70000 65000 60000 55000 50000 45000 40000 35000 30000 25000 20000 15000 10000 5000 0 Total Throughput(ops/sec) 0 20 40 60 80 100 120 140 160 sequoiadb hbase mongodb YCSB Test,3 Boxes,100 millions records,best throughput for Batch-Insert

SequoiaDB v.s. Couchbase couchbase 在使用到 Bucket 配置的限额内存时性能急剧下降 YCSB Test,3 Boxes,100 millions records

SQL interface for Hadoop and NoSQL database 标准 SQL 支持

27 PostgreSQL FDW 简介 Foreign Data Wrapper 支持标准 SQL92 语法 支持以下数据类型 整数浮点数 字符串 时间 日期 布尔型 数组

系统架构 应用层 其他数据源 调度层 编目分片 SQL Engine 协调节点... Oracle HDFS HBase DB2 网络层 数据存储层 数据分片数据分片数据分片... MySQL MongoDB etc

查询谓词下压, 利用数据库索引提升性能 查询 SELECT * FROM T, K WHERE T.Price > 1000 AND T.id = K.id 关联 数据存储层 HDFS Database HDFS 批量扫描 索引扫描 T.Price > 1000 优势 : 1. 减少网络数据传输 2. 利用数据库索引提升性能

Enhance your data center SEQUOIADB & HADOOP 紧密整合

SequoiaDB 集成 Hadoop 解决方案

SequoiaDB 与 Hadoop 丰富的对接形式 Hive sdb connector Sqoop sdb connector HDFS SequoiaDB HDFS SequoiaDB 与 Hive 对接, 实现大数据导入 / 分析 与 Hadoop/sqoop 对接, 实现传统数据库 / 非结构化数据与 SequoiaDB 转换

Hadoop 连接器 客户端 Hadoop MapReduce Job Tracker Task Tracker Task Tracker Task Tracker 连接器 数据库 Data Node

基于块级并发能力 业务应用 /Hadoop 导入数据量 导入性能 Hbase 30 亿条记录 15W/Sec 获取分片信息数据组 1: 分片号 10,12 数据组 2: 分片号 1,2 并发读取各个数据块内容 SequoiaDB 30 亿条记录 导入性能 19.3W/Sec 编目节点编目节点 数据块 数据块 数据块 数据块 数据组数据组数据组 协调节点数据块数据块数据块 数据块数据组数据组数据组 数据块 数据块 数据块 数据块 数据组数据组数据组 4 3.5 3 2.5 2 1.5 1 0.5 0 IBM Average Query Time(s) SequoiaDB Average Query Time(s) 20 50 100 150 200 多线程并发平均响应时间 1 大数据查询和导入性能相对 HBASE 有较大幅度提升 ; 2 与 Hadoop Map/Reduce 对接能发挥更大的并发优势 ; 在某电信运营商场景测试

Hadoop + SequoiaDB = 分析 + 实时混合业务大数据平台 JDBC/API 接口 Pig Hive MapReduce 分布式计算框架 SQL Engine HDFS 分布式存储引擎 SequoiaDB 关系型数据库

谢谢