NewSQL 数据库技术与企业级应用 巨杉数据库王涛

Similar documents
水晶分析师

ABOUT ME AGENDA 唐建法 / TJ MongoDB 高级方案架构师 MongoDB 中文社区联合发起人 Spark 介绍 Spark 和 MongoDB 案例演示

SequoiaDB技术简介


<4D F736F F D20BBAACCA9C1AABACFD6A4C8AFD3D0CFDED4F0C8CEB9ABCBBEB9D8D3DAC9EEDBDACAD0D0CBC9ADBFECBDDDB5E7C2B7BFC6BCBCB9C9B7DDD3D0CFDEB9ABCBBE C4EAB6C8C4DAB2BFBFD8D6C6D7D4CED2C6C0BCDBB1A8B8E6B5C4BACBB2E9D2E2BCFB2E646

Azure_s

业 务 与 运 营 Business & Operation (Transform) 加 载 (Load) 至 目 的 端 的 过 程, 该 部 分 在 数 据 挖 掘 和 分 析 过 程 中 为 最 基 础 的 一 部 分 一 个 良 好 的 ETL 系 统 应 该 有 以 下 几 个 功 能 1

册子0906

第 06 期 李祥池 : 基于 ELK 和 Spark Streaming 的日志分析系统设计与实现 1 日志 1.1 日志定义 IT 1.2 日志处理方案演进 v1.0 v2.0 Hadoop Storm Spark Hadoop/Storm/Spark v3.0 TB Splunk ELK SI

大数据分析技术 [13] 1.1 大数据 Big Data [2] IBM 5V Volume Velocity Variety Value Veracity Volume Velocity Variety Value Veracity 表 1 大数据特征表 Tab.1

天津天狮学院关于修订2014级本科培养方案的指导意见

专4-1 数据库引擎架构--李海翔.--v3.5

Big Data - Are You Ready





ù `


10 1



ù





1 1









`

Microsoft Word - 新疆银行业金融机构小微企业金融服务产品汇编.doc

穨九十年普通版.PDF




<4D F736F F D C2D6CCA5BBE1BFAF2D2D2D2DD7EED6D5B0E62D2DC4BFC2BC2E646F63>

`


大数据关键技术发展趋势及产业构成


培 训 机 构 介 绍 中 科 普 开 是 国 内 首 家 致 力 于 IT 新 技 术 领 域 的 领 航 者, 专 注 于 云 计 算 大 数 据 物 联 网 移 动 互 联 网 技 术 的 培 训, 也 是 国 内 第 一 家 开 展 Hadoop 云 计 算 的 培

平安银~1

白 皮 书 英 特 尔 IT 部 门 实 施 Apache Hadoop* 英 特 尔 分 发 版 软 件 的 最 佳 实 践 目 录 要 点 概 述...1 业 务 挑 战...2 Hadoop* 分 发 版 注 意 事 项...3 Hadoop* 基 础 架 构 注 意 事 项

Microsoft Word 電腦軟體設計.doc

合集

KV-cache 1 KV-cache Fig.1 WorkflowofKV-cache 2.2 Key-value Key ; Key Mem-cache (FIFO) Value Value Key Mem-cache ( Value 256B 100 MB 20%

是 证 券 市 场 的 后 来 者, 但 在 前 景 广 阔 的 道 路 上 前 行, 终 将 成 为 这 个 市 场 的 领 先 者, 这 里 会 给 你 一 个 巨 大 的 舞 台, 这 里 有 你 需 要 的 机 会, 这 里 欢 迎 优 秀 的 你! 二 招 收 条 件 1. 遵 守 国 家

untitled


PowerPoint 演示文稿

PowerPoint Presentation

SDK 概要 使用 Maven 的用户可以从 Maven 库中搜索 "odps-sdk" 获取不同版本的 Java SDK: 包名 odps-sdk-core odps-sdk-commons odps-sdk-udf odps-sdk-mapred odps-sdk-graph 描述 ODPS 基

ChinaBI企业会员服务- BI企业

台州市千寻软件技术有限公司

GBase 8a 案 例 集, 天 津 南 大 通 用 数 据 技 术 股 份 有 限 公 司 GBASE 版 权 所 有 2016, 保 留 所 有 权 利 如 果 通 过 本 文 的 介 绍, 使 您 了 解 GBase 8a 恰 是 您 巟 作 中 需 要 的 数 据 库 产 品, 戒 者 是

展 的 关 键 2015 年 国 内 资 本 市 场 持 续 活 跃, 市 场 交 易 规 模 大 幅 增 长, 带 动 投 资 者 规 模 快 速 增 长 (2) 大 资 管 时 代 到 来, 资 产 管 理 业 务 将 井 喷 式 增 长 自 2012 年 起, 监 管 政 策 放 开, 证 券

目 录 1 不 断 开 发 工 具 以 管 理 大 数 据 Hadoop* 简 介 : 支 持 从 大 数 据 中 获 得 出 色 价 值 的 可 靠 框 架 大 数 据 技 术 的 行 业 生 态 系 统 在 关 键 组 件 中 实 现 平 衡...

2

Microsoft Word - 临政办发31.doc

電機工程系認可證照清單 /7/1

11 天 山 区 区 环 卫 清 运 队 机 械 工 程 师 4011 C 1 不 限 不 限 机 电 具 有 两 以 工 作 经 12 天 山 区 乌 鲁 木 齐 市 第 15 小 会 计 4012 C 1 不 限 不 限 会 计 财 会 财 电 算 化 临 床 医 预 防 医 公 共 卫 生 与

<4D F736F F D20B9D8D3DAD3A1B7A2A1B6D6D0B9FAC4DCD4B4BDA8C9E8BCAFCDC5D3D0CFDEB9ABCBBEC1AEBDE0B7E7CFD5B7C0BFD8B9DCC0EDCAB5CAA9B0ECB7A8A3A8CAD4D0D0A3A9A1B7B5C4CDA8D6AA2E646F63>

控 单 位, 商 贸 公 司 是 具 体 执 行 单 位, 项 目 单 位 是 采 购 单 位 物 资 集 团 化 集 采 配 送 工 作 内 容 一 般 包 括 : 招 标 采 购 合 同 谈 判 合 同 签 订 与 执 行 咨 询 服 务 质 量 控 制 催 交 催 运 运 输 配 送 及 商

Microsoft Word _ _5_新建 Microsoft Word 文档.doc

职 业 教 育 的 学 生 其 意 义 更 为 重 要 对 于 企 业 无 才 无 德 等 于 废 品, 有 德 无 才 等 于 次 品, 有 才 无 德 等 于 危 险 品, 有 德 有 才 等 于 正 品 企 业 用 人 的 原 则 是 有 德 有 才 重 点 使 用, 有 德 无 才 培 养

,,

Untitiled

中艺华海修改1.7.indd

北 京 蓝 皮 书 公 共 服 务 相 比 而 言, 养 老 医 疗 失 业 等 保 险 都 早 已 经 由 国 务 院 颁 布 了 相 应 的 立 法 条 例, 在 全 国 范 围 内 形 成 了 统 一 的 制 度 党 的 十 八 届 四 中 全 会, 首 次 以 依 法 治 国 为 主 题,

2006年中央、国家机关公务员录用考试


untitled

3. 透 過 團 體 小 組 分 別 設 計 出 一 套 自 行 車 伸 展 操 4. 教 師 介 紹 騎 乘 自 行 車 上 座 方 法 煞 車 及 踩 踏 等 要 領. 練 習 自 行 車 運 動 中 基 本 的 上 座 平 衡 直 行 轉 彎 煞 車 等 動 作 ( 二 ) 自 行 車 運 動

外科手术基础概述

yy.xls


穨finaldiss.doc

13. 下 列 植 物 的 向 性 或 運 動, 哪 些 是 受 到 生 長 素 作 用 的 影 響?(5-4) 甲. 睡 蓮 的 花 到 了 晚 上 會 合 起 來 ; 乙. 黃 瓜 的 捲 鬚 攀 附 竹 竿 向 上 生 長 ; 丙. 含 羞 草 的 葉 經 碰 觸 後 閉 合 ; 丁. 紅 豆


第十二章 角色转换 走向成功

國立和美實驗學校103學年度第1次教師甄選簡章

104 年 度 推 廣 校 園 正 確 用 藥 教 育 模 式 中 心 學 校 成 果 報 告 書 學 校 : 桃 園 市 中 心 學 校 田 心 國 民 小 學 壹 計 畫 目 的 一 凝 聚 本 市 中 心 學 校 與 重 點 種 子 學 校 正 確 用 藥 教 育 推 廣 共 識, 期 能 培

学做一体手册,餐饮.doc

人体解剖实习指导.doc

ZW.PDF

cm 50.5cm

16 标 本 缓 急 的 护 理 原 则 不 包 括 ( 扶 正 祛 邪 法 ) 17 顺 从 疾 病 假 象 而 进 行 护 理 的 方 法 为 ( 反 护 法 ) 18 下 列 属 于 正 护 法 的 是 ( 虚 则 补 之 ) 19 因 中 气 不 足 脾 阳 不 运 而 致 的 腹 胀 便

???p???????????i?h?h?D???N_?s_

( ) 5. 自 行 車 有 吱 吱 喳 喳 的 聲 音 可 能 是 什 麼 原 因 所 造 成?(1) 鈴 號 的 聲 音 (2) 螺 栓 ( 帽 ) 鬆 動 (3) 腳 踏 板 磨 損 ( ) 6. 下 列 敘 述 何 者 是 對 的?(1) 輪 胎 的 胎 壓 是 愈 高 愈 好, 所 以 填

硕士论文正文

《教育信息化前沿》

目 录 数 据 化 管 理 :... 3 分 析 师 层 级... 3 数 据 运 营 流 程... 4 分 析 师 未 来 发 展... 4 你 是 否 适 合 做 分 析 师... 5 企 业 对 分 析 师 的 要 求... 5 制 定 分 析 师 学 习 规 划... 7 数 据 分 析 师

02 责任编辑 张晋芬 2 16:06:31

Transcription:

NewSQL 数据库技术与企业级应用 巨杉数据库王涛

公司简介 : SequoiaDB 巨杉数据库, 成立于 2011 年专注于新一代企业大数据平台研发, 其核心产品 SequoiaDB( 巨杉数据库 ) 是国内第一款新一代分布式数据库 ; 核心产品完全自主研发, 数据库引擎没有基于任何开源数据库源代码, 已经成功部署并运行在多家世界 500 强企业的生产环境中 ; 获著名基金启明创投 (A 轮 ) 与 DCM(B 轮 ) 融资 ; 中国第一款商业开源数据库产品 www.github.com/sequoiadb/sequoiadb www.sequoiadb.com

行业与企业级用户 主要客户以金融 运营商 政府和互联网行业为基础 研发中心在深圳, 现场支持队伍部署在北京 上海 广州三地

大数据数据湖

大数据思维 先有数据, 再探索关系 大数据的应用特点 : 全量 关联 实时 数据成为真正核心全息资产, 巨大的信息量足以支撑以前难以完成的任务 特定场景下基于样本数据的挖掘 以问题为中心以全量数据为基础的统计

大数据数据湖 (Data Lake) 传统的数据集市, 为了优化数据分析的性能, 只会存储一部分的属性并且只操作已经聚合的数据 而 数据湖 则是将全量数据的所有属性都进行存储, 尤其是当你并不确定从什么角度去分析和使用这些数据时

数据湖实现大数据价值 (Data Lake)

数据湖的优势 回单查询 数仓报表 实时风控 用户画像 Analy&cal Zone Opera&onal Zone 司法查询 风险管控 影像平台

大数据技术框架划分 计算层 离线分析在线业务实时计算 存储层 分布式文件系统 分布式数据库

大数据时代的数据库

大数据时代 ---OLTP,OLAP 外的新需求 大数据应用场景, 催生出了传统 OLTP 和 OLAP 外的新需求就是实时数据操作 (Operational) 主要的技术需求包括 : 海量数据的存储管理 高并发实时查询 高性能的读写 OLTP Opera&onal OLAP

大数据基础软件的发展 : 殊途同归 分布式存储以及批处理数据仓库, 基于 MapReduce 算法搭建实现 MPP 数据库, 基于已有架构进行并行计算 新一代分布式数据库 重建分布式架构, 专注于存储引擎的建设

分布式数据库的未来 传统关系型数据库 成为存量市场, 逐渐萎缩 NoSQL 开始支持 ACID 与关系模型, 在提供自身特有特性的同事提供标准 SQL 接口 SQL-on-Hadoop Hadoop 成为分布式文件系统与分布式调度框架,MR 被完全淘汰, 原生 SQL 引擎一统天下,Spark 负责流处理与分析挖掘 NewSQL( 新型分布式数据库 ) 概念逐渐被泛指新型分布式数据库, 传统 NewSQL 新型的支持 SQL 接口的 NoSQL 与 SQL-on-Hadoop 都可以被概括在 NewSQL 的范畴之内

NewSQL 数据库的产品定位

NewSQL 技术特点

分布式架构与扩展性 分布式 Share-Nothing 架构 主 - 备高可用机制 线性水平扩展

SQL 支持 SQL 支持 :ANSI SQL 2003 标准,OLAP 扩展, 标准 JDBC/ODBC 支持 支持多种分区方法及多级分区 多种 UDF( 用户自定义函数 ) 语言支持 :java, python, c/ c++, perl, R 等 动态扩容 : 动态按需扩容, 按照存储大小或者计算需求, 秒级添加节点 SDB+SSQL SSQL 执行节点 SSQL 执行节点 SDB 协调节点 SDB 协调节点 SDB 协调节点 SDB 编目节点 SDB 编目节点 SDB 编目节点 SDB 数据节点 SDB 数据节点 SDB 数据节点 SDB 数据节点 SDB 数据节点 SDB 数据节点 SDB 数据节点 SDB 数据节点 SDB 数据节点

/ 时间序列数据的处理是常见需求, 很多应用中海量数据的时间特性以递增为主, 旧数据的热度随着时间的推移递减 SequoiaDB 提供集合分区 ( 主子集合 ) 机制可以轻松应对时间序数据 避免单一集合数据量膨胀时索引树过大而导致的写入性能雪崩 按时间序能直观反映数据访问热点, 保障热点数据集合的性能 直观的分配资源给不同集合, 直观的备份 归档规则 MongoDB 和 Hbase 都没有提供类似的主子集合机制 db.cs.createcl( My0101 ) db.cs.myhistory.attachcl( cs.my0101, {UpBound:{date: 20140201 }, LowBound:{date: 20140101 }} ) db.cs.createcl( My0201 ) db.cs.myhistory.attachcl( cs.my0201, {UpBound:{date: 20140301 }, LowBound:{date: 20140201 }} ) db.cs.createcl( My0301 ) db.cs.myhistory.attachcl( cs.my0301, {UpBound:{date: 20140401 }, LowBound:{date: 20140301 }} ) MyHistory 20140201 20140301 20140401 20140501 20140601 My0101 My0201 My0301 My0401 My0501 20140101 20140201 20140301 20140401 20140501

双存储引擎 记录 / 块存储 SequoiaDB 分布式块存储 文件按照 LOB 处理 自动按照 64/128KB 的数据块进行切分, 放在不同分区存储 使用 DIO 避免二进制数据占用文件系统缓存 并行处理 与 GridFS 相比不占用内存 与 HDFS 相比不存在 Namenod e 限制 数据块数据块数据块 数据块 分区 1 数据块数据块数据块 数据块 分区 2 数据块数据块数据块 数据块 分区 3 1. 关系数据库 + 文件系统地址问题 : 文件条目受关系型数据库的限制, 比如超过 3 亿条后性能下降 2. MongoDB GridFS 问题 :MMAP 机制把文件放进内存, 与索引等关键数据争用内存 3. HDFS 问题 : 受 Namenode 限制无法处理大量的小文件, 分配 64MB 存储浪费空间

数据在多个分布节点内可以自动分片和复制, 可以定制数据分布策略. 保证多类型业务可以运行在同一平台上, 比如 : 冷 / 热数据区分离 读 / 写分离 写交易的 强一致性 和 弱一致性 分离 查询 / 批量分离 实时查询 批量分析 数据修改 / 写 SequoiaDB 平台 普通存储设备 高速存储设备

一致性因素读主节点读备节点 W=N W!=N 强一致, 无数据丢失, 事务操作符合传统关系型数据库模型 强一致型, 极端情况下可能发生数据丢失, 事务操作符合传统关系型数据库模型 强一致, 无数据丢失, 读操作受节点分布影响会有脏读时间 最终一致, 可能发生读取不到写入的数据, 极端情况下可能发生数据丢失 持久性因素备节点响应策略数据可靠性 物理同步 数据在备节点写入事务日志 全部节点宕机不会造成数据丢失, 但会 损失性能 逻辑同步 数据在备节点处理但未写入事务 主备节点同时宕机可能会造成数据丢失, 数据查询强一致 半同步 数据在备节点成功接收但还未处理 备节点宕机可能会造成数据丢失, 最终一致性 异步数据不需要被备节点感知主节点宕机可能会造成数据丢失 MongoDB 和 Hbase 不支持 SQL 访问, 其 API 也没有提供事务机制

NewSQL 应用案例

1. 金融行业近线数据平台

近线数据服务平台体现数据湖业务价值 离线数据近线化 业务系统数据的统一归档 提供冷数据对最终用户的服务 ( 例如 ECIF 回单查询 ) 自由查询 自助报表 面向监察室及运维人员开放统一的数据查询入口 面向公检法的司法查询系统 面向行内用户与分行 IT 人员, 提供自定义数据查询与报表服务功能 生产系统瘦身 数据仓库 ODS 瘦身 T+0 用户实时资产视图

近线数据平台定位 数据生命期管理工具 热数据 ( 在线 ) 温数据 ( 近线 ) 冷数据 ( 离线 ) ü 热数据可以根据数据生命期管理机制迁移为温数据 ü 银行在线对外业务, 如核心交易 信用卡等重要模块 数据计算层服务 低延时 高延时 高并发数据查询 批量分析 影像处理 数据挖掘 事件流 机器学习 ü 存储介质从磁带改为分布式库 / 文件存储 ü 可用性大幅增加 ü 不可修改归档文件数归档库据 传统数据库 近线数据平台 Oracle DB2 SequoiaDB

NewSQL 数据库构建近线数据平台核心价值 海量的离线数据的近线化 近线数据平台存储原本离线与近线数据, 不涉及已有在线业务 对已有业务不进行替换, 而是补充 达到离线数据近线化 与近线生产库瘦身两大目的 分布式架构提升性能, 节约成本

2. 企业内容管理 / 影像平台

ECM 影像内容管理 存储票据 影像 视频等非结构化数据区域 提供数据分层存储机制 ECM 在线数据 : 提供热数据存储服务, 使用高端 PC 服务器保证读写速度高效稳定, 支持大规模并行访问和读写能力 ECM 近线数据 : 提供中期数据存储服务, 以只读业务为主, 对修改操作支持但性能欠佳 ECM 归档数据 : 提供数据的归档服务, 在 SDB 中归档数据也可以进行访问, 只是使用相对低配置服务器导致不以性能为优先考虑点 提供在线 中高并发的内容数据处理 提供 15 年影像视频数据保留期限 影像数据 影像数据 影像数据 ECM 内容管理平台 ECM 在线数据 ECM 近线数据 ECM 归档数据 文本数据 文本数据 文本数据

NewSQL 数据库构建 ECM 内容管理平台 双引擎机制, 文件和元数据同时存储 运营管理 信贷管理运营管理信贷管理 分布式架构提供容量的灵活扩展, 提高性能节约成本 海量非结构化数据的实时查询 调用, 前台业务的无缝对接 Oracl e DBMS CM API Documentum SQL 文件 API IBM CM 存储 存储 存储 存储 文件 CM API 分布式影像平台 API 访问

SequoiaECM 逻辑架构 多渠道内容管理 文档管理 用户鉴权身份验证 检入检出机制 文档多版本控制 RESTful API 接口 对象存储接口 多平台支持

3. 360 用户视图 / 数据视图

政府大数据平台 某市电子政务中心利用 SequoiaDB, 作为统一的数据湖, 将每个市民的身份证作为唯一标识, 将全市 1000 万 + 市民以及超过 40 余个委办局的数据打通, 做到针对市民的全维度视图 在该系统中,SequoiaDB 利用其分布式架构与对象存储能力, 将每个市民的全维度数据形成一条统一的记录, 不同委办局的维度在该记录中以嵌套字段的形式体现, 大大方便了应用程序的开发和管理

互联网旅游平台数据撮合 途牛旅游网, 使用 SequoiaDB 巨杉数据库支撑动态资源和动态报价等业务, 通过应用于 价格中心 资源系统 酒店系统 等多个业务核心部门, 解决了海量多类型数据的存储以及处理这个互联网企业普遍面临的技术瓶颈, 使得多个核心系统计算量从去年同期的每天 1 亿次, 增加到今年每天 100 亿次以上

4. 物联网智能制造 / 智慧交通

NewSQL for IOT 分布式架构, 应对物联网快速增长的设备数据 多类型存储, 日志 图像等非结构化 半结构化数据的存储 高性能高稳定, 为物联网 / 智慧交通提供了实时的数据存储管理和调用支持

物联网与智能制造 如今的 IT 已经逐渐由 人产生数据 向 设备产生数据 过度 对于设备的制造企业来说, 传统的 IT 主要围绕 ERP 库存 上下游渠道 CRM 等系统构造, 而对于设备本身产生的数据则没有过多关注 但是, 对于新一代物联网设备, 其产生的数据具有量大 繁杂 多样等特性, 使用传统数据存储与处理技术很难有效地从中挖掘出价值 在巨杉某运营商用户中,SequoiaDB 作为智能网关的后台数据管理平台 (DMP), 承载智能网关设备中软件日志的采集 分析与挖掘功能, 为家庭用户更安全 稳定 高效的网络环境提供了基础保障

智能交通监控 在政府与交通行业, 针对视频卡口的大数据存储 分析与应用一直以来是最受关注的主题 借助 SequoiaDB 半结构化对象存储 分布式横向扩展能力以及非结构化影像存储引擎, 交通部门可以从卡口视频文件中提取出的车牌信息 位置信息 以及时间信息按照三个维度汇总, 进行道路拥堵预测 车辆轨迹跟踪 套牌车监控 尾随车辆监控等多种安防措施

5. 互联网金融业务底层数据平台

互联网体系下的金融模式 独立于核心银行之外的新型服务模式 在商业与技术上探索新的渠道对金融行业所带来的转变 渠道由线下转移到线上, 由人与人的接触转变为机器与人的接触 信息的收集和发送从人转向软件 用户体验要求的提升 新的业务模式 远程开户 虚拟柜员 网上信贷 非金融服务 个人与小微征信 新的技术模式 原本由人做出的决策, 现在需要由机器完成 用户行为数据与第三方数据是新模式的核心

NewSQL 数据库助力互联网金融业务 分布式架构, 灵活容量扩展, 应对飞速增长的互金业务数据 灵活存储结构, 结构化非结构化数据同时存储, 适应互金数据系统的多种数据处理需求 兼容企业级应用,SQL 等企业级功能, 完美适应已有应用 高性能的存储管理, 高速响应互金业务的高速发展 分布式高可用, 保证互金数据的安全稳定

案例 :NewSQL 应用于电子银行 优惠券 卡券信息 基础交易数据 活动管理 渠道管理 精准营销 日志采集

关注巨杉公众号试用最新 2.6 社区版 www.sequoiadb.com Sales_support@sequoiadb.com 400-8038-339