目录 一 概要... 3 二 保持数据一致性面临的挑战... 4 三 关于 SaCa DataCompare... 6 四 工作原理... 8 五 技术架构 六 产品优势 七 客户示例 八 总结

Similar documents
水晶分析师


册子0906

近四年网络工程专业培养方案.doc

KV-cache 1 KV-cache Fig.1 WorkflowofKV-cache 2.2 Key-value Key ; Key Mem-cache (FIFO) Value Value Key Mem-cache ( Value 256B 100 MB 20%

sql> startup mount 改变数据库的归档模式 sql> alter database archivelog # 打开数据库 sql> alter database open 禁止归档模式 sql> shutdown immediate sql>startup mount sql> al

臺銀人壽「98年九至十一職等人員甄試」

PowerPoint Presentation

天津天狮学院关于修订2014级本科培养方案的指导意见

燃烧器电子控制系统 目录 2

SDK 概要 使用 Maven 的用户可以从 Maven 库中搜索 "odps-sdk" 获取不同版本的 Java SDK: 包名 odps-sdk-core odps-sdk-commons odps-sdk-udf odps-sdk-mapred odps-sdk-graph 描述 ODPS 基


IQ

大连软~1

威 福 髮 藝 店 桃 園 市 蘆 竹 區 中 山 里 福 祿 一 街 48 號 地 下 一 樓 50,000 獨 資 李 依 純 105/04/06 府 經 登 字 第 號 宏 品 餐 飲 桃 園 市 桃 園 區 信 光 里 民

Microsoft Word 電腦軟體設計.doc

01

電機工程系認可證照清單 /7/1

目 录 1. 引 言 数 据 交 换 平 台 TongDXP 功 能 定 位 总 体 构 成 功 能 架 构 主 要 功 能 TongDXP 优 势... 9 易 于 使 用 贴 近 用

一 登录 crm Mobile 系统 : 输入 ShijiCare 用户名和密码, 登录系统, 如图所示 : 第 2 页共 32 页

11 天 山 区 区 环 卫 清 运 队 机 械 工 程 师 4011 C 1 不 限 不 限 机 电 具 有 两 以 工 作 经 12 天 山 区 乌 鲁 木 齐 市 第 15 小 会 计 4012 C 1 不 限 不 限 会 计 财 会 财 电 算 化 临 床 医 预 防 医 公 共 卫 生 与

ChinaBI企业会员服务- BI企业

Kubenetes 系列列公开课 2 每周四晚 8 点档 1. Kubernetes 初探 2. 上 手 Kubernetes 3. Kubernetes 的资源调度 4. Kubernetes 的运 行行时 5. Kubernetes 的 网络管理理 6. Kubernetes 的存储管理理 7.


通过动态路由协议实现链路备份

Microsoft Word 级第二专业学士学位培养计划.doc

抗日战争研究 年第 期

01

帝国CMS下在PHP文件中调用数据库类执行SQL语句实例

MASQUERADE # iptables -t nat -A POSTROUTING -s / o eth0 -j # sysctl net.ipv4.ip_forward=1 # iptables -P FORWARD DROP #

信息

职 位 类 别 : 测 试 工 程 师 工 作 经 验 或 实 习 经 历 : 不 限 岗 位 要 求 : 1. 本 科 及 其 以 上 学 历, 计 算 机 相 关 专 业 2014 届 毕 业 生 ; 2. 实 习 时 间 要 求, 尽 量 一 周 五 个 工 作 日 ; 3. 熟 悉 Wind

孙 蓝等 基于目标导向的研究生英语学习模式创新

1 1 大概思路 创建 WebAPI 创建 CrossMainController 并编写 Nuget 安装 microsoft.aspnet.webapi.cors 跨域设置路由 编写 Jquery EasyUI 界面 运行效果 2 创建 WebAPI 创建 WebAPI, 新建 -> 项目 ->

Bluemix 从概念到应用CN改

大容量 redis 存储方案 --Pika 陈宗志 360 基础架构组技术经理 SACC2017

温 馨 提 示 一 如 无 另 行 说 明, 投 标 / 报 价 文 件 递 交 时 间 为 投 标 / 报 价 文 件 递 交 截 止 时 间 之 前 30 分 钟 内 二 为 避 免 因 迟 到 而 失 去 投 标 / 报 价 资 格, 请 适 当 提 前 到 达 三 投 标 / 报 价 供 应

目 录 目 录... I 1 背 景 介 绍 指 导 思 想 和 建 设 目 标 建 设 内 容 系 统 定 位 系 统 架 构 信 息 交 换 平 台 建 立 云 计 算 应

论文,,, ( &, ), 1 ( -, : - ), ; (, ), ; ;, ( &, ),,,,,, (, ),,,, (, ) (, ),,, :. : ( ), ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ), ( ),,,, 1 原译作 修补者, 但在英译版本中, 被译作

目 录 第 五 部 分 第 六 部 分 第 七 部 分 第 八 部 分 投 标 邀 请 投 标 人 须 知 附 表 评 标 方 法 和 评 分 细 则 项 目 需 求 和 技 术 方 案 要 求 1

FPGAs in Next Generation Wireless Networks WPChinese

5 2. 过程与方法 情感 态度与价值观 三 知识结构图 四 教学内容和教学要求 课 程 教学要求 课时安排

Microsoft PowerPoint - WinCC V7.0典型架构选型指南.PPT

<4D F736F F D204954D0D0D2B5D6B0D2B5BCBCC4DC2020CDA8D3C3D2AAC7F32D656E642E646F63>

“百企入校——广西青年企业家协会高校

臺銀人壽「98年九至十一職等人員甄試」

附 件 : 2009 年 度 国 家 精 品 课 程 名 单 一 本 科 国 家 精 品 课 程 ( 以 学 科 为 序, 共 400 门 ) 序 号 一 级 学 科 二 级 学 科 课 程 名 称 学 校 名 称 负 责 人 1 哲 学 哲 学 类 马 克 思 主 义 伦 理 学 安 徽 师 范

附件2

Microsoft Word - 安徽商贸职业技术学院高等职业教育质量年度报告(2015).doc


<4D F736F F D20C8EDBCFEA1B A1B33136BAC5A3BAB9D8D3DAB7A2B2BC C4EAC8EDBCFEB9A4B3CCCAB5D1B5D6AED0A3C4DABFC6D1D0CFEEC4BFB5C4CDA8D6AA2E646F63>

第 期 曹 源 等 形式化方法在列车运行控制系统中的应用

南京市人才服务中心

01

中信建投证券股份有限公司

1


六域链联盟 SDChain-Matrix 节点搭建指南 2018/07/26 Version : 1.0.0

PowerPoint Presentation

Microsoft Word - 13院21号.doc

第6章  数据库技术基础

目 录 第 五 部 分 报 价 邀 请 第 六 部 分 供 应 商 须 知 附 表 第 七 部 分 评 审 方 法 和 评 分 细 则 第 八 部 分 项 目 需 求 和 服 务 方 案 要 求 1

Guava学习之Resources

广东省海外高层次人才需求信息表.xlsx

Office Office Office Microsoft Word Office Office Azure Office One Drive 2 app 3 : [5] 3, :, [6]; [5], ; [8], [1], ICTCLAS(Institute of Computing Tech

微软用户


计算机软件技术专业教学计划

住户表

最 佳 做 法 : 在 需 要 时 或 需 要 前 从 CDN 下 载 内 容, 并 使 它 们 与 Flash 代 码 和 文 件 分 离 存 盘 率 vs 响 应 速 度 当 用 户 玩 游 戏 时, 客 户 端 可 以 把 每 一 个 变 化 实 时 写 到 后 端 Web 服 务 器, 也


目 录 1 爱 游 戏 业 务 及 游 戏 大 厅 ( 客 户 端 ) 简 介 什 么 是 爱 游 戏 业 务 什 么 是 游 戏 大 厅 ( 客 户 端 ) 游 戏 大 厅 ( 客 户 端 ) 主 要 功 能 游 戏 大 厅

软 件 工 程 专 业 习 指 南 目 录 一 软 件 工 程 专 业 设 置 背 景 与 发 展 前 景... 3 二 软 件 工 程 专 业 实 践 教 条 件... 4 三 软 件 工 程 专 业 课 程 类 型 及 核 方 式 软 件 工 程 专 业 课 程 类 型...7

汹涌澎湃汹涌澎湃汹涌澎湃汹涌澎湃

XXXXXXXX

模糊数学在飞行控制系统故障诊断的应用

<4D F736F F D20CEF7C5C9B0A3CEC2B6C8D2C7B1EDB9ABCBBED1F9B1BE31312E646F63>

CHCN_8-14_K.indd


<4D F736F F F696E74202D20C8EDBCFEB2E2CAD4D1A7CFB0D7CAC1CF2E BBCE6C8DDC4A3CABD5D>

<4D F736F F D BAD3C4CFC0EDB9A4B4F3D1A C4EAB6C8B1BEBFC6BDCCD1A7D6CAC1BFB1A8B8E6A3A8D7EED6D5B8E5A3A92E646F63>

Microsoft Word 二專招生簡章_全_.doc

目 录 全 国 计 算 机 等 级 考 试 考 务 管 理 规 则 (2014 年 版 ) 第 一 章 总 则... 1 第 二 章 组 织 机 构... 1 第 三 章 工 作 人 员... 4 第 四 章 考 试 实 施... 5 第 五 章 评 卷 成 绩 与 证 书... 7 第 六 章 考

android讲座

Ioncube Php Encoder 8 3 Crack 4. llamaba octobre traslado General Search colony

幻灯片 1

目 录 1. 业 务 流 程 系 统 开 发 面 临 的 挑 战 与 机 遇 业 务 流 程 管 理 新 一 代 开 源 业 务 流 程 开 发 平 台 BPMX BPMX3 是 什 么 为 什 么 要 优 先 采 用 BPMX

corel windvd pro 11 keygen downloads

项目采购需求编写模板

handsome-招股书-新规则-final-version-0422.PDF

电信行业网上营业厅

untitled

本 课 程 作 为 非 计 算 机 专 业 本 科 通 识 课 程, 是 一 门 理 论 和 实 践 紧 密 结 合 的 实 用 课 程, 内 容 包 括 计 算 机 基 础 部 分 和 程 序 设 计 部 分 计 算 机 基 础 部 分 涵 盖 计 算 机 软 硬 件 组 成 数 制 表 示 操

ABOUT ME AGENDA 唐建法 / TJ MongoDB 高级方案架构师 MongoDB 中文社区联合发起人 Spark 介绍 Spark 和 MongoDB 案例演示

幻灯片 1

* 系统架构 * IB API 模块 目录 * 消息总线模块 * 行情采集处理引擎模块 * 持久化存储模块

复 变 函 数 与 积 分 变 换 常 微 分 方 程 数 值 分 析 数 值 分 析 课 程 实 习 微 分 方 程 数 值

137677_Eta_press Folder-cn用的.indd

UAP中心

附录八:验收监测表格式

Transcription:

东软内部公开 SaCa DataCompare 数据比对平台产品白皮书

目录 一 概要... 3 二 保持数据一致性面临的挑战... 4 三 关于 SaCa DataCompare... 6 四 工作原理... 8 五 技术架构... 10 六 产品优势... 11 七 客户示例... 12 八 总结... 14 2

一 概要 不断增长的结构化和非结构化数据增加了信息管理的复杂性, 同时客户希望在跨异构环境中能更出色地管理数据, 企业需要数据高度可用, 需要能够不间断地访问数据, 同时不会导致性能下降和服务中断, 为此企业需要拥有冗余的分布式数据副本 然而, 在当今复杂的 IT 环境中, 在各个分布式数据副本之间保持数据一致性极具挑战, 不幸的现实是可能出现数据差异 如果不良数据未被发现并解决, 则可能导致错误的决策, 最终出现运营 财务和法律风险 在 SaCa DataCompare 的帮助下, 企业可以信心十足地在其备份系统 报表 / 查询数据库 主从数据库和其他类型的冗余数据系统中实现数据一致性 在本文中, 我们将这些系统统称为目标数据库 SaCa DataCompare 在源数据库与目标数据库之间执行定期检查, 企业可根据需要设置检查频率, 且无需使任一系统脱机 SaCa DataCompare 为在对业务造成负面影响之前发现不同步的数据提供了一个易用且强大的解决方案 SaCa DataCompare 可与 SaCa CDC 实时数据复制产品,SaCa DataExchange 数据交换产品,SaCa DataTransform 数据转换与清洗产品一起部署, 也可以单独部署, 能够确保在各数据库之间保持数据一致性 3

二 保持数据一致性面临的挑战 在我们讨论对帮助管理数据库间数据一致性的解决方案的需求之前, 我们需要了解企业中出现数据不一致的常见原因 当目标数据库中的数据偏离源数据库时就出现了数据差异 数据偏离的程度取决于各种因素, 一些可能是有意而为之, 一些可能是无意形成的 即使使用能够可靠复制数据的产品, 如 SaCa CDC 或 SaCa DataTransform, 仍会存在可能导致出现数据差异的一些原因 如果目标数据库的目标是保持与源数据库严格一致, 那么 IT 将需要实施相应的流程和策略以确保实现此目标 下面将描述可能导致出现数据差异的一些原因 : 迁移错误在可以开始复制之前, 要使用各种不同的迁移工具来帮助进行目标数据库的初始加载 迁移工具和复制产品中用于处理数据的配置上的差异可能会导致出现数据差异 例如, 如果某列值未知, 迁移工具可能使用?, 而复制产品可能使用 null 当执行迁移时, 可能存在待办事务未纳入其中, 从而导致目标数据库上的数据缺失 源数据库与目标数据库中的差异源数据库和目标数据库的配置差异, 如编码 区域设置 字节顺序或数据库版本不同, 可能导致在迁移和复制过程中出现细微差异 例如, 不兼容的字符集或日期 / 时间格式和范围可能会导致目标数据库出现错误 实例化错误在可以开始迁移或复制之前, 将需要使用正确的模式和约束条件实例化目标数据库 如果这么做时出现故障, 将导致源数据库和目标数据库不同步 例如, 如果无法设置主键 / 唯一键, 可能会导致出现重复行 即使源数据库中无重复行也可能会创建重复行, 因为无法保证完成迁移作业时不出现任何故障 其他实例化错误包括不正确的迁移作业 脚本和触发器, 这些可能导致不正确地修改数据 配置错误 4

复制产品的不当配置和意外配置可能导致出现差异 这种类型的差异不显示在复制日志中, 因为从复制产品的角度来看, 是按配置执行 这还可能让 QA 测试发现不了问题 复制方面的漏洞虽然在源数据库与目标数据库之间启用了复制, 并且复制运行完好, 但也存在源数据库中插入的数据未被复制的情况 例如, 当批量插入数据时, 用户常常会使用数据库中的一些选项 ( 如 Oracle 数据库中的 NOLOGGING), 这些选项会导致复制系统避免捕获这些数据 复制延迟使用异步复制, 对源数据库进行更改与将这些更改提交到目标数据库之间将存在短暂的延迟 然而, 如果不满足最大延迟要求, 可能会违反服务级别协议或数据合规性要求 基础架构故障系统故障 磁盘损坏和网络故障等基础架构错误可能导致源数据库与目标数据库之间出现数据差异 恢复有故障的系统后, 一项主要任务是要确保源系统与目标系统之间的数据一致性毫发无损 虽然 SaCa CDC 等复制或迁移产品通常具有检查点功能, 但它们无法保证发生崩溃后对系统进行恢复时目标数据库中数据的质量 用户错误通常创建目标数据库的目的是分流源数据库的查询处理 这样可以在不影响源数据库上运行的应用程序的情况下生成丰富的运行报告 根据使用的技术, 目标数据库不仅对于读操作是开放的而且对于写操作也可能是开放的 如果是这样, 即使应用了 IT 策略, 用户 /DBA 也可能会无意或恶意修改数据 应用程序错误使用目标数据库的应用程序可能因逻辑错误以及在应用程序升级期间更改数据 此外, 即使目前复制运行正常且数据保持一致,IT 也可能会开发使用目标数据库的新应用程序, 因此可能会在未来某个时候修改数据 5

三 关于 SaCa DataCompare SaCa DataCompare, 是一款高性能且侵入性极低的数据比对工具, 可帮助管理整个企业内的数据一致性, 该产品可在多种情境下使用以确保数据一致性, 如用来对关系型数据库 列存储数据库中的数据进行比对和同步 通过比对的方式分析两端数据库的差异性 ( 数据结构 数据量 数据项 ), 并能够提供差异性报告, 同时支持数据的合并 SaCa DataCompare 可与 SaCa CDC 等产品以及其他类似产品无缝协作, 它可对这 些产品的功能加以补充并确保数据一致性 现在我们已充分了解在整个企业内维护一致数据面临的挑战, 下面我们将讨论 SaCa DataCompare 一些关键功能, 这些功能不仅可帮助应对上述挑战, 而且还能无缝融入 IT 组 织中 支持多种数据源 支持主流的关系型数据库 (Oracle DB2 SQLServer MySQL 以及达梦 南大 金仓等国产数据库 ), 同时可灵活扩展新的数据源 提供多种比对方式 支持基于表结构比对识别结构化差异 数据量比对识别数量差异 数据项比对识别信息 内容差异, 支持表 视图 自定义 SQL 等方式 适用于各种网络环境 既可以在企业局域网内部使用, 也可部署在跨网络 跨机房等环境中, 即使是跨机房的 6

方式也不会丢失其性能和配置的简便性 Web 方式管理监控 提供完全基于浏览器的方式配置比对模型, 监控和执行差异分析流程, 查看差异数据报告以及基于个性化配置的数据补齐过程 快速安装部署 提供多种平台产品安装包, 解压即用, 无需额外安装其他软件, 而且对硬件的要求也不 算高, 绝大多数的计算机配置都可以很流畅地运行这个系统 多样化调度方式支持调度, 可以实时的不间断的调度 定时的基于某个固定的时间点或周期调度 手动 执行或者基于 WebService 接口的触发调度 7

四 工作原理 在探究 SaCa DataCompare 的架构 安装和配置细节之前, 我们简单介绍一下 DataCompare 的工作原理 与要么全有要么全无的方法不同,DataCompare 允许用户选择要比较的对象以及灵活地确定比较方式, 以便只处理相关数据, 只突显相关差异 在初始比较 ( 或行散列 ) 步骤中, 利用查询从源表和目标表检索行 如果源数据库与目标数据库属于不同的类型, 列将转换为标准化的数据类型格式, 以进行准确比较 默认情况下,DataCompare 在比较行时, 会以值一一对应的方式比较主键的所有列, 而对所有非键列使用散列值 用于计算散列值的独特的数字签名缩小了通过网络传输以进行比较的数据, 同时仍提供高效且高度可靠, 但是并非绝对的机制来确定两行是包含相同还是不同的列值 为完全确保发现不同步的行,DataCompare 可配置为以列一一对应的方式比较非键行, 而不使用散列 全列比较会降低处理性能且下降程度与列数成比例, 还会增加网络使用率, 因此不建议作为最佳实践 8

在实际复制环境中,DataCompare 完成初始比较后, 将看起来不同步的行存储在队列中 不确定的原因是复制与比较同时执行, 因此, 差异可能是在源系统上捕获但尚未应用于目标系统的进行中事务引起的 在确认步骤, 也称为确认不同步步骤中,DataCompare 在不断变化的环境中确认行状态, 从而确保结果准确 默认情况下, 执行确认处理的线程与初始比较步骤并行执行, 但每行的确认直到超出指定的复制延迟阈值后才执行 在这一步的最后, 会给出对队列中的行的评估结果, 如下所示 : 完成作业后, 可以通过使用 SaCa DataCompare Web 界面或直接查看文件来查看比 较报告和不同步报告 9

五 技术架构 以上架构示意图展示了各个 SaCa DataCompare 组件的典型架构设置 箭头表示发起通信的起始位置 Monitor&Management, 使用 web 浏览器, 用户可以连接到 DataCompare 服务器并配置 DataCompare 任务及其关联对象 在配置必需的 DataCompare 任务后, 用户就可以开始进行比较以及查看报告了 Compare 组件, 是一个用于执行 DataCompare 任务的 Java 程序 DataCompare 使用 Repository 库中的配置信息来获得有关 DataCompare 任务的细节 用户可通过 Web 浏览器手动执行 DataCompare 任务 还可以使用 DataCompare 调度定期自动执行比较任务 DataCompare 服务器通常与源数据库和目标数据库安装在不同的机器上 Repository 元数据库, 用于存储 DataCompare 任务, 调度等一系列配置信息, 报告信息以及运行日志信息 10

六 产品优势 完全基于 Web 方式配置 管理和监控 高速度 侵入性极低 支持异构数据库 高效处理大量数据 支持跨网络跨机房的比对 支持数据不断变化的实时数据库 源系统和目标系统无需停机 对硬件和网络资源的影响很低 提供有关不一致数据的详细 可指导行动的报告 11

七 客户示例 全国人口基本信息资源库, 是在全国人口信息管理系统建设基础上, 充分利用公安综合业务通信网络资源, 建立部级人口信息管理系统和全国人口基本信息资源库, 集中存储全国常住人口的文字和照片信息, 为全国各级公安机关广大民警提供人口信息快速查询查证服务 挑战公安部信息部门在数据管理方面面临着多项挑战, 其中包括确保人口基本信息数据的完整性 公安部人口信息库的数据来源于所有的 31 个省数据中心, 这就需要一种解决方案来发现公安部与省级的数据差异并在不停机的情况下在各个数据库之间重新同步数据, 以确保一致, 并避免因服务级别降低而导致收入损失的情况 这些不一致的数据包括 : 不同的记录, 显示目标中键与源相同但数据与源不同的记录 只在源中, 显示目标中未出现的源中的记录 只在目标中, 显示源中未出现的目标中的记录 相同的记录, 显示目标中键和数据都与源相同的记录的 解决方案公安部数据中心机房部署了 SaCa DataCompare 产品, 因而在数据不同步时能够快速 自动发现这种情况, 且不会中断数据库可用性 不再需要运行复杂的查询并投入大量的人力资源以发现受影响的数据, 在某些情况下可节省数周的时间 东软的 IT 服务团队创建了一系列个 SaCa DataCompare 任务, 用以处理 31 个省 / 直辖市差异数据, 定位差异的数据, 以及自动修复数据环境, 这进一步节省了时间和资源, 从而扩展了 SaCa DataCompare 的价值 优势通过使用 SaCa DataCompare, 公安部无需手动将数据从一个省级数据中心复制到公安部数据中心站点, 也无需使某数据中心长时间地停机以从另一个数据中心重新初始化化 12

这样, 就提高了系统可用性, 降低了错误风险 当从省级数据中心将数据迁移到部数据中心时, 利用该解决方案高效地检测可能的错误和数据遗漏, 从而简化了流程, 避免了可能的数据丢失 利用扩展解决方案的高级同步功能, 无需重新实例化数据库, 每小时可处理 1 亿多行的数据 13

八 总结 在当今复杂的 IT 环境中, 一个不幸的现实是可能会出现数据差异 如果不一致的数据未被发现并解决, 则可能导致错误的决策 不满足服务级别协议要求, 最终出现运营 财务和法律风险 SaCa DataCompare 为在对业务造成负面影响之前发现不同步的数据提供了一个易用且强大的解决方案 SaCa DataCompare 与 SaCa CDC,SaCa DataExchange 等系列产品一起, 提供了确保数据一致性的实时数据集成和持续可用性解决方案 产品网站 :http://platform.neusoft.com 销售热线 :400 655 6789 产品邮箱 :platform@neusoft.com 微信账号 : 东软平台产品 14