数据安全 程绍银 sycheng@ustc.edu.cn
本章内容 数据安全数据备份数据容灾数据恢复 2
本章内容 数据安全数据备份数据容灾数据恢复 3
数据安全 4 数据安全的重要性 数据不论是对单位, 还是对个人, 都是至关重要的, 一但不慎丢失, 都会造成不可估量的损失, 轻则辛苦积累起来的心血 付之东流 ; 严重的会影响单位的正常运作 信息系统可以花钱买, 但数据买不到 恢复数据所需要成本 无论什么原因造成数据丢失, 恢复或重建这些数据的开销都是巨大的 开销包括人员工资 设备和其它资源的花费以及宕机时间对工作和信誉造成的影响 据国外的调查结果, 重建 1MB 的数据平均需要 3 千美元 而更为严重的是, 有些数据是根本无法重建的 保证数据安全是成功之母
影响数据安全的因素 硬盘驱动器毁坏 : 由于一个系统或电器的物理损坏使你的文件丢失 ( 突然停电 ) 人为错误 : 你偶然地删除一个文件或重新格式化一个磁盘 黑客 : 有人在你的计算机上远程侵入并损害信息 病毒 : 你的硬盘驱动器或磁盘被感染 5
影响数据安全的因素 ( 续 ) 盗窃 : 有人从你的计算机上复制或删除信息或侵占整个单元系统 自然灾害 : 火灾或洪水破坏你的计算机和硬盘驱动器 电源浪涌 : 一个瞬间过载电功率损害在你的硬盘驱动器上的文件 磁干扰 : 你的软盘接触到有磁性的物质, 比如有人用曲别针盒, 使文件被清除 6
保障数据安全的方式 如何有效地保护数据安全 数据备份是关键数据检查是保证用户的责任是基础 数据不慎丢失后 尽可能的进行数据恢复 最重要是数据备份 有备无患! 7
本章内容 数据安全 数据备份数据容灾数据恢复 8
数据备份 9 数据备份 : 指计算机系统中硬盘上的数据, 通过适当的形式转录到其他的保存介质 ( 如硬盘 磁带 软磁盘 光盘等 ) 上. 以便需要时调入计算机网络系统使用数据备份的方法备份到磁盘通过网络备份到其他计算机刻录到光盘备份通过其他载体备份本地和异地备份相结合
数据备份工作的原则 10 数据安全是一项常备不懈的工作并不是谁都有能力采用双机群集 在线备份技术和设备, 经常是手工备份, 但却是人人都能做到的备份工作可分为六原则建立严格的备份制度, 落实到具体的人备份应进行全面性备份或关键数据备份建立多套备份建立备份的时间策略做好备份的登记工作 备份数据的检查
数据备份 ( 续 ) 11 数据备份时间 应选择服务器活动量最少时进行备份, 一般在下班前或中午, 如果有时时备份软件则更好 ; 建立备份的时间, 按天分, 标好星期一到星期天的每一次, 或根据业务按周分, 到那一天备份到那里, 既不乱也实现多套备份对备份数据进行定期检查 查现有数据和原有数据对比大小 看备份文件的时间, 是不是最新的 看看文件全不全
数据备份 ( 续 ) 数据进行数据恢复试验 要求 : 所有的数据都必须可随时用于恢复, 安全的话, 把现有数据建立一套和使用系统一样的, 把数据还原, 进入系统做检查, 只有检查了才放心 数据备份注意事项 所有的数据备份情况都要进行记录 所做的备份都要进行相应的标记 定期检查在现场与非现场的备份介质 ( 例如, 磁带 磁盘 ) 是否存储在物理安全的位置 并检查备份介质是否放在防火的地方或其它抗干扰 防腐蚀的地方 12
常用的备份方式 数据备份的策略 完全备份 (Full Backup) 增量备份 (Incremental Backup) 差分备份 (Differential Backup) 13
常用的备份方式 完全备份 : 是指用一盘磁带对整个系统进行包括系统和数据的完全备份 14
常用的备份方式 增量备份 : 每次备份的数据只是相当于上一次备份后增加的和修改过的数据 15
常用的备份方式 差分备份 : 每次备份的数据是相对于上一次全备份之后新增加的和修改过的数据 16
主流存储技术 RAID:Redundant Array of Independent Disk, 独立冗余磁盘阵列 SAN: Storage Area Network, 存储区域网 NAS: Network Attached Storage, 网络附加存储设备, 网络磁盘阵列 LAN-free 17
RAID 18 RAID:Redundant Array of Independent Disk, 独立冗余磁盘阵列 加州大学伯克利分校 1987 年提出, 最初是为了组合小的廉价磁盘来代替大的昂贵磁盘, 同时希望磁盘失效时不会使对数据的访问受损失而开发出一定水平的数据保护技术 RAID 就是一种由多块廉价磁盘构成的冗余阵列, 在操作系统下是作为一个独立的大型存储设备出现 RAID 可以充分发挥出多块硬盘的优势, 可以提升硬盘速度, 增大容量, 提供容错功能够确保数据安全性, 易于管理的优点, 在任何一块硬盘出现问题的情况下都可以继续工作, 不会受到损坏硬盘的影响
RAID 0 RAID 0 可以把多块硬盘连成一个容量更大的硬盘群, 可以提高磁盘的性能和吞吐量 RAID 0 没有冗余或错误修复能力, 成本低, 要求至少两个磁盘, 一般只是在那些对数据安全性要求不高的情况下才被使用 19
RAID 1 RAID 1 称为磁盘镜像 : 把一个磁盘的数据镜像到另一个磁盘上, 在不影响性能情况下最大限度的保证系统的可靠性和可修复性上, 具有很高的数据冗余能力, 但磁盘利用率为 50%, 故成本最高, 多用在保存关键性的重要数据的场合 20
RAID 5 RAID 5 可以理解为是 RAID 0 和 RAID 1 的折衷方案, 但没有完全使用 RAID 1 镜像理念, 而是使用了 奇偶校验信息 来作为数据恢复的方式, 与下面的 RAID10 不同 21
RAID 5 RAID 5 是一种存储性能 数据安全和存储成本兼顾的存储解决方案 以四个硬盘组成的 RAID 5 为例, 其数据存储方式如图所示 : 图中,Ap 为 A1,A2 和 A3 的奇偶校验信息, 其它以此类推 由图中可以看出,RAID 5 不对存储的数据进行备份, 而是把数据和相对应的奇偶校验信息存储到组成 RAID5 的各个磁盘上, 并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上 当 RAID5 的一个磁盘数据发生损坏后, 利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据 22
RAID 5 23 至少使用 3 块硬盘 ( 也可以更多 ) 组建 RAID5 磁盘阵列 当有数据写入硬盘的时候, 按照 1 块硬盘的方式就是直接写入这块硬盘的磁道 如果是 RAID5 的话这次数据写入会根据算法分成 3 部分, 然后写入这 3 块硬盘, 写入的同时还会在这 3 块硬盘上写入校验信息 当读取写入的数据的时候会分别从 3 块硬盘上读取数据内容, 再通过检验信息进行校验 当其中有 1 块硬盘出现损坏的时候, 就从另外 2 块硬盘上存储的数据可以计算出第 3 块硬盘的数据内容 也就是说 raid5 这种存储方式只允许有一块硬盘出现故障, 出现故障时需要尽快更换
RAID 10 24 RAID10 也被称为镜象阵列条带 象 RAID0 一样, 数据跨磁盘抽取 ; 象 RAID1 一样, 每个磁盘都有一个镜象磁盘, 所以 RAID 10 的另一种会说法是 RAID 0+1 RAID10 提供 100% 的数据冗余, 支持更大的卷尺寸, 但价格也相对较高 对大多数只要求具有冗余度而不必考虑价格的应用来说,RAID10 提供最好的性能 使用 RAID10, 可以获得更好的可靠性, 因为即使两个物理驱动器发生故障 ( 每个阵列中一个 ), 数据仍然可以得到保护
RAID 10 25
RAID 总结 26
主流存储技术 SAN: Storage Area Network(SAN 存储区域网 ) 是指独立于服务器网络系统之外的高速光纤存储网络 采用高速光纤通道作为传输体, 以 SCSI-3 协议作为存储访问协议 将存储系统网络化, 实现真正的高速共享存储 27
主流存储技术 NAS: Network Attached Storage 网络附加存储设备 (NAS) 是一种专业的网络文件存储及文件备份设备, 或称为网络直联存储设备 网络磁盘阵列 一个 NAS 里面包括核心处理器, 文件服务管理工具, 一个或者多个的硬盘驱动器用于数据的存储 NAS 可以应用在任何的网络环境当中 主服务器和客户端可以非常方便地在 NAS 上存取任意格式的文件, 包括 SMB 格式 (Windows)NFS 格式 (Unix, Linux) 和 CIFS 格式等等 NAS 系统可以根据服务器或者客户端计算机发出的指令完成对内在文件的管理 另外 : 独立于操作平台, 不同类的文件共享, 交叉协议用户安全性 / 许可性, 浏览器界面的操作 / 管理, 和不 28 会中断网络的增加和移除服务器
主流备份技术 - LAN-free 备份 29 数据不经过局域网直接进行备份, 即用户只需将磁带机或磁带库等备份设备连接到 SAN 中, 各服务器就可以把需要备份的数据直接发送到共享的备份设备上, 不必再经过局域网链路 由于服务器到共享存储设备的大量数据传输是通过 SAN 网络进行的, 局域网只承担各服务器之间的通信 ( 而不是数据传输 ) 任务 特点 : 为每台服务器配备光纤通道适配器和特定的管理软件 缺点 : 服务器参与了将备份数据从一个存储设备转移到另一个存储设备的过程, 在一定程度上占用了宝贵的 CPU 处理时间和服务器内存 ; 恢复能力不好
主流备份技术 - 无服务器备份 无服务器备份 (Serverless) 是 LAN-free 的一种延伸, 可使数据能够在 SAN 结构中的两个存储设备之间直接传输, 通常是在磁盘阵列和磁带库之间 备份数据通过数据移动器从磁盘阵列传输到磁带库上 ; 使用 NDMP 网络数据管理协议特点 : 服务器不是主要的备份数据通道, 源设备 目的设备以及 SAN 设备是数据通道的主要部件 大大缩短备份及恢复所用的时间 缺点 : 仍需要备份应用软件 ( 以及其主机服务器 ) 来控制备份过程 存在兼容性问题 恢复功能有待更大改进 30
存储与备份技术发展 随着将来 IP 存储技术在存储网络中占有的强劲优势,LANfree 和无服务器备份技术应用的解决方案将会变得更为普遍 LAN-free 和无服务器备份并非适合所有应用 WAFS(Wide Area File Service, 广域网文件服务 ) 主要面向拥有众多分支机构的大型存储用户提供服务, 有人也把它称为 NAS( 网络附件存储 ) 远程互联解决方案 这一技术的不断成熟, 将为数据的远程备份开辟美好的未来连续数据保护 (CDP) 产品采用一种连续捕获和保存数据变化, 并将变化后的数据独立于初始数据进行保存的方法, 而且该方法可以实现过去任意一个时间点的数据恢复 总体成本和复杂性都要低, 目前已经出现相关产品 31
本章内容 数据安全数据备份 数据容灾数据恢复 32
数据容灾 容灾计划包括一系列应急计划, 具体有 : 业务持续计划 (BCP-Business Continuity Plan) 业务恢复计划 (ERP-Business Recovery Plan) 运行连续性计划 (COOP-Continuity of Operations Plan) 事件响应计划 (IRP-Incident Response Plan) 场所紧急计划 (OEP-Occupant Emergency Plan) 危机通信计划 (CCP-Crisis Communication Plan) 灾难恢复计划 (DRP-Disaster Recovery Plan) 33
数据容灾与数据备份的联系 数据备份是数据容灾的基础数据备份是数据高可用的最后一道防线, 其目的是为了系统数据崩溃时能够快速地恢复数据 容灾不是简单备份真正的数据容灾就是要避免传统冷备份所具有先天不足, 它能在灾难发生时, 全面 及时地恢复整个系统 容灾按其容灾能力的高低可分为多个层次 容灾不仅是技术容灾是一个工程, 不仅包括容灾技术, 还应有一整套容灾流程 规范及其具体措施 34
数据备份技术与容灾技术的功能联系 项 目 数据备份技术 容灾技术 物理硬件故障 是 是 病毒发作 是 部分 防范意外事件 人为误操作 是 部分 人为恶意破坏 是 否 自然灾害 否 是 数据和文件 是 是 应用和设置 部分 是 保护对象 操作系统 部分 是 网络系统 否 是 供电系统 否 是 系统连续性 不保证 保证 系统恢复 数据损失 有少量损失 完全不损失 可恢复到时间点 多个 当前 其他方面 数据管理方式 搬移到离线 在线同步 适用系统规模 任何系统规模 大型系统 35
数据容灾等级 36 第 0 级 : 本地备份 本地保存的冷备份实际上就是上面所指的数据备份 它的容灾恢复能力最弱, 只在本地进行数据备份, 并且被备份的数据磁带只在本地保存, 没有送往异地第 1 级 : 本地备份 异地保存的冷备份在本地将关键数据备份, 然后送到异地保存, 如交由银行保管 灾难发生后, 按预定数据恢复程序恢复系统和数据第 2 级 : 热备份站点备份在异地建立一个热备份点, 通过网络进行数据备份 也就是通过网络以同步或异步方式, 把主站点的数据备份到备份站点 备份站点一般只备份数据, 不承担业务 当出现灾难时, 备份站点接替主站点的业务, 从而维护业务运行的连续性第 3 级 : 活动互援备份主 从系统不再是固定的, 而是互为对方的备份系统 这两个数据中心系统分别在相隔较远的地方建立, 它们都处于工作状态, 并进行相互数据备份 当某个数据中心发生灾难时, 另一 个数据中心接替其工作任务
数据容灾技术 37 互连技术由于容灾涉及到生产站点与冗余站点, 因此将它们连接起来的互联技术在容灾中十分重要 目前, 生产站点与冗余站点之间的连接主要有两种方式 第一种方式为光纤通道连接 ( 例如远距离互联 SAN) 光纤通道连接可以提供很高的性能, 但是成本较高 另一种方式是近期发展的 IP 互联技术, 包括 FCIP ifcp iscsi 等 远程镜像技术数据镜像即把磁盘 ( 或磁盘子系统 ) 中的数据完全复制到另一磁盘 ( 或磁盘子系统 ) 中, 数据在两处的存储方式完全相同 数据镜像首先应用于本地操作, 由于容灾对距离的要求, 便发展成为远程镜像技术, 即生产站点与冗余站点的数据存储方式一致快照技术快照是某时间点磁盘系统中数据的扫描 ( 类似一种数据指针集合 ), 它不包含所有数据信息, 但是用户通过快照与时间信息可以完全得到该时刻的完整数据
数据容灾技术 ( 续 ) 存储虚拟化 存储虚拟化为容灾提供了一种灵活的解决方案, 原因在于虚拟化方案在 虚拟 的各类设备之间可以实现容灾功能 存储虚拟化的目标是改善管理和提高利用率 存储虚拟化还可以实现更高层次的管理功能 利用虚拟化特性, 数据管理工具就可以更好地处理快照 复制 按需配置容量, 以及基于策略的决策 卷管理也被认为是虚拟化的一种形式, 而且目前已经成为多数数据中心管理存储网络和大型存储阵列的必备工具 在未来的几年中, 它将会成为入门级存储阵列中的一个标准特性, 并且广泛应用于 IP 存储和入门级存储网络之中 38
IBM IBM 典型应用案例 典型的基于磁盘系统的 PPRC 数据级灾难备份解决方案应用环境拓扑图 外网 :10.1.1.XX X445-1 IP:172.31.1.11 ESSNet:172.31.1.XX X445-2 IP:172.31.1.12 本地生产中心 远程备份中心 D V D 2109F16 D V D D V D 2109F16 D V D ESS1c1:172.31.1.1 ESS1c2:172.31.1.2 39 Console:172.31.1.200 ESS1c3:172.31.1.3 ESS1c4:172.31.1.4
本章内容 数据安全数据备份数据容灾 数据恢复 40
数据恢复 41 数据恢复恢复过程主要是将保存在存储介质上的资料重新拼接整理, 即使资料被误删或者硬盘驱动器出现故障, 只要在存储介质的存储区域没有严重受损的情况下, 还是可以通过数据恢复技术将资料完好无损的恢复出来当存储介质 ( 包括硬盘 移动硬盘 U 盘 软盘 闪存 磁带等 ) 由于软件问题 ( 如误删除 病毒 系统故障等 ) 或硬件原因 ( 如震荡 撞击 电路板或磁头损坏 机械故障等 ) 导致数据丢失时, 便可通过数据恢复技术把资料全部或者部分还原因此, 数据恢复技术分为 : 软件问题数据恢复技术硬件问题数据恢复技术
数据恢复 ( 续 ) 软件问题数据恢复软件问题, 如由格式化误删或者病毒引起的资料损失的情况下, 大部分数据通过数据恢复软件 ( 如 Easyrecovery FinalData Recovery my file 等 ), 加上一些使用技巧和经验, 仍能将恢复的, 除非数据已被完全覆盖 因为损失的只有资料的连接环节, 重新恢复连接资料区连接环节的话, 便可以重新将资料恢复 42
数据恢复 ( 续 ) 43 硬件问题数据恢复而因为硬盘本身问题而无法读取资料时, 需要通过专业的数据恢复工程师, 在无尘环境下维修和更换发生故障的零件便有机会令资料恢复但因存储介质款式繁多, 而且每个品牌或者型号会使用不同的零件, 所以专业数据恢复公司会建立了完善的零件库, 存储大部分介质的零件, 以配合专业的数据恢复技术服务数据恢复技术是信息技术中一项新兴的高新技术, 由于存储介质的高速发展, 因此这项技术也是在不断发展中
Windows 文件恢复 不小心删除文件怎么办? 可能还在回收站里?Good luck! 使用数据恢复软件, 如 Easy Recovery 插曲 : 出于安全原因, 需要彻底删除文件 360 文件粉粹机 文件格式的影响 NTFS FAT32 exfat 44
WD Backup 45
小结 数据备份 完全备份增量备份差分备份 数据备份 VS. 数据容灾 46
作业 练习 1 增量备份和差分备份有什么区别? 练习 2 RAID 5 工作原理是什么? 最少需要几块硬盘? 47