管理节点灾难恢复 产品版本 :ZStack 2.3.2 文档版本 :V2.3.2
管理节点灾难恢复 / 版权声明 版权声明 版权所有 上海云轴信息科技有限公司 2018 保留一切权利 非经本公司书面许可, 任何单位和个人不得擅自摘抄 复制本文档内容的部分或全部, 并不得以任何形式传播 商标说明 ZStack 商标和其他云轴商标均为上海云轴信息科技有限公司的商标 本文档提及的其他所有商标或注册商标, 由各自的所有人拥有 注意您购买的产品 服务或特性等应受上海云轴公司商业合同和条款的约束, 本文档中描述的全部或部分产品 服务或特性可能不在您的购买或使用范围之内 除非合同另有约定, 上海云轴公司对本文档内容不做任何明示或暗示的声明或保证 由于产品版本升级或其他原因, 本文档内容会不定期进行更新 除非另有约定, 本文档仅作为使用指导, 本文档中的所有陈述 信息和建议不构成任何明示或暗示的担保 文档版本 :V2.3.2 I
管理节点灾难恢复 / 目录 目录 版权声明... I 1 简介...1 2 前提...2 3 管理节点灾难恢复... 3 术语表... 5 II 文档版本 :V2.3.2
管理节点灾难恢复 / 1 简介 1 简介 使用 ZStack 过程中, 管理节点可能因为硬件故障或系统崩溃导致无法进入系统, 此时只需在其他机器上重新安装 ZStack, 恢复相应的数据库即可对 ZStack 进行灾难恢复 文档版本 :V2.3.2 1
管理节点灾难恢复 / 2 前提 2 前提 定时备份数据库 ZStack 云管理平台首次安装后, 默认会自动备份数据库, 默认每天凌晨 12 点半和中午 12 点半, 各备 份一次数据库, 最多保留 14 次备份数据 可通过 crontab -l 查看 30 0,12 * * * zstack-ctl dump_mysql --keep-amount 14 如果管理节点长期运行在高负载状态, 建议调整备份频率和保留备份次数, 通过 crontab -e 修改为 以下状态 表示每小时的 30 分, 进行一次数据库备份, 最多保留 200 次备份数据 30 * * * * zstack-ctl dump_mysql --keep-amount 200 异地备份数据库 ZStack 云管理平台的数据库默认备份在管理节点的 /var/lib/zstack/mysql-backup/ 目录 为防止管理 节点出现故障不能进入系统, 建议在额外节点进行相应的数据库备份 假定管理节点的 IP 地址为 172.20.12.16, 异地备份机器的 IP 地址为 172.20.12.75, 进行异地备 份, 请在异地备份机器 172.20.12.75 上执行以下步骤 : ssh-keygen # 在异地备份机器上生成 ssh key 公钥 ssh-copy-id root@172.20.12.16 # 拷贝 ssh key 公钥到管理节点, 期间需手动输入 yes 和 root 密码 异地数据库冗余备份 如果有多台机器可做冗余备份, 可以在其他机器上同时进行异地数据库备份, 增加数据库的多备 份 在异地备份机器 172.20.12.75 上, 通过 crontab -e 修改 crontab, 使用 rsync 远程拷贝管理节点存放的 数据库目录来进行定时异地备份 50 * * * * rsync -av root@172.20.12.16:/var/lib/zstack/mysql-backup/ /mysql-backup/ # 每小时的 50 分, 将管理节点 172.20.12.16 的 /var/lib/zstack/mysql-backup/ 目录, 直接同步到异地备份机器的 /mysql-backup/ 目录下 2 文档版本 :V2.3.2
管理节点灾难恢复 / 3 管理节点灾难恢复 3 管理节点灾难恢复 背景信息 操作步骤 假如管理节点因硬件或软件故障无法进入系统, 可参考以下步骤进行恢复 1. 安装管理节点操作系统 参考 ZStack 官方的 ISO 进行操作系统的安装, 选择原本的管理节点重新安装管理节点操作系 统, 或选择新的机器作为管理节点 2. 安装 ZStack 参考 ZStack 官网的安装文档进行安装 3. 恢复数据库 注 : 请选择系统出现故障时的版本进行安装 假定在出现故障前,ZStack 版本为 2.2.3, 则建议安装 ZStack 2.2.3 待恢复数据库后, 再进行升级 ZStack 到最新版本 在异地备份的机器上, 选择最后一次的数据库备份文件 其文件命名类似以下格式 : zstack-backup-db-2016-12-07_14-43-43.gz # 代表在 2016 年 12 月 7 日 14 点 43 分 43 秒进行的数据库备份 将此文件拷贝到新安装的 ZStack 机器上 假定存放在 /root/ 目录 执行以下命令进行数据库恢 复 恢复数据库之前,ZStack 会再次对当前的数据库进行备份 恢复过程中会停止相关的管理 节点服务 zstack-ctl restore_mysql -f /root/zstack-backup-db-2016-12-07_14-43-43.gz --mysql-rootpassword zstack.mysql.password #-f 参数代表选择 /root/zstack-backup-db-2016-12-07_14-43-43.gz 进行数据库恢复 #--mysql-root-password zstack.mysql.password 参数代表指定使用 zstack.mysql.password 作为 mysql 的 root 密码进行恢复 注 : 如果恢复前管理节点同时作为计算节点添加进入物理机列表, 那么此计算节点不可 恢复, 需手动删除 文档版本 :V2.3.2 3
管理节点灾难恢复 / 3 管理节点灾难恢复 如果恢复前管理节点有修改过 consoleproxyoverriddenip 的值, 同时需要在新管理 节点修改以下文件的 consoleproxyoverriddenip 配置以恢复原本设置 /usr/local/zstack/apache-tomcat/webapps/zstack/web-inf/classes/zstack.properties 如果管理机器数据库备份未同步到异地备份机器上, 就发生了灾难, 无法修复 参考本文档的恢复方法, 可能存在一个小时的数据误差 此时间段内创建的云主 机, 数据恢复后, 可能会变成不受控制的云主机 但是其他云主机的状态会直接同 步原本物理机的状态 4 文档版本 :V2.3.2
管理节点灾难恢复 / 术语表 术语表 区域 (Zone) ZStack 中最大的一个资源定义, 包括集群 二层网络 主存储等资源 集群 (Cluster) 一个集群是类似物理主机 (Host) 组成的逻辑组 在同一个集群中的物理主机必须安装相同的操作系统 ( 虚拟机管理程序,Hypervisor), 拥有相同的二层网络连接, 可以访问相同的主存储 在实际的数据中心, 一个集群通常对应一个机架 (Rack) 管理节点 (Management Node) 安装系统的物理主机, 提供 UI 管理 云平台部署功能 计算节点 (Compute Node) 也称之为物理主机 ( 或物理机 ), 为云主机实例提供计算 网络 存储等资源的物理主机 主存储 (Primary Storage) 用于存储云主机磁盘文件的存储服务器 支持本地存储 NFS Ceph FusionStor Shared Mount Point 等类型 镜像服务器 (Backup Storage) 也称之为备份存储服务器, 主要用于保存镜像模板文件 建议单独部署镜像服务器 镜像仓库 (Image Store) 镜像服务器的一种类型, 可以为正在运行的云主机快速创建镜像, 高效管理云主机镜像的版本变迁以及发布, 实现快速上传 下载镜像, 镜像快照, 以及导出镜像的操作 云主机 (VM Instance) 运行在物理机上的虚拟机实例, 具有独立的 IP 地址, 可以访问公共网络, 运行应用服务 镜像 (Image) 云主机或云盘使用的镜像模板文件, 镜像模板包括系统云盘镜像和数据云盘镜像 文档版本 :V2.3.2 5
管理节点灾难恢复 / 术语表 云盘 (Volume) 云主机的数据盘, 给云主机提供额外的存储空间, 共享云盘可挂载到一个或多个云主机共同使用 计算规格 (Instance Offering) 启动云主机涉及到的 CPU 数量 内存 网络设置等规格定义 云盘规格 (Disk Offering) 创建云盘容量大小的规格定义 二层网络 (L2 Network) 二层网络对应于一个二层广播域, 进行二层相关的隔离 一般用物理网络的设备名称标识 三层网络 (L3 Network) 云主机使用的网络配置, 包括 IP 地址范围 网关 DNS 等 公有网络 (Public Network) 由因特网信息中心分配的公有 IP 地址或者可以连接到外部互联网的 IP 地址 私有网络 (Private Network) 云主机连接和使用的内部网络 L2NoVlanNetwork 物理主机的网络连接不采用 Vlan 设置 L2VlanNetwork 物理主机节点的网络连接采用 Vlan 设置,Vlan 需要在交换机端提前进行设置 VXLAN 网络池 (VXLAN Network Pool) VXLAN 网络中的 Underlay 网络, 一个 VXLAN 网络池可以创建多个 VXLAN Overlay 网络 ( 即 VXLAN 网络 ), 这些 Overlay 网络运行在同一组 Underlay 网络设施上 VXLAN 网络 (VXLAN) 使用 VXLAN 协议封装的二层网络, 单个 VXLAN 网络需从属于一个大的 VXLAN 网络池, 不同 VXLAN 网络间相互二层隔离 6 文档版本 :V2.3.2
管理节点灾难恢复 / 术语表 云路由 (vrouter) 云路由通过定制的 Linux 云主机来实现的多种网络服务 安全组 (Security Group) 针对云主机进行第三层网络的防火墙控制, 对 IP 地址 网络包类型或网络包流向等可以设置不同的安全规则 弹性 IP(EIP) 公有网络接入到私有网络的 IP 地址 快照 (Snapshot) 某一个时间点上某一个磁盘的数据备份 包括自动快照和手动快照两种类型 文档版本 :V2.3.2 7