HOL-1704-CHG-2

Similar documents
HOL-CHG-1695

Basic System Administration


Symantec™ Sygate Enterprise Protection 防护代理安装使用指南

HOL-1706-SDC-5-ZH

手册 doc


ebook140-9

Chapter #

Cloudy computing forEducation

... 3 vsphere Hypervisor ESXi ESXi DCUI...4 NVIDIA GRID...4 Horizon with GRID vgpu...4 Horizon with GRID vdga.


Microsoft Word - install_manual-V _CN.docx

ebook140-11

F515_CS_Book.book

Microsoft Word - 03.doc

册子0906

IBM Rational ClearQuest Client for Eclipse 1/ IBM Rational ClearQuest Client for Ecl

Autodesk Product Design Suite Standard 系统统需求 典型用户户和工作流 Autodesk Product Design Suite Standard 版本为为负责创建非凡凡产品的设计师师和工程师提供供基本方案设计和和制图工具, 以获得令人惊叹叹的产品

1 SQL Server 2005 SQL Server Microsoft Windows Server 2003NTFS NTFS SQL Server 2000 Randy Dyess DBA SQL Server SQL Server DBA SQL Server SQL Se

1 o o o CPU o o o o o SQL Server 2005 o CPU o o o o o SQL Server o Microsoft SQL Server 2005

0 配置 Host MIB 设备 V ( 简体版 ) 0 Update: 2016/1/30

快 速 入 门 (Linux) 概 述 文 档 目 的 本 文 档 介 绍 了 如 何 快 速 创 建 Linux 系 统 实 例 远 程 连 接 实 例 部 署 环 境 等 旨 在 引 导 您 一 站 式 完 成 实 例 的 创 建 登 录 和 快 速 环 境 部 署 云 服 务 器 ECS 实

TPM BIOS Infineon TPM Smart TPM Infineon TPM Smart TPM TPM Smart TPM TPM Advanced Mode...8

一 登录 crm Mobile 系统 : 输入 ShijiCare 用户名和密码, 登录系统, 如图所示 : 第 2 页共 32 页

X713_CS_Book.book

IP505SM_manual_cn.doc

untitled

ebook140-8

untitled

1 IT IT IT IT Virtual Machine, VM VM VM VM Operating Systems, OS IT

ChinaBI企业会员服务- BI企业

05 01 X Window X Window Linux Linux X Window X Window Webmin Web Linux Linux X Window X Window Notebook PC X Window X Window module Linux Linux kernel

HOL VWS

ebook 185-6

<55342D323637CBB5C3F7CAE92E786C73>

Chapter 2

AXIS P7224 Video Encoder Blade – Installation Guide

Windows XP

AL-MX200 Series


ebook66-15

HOL-1757-MBL-3-ZH

ebook 132-2

Cadence SPB 15.2 VOICE Cadence SPB 15.2 PC Cadence 3 (1) CD1 1of 2 (2) CD2 2of 2 (3) CD3 Concept HDL 1of 1

Microsoft Word - PS2_linux_guide_cn.doc

水晶分析师

HOL-1708-CHG-3-ZH

Desktop Management Guide

IDEO_HCD_0716

目录 1 IPv6 快速转发 IPv6 快速转发配置命令 display ipv6 fast-forwarding aging-time display ipv6 fast-forwarding cache ipv6 fas

AL-M200 Series

Windows 2000 Server for T100

NT 4

校友会系统白皮书feb_08

Progress Report of BESIII Slow Control Software Development

Kubenetes 系列列公开课 2 每周四晚 8 点档 1. Kubernetes 初探 2. 上 手 Kubernetes 3. Kubernetes 的资源调度 4. Kubernetes 的运 行行时 5. Kubernetes 的 网络管理理 6. Kubernetes 的存储管理理 7.

ch08.PDF

Sun Storage Common Array Manager 阵列管理指南,版本 6.9.0

在 Hitachi AMS 2000 系列上应用 VMware VAAI 的优势

2005 Sun Microsystems, Inc Network Circle, Santa Clara, CA U.S.A. Sun Sun Berkeley BSD UNIX X/Open Company, Ltd. / Sun Sun Microsystems Su

epub 61-2

User Group SMTP

穨IC-1000

1 1 大概思路 创建 WebAPI 创建 CrossMainController 并编写 Nuget 安装 microsoft.aspnet.webapi.cors 跨域设置路由 编写 Jquery EasyUI 界面 运行效果 2 创建 WebAPI 创建 WebAPI, 新建 -> 项目 ->

A9RF716.tmp

+01-10_M5A_C1955.p65

P4i45GL_GV-R50-CN.p65

Mohamed

WebSphere Studio Application Developer IBM Portal Toolkit... 2/21 1. WebSphere Portal Portal WebSphere Application Server stopserver.bat -configfile..

6112 http / /mops.tse.com.tw http / /

2 2 3 DLight CPU I/O DLight Oracle Solaris (DTrace) C/C++ Solaris DLight DTrace DLight DLight DLight C C++ Fortran CPU I/O DLight AM

T1028_Manual_KO_V3 0.pdf


Microsoft Word - Web Dynpro For ABAP跟踪测试工具简介 _2_.doc

BYOD IP+Optical (IP NGN) API 4. End-to-End (Service Aware) 5. IP NGN (IP Next Generation Network) ( ) Prime Carrier Management Access Edge Co

目录 1 H3C R4900 G2 服务器可选部件与操作系统兼容性列表 控制卡 GPU 卡 网卡 FC HBA 卡 TPM/TCM 模块 NVMe SSD PCle 加速卡 1-31 i

投影片 1

untitled

李 琼 评扎迪 史密斯的 白牙 要是他 指艾伯特 加勒比海移民 真的回去 了 那么他将要面临的失败是明摆在那儿的 因为当地并没有发生什么变化 这就是移民的悲剧 他们比他们离弃的故乡变化得更 快 于是他们永远也不可能因回到家乡而感 到幸福 可是 他们在移居的国家也不幸福 因为这不是家乡 瞿世镜

自由軟體教學平台

典型自编教材

互动演示 诺基亚在线客户服务 软件 诺基亚客户服务网络支持可为您提供有关诺基亚在线服务的更多信息 互动演示通过该演示可了解应如何对手机进行设置, 并可掌握手机的更多功能 互动演示提供了有关手机使用方法的分步说明 用户手册在线用户手册包含有关手机的详细信息 切记应定期查看内容更新 用户手册 软件利用手

六域链联盟 SDChain-Matrix 节点搭建指南 2018/07/26 Version : 1.0.0

(Veritas\231 System Recovery 16 Monitor ????)

燃烧器电子控制系统 目录 2

Oracle Solaris Studio makefile C C++ Fortran IDE Solaris Linux C/C++/Fortran IDE "Project Properties" IDE makefile 1.

HP 3PAR StoreServ 7000 Storage SmartStart 1.3 软件发行说明

制 智能 箱 : 使 和 September 8, 2017 玩点什么 : 1

帝国CMS下在PHP文件中调用数据库类执行SQL语句实例

2Office 365 Microsoft Office 365 Microsoft Office Microsoft Office Microsoft Office 365 Office (Office Web Apps) Office WindowsMAC OS Office 365 Offic

HPE LeftHand OS 12.5 版发行说明

A API Application Programming Interface 见 应 用 程 序 编 程 接 口 ARP Address Resolution Protocol 地 址 解 析 协 议 为 IP 地 址 到 对 应 的 硬 件 地 址 之 间 提 供 动 态 映 射 阿 里 云 内

LTM Management Console

WinMDI 28

《计算机网络》实验指导书

untitled


<C8EBC3C5C6AAA3A8B5DA31D5C2A3A92E696E6464>

Transcription:

Table of Contents 练习概述 - - vsphere 6 挑战练习... 2 练习指导... 3 第 1 单元 : 在实践中学习 (30 分钟 )... 8 剪贴板复制和粘贴功能无法使用?... 9 虚拟机性能不佳... 19 第 2 单元 : 基本运维挑战 (30 分钟 )... 35 无法登录 vsphere Web Client... 36 vsphere Web Client 中存在空白清单 请求帮助!... 42 VMRC 不允许我连接到虚拟机... 45 SSH 为何无法在 ESXi 主机上正常运行?... 51 第 3 单元 : 基本性能挑战 (30 分钟 )... 55 为什么我的虚拟机很慢?... 56 对性能低下的虚拟机执行故障排除... 78 第 4 单元 : 高级运维挑战 (30 分钟 )... 95 为什么我的 ESXi 主机总是断开连接?!... 96 无法使用 SSO 管理员帐户登录到 vcenter 以分配权限 (SSO 管理员帐户已锁定 )...106 无法将服务器置于维护模式... 109 第 5 单元 : 高级性能挑战 (30 分钟 )... 118 存储性能低下... 119 vnuma 故障排除... 147 单元提示... 159 第 1 单元 : 在实践中学习... 160 第 2 单元 : 基本运维挑战... 162 第 3 单元 : 基本性能挑战... 164 第 4 单元 : 高级运维挑战... 165 第 5 单元 : 高级性能挑战... 167 总结... 168 Page 1

练习概述 - - vsphere 6 挑战练习 Page 2

练习指导 vsphere 6 挑战练习要求您认真考虑如何节省时间! 每个单元都会为您提供一个不同的虚构场景, 需要您修复常见的 vsphere 运维和性能问题 您是否遇到过因主机或虚拟机断开连接导致您无法在其中启动远程控制台的情况? 虚拟机是否莫名其妙地出现性能下降? 在本练习中, 您将了解如何解决这些问题及更多内容 您走进了一幢高大的玻璃建筑, 这时您看了一眼手表, 刚好是早上 9 点 现在是 2096 年, 您在这家令人向往的企业里的另一个工作日就这样开始了, 这家公司名为 PanContinental Teleportation Corporation PanContinental Teleportation 可在全球范围内瞬时移动人和物 快速付款之后, 任何人都可以进入一个像电话亭一样遍布全球各大城市的 Waypoint 中 他们只需选择自己的目的地, 就可以瞬间出现在其他任何一个 Waypoint 中 但是,PanContinental 技术并非魔术 事实上, 它由主要数据中心 ( 即您刚刚步入的那幢闪闪发光的建筑 ) 和 vsphere 6.0 提供技术支持 作为规模最大 最值得信赖的全球远程传送网络,PanContinental 的头等要务是要确保客户的安全性及业务的连续性 这一重任落在了您和同事的肩上 接下来的单元会考验您的才能, 看您能否确保远程传送网络顺利运行 本练习最适合具备一定 vsphere 经验的人员, 或已完成部分练习的人员, 如 HOL-1710-SDC-1:vSphere 6 with Operations Management 或 HOL-1704-SDC-1:vSphere 6 性能优化 学习本练习内容需要两个小时以上, 因此您可能无法一次性学完 因为 vsphere 6 挑战练习需要执行故障排除, 所以您的实际完成时间可能会不同于以下所列时长 我们对整个过程中提供可选提示, 同时还提供各项挑战的最终解决方案 建议您先从第 1 单元开始, 然后再转到您最感兴趣的任意单元 如果您已经完成第 1 单元, 则可以转到任意单元继续学习 单击以下任意一个单元开始练习 第 1 单元 - 在实践中学习 (30 分钟 ) 入职第一天? 没问题 由此开始 第 2 单元 - 基本运维挑战 (30 分钟 ) 本单元要求您解决常见的 vsphere 运维问题, 包括 vsphere Web Client 出现空白清单 虚拟机远程控制台无法正常运行等 第 3 单元 - 基本性能挑战 (30 分钟 ) 您能否识别并解决常见的 vsphere 性能问题? 第 4 单元 - 高级运维挑战 (30 分钟 ) 通过修复 vsphere 中诸如 ESXi 主机断开连接 vcenter Server 运行状况警报等运维问题, 让数据中心恢复正常 第 5 单元 - 高级性能挑战 (30 分钟 ) 如果您能解决这些比较少见的存储性能和 vnuma 问题, 我们会对您刮目相看 练习负责人 :Nick Fritsch 和 Tony Okwechime 本练习手册可以从动手练习文档站点下载, 网址为 : http://docs.hol.vmware.com/hol-2017/hol-1704-chg-2_pdf_en.pdf Page 3

本练习可能提供其他语言版本 要设置语言首选项并在练习中部署本地化手册, 可以在本文档的帮助指导下完成 : http://docs.hol.vmware.com/announcements/nee-default-language.pdf 主控制台的位置 1. 红框区域包含主控制台 练习手册位于主控制台右侧的选项卡上 2. 特定练习可能会需要其他控制台, 分别位于左上角单独的选项卡上 如有需要, 系统将引导您打开其他的特定控制台 3. 练习时间为 90 分钟, 由计时器计时 练习结果无法保存 所有工作必须在练习过程中完成 但是您可以单击 EXTEND( 延长 ) 延长时间 在 VMware 活动期间, 您可以将练习时间延长两次, 最多可延长 30 分钟 每单击一次可延长 15 分钟 非 VMware 活动期间, 最多可将练习时间延长至 9 小时 30 分钟 每单击一次可延长一小时 激活提示或水印 首次开始练习时, 您可能会注意到桌面上有一个水印, 提示 Windows 尚未激活 虚拟化的一个主要优势在于, 可以在任意平台上移动和运行虚拟机 本动手练习利用了这一优势, 我们可以运行多个数据中心内的练习 但是, 这些数据中心的处理器可能不同, 这就需要通过 Internet 进行 Microsoft 激活检查 请放心,VMware 和本动手练习完全符合 Microsoft 的许可要求 您使用的练习是一个独立的单元, 没有对 Internet 的完全访问权限, 而 Windows 需要该权限才能验证激活 如果没有对 Internet 的完全访问权限, 此自动化过程会失败, 并且显示此水印 Page 4

这个问题无关紧要, 不会影响到您的练习 用键盘输入数据的替代方法 在本单元中, 您将向主控制台中输入文本 除直接输入外, 还有两种非常有用的数据输入方法, 可简化输入复杂数据的过程 单击, 将练习手册内容拖放到控制台的活动窗口 也可以单击, 将文本和命令行界面 (CLI) 命令直接从练习手册拖放到主控制台中的活动窗口 访问在线国际键盘 您还可以使用主控制台中的在线国际键盘 1. 单击 Windows 快速启动任务栏上的键盘图标 Page 5

在活动的控制台窗口中单击一下 在本例中, 您将使用在线键盘输入电子邮件地址中所使用的 @ 符号 在美式键盘布局上, 要输入 @ 符号需要按住 Shift 并按 2 1. 在活动的控制台窗口中单击一下 2. 单击 Shift 键 单击 @ 键 1. 单击 @ 键 你会注意到活动控制台窗口中输入了 @ 符号 Page 6

查看屏幕右下部分 请检查是否完成练习的所有启动例程, 以及是否准备好开始练习 如果您看到 Ready( 准备就绪 ) 以外的内容, 请等待几分钟 如果 5 分钟后, 您的练习仍未变为 Ready( 准备就绪 ), 请寻求帮助 Page 7

第 1 单元 : 在实践中学习 (30 分钟 ) Page 8

剪贴板复制和粘贴功能无法使用? 您的新同事 Murphy 请您帮助他处理在使用全新虚拟机 linux-base-01 时遇到的一些问题 这个虚拟机十分重要, 因为 Murphy 需要通过它的剪贴板复制和粘贴功能将来自研究实验室的关键信息传输到该虚拟机中 收到全新虚拟机 linux-base-01 后,Murphy 无法从他的研究笔记本电脑里将剪贴板信息复制 / 粘贴到虚拟机中 因此他需要依靠您这位 VMware vsphere 专家来帮助他对这一问题进行故障排除 故障排除指导原则 : 要对该挑战进行故障排除, 请在必要时通过 Internet 探索相应的解决方案 如果您正在全屏模式下观看此练习, 可按 F11 键禁用全屏模式, 然后访问 Internet 对于使用非美式键盘的用户 如果您使用的是非美式键盘, 则在本练习过程中可能难以输入 CLI 命令或者用户名和密码 以下几种方案可帮助您解决此问题 方案 1: 在任务栏上, 单击键盘图标打开可单击的屏幕键盘 Page 9

对于使用非美式键盘的用户 方案 2: 打开桌面上的 README.txt 此文件中包含适用于 vsphere 6 挑战练习的所有凭证和编写好的输入命令 这样, 您便可以根据需要复制和粘贴这些内容 Page 10

对于使用非美式键盘的用户 方案 3: 最后, 利用 VMware Learning Platform 的 Send Text( 发送文本 ) 选项, 您可以使用本机键盘输入文本并将其发送到练习桌面 单击练习控制台左上角的 Send Text( 发送文本 ) 按钮 此时会打开一个窗口, 您可以在其中输入文本 ; 然后单击 Send( 发送 ) 等待练习状态 : 准备就绪 在桌面控制台的右下角, 您将看到以绿色或红色显示的 Lab Status( 练习状态 ) 字样 现在就请在动手练习桌面上查找此内容 如果 Lab Status( 练习状态 ) 为绿色, 请转到下一页立即开始练习 如果 Lab Status( 练习状态 ) 为红色, 请勿开始练习 这表示我们仍在准备您的虚拟环境 请等待 Lab Status( 练习状态 ) 变为绿色并显示 Ready( 准备就绪 ) 有时, 这个过程可能需要 10 分钟以上 如果 Lab Status( 练习状态 ) 显示为 Ready( 准备就绪 ), 请转到下一页开始练习 激活提示或水印 首次开始练习时, 您可能会注意到桌面上有一个水印, 提示 Windows 尚未激活 Page 11

虚拟化的一个主要优势在于, 可以在任意平台上移动和运行虚拟机 本动手练习利用了这一优势, 我们可以运行多个数据中心内的练习 但是, 这些数据中心的处理器可能不同, 这就需要通过 Internet 进行 Microsoft 激活检查 请放心,VMware 和本动手练习完全符合 Microsoft 的许可要求 您使用的练习是一个独立的单元, 没有对 Internet 的完全访问权限, 而 Windows 需要该权限才能验证激活 如果没有对 Internet 的完全访问权限, 此自动化过程会失败, 并且显示此水印 这个问题无关紧要, 不会影响到您的练习 如果您有任何疑问或顾虑, 请随时使用为您提供的支持 您可以通过 VMworld 上动手练习部分的由专家主持的研讨会获得支持, 也可以通过调查评论获得在线支持 我们始终致力于改善您的动手练习体验 打开 vsphere Web Client 在桌面上, 单击 Chrome 浏览器的桌面快捷方式 查找 RegionB Web Client( 区域 B Web Client) 书签 单击该书签 登录 vsphere Web Client 选中 Use Windows session authentication( 使用 Windows 会话身份验证 ), 然后单击 Login( 登录 ) Page 12

导航到 Hosts and Clusters ( 主机和集群 ) 1. 单击 Home( 主页 ) 2. 单击 Hosts and Clusters( 主机和集群 ) Page 13

启动远程控制台 1. 展开 vcsa-01b 上的 QueTip 插件 2. 单击虚拟机 linux-base-01 3. 单击 Summary( 摘要 ) 4. 单击 Launch Remote Console( 启动远程控制台 ) 注意 : 启动远程控制台之前, 请确保 linux-base-01 处于开启状态 Page 14

登录 linux-base-01 使用以下凭证从远程控制台应用登录 linux-base-01: 用户 :holuser( 您无需键入这些信息 ) Password( 密码 ):VMware1! 注意 : 单击 HOL User(HOL 用户 ), 打开待填充的 Password( 密码 ) 字段, 然后输入 VMware1! 将文本复制到 linux-base-01 登录 Murphy 的虚拟机后, 您需要解决他无法将研究信息复制到他创建的文档中这个问题 要访问该文档, 请执行以下操作 : 1. 打开 quantum_teleportation 文件夹 Page 15

2. 打开 protocol.txt 文件 Murphy 在 README.txt 文件的第 1 单元下为您提供了他的研究文本片段, 您可以在主控制台主控制台桌面上找到此信息 注意 : 请将 Chrome 窗口最小化以便访问主控制台桌面上的 README.txt 文件 您的任务 : 1. 修复 linux-base-01 中出现的剪贴板复制 / 粘贴问题 2. 在主控制台主控制台桌面上的 README.txt 文件中, 复制标题第 1 单元下的文本片段 3. 然后, 将其粘贴到 linux-base-01 上 quantum_teleportation 文件夹中的 protocol.txt 文件 需要提示? 查看第 1 条提示 查看第 2 条提示 Page 16

解决方案 有些时候, 您可能想要在虚拟机上启用剪贴板复制 / 粘贴功能, 甚至包括驻留在 ESXi 主机上的虚拟机 然而, 此功能默认处于禁用状态 要启用特定虚拟机的 Copy and Paste( 复制和粘贴 ) 选项, 请执行以下操作 : Page 17

注意 : 必须安装 VMware Tools 才能正常操作 1. 登录 vsphere Web Client 2. 导航到 vcsa-01b 并查找 linux-base-01 3. 关闭虚拟机 (linux-base-01) 4. 选择虚拟机 (linux-base-01), 然后单击 Summary( 摘要 ) 选项卡 5. 单击 Edit Settings( 编辑设置 ) 6. 依次导航到 VM Options( 虚拟机选项 )Advanced( 高级 )Configuration Parameters( 配置参数 )Edit Configuration( 编辑配置 ) 7. 单击 Add Row( 添加行 ), 然后添加配置参数 isolation.tools.copy.disable 并取值 false 8. 再次单击 Add Row( 添加行 ), 然后添加配置参数 isolation.tools.paste.disable 并取值 false isolation.tools.copy.disable = false isolation.tools.paste.disable = false 您可以单击两次 OK( 确定 ) 关闭 Configuration( 配置 ) 对话框, 然后重新启动虚拟机 注意 : 作出以上更改后, 请记住首先启动 linux-base-01, 然后再启动远程控制台 有关更多信息, 可以参阅这篇知识库文章 Page 18

虚拟机性能不佳 针对 Murphy 的虚拟机成功启用剪贴板复制和粘贴功能后, 您感觉不错 然而, 正如墨菲定律所说, 会出错的事总会出错, 还有另一项挑战等待着您 一名 Waypoint 技术人员提出了一份优先级较高的申请, 表示她的 Waypoint 在尝试锁定到某个相位时陷入停顿 延迟导致在该 Waypoint 前形成了一个队列 这可能是 Waypoint 相位选择器虚拟机性能不佳所致 我们需要快速解决这个问题, 那么, 现在就开始吧 打开桌面上的 Challenge Scripts 文件夹 1. 回到动手练习主控制台, 然后打开桌面上的 Challenge Scripts 文件夹 启动第 1 单元的脚本 1. 右键单击 Module1-start.ps1 2. 从上下文菜单中, 选择 Run with PowerShell( 使用 PowerShell 运行 ) 启动第 1 单元的脚本 脚本开始运行, 需要一分钟时间完成 在脚本运行过程中, 请转到下一页 有关如何应对挑战的指导原则 与处理上一项挑战一样, 请在必要时通过 Internet 探索相应的解决方案 Page 19

如果您正在全屏模式下观看此练习, 可按 F11 键禁用全屏模式, 然后访问 Internet 当然, 如果您身边有已连网的移动设备, 也可以用移动设备访问 让我们先来想想有哪些方法可以解决性能问题 请转到下一页 故障排除方法 故障排除的第一步便是找出症结所在 在 vsphere 6 挑战练习中, 我们会告诉您问题解决后将出现哪种行为, 从而简化这一部分的工作 在现实环境中, 将系统性能与其以往性能或不同系统的性能相比较时, 请确保彼此之间具有可比性 如果物理或虚拟基础架构发生了改变, 比较结果可能无效 请记住, 并非所有指导原则或经验法则都适用于您的环境 综合考虑了这些因素后, 您会发现性能问题其实并不存在 很多不同的子系统可能会导致性能问题的发生 上图中的圆圈大致呈现了每个子系统导致出现性能问题的可能性 从统计数据来看, 存储是导致性能问题的最常见原因, 而网络则是不太常见的原因 锁定某个特定的子系统后, 请开动脑筋多想出一些潜在的解决方案 逐一尝试各种潜在的解决方案, 然后重新测试以判断问题是否得到解决 Page 20

如果没有, 请返回实施前的状态 不断重复这一模式, 直至消除潜在的问题根源 Page 21

第 1 单元的脚本结束运行 脚本结束运行后, 系统将显示 You may now close this window( 您现在可以关闭此窗口 ) 实际的显示内容可能有所不同 按两次 Enter 键或使用右上角的关闭按钮关闭窗口 打开 challenge-01a 远程桌面 在桌面上双击 chg-01a.rdp, 打开与虚拟机 challenge-01a 的远程桌面会话 如果您收到弹出式消息 Remote Desktop can't connect to the remote computer...( 远程桌面无法连接到远程计算机...), 请单击 OK( 确定 ), 稍等片刻后重新尝试打开远程桌面 Page 22

challenge-01a 桌面 虚拟机 challenge-01a 上已安装了一些工具, 它们可帮助您监控虚拟机的运行状况 1. 在桌面上, 您可以看到虚拟机的相关信息, 包括它的主机名 IP 地址 CPU 使用情况和内存使用情况 其中 CPU 使用情况和内存使用情况会实时更新 在 CPU 使用情况图表中, 您可以同时看到已使用的 CPU 总量 (Total:[ 总量 :]) 和客户操作系统内核使用的 CPU 用量 (Krnl:[ 内核 :]), 均以百分比表示 2. 双击 SPECjbb 以启动性能衡量应用 SPECjbb2005 此时会打开一个名为 SPECjbb2005 的窗口 challenge-01a 上会安装 SPECjbb2005 的副本 SPECjbb2005 是一个基于 java 的真实 SPEC 基准测试, 可衡量 CPU 和内存性能 Page 23

1. 单击 Start Benchmark( 启动基准测试 ) 按钮启动基准测试 SPECjbb 启动 您需要等待几秒钟时间, 然后基准测试才会开始运行 请转到下一页 SPECjbb 正在运行 1. 当 SPECjbb 开始生成性能结果时, 您将看到 SPECjbb2005 窗口中显示性能分值 分值越高, 表示性能越好 2. 底部的文本文件将实时显示基准测试的输出结果 性能结果以每秒业务操作数 (BOPS) 或吞吐量为衡量标准, 以黄色突出显示 此窗口只用于查看基准测试的执行情况, 关闭此窗口不会影响基准测试的运行 关闭 SPECjbb2005 窗口或单击 Stop Benchmark( 停止基准测试 ), 基准测试即停止运行 不过, 为了分析性能结果, 您应保持基准测试继续运行 Page 24

性能结果每 10 秒更新一次 首次启动 SPECjbb2005 或对环境做出更改时, 您可能需要等待几个更新周期, 性能结果才能达到稳定状态 您的结果可能会不同于此处显示的结果 尽管 SPECjbb2005 基准测试现已停用, 但它仍有助于显示我们虚拟机的性能特征 因为 SPECjbb2005 会在环境中产生负载, 因此不适合用作与生产工作负载一起使用的性能监控工具 在动手练习中, 我们将它用作演示目的 vrealize Operations Manager 专门设计用于监控环境的性能特征 要了解有关 vrealize Operations Manager 的更多信息, 请参阅练习 HOL-1710-SDC-3,vSphere with Operations Managment: 高级主题 3. 您可以在此处同时监控 CPU 和内存的使用情况 请留意在您启动基准测试后它们如何发生的变化 注意 :SPECjbb2005 将在 45 分钟后停止运行 如果发生这种情况, 则必须再次运行 Module1-start.ps1 脚本, 然后在 challenge-01a 上重启 SPECjbb 很遗憾,challenge-01a 的性能分值过低!challenge-01a 控制着 Waypoint 网络的相位选择 ; 如不解决此问题, 路径点将继续保持停顿状态 更糟糕的是, 它们可能会锁定到错误的相位, 乘客可能会因而被重定向到平行空间! 这不利于赢得重复业务 您面临的挑战就是提高性能 您能否让 challenge-01a 稳定状态下的性能翻倍? 不过首先... 您会将此虚拟机托管在什么位置? 又会如何对其进行管理? Page 25

打开 vsphere Web Client 将与 challenge-01a 的远程会话保持为打开状态, 然后导航回 vsphere Web Client 如需要, 请打开 Chrome, 然后单击书签栏中的 RegionA Web Client( 区域 A Web Client) 书签 主机和集群 如需要, 请选中 Use Windows session authentication( 使用 Windows 会话身份验证 ), 然后单击 Login( 登录 ) Page 26

导航到 Hosts and Clusters ( 主机和集群 ) 如果需要, 请在 Home( 主页 ) 页面上单击 Hosts and Clusters( 主机和集群 ) 图标 打开 vsphere Web Client 根据需要展开 vcsa-01a challenge-01a 由 vcenter Server vcsa-01a 进行管理 它与邻近的虚拟机 challenge-02a 一起托管在 esx-02a 上 vsphere 性能图表 要对性能问题进行实时故障排除,vSphere 性能图表将是首选工具 让我们立即试用一下这些图表 如果您熟悉 vsphere 性能图表, 请直接跳到下一步 可在数据中心 集群 资源池 ESXi 主机或虚拟机级别查看性能图表 Page 27

请在 vsphere Web Client 中执行以下操作 : 1. 单击感兴趣的对象 在本例中, 请单击 challenge-01a 2. 单击 Monitor( 监控 ) 选项卡 3. 单击 Performance( 性能 ) 选项卡 4. 您可以查看 Overview( 概述 ) 或 Advanced( 高级 ) 屏幕 眼下, 请单击 Advanced( 高级 ) 5. 单击锁定图标锁定图标隐藏左侧边栏以扩大浏览空间 6. 单击箭头隐藏内部边栏, 以进一步扩大浏览空间 Page 28

vsphere 性能图表 默认情况下,vSphere Web Client 性能图表每 20 秒更新一次, 每次显示一个小时的性能统计数据 您可以通过单击下拉菜单来切换视图 1. 现在, 请单击 Chart Options( 图表选项 ) 以便进一步了解 vsphere 性能图表 Chart Options( 图表选项 ) 屏幕的重要部分已突出显示 此处您无需进行任何单击操作, 因为我们只是概述此屏幕的重要部分 1. 选择您希望从中选择的一组衡量指标 2. 调整图表的时间跨度 3. 对象因衡量指标类型而异 这里的 0 表示虚拟机的首个虚拟 CPU,1 表示虚拟机的第二个虚拟 CPU,challenge-01a 则表示两者的平均值 4. 在此处选择或取消选择图表的衡量指标 Page 29

5. 单击 Cancel( 取消 ) 返回, 而不对图表进行修改 Page 30

vsphere 性能图表 要返回左侧边栏, 1. 请单击 (0) Navigator([0] 导航器 ) 2. 单击锁定图标锁定图标 您面临的挑战 您面临的挑战是让 challenge-01a 的性能翻倍! 如果更改了底层基础架构, 请留出时间 (30-60 秒 ) 让虚拟机的性能达到稳定状态 对于这项挑战, 您可以执行以下操作 : - 修改虚拟机设置 - 通过 vmotion 迁移虚拟机 - 修改资源分配 - 重新启动 SPECjbb 有时, 如果虚拟机上的可用资源非常少,SPECjbb 可能会停止运行, 或者最终在 45 分钟后停止运行 如果 SPECjbb2005 窗口报告 Performance: Not Running( 性能 : 未运行 ), 请关闭 SPECjbb2005 窗口, 然后通过虚拟机的桌面快捷方式将其重新打开 - 如果您出于某种原因需要重新解决这项挑战, 可以重新运行脚本 C:\HOL-CHG\ Module1-start.ps1 这将会重新引导所有虚拟机, 并将一些虚拟机设置恢复为开始应对这项挑战时 Page 31

的状态 请注意, 并非所有设置和虚拟硬件都会重置, 因此, 如果您对环境做出了更改却无法成功应对挑战, 请恢复环境的设置 您不得执行以下操作 : - 重命名所有虚拟机 - 关闭或重新引导任何虚拟机 - 修改 challenge-01a 或 challenge-02a( 运行 Linux 版 SPECjbb2005) 上的任何基准测试参数以改变 SPECjbb 的操作 - 关闭任意虚拟机上的 SPECjbb - 查看 Module1-start.ps1 脚本 ( 这将产生误导 )! 如果您这么做, 就会威胁到远程传送器网络的完整性, 那您今晚可能就回不了家了! 需要提示? 查看第 1 条提示 查看第 2 条提示 如果您感觉自己已经找到答案, 或者决定就此放弃, 请转到下一页 解决方案 就像在现实生活中那样, 解决这一性能问题的方法不只一种 性能低下的根本原因是 CPU 争用或者严重的 CPU 超额分配 challenge-01a 和 challenge-02a 都给 esx-02a 造成了巨大的 CPU 负载 而且, 主机 esx-02a 只有两个核心, 而 challenge-01a 和 challenge-02a 总共有 3 个虚拟 CPU, 且每个都要求达到 100% 的利用率 要提高虚拟机性能, 需消除或缓解资源争用 检测是否存在 CPU 争用的主要方式是监控 ESXi 的衡量指标就绪程度百分比 就绪程度是指虚拟机已准备就绪, 但却不能安排其在物理 CPU 上运行的时间所占的百分比 当虚拟机对 CPU 时间的需求超出物理 CPU 可提供的时间时, 就会发生争用 根据经验, 尽管可接受的就绪时间取决于您的环境, 但如果就绪程度超过 10%,CPU 争用就会对虚拟机性能产生负面影响 您可能已经注意到, 当主机上发生严重的 CPU 争用时,Windows 2012 系统内核似乎会耗用更大比例的虚拟机 CPU 时间 当主机上发生资源争用时,Windows 客户机的 CPU 时间计算可能会出现偏差, 因此, 不要完全相信这些衡量指标 Page 32

如果过于保守的电源管理技术正在减慢 CPU 的速度, 就绪程度也可能会达到较高百分比 ; 请参见知识库文章 1018206( 在新窗口中打开 ) 始终确保将主机的 BIOS 电源管理设置设定为操作系统控制, 且 ESXi 电源管理配置文件为平衡或高性能 针对此场景的解决方案 : 1. 将 challenge-01a 从 ESXi 主机 esx-02a 迁移到 ESXi 主机 esx-01a 由于 esx-01a 未使用, 争用 CPU 资源的虚拟机就更少, 性能因此得以提高 或者, 您可以将 challenge-02a 从 esx-02a 迁移到 esx-01a, 基于同样的原因,esx-01a 当前未投入使用, 因此拥有可用的 CPU 资源 2. 使用资源分配限制分配到 challenge-02a 的 CPU MHz 使用 Edit Resource Settings( 编辑资源设置 ) 为 challenge-02a 设定 CPU 限制 3. 使用资源分配确保 challenge-01a 至少会获得一定数量的 CPU MHz 使用 Edit Resource Settings( 编辑资源设置 ) 为 challenge-01a 创建 CPU 预留 如果您使用其他方法解决了这项挑战, 同样表示祝贺 不过, 如果您想在本单元结束后继续学习其他单元, 请将设置恢复到先前的状态 有关用以了解 CPU 性能的更多资源, 请参加 HOL-1704-SDC-1,vSphere 性能优化练习 白皮书 : 适用于 ESXi 6.0 的 vsphere 资源管理 (vsphere Resource Management for ESXi 6.0)( 在新窗口中打开 ) 白皮书 : VMware vsphere 5.1 中的 CPU 调度程序 (The CPU Scheduler in VMware vsphere 5.1)( 在新窗口中打开 ) 尽管按主机监控 CPU 利用率很有用, 但 vrealize Operations 却是监控数据中心内 CPU 利用率的上佳工具 参加动手练习 HOL-1710-SDC-1 或 HOL-1710-SDC-3, 了解更多信息 Page 33

您已完成第 1 单元的学习 恭喜, 您已经解决了第一项挑战, 完成了第 1 单元 远程传送器仍然在正常运行!PanContinental 向您表示感谢 所有工作在一天内全部完成 继续学习以下您最感兴趣的任意一个单元 如果您对 vsphere 不太熟悉, 请选择基本挑战, 如果您是一位富有经验的管理员, 则更适合解决高级挑战 第 2 单元 - 基本运维挑战 (30 分钟 ) 本单元要求您解决常见的 vsphere 运维问题, 包括 vsphere Web Client 出现空白清单 虚拟机远程控制台无法正常运行等 第 3 单元 - 基本性能挑战 (30 分钟 ) 您能否识别并解决常见的 vsphere 性能问题? 第 4 单元 - 高级运维挑战 (30 分钟 ) 通过修复 vsphere 中诸如 ESXi 主机断开连接 vcenter Server 运行状况警报等运维问题, 让数据中心恢复正常 第 5 单元 - 高级性能挑战 (30 分钟 ) 如果您能解决这些比较少见的存储性能和 vnuma 问题, 在此献上我们的敬意 Page 34

第 2 单元 : 基本运维挑战 (30 分钟 ) Page 35

无法登录 vsphere Web Client 您刚走进办公室, 正要品尝一杯美味的咖啡, 这时, 新同事 Murphy 的电话打过来了 他最近在使用自己的凭证登录 vsphere Web Client 时遇到了问题 作为一名资深的 VMware 专家, 您自告奋勇地帮助他解决这一问题 对于使用非美式键盘的用户 如果您使用的是非美式键盘, 则在本练习过程中可能难以输入 CLI 命令或者用户名和密码 以下几种方案可帮助您解决此问题 方案 1: 在任务栏上, 单击键盘图标打开可单击的屏幕键盘 Page 36

对于使用非美式键盘的用户 方案 2: 打开桌面上的 README.txt 此文件中包含适用于 vsphere 6 挑战练习的所有凭证和编写好的输入命令 这样, 您便可以根据需要复制和粘贴这些内容 Page 37

对于使用非美式键盘的用户 方案 3: 最后, 利用 VMware Learning Platform 的 Send Text( 发送文本 ) 选项, 您可以使用本机键盘输入文本并将其发送到练习桌面 单击练习控制台左上角的 Send Text( 发送文本 ) 按钮 此时会打开一个窗口, 您可以在其中输入文本 ; 然后单击 Send( 发送 ) 等待练习状态 : 准备就绪 在桌面控制台的右下角, 您将看到以绿色或红色显示的 Lab Status( 练习状态 ) 字样 现在就请在动手练习桌面上查找此内容 如果 Lab Status( 练习状态 ) 为绿色, 请转到下一页立即开始练习 如果 Lab Status( 练习状态 ) 为红色, 请勿开始练习 这表示我们仍在准备您的虚拟环境 请等待 Lab Status( 练习状态 ) 变为绿色并显示 Ready( 准备就绪 ) 有时, 这个过程可能需要 10 分钟以上 如果 Lab Status( 练习状态 ) 显示为 Ready( 准备就绪 ), 请转到下一页开始练习 激活提示或水印 首次开始练习时, 您可能会注意到桌面上有一个水印, 提示 Windows 尚未激活 Page 38

虚拟化的一个主要优势在于, 可以在任意平台上移动和运行虚拟机 本动手练习利用了这一优势, 我们可以运行多个数据中心内的练习 但是, 这些数据中心的处理器可能不同, 这就需要通过 Internet 进行 Microsoft 激活检查 请放心,VMware 和本动手练习完全符合 Microsoft 的许可要求 您使用的练习是一个独立的单元, 没有对 Internet 的完全访问权限, 而 Windows 需要该权限才能验证激活 如果没有对 Internet 的完全访问权限, 此自动化过程会失败, 并且显示此水印 这个问题无关紧要, 不会影响到您的练习 如果您有任何疑问或顾虑, 请随时使用为您提供的支持 您可以通过 VMworld 上动手练习部分的由专家主持的研讨会获得支持, 也可以通过调查评论获得在线支持 我们始终致力于改善您的动手练习体验 启动 Chrome 1. 在桌面上, 找到 Chrome 的快捷方式 2. 双击打开 启动 vsphere Web Client 要启动 vsphere Web Client, 请执行以下操作 : 单击 RegionB Web Client( 区域 B Web Client) 书签 登录 vsphere Web Client vcenter Single Sign On 报告您同事的用户名 murphy@vsphere.local 登录失败 以下是您同事的登录凭证 : 1. User name( 用户名 ):murphy@vsphere.local 2. Password( 密码 ):VMware1! Page 39

系统为您提供了 vcenter Single Sign On 管理员帐户, 帮助您完成这项任务 : 1. User name( 用户名 ):administrator@vsphere.local 2. Password( 密码 ):VMware1! 对于这项挑战 : 1. 您需要对帐户 murphy@vsphere.local 进行调查, 确定 Murphy 不能登录 vsphere Web Client 2. 待问题解决后再测试一次, 确保 murphy@vsphere.local 能够登录 vsphere Web Client 需要提示? 查看第 1 条提示 解决方案 很多时候, 如果出现以下情况, 用户就可能被迫从 vsphere 系统注销 : 1. 用户帐户已被 SSO 管理员禁用 2. 尝试失败次数过多, 触犯了 SSO 管理员设置的锁定策略 要解决这项挑战, 请执行以下操作 : 1. 以 SSO 管理员身份登录 vsphere Web Client 2. 单击 Administration( 管理 )-Single Sign-On( 单点登录 )-Users and Groups( 用户和组 ) 3. 查找帐户名称 murphy 4. 右键单击并启用用户帐户 murphy Page 40

祝贺您! Murphy 想要向您表达诚挚的谢意 他承诺下次来办公室时会为您带来您最喜欢的咖啡饮料 团队里有您真是太棒了! Page 41

vsphere Web Client 中存在空白清单 请求帮助! 注意 : 要想尝试这项挑战, 您需要先解决上一项挑战 : 无法登录 vsphere Web Client 否则, 请勿尝试这项挑战 如果您尚未完成 无法登录 vsphere Web Client 这项挑战, 请单击此处 能够再次登录 vsphere Web Client, 您的同事 Murphy 非常开心 没多久, 您又接到了 Murphy 的电话 这一次的问题是, 尽管他能登录 vsphere Web Client, 但无法查看任何 vsphere 清单对象 他无法查看 vcenter 数据中心 集群 ESXi 主机 虚拟机等 这一回, 他需要您帮助他解决登录后 vsphere Web Client 会出现空白清单的问题 启动 Chrome 1. 在桌面上, 找到 Google Chrome 的快捷方式 2. 双击打开 启动 vsphere Web Client 要启动 vsphere Web Client, 请执行以下操作 : 单击 RegionB Web Client( 区域 B Web Client) 书签 Page 42

登录 vsphere Web Client 使用以下凭证登录 vsphere Web Client: 1. User name( 用户名 ):murphy@vsphere.local 2. Password( 密码 ):VMware1! 3. 单击 Login( 登录 ) 按钮 导航到 Host and Clusters ( 主机和集群 ) 1. 选择 Hosts and Clusters( 主机和集群 ) 空白清单? murphy@vsphere.local 理应具有以下权限 : 1. 只读访问权限 2. 登录 2 个 vcenter Server(vcsa-01a 和 vcsa-01b) Page 43

但您在登录 vsphere Web Client 后却看到空白清单 您的任务是修复 murphy@vsphere.local 的帐户权限 您可以使用以下 vcenter Single Sign On 管理员帐户完成这项操作 : User name( 用户名 ):administrator@vsphere.local Password( 密码 ):VMware1! 需要提示? 查看第 1 条提示 解决方案 用户至少需要在 vcenter Server 级别获得只读权限 如果缺失这些权限, 用户看到的就会是空白清单状态 要解决这个问题, 请在 vcenter Server 级别为相关用户分配最低的只读权限 要分配只读权限, 请执行以下操作 : 1. 以 vsphere Web Client 管理员身份登录 vcenter Server 2. 在导航器窗口中选择相应的 vcenter Server 3. 单击 Manage( 管理 )-Permissions( 权限 ) 4. 右键单击 murphy 帐户并更改用户角色 5. 将访问权限更改为只读, 然后单击 Ok( 确定 ) Page 44

VMRC 不允许我连接到虚拟机 Murphy 正在尝试使用 VMware Remote Console 访问他的一个系统 linux-desk-01a, 该系统用于管理全球远程传送粒子的使用情况 托管虚拟机的 ESXi 主机 esx-01b 近期进行了一些安全测试 测试结束后,Murphy 就发现自己不能再用 VMware Remote Console 访问虚拟机了 然而, 在试着连接几次后, 他还是放弃了, 只能找您这位 VMware 专家来帮他解决问题 启动 Chrome 1. 在桌面上, 找到 Chrome 的快捷方式 2. 双击启动 启动 vsphere Web Client 从 Chrome 书签中, 单击 RegionB Web Client( 区域 B Web Client) Page 45

登录 vsphere Web Client 要登录 vsphere Web Client, 请执行以下操作 : 1. User name( 用户名 ):CORP\Administrator 2. Password( 密码 ):VMware1! 3. 单击 Login( 登录 ) 按钮 Page 46

导航到 Hosts and Clusters ( 主机和集群 ) 1. 选择 Hosts and Clusters( 主机和集群 ) Page 47

启动虚拟机的远程控制台 要启动虚拟机 (linux-desk-01) 的远程控制台, 请执行以下操作 : 1. 展开 vcsa-01b 清单, 显示 vcenter 清单 2. 单击虚拟机 linux-desk-01 3. 单击 Summary( 摘要 ) 选项卡 4. 单击 Launch Remote Console( 启动远程控制台 ) Page 48

VMRC 出现访问问题?! 从 vsphere Web Client 启动远程控制台后, 您会在尝试连接虚拟机 linux-desk-01 的远程控制台时遇到这种错误 您的任务是解决这个问题, 让用户能够使用远程控制台访问他们的虚拟机 其他信息 : 这一问题仅在安全团队更改了 ESXi 主机 (esx-01b) 的安全设置后才出现 需要提示? 查看第 1 条提示 查看第 2 条提示 解决方案 您必须先在 ESX/ESXi 主机上启用 SSL 身份验证, 才能使用 VMware Remote Console (VMRC) 打开虚拟机的远程控制台 在 ESX/ESXi 主机上,SSL 身份验证默认处于启用状态 要从 GUI 启用 SSL 身份验证, 请执行以下操作 : 1. 连接至使用 vsphere Web Client 托管主机的 vcenter Page 49

2. 选择 esx-01b 3. 单击 Manage( 管理 ) 选项卡 4. 在 Settings( 设置 )- System( 系统 ) 下, 单击 Advanced System Settings( 高级系统设置 ) 搜索名为 Config.Defaults.security.host.ruissl 的选项, 将其设置为 yes( 是 )/true( 真 ) 要了解更多信息, 请参阅此知识库文章 Page 50

SSH 为何无法在 ESXi 主机上正常运行? 到目前为止,Murphy 对您的帮助一直非常满意 非常好! 最近, 他在使用 SSH 连接到 ESXi 主机 (esx-01b) 时遇到了一些问题, 尽管尝试用 SSH 协议连接了几次, 但还是连不上 现在, 他又来找您帮他解决这个问题 启动 PuTTY 客户端 1. 在桌面任务栏上找到 PuTTY 客户端的快捷方式 2. 单击 PuTTY 将其启动 Page 51

使用 SSH 连接到 ESXi 主机 要使用 SSH 连接到 ESXi 主机 esx-01b, 请执行以下操作 : 1. 从 Saved Sessions( 保存的会话 ) 中单击 esx-01b 2. 单击 Open( 打开 ) 按钮 更多信息 : 1. SSH 用户 :root 2. SSH 密码 :VMware1! 连接被拒? 在您尝试通过 SSH 连接到 ESXi 主机 esx-01b 时, 您的 PuTTY 客户端显示了一条 Network error: Connection refused( 网络错误 : 连接被拒 ) 的消息 Murphy 需要具备对 ESXi 主机的 SSH 访问权限才能执行某些故障排除活动 您面临的挑战是解决 SSH 与 ESXi 主机 esx-01b 之间的通信问题 注意 : 您可能想使用以下凭证登录 vsphere Web Client 以对 esx-01b 做出检查 : User name( 用户名 ):administrator@corp.local Page 52

Password( 密码 ):VMware1! 需要提示? 查看第 1 条提示 查看第 2 条提示 解决方案 在大部分 ESXi 故障排除活动期间, 很多管理员在尝试与 ESXi 主机建立远程 SSH 会话时确实会遇到问题 原因是 SSH 通常会被禁用, 用以防止远程访问 ESXi 主机 只有在故障排除活动期间, 才会由管理员将其激活 要通过 vsphere Web Client 启用 ESXi 主机上的 SSH, 请执行以下操作 : 1. 登录 vsphere Web Client 2. 搜索和查找 ESXi 主机 3. 转到 Manage( 管理 ) 选项卡 4. 单击 Settings( 设置 )-Security Profile( 安全性配置文件 ) 5. 在 Services( 服务 ) 下, 检查 SSH 的状态 6. 单击 Edit( 编辑 ) 将其更改为 Running( 正在运行 ) Page 53

棒极了! 是的, 您做到了! 现在, 一切恢复如常, 您也确保了 PanContinental 的远程传送器不会再出现任何重大问题 请转到下一页 您已完成第 2 单元的学习 祝贺您! 您已经完成了第 2 单元的学习! 继续学习以下您最感兴趣的任意一个单元 如果您对 vsphere 不太熟悉, 请选择基本挑战, 如果您是一位富有经验的管理员, 则更适合解决高级挑战 第 1 单元 - 在实践中学习 (30 分钟 ) 入职第一天? 没问题 由此开始 第 3 单元 - 基本性能挑战 (30 分钟 ) 您能否识别并解决常见的 vsphere 性能问题? 第 4 单元 - 高级运维挑战 (30 分钟 ) 通过修复 vsphere 中诸如 ESXi 主机断开连接 vcenter Server 运行状况警报等运维问题, 让数据中心恢复正常 第 5 单元 - 高级性能挑战 (30 分钟 ) 如果您能解决这些比较少见的存储性能和 vnuma 问题, 我们会对您刮目相看 Page 54

第 3 单元 : 基本性能挑战 (30 分钟 ) Page 55

为什么我的虚拟机很慢? 您坐在办公室里, 正在读 VMware vsphere 6 性能最佳实践 (Performance Best Practices for VMware vsphere 6)( 在新窗口中打开 ), 这时您决定再仔细检查下两个远程传送器粒子发送机虚拟机 (challenge-01a 和 challenge-04a) 的配置 您想要确保它们符合最佳实践 或许您还应该在检查配置时仔细检查它们的性能数据 等待练习状态 : 准备就绪 在桌面控制台的右下角, 您将看到以绿色或红色显示的 Lab Status( 练习状态 ) 字样 现在就请在动手练习桌面上查找此内容 如果 Lab Status( 练习状态 ) 为绿色, 请转到下一页立即开始练习 如果 Lab Status( 练习状态 ) 为红色, 请勿开始练习 这表示我们仍在准备您的虚拟环境 请等待 Lab Status( 练习状态 ) 变为绿色并显示 Ready( 准备就绪 ) 有时, 这个过程可能需要 10 分钟以上 如果 Lab Status( 练习状态 ) 显示为 Ready( 准备就绪 ), 请转到下一页开始练习 打开桌面上的 Challenge Scripts 文件夹 1. 打开桌面上的 Challenge Scripts 文件夹 Page 56

启动第 3 单元第 1 部分的脚本 1. 右键单击 Module3-part1.ps1 2. 从上下文菜单中, 选择 Run with PowerShell( 使用 PowerShell 运行 ) 第 3 单元第 1 部分的脚本开始运行 脚本需要一分钟才能完成运行 同时, 请继续执行下一步骤, 我们将介绍一些处理挑战的指导原则 Page 57

有关如何应对挑战的指导原则 要对该挑战进行故障排除, 请在必要时通过 Internet 探索相应的解决方案 如果您正在全屏模式下观看此练习, 可按 F11 键禁用全屏模式, 然后访问 Internet 当然, 如果您身边有已连网的移动设备, 也可以用移动设备访问 Page 58

对于使用非美式键盘的用户 如果您使用的是非美式键盘, 则在本练习过程中可能难以输入 CLI 命令或者用户名和密码 以下几种方案可帮助您解决此问题 方案 1: 在任务栏上, 单击键盘图标打开可单击的屏幕键盘 Page 59

对于使用非美式键盘的用户 方案 2: 打开桌面上的 README.txt 此文件中包含适用于 vsphere 6 挑战练习的所有凭证和编写好的输入命令 这样, 您便可以根据需要复制和粘贴这些内容 Page 60

对于使用非美式键盘的用户 方案 3: 最后, 利用 VMware Learning Platform 的 Send Text( 发送文本 ) 选项, 您可以使用本机键盘输入文本并将其发送到练习桌面 单击练习控制台左上角的 Send Text( 发送文本 ) 按钮 此时会打开一个窗口, 您可以在其中输入文本 ; 然后单击 Send( 发送 ) 激活提示或水印 首次开始练习时, 您可能会注意到桌面上有一个水印, 指示 Windows 尚未激活 虚拟化的一个主要优势在于, 可以在任意平台上移动和运行虚拟机 本动手练习利用了这一优势, 我们可以运行多个数据中心内的练习 但是, 这些数据中心的处理器可能不同, 这就需要通过 Internet 进行 Microsoft 激活检查 请放心,VMware 和本动手练习完全符合 Microsoft 的许可要求 您使用的练习是一个独立的单元, 没有对 Internet 的完全访问权限, 而 Windows 需要该权限才能验证激活 如果没有对 Internet 的完全访问权限, 此自动化过程会失败, 并且显示此水印 这个问题无关紧要, 不会影响到您的练习 如果您有任何疑问或顾虑, 请随时使用为您提供的支持 您可以通过 VMworld 上动手练习部分的由专家主持的研讨会获得支持, 也可以通过调查评论获得在线支持 我们始终致力于改善您的动手练习体验 Page 61

第 3 单元第 1 部分的脚本结束运行 脚本结束运行后, 系统将显示 You may now close this window( 您现在可以关闭此窗口 ) 实际的显示内容可能有所不同, 具体取决于您在此之前完成的单元 按两次 Enter 键或使用右上角的关闭按钮关闭窗口 打开 challenge-01a 和 challenge-04a 的远程桌面 在桌面上双击 chg-01a.rdp, 打开与虚拟机 challenge-01a 的远程桌面会话 接下来, 针对 chg-04a.rdp 执行相同的操作 如果您收到弹出式消息 Remote Desktop can't connect to the remote computer...( 远程桌面无法连接到远程计算机...), 请单击 OK( 确定 ), 稍等片刻后重新尝试打开远程桌面 Page 62

调整窗口位置, 以便同时监控两个远程桌面 调整远程桌面的窗口位置, 以便您轻松地同时查看两个桌面 Page 63

桌面说明 虚拟机 challenge-01a 和 challenge-04a 上已安装了一些工具, 它们可帮助您监控虚拟机的运行状况 在桌面上, 您可以看到各虚拟机的相关信息, 包括它的主机名 IP 地址 CPU 使用情况和内存使用情况 其中 CPU 使用情况和内存使用情况会实时更新 在 CPU 使用情况图表中, 您可以同时看到已使用的 CPU 总量 (Total:[ 总量 :]) 和客户操作系统内核使用的 CPU 用量 (Krnl:[ 内核 :]), 均以百分比表示 1. 在 challenge-01a 上, 双击 SPECjbb 以启动性能衡量应用 Page 64

SPECjbb2005 此时会打开一个标题为 SPECjbb2005 的窗口 challenge-01a 上会安装 SPECjbb2005 的副本 SPECjbb2005 是一个基于 java 的真实 SPEC 基准测试, 可衡量 CPU 和内存性能 1. 单击 Start Benchmark( 启动基准测试 ) 按钮启动基准测试 SPECjbb 启动 您需要等待几秒钟时间, 然后基准测试才会开始显示性能结果 当 SPECjbb 在 challenge-01a 上启动时, 在 challenge-04a 上重复执行该流程 : 双击 challenge-04a 上的 SPECjbb 图标, 然后单击 Start Benchmark( 启动基准测试 ) 按钮 转到下一页 SPECjbb 正在运行 1. 当 SPECjbb 开始生成性能结果时, 您将看到 SPECjbb2005 窗口中显示性能分值 Page 65

2. 底部的文本文件将实时显示基准测试的输出结果 性能结果以每秒业务操作数 (BOPS) 或吞吐量为衡量标准, 以黄色突出显示 此窗口只用于查看基准测试的执行情况, 关闭此窗口不会影响基准测试的运行 关闭 SPECjbb2005 窗口或单击 Stop Benchmark( 停止基准测试 ), 基准测试即停止运行 不过, 为了分析性能结果, 您应保持基准测试继续运行 性能结果每 10 秒更新一次 首次启动 SPECjbb2005 或对环境做出更改时, 您可能需要等待几个更新周期, 性能结果才能达到稳定状态 您的结果可能会不同于此处显示的结果 3. 您可以在此处同时监控 CPU 和内存的使用情况 请留意在您启动基准测试后它们如何发生的变化 比较 challenge-01a 和 challenge-04a 的性能 当基准测试达到稳定性能时, 可以注意一下 challenge-01a 和 challenge-04a 在执行方式上的差异 查看这两台虚拟机的 SPECjbb 性能分值 哪台虚拟机的性能更好 ( 即在 SPECjbb2005 中的性能分值更高 )? 当您认为自己看到了稳定的差距后, 请翻过本页 Page 66

challenge-04a 的性能高于 challenge-01a 很快就明确体现出 challenge-04a 的性能高于 challenge-01a 您的结果可能与上述情况不完全一致, 具体取决于动手练习的环境 challenge-04a 的性能分值较高, 如果查看 CPU 使用量随时间的变化情况, 您还能看到一个差异 challenge-01a 的平均内核时间明显高于 challenge-04a 哦, 不!challenge-01a 和 challenge-04a 为 Waypoints 补充了远程传送粒子流! 如果一台虚拟机的运行速度高于另一台, 则由 challenge-01a 供应的 Waypoints 可能会耗尽粒子并无法工作, 而与 challenge-04a 对应的 Waypoints 可能会收到太多粒子, 从而产生放射性并为客户带来健康风险 但是, 这些虚拟机位于何处? 如何对其进行管理? Page 67

打开 Chrome 双击桌面上的图标以打开 Chrome Page 68

打开 Region A Web Client ( 区域 A Web Client) 在书签栏上, 单击 RegionA Web Client( 区域 A Web Client) 打开 vsphere Web Client 打开 vsphere Web Client 选中 Use Windows session authentication( 使用 Windows 会话身份验证 ), 然后单击 Login( 登录 ) 导航到 Hosts and Clusters ( 主机和集群 ) 如果需要, 请在 Home( 主页 ) 页面上选择 Hosts and Clusters( 主机和集群 ) 图标 根据需要刷新 Web Client 由于这是动手练习, 您可能需要手动刷新 Web Client 才能看到更改 单击箭头进行刷新 打开 vsphere Web Client 根据需要展开 vcsa-01a.corp.local challenge-01a 由 vcenter Server vcsa-01a.corp.local 进行管理 它与虚拟机 challenge-04a 和 challenge-05a 一同托管在 esx-03a.corp.local 上 Page 69

challenge-01a 和 challenge-04a 同为 Windows Server 2012 虚拟机, 而 challenge-05a 为 Linux 虚拟机 您的同事 Murphy 也是 vcsa-01a.corp.local 的一名管理员 challenge-01a 和 challenge-05a 是他最喜欢的其中两台虚拟机 但是, 既然 challenge-01a 是他喜欢的虚拟机之一, 为何该虚拟机运行速度缓慢? vsphere 性能图表 要对性能问题进行实时故障排除,vSphere 性能图表将是首选工具 让我们立即试用一下这些图表 如果您熟悉 vsphere 性能图表, 请直接跳到下一步 可在数据中心 集群 资源池 ESXi 主机或虚拟机级别查看性能图表 请在 vsphere Web Client 中执行以下操作 : 1. 单击感兴趣的对象 在本例中, 请单击 challenge-01a 2. 单击 Monitor( 监控 ) 选项卡 3. 单击 Performance( 性能 ) 选项卡 4. 您可以查看 Overview( 概述 ) 或 Advanced( 高级 ) 屏幕 眼下, 请单击 Advanced( 高级 ) Page 70

5. 单击锁定图标锁定图标隐藏左侧边栏以扩大浏览空间 6. 单击箭头隐藏内部边栏, 以进一步扩大浏览空间 Page 71

vsphere 性能图表 默认情况下,vSphere Web Client 性能图表每 20 秒更新一次, 每次显示一个小时的性能统计数据 您可以通过单击下拉菜单来切换视图 1. 现在, 请单击 Chart Options( 图表选项 ) 以便进一步了解 Page 72

vsphere 性能图表 Chart Options( 图表选项 ) 屏幕的重要部分已突出显示 此处您无需进行任何单击操作, 因为我们只是概述此屏幕的重要部分 1. 选择您希望从中选择的一组衡量指标 2. 调整图表的时间跨度 3. 对象因衡量指标类型而异 这里的 0 表示虚拟机的首个虚拟 CPU,1 表示虚拟机的第二个虚拟 CPU,challenge-01a 则表示两者的平均值 4. 在此处选择或取消选择图表的衡量指标 5. 单击 Cancel( 取消 ) 返回, 而不对图表进行修改 Page 73

vsphere 性能图表 要返回左侧边栏, 1. 请单击 (0) Navigator([0] 导航器 ) 2. 单击锁定图标锁定图标 您面临的挑战 您面临的挑战是提高虚拟机 challenge-01a 的性能, 以便 challenge-01a 和 challenge-04a 的性能大致相当 最终,challenge-04a 可能会显示性能有所降低 为了使性能大致相当, 请尝试使 challenge-01a 和 challenge-04a 之间的性能分值最多相差 2000 此外, 每台虚拟机的内核时间也应大致相等 如果更改了底层基础架构, 请留出时间 (30-60 秒 ) 让虚拟机的性能达到稳定状态 对于这项挑战, 您可以执行以下操作 : Page 74

- 修改虚拟机设置 - 修改资源分配 - 通过 vmotion 迁移虚拟机 - 重新启动 SPECjbb 有时, 如果虚拟机上的可用资源非常少,SPECjbb 可能会停止运行, 或者最终在 45 分钟后停止运行 如果 SPECjbb2005 窗口报告 Performance: Not Running( 性能 : 未运行 ), 请关闭 SPECjbb2005 窗口, 然后通过虚拟机的桌面快捷方式将其重新打开 - 如果您出于某种原因需要重新解决这项挑战, 可以重新运行脚本 C:\HOL-CHG\ Module3-part1.ps1 这将会重新引导所有虚拟机, 并将一些虚拟机设置恢复为开始应对这项挑战时的状态 请注意, 并非所有设置和虚拟硬件都会重置, 因此, 如果您对环境做出了更改却无法成功应对挑战, 请恢复环境的设置 您不得执行以下操作 : - 重命名所有虚拟机 - 关闭或重新引导任何虚拟机 - 修改虚拟机的虚拟硬件 - 修改 challenge-01a challenge-04a 或 challenge-05a( 运行 Linux 版 SPECjbb2005) 上的任何基准测试参数以改变 SPECjbb 的操作 - 关闭任意虚拟机上的 SPECjbb 如果您这么做, 就会威胁到远程传送器网络的完整性! 对于是否执行这些操作, 你们的选择可能各参半, 这种情况不太好 需要提示? 查看第 1 条提示 查看第 2 条提示 如果您感觉自己已经找到答案, 或者决定就此放弃, 请转到下一页 我有一个问题向您请教 问题 : 您是否已将 FavoriteVMs 资源池的 CPU 份额设置为 4000? Page 75

如果是, 那么该答案不正确 请重试, 并在您感觉自己已经找到答案或准备放弃时转到下一页 解决方案 可用于解决该问题的方法有很多 Murphy 创建了一个 FavoriteVMs 资源池, 可能用于将某些虚拟机与其他虚拟机进行逻辑区分 ( 我们永远无法获知原因 ) 资源池始终会对位于其中的虚拟机产生性能影响 分配到池的资源会根据虚拟机级别的资源分配设置在池中的虚拟机之间进行拆分 该资源池共有 500 个 CPU 份额 这意味着 : challenge-01a 拥有 166 个 CPU 份额, 因为该虚拟机拥有 1000 个份额, 因此占资源池的 1/3 challenge-05a 拥有 333 个 CPU 份额, 因为该虚拟机拥有 2000 个 CPU 份额, 因此占资源池的 2/3 challenge-04a 具有 Normal( 正常 ) 的 2000 个 CPU 份额 由于已开启虚拟机的份额总数为 2500, 因此 challenge-01a 占总 CPU 份额的 7%, challenge-05a 占 13%, 而 challenge-04a 占 80% 这将导致 CPU 争用, 从而使 challenge-01a 需要较高的就绪时间比率, 而 challenge-04a 不需要 您是否发现 challenge-01a 的内核时间比 challenge-04a 多? 这相当于就绪时间, 客户操作系统就是通过内核时间来查看 ESXi 的就绪时间 针对此场景的解决方案 : 1. 从资源池中移除 challenge-01a, 将其虚拟机级别的资源分配设置为 2000 个 CPU 份额, 从而为 challenge-01a 和 challenge-04a 提供相等的份额 2. 您可以将 challenge-01a 从 ESXi 主机 esx-03a 迁移到 ESXi 主机 esx-02a 由于 esx-02a 未使用, 争用 CPU 资源的虚拟机就更少, 性能因此得以提高 您也可以将 challenge-04a 从 esx-01a 迁移到 esx-02a 以达到相同的目的 Page 76

PanContinental 向您表示感谢! Murphy 也向您表示感谢 下次上班时他会为大家带来甜甜圈, 一定有您一份 感谢您加入团队 Page 77

对性能低下的虚拟机执行故障排除 吃过午餐后, 您回到自己的办公桌, 接听了 Murphy 的来电 我启动了另一台粒子重组的虚拟机 challenge-03a, 您应该看一下 challenge-01a 发生的情况 现在, 我已经关闭了 challenge-03a, 但是您能看一下吗? 我们走吧! 发生了什么情况? 更重要的是... 您能否在此之后静心休息? 没关系, 您会把问题解决的, 因为您已为一切做好准备... 是的, 一切事情! 打开桌面上的 Challenge Scripts 文件夹 1. 打开桌面上的 Challenge Scripts 文件夹 Page 78

启动第 3 单元第 2 部分的脚本 1. 右键单击 Module3-part2.ps1 2. 从上下文菜单中, 单击 Run with PowerShell( 使用 PowerShell 运行 ) 第 3 单元第 2 部分的脚本结束运行 等待脚本运行完成 脚本结束运行后, 系统将显示 You may now close this window( 您现在可以关闭此窗口 ) 实际的显示内容可能有所不同, 具体取决于您在此之前完成的单元 按两次 Enter 键或使用右上角的关闭按钮关闭窗口 打开 challenge-01a 远程桌面 在桌面上双击 chg-01a.rdp, 打开与虚拟机 challenge-01a 的远程桌面会话 Page 79

challenge-01a 桌面 虚拟机 challenge-01a 上已安装了一些工具, 它们可帮助您监控虚拟机的运行状况 在桌面上, 您可以看到虚拟机的相关信息, 包括它的主机名 IP 地址 CPU 使用情况和内存使用情况 其中 CPU 使用情况和内存使用情况会实时更新 在 CPU 使用情况图表中, 您可以同时看到已使用的 CPU 总量 (Total:[ 总量 :]) 和客户操作系统内核使用的 CPU 用量 (Krnl:[ 内核 :]), 均以百分比表示 1. 双击 SPECjbb 以启动性能衡量应用 Page 80

启动 SPECjbb 此时会打开一个名为 SPECjbb2005 的窗口 challenge-01a 上会安装 SPECjbb2005 的副本 SPECjbb2005 是一个基于 java 的真实 SPEC 基准测试, 可衡量 CPU 和内存性能 1. 单击 Start Benchmark( 启动基准测试 ) 按钮启动基准测试 SPECjbb 启动 需等待几秒钟时间基准测试才会开始运行 SPECjbb 正在运行 1. 哇, 看起来此处的性能表现良好 在对环境做出更改时, 您可能需要等待几个周期, 性能结果才能达到稳定状态 您的结果可能会不同于此处显示的结果 Page 81

2. 您可以在此处同时监控 CPU 和内存的使用情况 请留意在您启动基准测试后它们如何发生的变化 CPU 使用率较高且较稳定, 这表明虚拟机在尽可能充分利用其虚拟 CPU 内存使用量仅为 62% 请记住该性能分值, 因为您将需要在随后应对挑战时用到该分值 我们来查看下一台虚拟机 challenge-03a 打开 Chrome 返回桌面, 双击 Chrome 图标打开该程序 如果 Chrome 仍处于打开状态并已登录到 Web Client, 则可跳过此步 Page 82

打开 RegionA Web Client ( 区域 A Web Client) 如果您无法自动转到 VMware vcenter Single Sign on(vmware vcenter 单点登录 ) 页面, 请单击书签栏上的 RegionA Web Client( 区域 A Web Client) 打开 vsphere Web Client 打开 vsphere Web Client 1. 选择 Use Windows session authentication( 使用 Windows 会话身份验证 ) 2. 单击 Login( 登录 ) 导航到 Hosts and Clusters ( 主机和集群 ) 如果需要, 请在 Home( 主页 ) 页面上选择 Hosts and Clusters( 主机和集群 ) 图标 根据需要刷新 Web Client 由于这是动手练习, 您可能需要手动刷新 Web Client 才能看到更改 单击箭头进行刷新 Page 83

打开 vsphere Web Client 根据需要展开 vcsa-01a challenge-01a 由 vcenter Server vcsa-01a 进行管理 它托管在 esx-03a 上 启动 challenge-03a 让我们启动 Murphy 的粒子重组虚拟机 challenge-03a, 看一看会发生什么情况 1. 单击 challenge-03a 2. 单击 challenge-03a 的 Actions( 操作 ) 下拉菜单 3. 将鼠标光标悬停在 Power( 电源 ) 上 4. 然后, 单击 Power On( 启动 ) Page 84

查看 challenge-01a 远程桌面会话 单击以返回 challenge-01a, 查看启动 challenge-03a 对其有何影响 发生了什么情况?? 您的远程桌面连接中断? 您可能会看到该屏幕, 也许不会 您认为导致这种情况的原因是什么? 请转到下一页 远程桌面会话中断 请稍等片刻, 远程桌面会话将重新连接 或许与您启动的虚拟机有关 Page 85

challenge-01a 的行为已改变 哦, 天哪 1. challenge-01a 已经恢复正常, 但其性能分值比之前下降太多 2. 内核的 CPU 使用情况显著增加, 内存使用情况也已增加到 94% challenge-01a 发生了什么情况? 您面临的挑战 您面临的挑战是提高 challenge-01a 的性能分值! 您能否将性能分值提高到与启动 challenge-03a 之前一样? 如果更改了底层基础架构, 请留出时间 (30-60 秒 ) 让虚拟机的性能达到稳定状态 对于这项挑战, 您可以执行以下操作 : - 通过 vmotion 迁移虚拟机 - 修改虚拟机设置 Page 86

- 重新启动 SPECjbb 有时, 如果虚拟机上的可用资源非常少,SPECjbb 可能会停止运行, 或者最终在 45 分钟后停止运行 如果 SPECjbb2005 窗口报告 Performance: Not Running( 性能 : 未运行 ), 请关闭 SPECjbb2005 窗口, 然后通过虚拟机的桌面快捷方式将其重新打开 - 如果您出于某种原因需要从头再做一次这个挑战, 可以重新运行脚本 C:\HOL-CHG\ Module3-part2.ps1 这将会重新引导所有虚拟机, 并将一些虚拟机设置恢复为开始应对这项挑战时的状态 请注意, 并非所有设置和虚拟硬件都会重置, 因此, 如果您对环境做出了更改却无法成功应对挑战, 请恢复环境的设置 您不得执行以下操作 : - 重命名任何虚拟机 - 关闭或重新引导任何虚拟机 - 修改虚拟机的虚拟硬件 - 修改 challenge-01a 上的任何基准测试参数以改变 SPECjbb 的操作 - 关闭任意虚拟机上的 SPECjbb 如果您这么做, 就会威胁到远程传送器网络的完整性! 有些人可能会将这些注意事项抛在脑后 需要提示? 查看第 1 条提示 查看第 2 条提示 如果您感觉自己已经找到答案, 或者决定就此放弃, 请转到下一页 解决方案 虚拟机 challenge-03a 启动后便开始执行内存密集型工作负载 esx-03a 主机上的内存已超额分配 : 分配到虚拟机的虚拟内存超出了主机的物理内存容量 esx-03a 主机具有 4 GB 物理内存 challenge-01a 和 challenge-03a 分别分配有 2 GB 和 3 GB 虚拟内存, 总共为 5 GB 还请记住,ESXi 本身及其运行的各虚拟机也需要一些内存开销 Page 87

如果各虚拟机未使用所有可用内存, 则这样的分配方案是可以接受的, 但如果内存需求增加, 则会为性能带来风险 在本例中, 当 challenge-03a 开始运行后导致内存供不应求时,challenge-01a 的性能受到影响 与大多数应用一样, 如果内存不足,challenge-01a 上 SPECjbb 的性能就会受到不利影响 要解决该问题, 您可能需要 : 1. 通过 vmotion 将 challenge-01a 迁移到未发生争用的另一台主机上 2. 为 challenge-01a 创建内存预留或者提高其内存份额 3. 对 challenge-03a 创建内存限制或者减少其内存份额 Page 88

查看 challenge-01a 上的客户机内存 无论您的工作负载是否仍在运行, 我们都要在 Web Client 中查看一下 challenge-01a 的内存状态 1. 在 Hosts and Clusters( 主机和集群 ) 视图中, 单击 challenge-01a 2. 单击 Monitor( 监控 ) 选项卡 3. 单击 Utilization( 利用率 ) 选项卡 Active Guest Memory( 活动客户机内存 ): 该值是 ESXi 估测虚拟机正积极使用的内存量 并非所有 2 GB 虚拟内存都处于同一状态 Private( 专有 ): 这是与物理内存相对应的虚拟内存 只有 25% 的虚拟机内存属于专有内存 Shared( 共享 ) Compressed( 压缩 ) Swapped( 交换 ) 和 Ballooned( 释放 ) 都是内存回收形式 请转到下一页 Page 89

Page 90

出现内存压力前后的 challenge-01a 内存使用情况 顶图显示了没有内存压力时的 challenge-01a 客户机内存 活动内存为 1.86 GB 所有内存都处于专有或未访问状态 出现内存压力后,ESXi 开始从 challenge-01a 回收内存 ESXi 使用不同的内存管理机制以动态方式减少每台虚拟机所需的物理内存量 此外, 活动客户机内存总量已从 1.86 GB 降至 1.40 GB 由于内存限制, 基准测试使用的内存已开始受限 页面共享 : 在 vsphere 6.0 中, 虚拟机内会默认共享内存页 默认情况下,vSphere 6.0 中将虚拟机之间之间的页面共享设为禁用状态, 但可通过将主机高级设置 Mem.ShareForceSalting 设置为 0 进行启用 有关详细信息, 请参阅 VMware vsphere 6.0 性能最佳实践 Page 91

ESXi 中的内存管理 ESXi 可以使用多种内存管理技术 : 内存释放 : 内存释放驱动程序 (vmmemctl) 与 ESXi 协作回收操作系统认为最不重要的页面 该驱动程序采用内存释放技术, 该技术非常接近本机系统在类似内存限制下的行为 该技术可增加或减少客户操作系统的内存压力, 使得客户机能够使用自己的本机内存管理算法自己的本机内存管理算法 当内存紧缺时, 客户操作系统将决定要回收哪些页面, 并在必要时将这些页面交换到自己的虚拟磁盘上 Page 92

有些内存释放很正常, 并未指示存在问题 您可能已经注意到,challnege-01a 的内存消耗在 challenge-03a 启动后有所增加 这是由内存回收技术所导致的, 特别是内存释放 压缩 :ESXi 压缩内存页以减少所需的页数 解压缩内存页所需的时间少于将页面交换到磁盘所需的时间 交换 :ESXi 通过将内存页写入磁盘, 从虚拟机中强制回收内存 这种机制可能会因其高访问延迟而导致虚拟机性能明显下降 这些内存回收技术会根据环境中内存压力的严重程度以分层方式进行应用 页面共享页面共享是应用的第一项技术, 几乎不会影响性能 如果该技术无法解决内存不足问题, 则会应用内存释放内存释放技术 必要时将使用压缩压缩技术, 该技术会带来较大的性能影响, 因为必须将压缩的页面解压缩才能对其进行读取或写入 交换交换会对性能产生严重影响, 因此只有在迫不得已时才能使用该技术 : 将从磁盘而非内存中读取页面 Page 93

非常出色! 是的, 一切再次恢复正常运行! 远程传送器没有任何损失除了您口袋里掉出了些布屑 我认为没有人会在意这个 请转到下一页 您已完成第 3 单元的学习 祝贺您! 您已经完成了第 3 单元的学习 继续学习以下您最感兴趣的任意一个单元 如果您对 vsphere 不太熟悉, 请选择基本挑战, 如果您是一位富有经验的管理员, 则更适合解决高级挑战 第 1 单元 - 在实践中学习 (30 分钟 ) 入职第一天? 没问题 由此开始 第 2 单元 - 基本运维挑战 (30 分钟 ) 本单元要求您解决常见的 vsphere 运维问题, 包括 vsphere Web Client 出现空白清单 虚拟机远程控制台无法正常运行等 第 4 单元 - 高级运维挑战 (30 分钟 ) 通过修复 vsphere 中诸如 ESXi 主机断开连接 vcenter Server 运行状况警报等运维问题, 让数据中心恢复正常 第 5 单元 - 高级性能挑战 (30 分钟 ) 如果您能解决这些比较少见的存储性能和 vnuma 问题, 我们会对您刮目相看 Page 94

第 4 单元 : 高级运维挑战 (30 分钟 ) Page 95

为什么我的 ESXi 主机总是断开连接?! 新的一天开始了, 您在 PanContinental 的主要任务是确保数据中心平稳运行且正常工作 Murphy 最近总是找您, 而且看起来, 他一时半会儿也不会消停 这不, 您刚打算将目光从电子邮件上移开, 就收到了 Murphy 的求救, 说他的 ESXi 主机 (esx-02b) 连接断了 他非常关心这个问题, 因为负责各个远程传送路径点的系统由该主机上的虚拟机 (linux-base-01) 进行管理 尽管该虚拟机在 ESXi 主机 (esx-02b) 断开与 vcenter 的连接后仍正常运行, 但 Murphy 强调问题是, 这种情况让他无法从 vsphere Web Client 管理 ESXi 主机和虚拟机 他还强调说, 他即将需要运行一个系统补丁程序, 如果无法尽快访问他的虚拟机, 那么将会影响到全球所有远程传送路径点的运维就绪性, 这使事情显得更加紧迫! 对于使用非美式键盘的用户 如果您使用的是非美式键盘, 则在本练习过程中可能难以输入 CLI 命令或者用户名和密码 以下几种方案可帮助您解决此问题 方案 1: 在任务栏上, 单击键盘图标打开可单击的屏幕键盘 Page 96

对于使用非美式键盘的用户 方案 2: 打开桌面上的 README.txt 此文件中包含适用于 vsphere 6 挑战练习的所有凭证和编写好的输入命令 这样, 您便可以根据需要复制和粘贴这些内容 Page 97

对于使用非美式键盘的用户 方案 3: 最后, 利用 VMware Learning Platform 的 Send Text( 发送文本 ) 选项, 您可以使用本机键盘输入文本并将其发送到练习桌面 单击练习控制台左上角的 Send Text( 发送文本 ) 按钮 此时会打开一个窗口, 您可以在其中输入文本 ; 然后单击 Send( 发送 ) 等待练习状态 : 准备就绪 在桌面控制台的右下角, 您将看到以绿色或红色显示的 Lab Status( 练习状态 ) 字样 现在就请在动手练习桌面上查找此内容 如果 Lab Status( 练习状态 ) 为绿色, 请转到下一页立即开始练习 如果 Lab Status( 练习状态 ) 为红色, 请勿开始练习 这表示我们仍在准备您的虚拟环境 请等待 Lab Status( 练习状态 ) 变为绿色并显示 Ready( 准备就绪 ) 有时, 这个过程可能需要 10 分钟以上 如果 Lab Status( 练习状态 ) 显示为 Ready( 准备就绪 ), 请转到下一页开始练习 激活提示或水印 首次开始练习时, 您可能会注意到桌面上有一个水印, 提示 Windows 尚未激活 Page 98

虚拟化的一个主要优势在于, 可以在任意平台上移动和运行虚拟机 本动手练习利用了这一优势, 我们可以运行多个数据中心内的练习 但是, 这些数据中心的处理器可能不同, 这就需要通过 Internet 进行 Microsoft 激活检查 请放心,VMware 和本动手练习完全符合 Microsoft 的许可要求 您使用的练习是一个独立的单元, 没有对 Internet 的完全访问权限, 而 Windows 需要该权限才能验证激活 如果没有对 Internet 的完全访问权限, 此自动化过程会失败, 并且显示此水印 这个问题无关紧要, 不会影响到您的练习 如果您有任何疑问或顾虑, 请随时使用为您提供的支持 您可以通过 VMworld 上动手练习部分的由专家主持的研讨会获得支持, 也可以通过调查评论获得在线支持 我们始终致力于改善您的动手练习体验 打开桌面上的 Challenge Scripts 文件夹 1. 打开桌面上的 Challenge Scripts 文件夹 启动第 4 单元的脚本 1. 右键单击 Module4-start.ps1 2. 从上下文菜单中, 选择 Run with Powershell( 使用 Powershell 运行 ) Page 99

第 4 单元的脚本结束运行 等待脚本运行完成 脚本结束运行后, 系统将显示 Module 4 is ready( 第 4 单元已准备就绪 ) 按下 Enter 键或使用右上角的关闭按钮关闭窗口 继续执行下一步骤 打开 Chrome 返回桌面, 双击 Chrome 图标打开该程序 打开 RegionB Web Client ( 区域 B Web Client) 如果您无法自动转到 VMware vcenter Single Sign on(vmware vcenter 单点登录 ) 页面, 请单击书签栏上的 RegionB Web Client( 区域 B Web Client) 打开 vsphere Web Client Page 100

打开 vsphere Web Client 1. 选择 Use Windows session authentication( 使用 Windows 会话身份验证 ) 2. 单击 Login( 登录 ) 导航到 Hosts and Clusters ( 主机和集群 ) 如果需要, 请在 Home( 主页 ) 页面上单击 Hosts and Clusters( 主机和集群 ) 图标 打开 vsphere Web Client 根据需要展开 vcsa-01b esx-02b 由 vcenter Server vcsa-01b 进行管理 Page 101

vcenter 警报详细信息 为了进一步调查该问题, 请执行以下操作 : 1. 单击 Alarms( 警报 ) 选项卡 2. 单击 esx-02b.corp.local 警报 3. 深入查看警报详细信息 Page 102

深入查看警报详细信息和定义 1. 单击 esx-02b 2. 单击 Monitor( 监控 ) 选项卡 3. 单击 Issues( 问题 ) 4. 导航至 Triggered Alarms( 已触发的警报 ) 5. 单击 Host connection and power state( 主机连接和电源状况 ) Page 103

深入查看警报详细信息和定义 1. 展开 Triggers( 触发因素 ) 现在, 您应该已经确信 ESXi 主机 (esx-02b) 已失去连接或无响应 您的任务是将 esx-02b 恢复到正常状态并由 vcenter (vcsa-01b) 进行管理 四处询问后, 您从团队中听到一些流言, 说有些恶意管理员可能干涉 ESXi 主机上运行的服务 需要提示? 查看第 1 条提示 查看第 2 条提示 解决方案 如果 vcenter server 与 ESXi 主机之间无法保持检测信号 ( 即使 ESXi 主机仍在线, 虚拟机仍在运行 ), 那么这个问题会很常见 管理代理极有可能未运行或者需要重新启动 要使用远程 SSH 检查 ESXi 主机上管理代理的状态, 请执行以下操作 : 1. 使用 PuTTy 或您的 SSH 客户端以 root 身份登录 ESXi 主机 2. 运行以下命令 : Page 104

/etc/init.d/vpxa status 要使用远程 SSH 重新启动 ESXi 主机上的管理代理, 请执行以下操作 : 1. 使用 PuTTy 或您的 SSH 客户端以 root 身份登录 ESXi 主机 2. 运行以下命令 : /etc/init.d/vpxa start 有关更多信息, 请参阅这篇知识库文章 Page 105

无法使用 SSO 管理员帐户登录到 vcenter 以分配权限 (SSO 管理员帐户已锁定 ) Murphy 最近请求了特别审批, 以允许他管理对其自己的 VMware 环境的权限 他雇佣了一个优秀的工程师团队来分担一些管理任务 这样, 您便可以更多地关注即将展开的远程传送路径点制造厂扩张 为此,Murphy 获得了一个 SSO 管理员帐户 因此, 他可将权限分配给自己的团队成员, 从而帮助管理其环境 然而, 几天后, 他再次向您呼救, 因为他无法使用您为他创建的 SSO 管理员帐户访问 vsphere Web Client 他给了您两种选择 : 您来帮助他解决登录问题, 或者您可以帮助他向团队新成员分配 100 个新帐户 显然, 您选择了帮助他解决登录问题 打开 Chrome 在桌面上, 双击 Chrome 图标打开该程序 打开 RegionB Web Client ( 区域 B Web Client) 从 Chrome 的书签栏中, 单击 RegionB Web Client( 区域 B Web Client) Page 106

登录 vsphere Web Client 这是让 Murphy 遇到登录问题的 SSO 管理员帐户 (ssoadmin@vsphere.local) 登录凭证如下 : 1. User name( 用户名 ):ssoadmin@vsphere.local 2. Password( 密码 ):VMware1! 3. 单击 Login( 登录 ) 登录信息有误! 现在, 您应该已经想到, 问题的原因不太可能是 Murphy 给了您错误的用户名或密码 这个问题绝不是简单的用户名 / 密码不正确 为了帮助您完成这个任务, 向您授予了对默认 SSO 管理员帐户的访问权限 : User name( 用户名 ):administrator@vsphere.local Password( 密码 ):VMware1! 对于该项任务, 您需要执行以下操作 : 1. 找出 ssoadmin@vsphere.local 存在的问题 2. 找出解决登录问题的方法 3. 测试 ssoadmin@vsphere.local 能否再次登录 vcsa-01b.corp.local 需要提示? 查看第 1 条提示 查看第 2 条提示 Page 107

解决方案 SSO 管理员帐户经常会因为以下几个原因而被锁定 : 1. 超出登录尝试失败次数 2. 根据密码策略, 密码已过期 因此, 务必时常检查您的 VMware 单点登录帐户的密码是否过期 此外, 还务必应用适当的密码策略和帐户锁定策略 这样可以更好地确保您不会陷入被 VMware vsphere 环境完全锁定的状况 您可以使用具有 SSO 管理员权限的其他帐户来解锁某个帐户 : 1. 单击 Home( 主页 ) 2. 单击 Administration( 管理 ) 3. 单击 Single Sign-On( 单点登录 )Users and Groups( 用户和组 ) 4. 单击 Users( 用户 ) 选项卡 5. 右键单击受影响的用户帐户 ( 如 ssoadmin@vsphere.local), 然后单击 Unlock( 解锁 ) 有关更多信息, 请阅读这篇知识库文章 Page 108

无法将服务器置于维护模式 非常出色地解决了 Murphy 的登录问题! 挑战解决了, 接下来您希望主动针对一台 ESXi 主机进行维护, 以确保自己不会再接到任何支持来电 为此, 您需要将主机置于维护模式 登录 vsphere Web Client 并将 esx-01b 置于维护模式 打开 Chrome 单击任务栏中的 Chrome 图标打开该程序 打开 RegionB Web Client ( 区域 B Web Client) 从 Chrome 的书签栏中, 单击 RegionB Web Client( 区域 B Web Client) 登录 vsphere Web Client 1. 选择 Use Windows session authentication( 使用 Windows 会话身份验证 ) 2. 单击 Login( 登录 ) Page 109

导航到 Hosts and Clusters ( 主机和集群 ) 1. 单击 Home( 主页 ) 2. 单击 Hosts and Clusters( 主机和集群 ) Page 110

将 esx-01b.corp.local 置于维护模式 1. 展开 vcsa-01b 上的 QueTip 插件 2. 选择, 然后右键单击 esx-01b 3. 单击 Maintenance Mode( 维护模式 ) 4. 选择 Enter Maintenance Mode( 进入维护模式 ) Page 111

确认维护模式 在 Confirm Maintenance Mode( 确认维护模式 ) 对话框中, 单击 OK( 确定 ) 完成维护模式向导 在 Warning( 警告 ) 对话框中, 单击 OK( 确定 ) Page 112

监控任务进度 单击 Recent Tasks( 近期任务 ) 以查看任务进度 查看 Enter Maintenance Mode ( 进入维护模式 ) 任务的进度 等待几分钟后, 您可以看到 Enter Maintenance Mode( 进入维护模式 ) 任务停顿在 19%, 尽管没有出现任何错误消息, 任务仍停滞不前 您的任务 : Page 113

1. 确定无法完成维护模式任务的原因 2. 确保今后无需手动干预即可将集群中的服务器置于维护模式 3. 成功将 esx-01b 置于维护模式以完成维护活动 需要提示? 查看第 1 条提示 查看第 2 条提示 解决方案 DRS 具有 3 个自动化级别 上表列出了各个自动化级别及其相关操作 为确保无需手动干预即可将虚拟机迁出主机, 集群 DRS 自动化级别必须设置为 Fully Automated( 全自动 ) Page 114

查看 DRS 自动化级别 1. 确保已选择 RegionB01-COMP01 集群 2. 单击 Manage( 管理 ) 选项卡 3. 选择 vsphere DRS 4. 请注意,DRS Automation(DRS 自动化 ) 已设置为 Partially Automated( 半自动 ) 将 DRS 自动化级别设置为 Fully Automated ( 全自动 ) 单击 Edit( 编辑 ) 以更改 DRS 自动化级别 Page 115

更改 DRS 自动化级别 1. 单击 Partially Automated( 半自动 ) 以显示其他 DRS 自动化级别设置 2. 选择 Fully Automated( 全自动 ) 3. 单击 OK( 确定 ) 以确认集群设置配置更改 Page 116

问题解决了! 请注意,esx-01b 现已成功进入维护模式 Page 117

第 5 单元 : 高级性能挑战 (30 分钟 ) Page 118

存储性能低下 今天是美好的一天 早上醒来, 您的心情不错 您最近刚从 vsphere 5.1 环境迁移至 vsphere 6.0, 正期待它能提供出色的服务 查看电子邮件时, 您看到西南全局象限中的各 Waypoint 支付设备报告客户查询处理异常缓慢 支付操作属于会占用大量磁盘空间的工作负载, 因此, 您可以从这里开始 以故障排除这种方式开启新的一天总是非常令人振奋 等待练习状态 : 准备就绪 在桌面控制台的右下角, 您将看到以绿色或红色显示的 Lab Status( 练习状态 ) 字样 现在就请在动手练习桌面上查找此内容 如果 Lab Status( 练习状态 ) 为绿色, 请转到下一页立即开始练习 如果 Lab Status( 练习状态 ) 为红色, 请勿开始练习 这表示我们仍在准备您的虚拟环境 请等待 Lab Status( 练习状态 ) 变为绿色并显示 Ready( 准备就绪 ) 有时, 这个过程可能需要 10 分钟以上 如果 Lab Status( 练习状态 ) 显示为 Ready( 准备就绪 ), 请转到下一页开始练习 打开桌面上的 Challenge Scripts 文件夹 1. 打开桌面上的 Challenge Scripts 文件夹 启动第 5 单元的脚本 1. 右键单击 Module5-start.ps1 Page 119

2. 从上下文菜单中, 单击 Run with PowerShell( 使用 PowerShell 运行 ) 第 5 单元的脚本启动 脚本需要一分钟才能完成运行 同时, 请继续执行下一步骤, 我们将介绍一些处理挑战的指导原则 有关如何应对挑战的指导原则 要对该挑战进行故障排除, 请在必要时通过 Internet 探索相应的解决方案 如果您正在全屏模式下观看此练习, 可按 F11 键禁用全屏模式, 然后访问 Internet 当然, 如果您身边有已连网的移动设备, 也可以用移动设备访问 对于使用非美式键盘的用户 如果您使用的是非美式键盘, 则在本练习过程中可能难以输入 CLI 命令或者用户名和密码 以下几种方案可帮助您解决此问题 Page 120

方案 1: 在任务栏上, 单击键盘图标打开可单击的屏幕键盘 Page 121

对于使用非美式键盘的用户 方案 2: 打开桌面上的 README.txt 此文件中包含适用于 vsphere 6 挑战练习的所有凭证和编写好的输入命令 这样, 您便可以根据需要复制和粘贴这些内容 Page 122

对于使用非美式键盘的用户 方案 3: 最后, 利用 VMware Learning Platform 的 Send Text( 发送文本 ) 选项, 您可以使用本机键盘输入文本并将其发送到练习桌面 单击练习控制台左上角的 Send Text( 发送文本 ) 按钮 此时会打开一个窗口, 您可以在其中输入文本 ; 然后单击 Send( 发送 ) 激活提示或水印 首次开始练习时, 您可能会注意到桌面上有一个水印, 指示 Windows 尚未激活 虚拟化的一个主要优势在于, 可以在任意平台上移动和运行虚拟机 本动手练习利用了这一优势, 我们可以运行多个数据中心内的练习 但是, 这些数据中心的处理器可能不同, 这就需要通过 Internet 进行 Microsoft 激活检查 请放心,VMware 和本动手练习完全符合 Microsoft 的许可要求 您使用的练习是一个独立的单元, 没有对 Internet 的完全访问权限, 而 Windows 需要该权限才能验证激活 如果没有对 Internet 的完全访问权限, 此自动化过程会失败, 并且显示此水印 这个问题无关紧要, 不会影响到您的练习 如果您有任何疑问或顾虑, 请随时使用为您提供的支持 您可以通过 VMworld 上动手练习部分的由专家主持的研讨会获得支持, 也可以通过调查评论获得在线支持 我们始终致力于改善您的动手练习体验 Page 123

第 5 单元的脚本正在运行中 脚本到达这一状态后, 请勿关闭窗口 请转到下一页 打开 challenge-04a 远程桌面 双击桌面上的 chg-04a.rdp 快捷方式, 打开远程桌面会话 Page 124

打开 Iometer 双击桌面上的 Iometer 图标将其打开 Page 125

Iometer 此时会打开 Iometer 窗口 Iometer( 发音同 thermometer) 是存储基准测试 1. 单击绿色旗帜绿色旗帜开始测试 基准测试需要一分钟才能启动 在此期间 : 2. 请返回到动手练习桌面上的 Powershell 窗口 Page 126

继续运行第 5 单元的脚本 在动手练习桌面上的 PowerShell 窗口中, 按两次 Enter 键完成脚本运行 脚本运行完毕后, 请转到下一页 第 5 单元的脚本运行完毕 等待脚本运行完毕并显示如上所示的 You may now close this window( 您现在可以关闭此窗口 ) 按两次 Enter 键或者单击窗口右上角的关闭按钮, 将窗口关闭 Iometer 显示 在 challenge-04a 远程桌面会话中返回到 Iometer 窗口 Page 127

1. 单击 Results Display( 结果显示 ) 选项卡 Iometer 将存储负载放置在虚拟机 challenge-04a 上 显示的 Total I/Os per Second( 每秒的 I/O 总数 )(IOPS) 是多少? 只有五次?PanContinental 针对这台虚拟机的 SLA 规定 :challenge-04a 每秒的 I/O 次数至少要达到 16 次 Average I/O Response Time (ms)( 平均 I/O 响应时间 [ 毫秒 ]) 约为 12,000 毫秒, 即 12 秒 通常, 实际 I/O 响应时间 ( 或延迟 ) 在 1 到 10 毫秒之间, 具体取决于存储和 I/O 的负载特征 在现实情况中, 如果 I/O 响应时间为 12 秒, 则太长了 不过, 这并不是现实情况, 所以您不用担心响应时间的问题 就本练习而言, 您应该侧重于修复每秒的 I/O 次数 Murphy 说, 在他将这台虚拟机从 ESXi 5.1 主机迁移至目前的 ESXi 6.0 主机之前,5.1 主机可以很好地满足 SLA 要求 并且 6.0 主机没有出现任何问题 什么东西发生了改变呢? 我们来看一下 Web Client 中的虚拟机 Page 128

打开 Chrome 双击桌面上的图标以打开 Chrome 打开 RegionA Web Client ( 区域 A Web Client) 在书签栏上, 单击 RegionA Web Client( 区域 A Web Client) 打开 vsphere Web Client 打开 vsphere Web Client 选中 Use Windows session authentication( 使用 Windows 会话身份验证 ), 然后单击 Login( 登录 ) 您应在 vsphere Web Client 中查找 challenge-04a 虚拟机 在 vsphere Web Client 中找到 challenge-04a 后, 请转到下一页 Page 129

esxtop 概述 开始应对挑战之前, 我们来简单介绍一下一种有用的性能监控工具, 即 esxtop esxtop 是用于查看任何种类的高级主机级性能统计信息的理想工具 您可以将 esxtop 视为 ESXi 模拟 UNIX 中的 top 命令而设置的工具 克服这项挑战并不需要使用 esxtop, 但它是非常有用的故障排除工具 如果您愿意, 可以跳过这一部分 1. 单击任务栏上的 PuTTY 图标 打开 esx-03a 的 PuTTY 会话 双击 esx-03a.corp.local 打开 PuTTY 会话 esxtop 输入 Page 130

esxtop 然后按 Enter 键 Page 131

esxtop 默认视图 CPU screen(cpu 屏幕 ) 将实时显示 ESXi 上的运行环境 该表根据运行环境的 %USED 值以降序顺序排列这些环境 challenge-04a 位于列表顶部, 因为在所有运行环境中, 它占用的 CPU 时间最多 challenge-04a 并没有占用大量 CPU 时间 ( 占用率为 6.78%), 但它是在该主机上运行的唯一一台虚拟机 正如您看到的那样,esxtop 进程本身也会占用 CPU 时间 esxtop 按 h 键 查看 esxtop 帮助屏幕 借助 esxtop, 您可以在多个不同的专用屏幕之间切换 每个屏幕报告一组不同的衡量指标, 这些衡量指标将会实时进行更新 您一次只能查看一个屏幕, 只需进行一次键击即可在屏幕之间进行切换 Page 132

按 c 键可切换至 CPU 屏幕, 按 d 键可切换至磁盘适配器屏幕, 等等 esxtop 1. 单击 Maximize Window( 最大化窗口 ) 按钮, 将 PuTTY 窗口放大 2. 按 u 键 查看上面显示的磁盘设备屏幕 naa.6589cfc000000cfd9bc58d680c24402e 表示适用于 challenge-04a( 实际上是适用于本练习中的所有虚拟机 ) 的备用存储设备 您可以看到, 上面突出显示的 CMDS/s( 每秒的 I/O 操作次数 ) 与 Iometer 所报告的每秒的操作次数相同 此项 esxtop 统计信息显示了备用存储设备每秒接收到的 I/O 操作总数 因此我们可得出一个合理的结论 : 在这些 I/O 操作中, 有些是由 Iometer 创建的, 而有些则是由 challenge-04a 客户操作系统创建的 esxtop 使用多种不同的衡量指标缩写 有关 esxtop 屏幕和衡量指标的说明, 请参见文档解读 esxtop 统计数据 (Interpreting esxtop Statistics)( 在新窗口中打开 ) 该文档更加详细地介绍了这种高级工具 如果您有兴趣了解关于 esxtop 的更多信息, 请参见 HOL-1704-SDC-1 的第 10 单元 : 性能监控工具 :esxtop CLI 简介 Page 133

如果您已经熟悉 esxtop, 可以参阅知识库文章 1008205 使用 esxtop 识别 ESX/ESXi( 多个版本 ) 的存储性能问题 (Using esxtop to identify storage performance issues for ESX / ESXi [multiple versions])( 在新窗口中打开 ), 这是非常好的资源 关闭 PuTTY 窗口 请转到下一页开始应对挑战 您面临的挑战 您面临的挑战是提高 challenge-04a 每秒的 I/O 次数, 从而使其每秒的 I/O 总数接近 16 次 对于这项挑战, 您可以执行以下操作 : - 对虚拟机执行 vmotion 操作 - 修改虚拟机设置 - 如果您出于某种原因需要重新应对这项挑战, 可以重新运行脚本 C:\HOL-CHG-1695\ Module5-start.ps1 这将会重新引导所有虚拟机, 并将一些虚拟机设置恢复为开始应对这项挑战时的状态 请注意, 并非所有设置和虚拟硬件都会重置, 因此, 如果您对环境做出了更改却无法成功应对挑战, 请恢复环境的设置 您不得执行以下操作 : - 更改 Iometer 设置 您可以根据需要停止并重启, 但不能更改任何其他设置 - 重命名任何虚拟机 - 关闭所有虚拟机 - 修改虚拟机的虚拟硬件 - 查看 Module5-start.ps1 脚本 ( 这将产生误导作用 ) 如果您这么做, 就会威胁到远程传送器网络的完整性! 如果 Waypoints 网络出现问题, 我们的竞争对手将会赢得一大批新客户 需要提示? Page 134

查看第 1 条提示 查看第 2 条提示 如果您感觉自己已经找到答案, 或者决定就此放弃, 请转到下一页 Page 135

解决方案 针对此场景的解决方案 : 1. 将虚拟磁盘的 I/O 限制从 16 增加到 32 请继续阅读, 了解具体原因... 解决方案 IOPS 限制是 Storage I/O Control 的功能之一 在您使用 I/O 限制之前, 必须先启用 Storage I/O Control 在练习中,Storage I/O Control 已经处于启用状态 如果您需要在自己的环境中执行此操作, 可采用以下方式 在 vsphere Web Client 中, 选择一个数据存储, 依次单击 Manage( 管理 ) 选项卡和 Settings( 设置 ), 然后在 Datastore Capabilities( 数据存储功能 ) 下, 单击 Edit...( 编辑...) 确保选中 Enable Storage I/O Control( 启用 Storage I/O Control) 复选框 Page 136

除非 ESXi 主机检测到数据存储中发生拥塞, 否则 Storage I/O Control 不会起效 默认拥塞阈值为 30 毫秒, 最低可设置为 5 毫秒 Page 137

Iometer 浏览回到 challenge-04a 远程桌面会话 您可以在 Iometer 中看到每秒的 I/O 总数现已接近 16 您可能已经注意到,Average I/O Response Time( 平均 I/O 响应时间 [ 毫秒 ]) 也已从之前的平均 12 秒缩短到 4 秒左右 虚拟磁盘的 I/O 限制导致延迟居高不下 如果您使用虚拟磁盘 I/O 限制, 请记住, 该虚拟机的 I/O 响应时间也将受到负面影响, 但不会像您在本练习中看到的时间那么长 在此示例中,I/O 限制为 32, 这有点儿低的不切实际, 会导致 I/O 响应时间长的不切实际 在此示例中, 为了进行动手练习, 我们想要将存储负载保持在较低的水平 您可能会问自己, 当我将每秒的 I/O 次数限制设置为 32 时, 为什么虚拟机中每秒的 I/O 次数限制会是 16? 问得好! 1. 回到 challenge-04a, 单击红色的 Stop( 停止 ) 按钮停止存储测试 Page 138

Iometer 1. 选择 Access Specifications( 访问规范 ) 选项卡 在 Iometer 中, 访问规范决定 Iometer 放置在指定目标 ( 在本示例中为 challenge-04a 磁盘 ) 上的 I/O 负载类型 Page 139

Iometer 左侧窗格显示处于活动状态的访问规范 右侧窗格显示所有可能会用到的访问规范 Iometer 使用的 I/O 访问规范为 : 块大小为 64K 读取操作占 100% 随机 I/O 占 0%( 即, 顺序 I/O 占 100%) Page 140

Iometer 1. 在左侧窗格中, 选择 Access Specification( 访问规范 ) 2. 单击 Remove( 移除 ) 将其移除, 以停止使用 Page 141

Iometer 如果使用不同的访问规范,IOPS 结果是相同还是不同呢? 接下来, 1. 选用以下规范 : 块大小为 512B 读取操作占 100% 随机 I/O 占 0% 2. 单击 Add( 添加 ) 将此规范激活 3. 单击绿色旗帜绿色旗帜开始测试 4. 单击 Results Display( 结果显示 ) 看一下发生了什么情况 Iometer 测试 发生了什么情况? 接下来, 请尝试使用一种不同的访问规范 就像在执行故障排除以解决问题时一样, 当您进行测试时, 请一次更改一个变量, 然后重新测试以确定这一项更改所产生的效果 Page 142

我们将块大小为 64K 读取操作占 100% 连续跟踪占 100% 和块大小为 512 字节 读取操作占 100% 连续跟踪占 100% 这两种规范进行了比较 1. 请选择一种访问规范 2. 单击 Add( 添加 ) 将此规范激活 3. 单击绿色旗帜绿色旗帜开始测试 4. 单击 Results Display( 结果显示 ) 看一下发生了什么情况 此时没有什么具体问题需要解决 我们只是操作一下, 看一看发生了什么情况 为了安排好时间, 请记住, 处理完此项挑战之后, 本单元内还有另外一项挑战需要处理 如果需要, 您也可以返回 vsphere Web Client 并更改虚拟磁盘 IOPS 限制 如果您已准备好继续后面的操作, 请转到下一页 结束 Iometer 测试 1. 单击红色的 Stop( 停止 ) 按钮结束 Iometer 测试 2. 关闭 Iometer 窗口 IOPS 限制的算法 您可能已经注意到, 如果已经设置 IOPS 限制, 则强制实施限制的方式取决于 I/O 块大小, 即 512 字节 16 KB 64 KB 等等 vsphere 5.5 引入了一种新的 IOPS 限制调度算法, 该算法可针对 I/O 活动施加额外控制, 还可以改变强制实施 IOPS 限制的方式 这种新算法俗称 mclock, 可根据 I/O 块大小来权衡权衡允许虚拟机的 IOPS 为多少 换言之, 将限制设置为 16 次并不一定意味着虚拟机的 IOPS 最多为 16 次 您看到的 IOPS 会取决于虚拟机所生成的 I/O 的大小, 并且可能会大于或小于限制设置 块越大,IOPS 就越低 这就解释了为什么 Murphy 的虚拟机从 ESXi 5.1 主机迁移到 ESXi 6.0 主机后, 就无法满足 IOPS 为 16 的 SLA 要求 如果您要向 ESXi 5.5 或 6.0 主机迁移, 可以相应地重置虚拟机的 IOPS 限制, 或者也可以禁用新算法并回滚至 5.5 之前的 IOPS 限制算法 请转到下一页 Page 143

高级系统设置 如果您想要回滚至 5.5 之前的 IOPS 限制算法, 只需将主机的高级设置 Disk.SchedulerWithReservation 设置为 0 即可, 默认值为 1 重置虚拟磁盘限制 由于已操作完毕, 现在, 让我们将 IOPS 限制重置到无限制状态, 这样就不会影响我们处理下一项挑战 请在 vsphere Web Client 中执行以下操作 : 1. 右键单击 challenge-04a 2. 单击 Edit Settings...( 编辑设置...) Page 144

重置虚拟磁盘限制 在 Edit Settings( 编辑设置 ) 下, 1. 单击 Hard Disk 1( 硬盘 1) 将其展开 2. 单击 Limit - IOPS( 限制 - IOPS) 下拉菜单, 并将其设置更改为 Unlimited( 无限制 ) 3. 单击 OK( 确定 ) 祝贺您! 您所掌握的有关 IOPS 限制的新知识迟早会在那些大量占用磁盘空间的虚拟机上真正派上用场 Page 145

再接再厉! 您知道 vnuma 是什么吗? Page 146

vnuma 故障排除 Murphy 闯进您的办公室, 说 : 我的 challenge-04a 虚拟机上没有 vnuma, 我不知道这是为什么 我需要在这台虚拟机上安装 vnuma 拓扑, 以便进行一些新测试 vnuma 故障排除 您现在应该仔细想一下 您可以实现此目标! 现在我们来看一下 challenge-04a 打开 challenge-04a 远程桌面 对于此项挑战, 没有相应的启动脚本 如果 challenge-04a 远程桌面会话尚未打开, 那么请双击桌面图标 chg-04a.rdp, 打开虚拟机 challenge-04a 的远程桌面会话 Page 147

challenge-04a 桌面 1. 单击任务栏快捷方式, 打开命令提示符 Page 148

查看 challenge-04a 上的 vnuma 1. 在命令提示符下, 输入或从 README.txt 文件中复制以下命令 : coreinfo -n 然后按 Enter 键 您可以看到逻辑处理器映射到 NUMA 节点 从客户机的角度看, 它在一个 NUMA 节点 ( 节点 0) 上有四个核心 ( 用 * 表示 ) 查看 challenge-04a 上的 vnuma Coreinfo 是安装在 challenge-04a 上的第三方工具, 有了它, 可以轻松查看 NUMA 体系结构 在 Windows Server 2012 上, 还可以采用本机查看方式来查看虚拟 NUMA 体系结构 1. 单击 Server Manager 任务栏快捷方式 打开 Resource Monitor ( 资源监控器 ) 1. 单击 Tools( 工具 ) Page 149

2. 然后单击 Resource Monitor( 资源监控器 ) Page 150

资源监控器 1. 单击 CPU 选项卡 2. 单击 Views( 视图 ) 下拉菜单 3. 选择 Small( 小 ) 4. 在这里, 您可以看到 Windows 检测到它有四个 CPU, 但没有提及 NUMA 节点 Page 151

vnuma 但是, 当 vnuma 处于启用状态时, 带有两个插槽且每插槽包含两个核心的虚拟机看起来会有所不同 在资源监控器中,Windows 按 NUMA 节点汇总 CPU 使用率, 您可以清楚地看到虚拟核心所映射到的具体 NUMA 节点 接下来, 我们在 Web Client 中查找虚拟机 打开 Chrome 如果依然无法打开并登录 vsphere Web Client, 那么请双击 Main Console( 主控制台 ) 桌面图标打开 Chrome Page 152

打开 RegionA Web Client ( 区域 A Web Client) 如果您无法自动转到 VMware vcenter Single Sign on(vmware vcenter 单点登录 ) 页面, 请单击书签栏上的 RegionA Web Client( 区域 A Web Client) 打开 vsphere Web Client 登录 vsphere Web Client 1. 选择 Use Windows session authentication( 使用 Windows 会话身份验证 ) 2. 单击 Login( 登录 ) 出现问题的虚拟机是 challenge-04a; 您应该已经知道它的位置了 请转到下一页开始应对挑战 您面临的挑战 您面临的挑战是在 challenge-04a 上启用 vnuma 如果您尚不熟悉 NUMA, 可能需要完成练习 HOL-1704-SDC-1vSphere 性能优化的第 6 单元 : 带有内存热添加的 vnuma 但是, 要应对此挑战, 并不需要了解有关 NUMA 的技术知识 对虚拟机进行故障排除, 以便它能够像上面所示一样显示含两个 NUMA 节点 ( 每个节点包含两个核心, 核心用 * 表示 ) 的拓扑 对于这项挑战, 您可以执行以下操作 : - 通过 vmotion 迁移虚拟机 - 修改虚拟机设置 - 重新引导虚拟机 - 如果您出于某种原因需要重新应对这项挑战, 可以重新运行脚本 C:\HOL-CHG\ Module5-start.ps1 这将会重新引导所有虚拟机, 并将一些虚拟机设置恢复为开始应对这项挑战时 Page 153

的状态 请注意, 并非所有设置和虚拟硬件都会重置, 因此, 如果您对环境做出了更改却无法成功应对挑战, 请恢复环境的设置 您不得执行以下操作 : - 重命名任何虚拟机 - 修改虚拟机的虚拟硬件 - 查看 Module5-start.ps1 脚本 ( 这将产生误导作用 ) 如果您这么做, 就会威胁到远程传送器网络的完整性! 有些人可能会遭遇南辕北辙的情况 需要提示? 查看第 1 条提示 查看第 2 条提示 如果您感觉自己已经找到答案, 或者决定就此放弃, 请转到下一页 解决方案 如果 Hot Add vcpu( 热添加虚拟 CPU) 这一虚拟硬件设置处于启用状态, 则提供给虚拟机的体系结构将只有一致内存访问 (UMA) 要解决此问题, 请执行以下操作 : 1. 关闭 challenge-04a 2. 在 Web Client 中, 右键单击 challenge-04a, 然后单击 Edit Settings( 编辑设置 ) 在 CPU 下, 取消选择 Enable CPU Hot Add( 启用 CPU 热添加 ) Page 154

3. 单击 OK( 确定 ) 4. 重新启动虚拟机, 并且, 与虚拟机的虚拟硬件设置匹配的 vnuma 体系结构现在处于可见状态 您应该将 Enable CPU Hot Add( 启用 CPU 热添加 ) 设置保持禁用状态, 但如果需要使用此设置则例外 请注意, 虚拟机配有 4 个虚拟 CPU, 且在每个插槽中配有 2 个核心, 因为这是动手练习环境 但是, 通常应该将每个插槽的核心数量设为 1 个, 以实现最佳性能 当将每个插槽的核心数量设为 1 个 ( 默认值 ) 时,ESXi 可根据物理服务器自动为虚拟机选择最佳 vnuma 配置, 这样通常能实现最佳性能 将每个插槽的核心数量设为 1 个, 但如果您有不这样做的特殊理由则例外, 例如, 出于许可目的 如果您认为您的客户操作系统应该可以识别 vnuma 体系结构, 但它却识别不了, 请检查以下各项 : 默认情况下, 仅为包含超过八个虚拟 CPU 的虚拟机启用 vnuma 但是, 您也可为包含八个或不到八个虚拟 CPU 的虚拟机启用 vnuma, 方法是 : 将虚拟机设置 numa.vcpu.min 的默认值 9 改为虚拟机中所包含的虚拟 CPU 数量 此设置可控制为了启用 vnuma 而需要使用的虚拟 CPU 的最小数量 我们在 challenge-04a 上修改了此设置 vnuma 要求使用虚拟硬件版本 8 或更高版本 其他可能会完全禁用 NUMA ( 针对主机和虚拟机 ) 的因素包括 BIOS 设置, 例如, 启用节点交叉 通常情况下, 节点交叉功能默认处于禁用状态, 但如果您将它启用, 它将为 ESXi 主机提供 UMA 体系结构 如需更多关于 vnuma 的有用信息, 请完成 HOL-1704-SDC-1vSphere 性能优化练习的第 6 单元 : 带有内存热添加的 vnuma Page 155

Page 156

结果 如果我们在作出更改后查看 challenge-04a, 此时将看到 2 个 vnuma 节点 今天的任务已经大功告成! 可以好好休息一下了 请转到下一页 Page 157