与 Microsoft Windows Admin Center 集成的 Dell EMC OpenManage Integration 1.1.0 版 用户指南

故障排除

OMIMSWAC 扩展日志的可用性

可以在目标节点的 <Windows Directory>\Temp\OMIMSWAC 找到目标节点和群集节点的 OpenManage Integration with Microsoft Windows Admin Center (OMIMSWAC) 扩展日志。当运行 OMIMSWAC 功能时,日志捕获信息,另外还提供有关执行任何 OMIMSWAC 操作时所发生错误的调试信息。通过以下命名约定的帮助,可以轻松访问各种 OMIMSWAC 功能的日志:
  • 对于硬件和运行状况资源清册: Inventory<ID*>
  • 对于更新合规性: FirmwareCompliance<ID*>
  • 对于更新通知: Notification<ID*>

更新操作日志的可用性

可从以下路径获取更新合规性功能的应用程序日志:
  • 网关系统:<Windows Directory>\ServiceProfiles\NetworkService\AppData\Local\Temp\generated\logs
  • Windows 10 网关系统:<Windows installed drive>\Users\<user_name>\AppData\Local\Temp\generated\logs
系统会在应用程序日志中捕获联机目录下载状态,并使用捕获内容对联机目录的任何下载错误进行故障处理。
在选定联机目录源后,如果未提前在设置中配置 DSU 和 IC,OMIMSWAC 将在以下路径中下载目录、DSU 和 IC 实用程序:
  • 网关系统:<Windows Directory>\ServiceProfiles\NetworkService\AppData\Local\Temp\generated\Share\temp\<server/cluster_name>
  • Windows 10 网关系统:<Windows installed drive>\Users\<user_name>\AppData\Local\Temp\generated\Share\temp\<server/cluster_name>
确保在生成和更新合规性期间未修改下载的目录文件、DSU 和 IC。生成并更新合规性报告后,系统会自动删除目录文件、DSU 和 IC 实用程序。

可在每个节点的 <Windows Directory>\Temp\precau.log 中获取在 HCI 群集上运行以使存储处于维护模式的预更新脚本的日志。也可在每个节点的 <Windows Directory>\Temp\postcau.log 中获取在 HCI 群集上运行以使存储从维护模式恢复的更新后脚本的日志。

无法将所需的文件复制到目标节点以获取资源清册信息。

请确保:
  • 目标节点未处于重新启动状态,并已开机。
  • 防火墙未阻止通过 SMB 端口 445 进行通信。有关更多信息,请参阅 准备 Windows Admin Center 的环境
  • 用户使用网关管理权限登录。在连接到目标节点之前,请确保您选择“管理身份”,并提供相应的服务器管理员或群集管理员帐户。有关选择“管理身份”的详细信息,请参阅 Microsoft 说明文件中的“Windows Admin Center 入门”部分。

无法从 iDRAC 获取运行状况和硬件资源清册。

要从 iDRAC 获取运行状况和硬件资源清册信息,请确保:
  • 对于 PowerEdge 服务器的管理,OMIMSWAC 使用操作系统至 iDRAC 的内部直通接口。默认情况下,可以使用 IP 地址 169.254.0.1/<子网> 或 169.254.1.1/<子网> 访问 iDRAC。但是,如果主机在同一子网中有其他网络接口(例如,当安装了诸如 VMFleet 等工具时),则 OMIMSWAC 可能无法通过主机操作系统与 iDRAC 进行通信。

    要解决该冲突,请登录 iDRAC 并在“操作系统至 iDRAC 直通”部分下更改 USB NIC IP 地址。有关分配此 IP 地址的详细信息,请参阅支持站点上的 iDRAC 说明文件。

  • 对于群集管理,在使用 OMIMSWAC 管理群集之前,请确保可以使用 IP 地址、主机名或完全限定域名 (FQDN) 访问所有群集节点。
  • 如果 Redfish 服务已禁用,请使用 iDRAC UI 启用 Redfish 服务。有关详细信息,请参阅 Dell EMC 支持站点上的 iDRAC 说明文件。
  • iDRAC 上有用于创建新用户的用户插槽。

无法完成或选择用于闪烁或取消闪烁操作的磁盘。

  • 原因:Redfish 服务未启用。

    解决方案:通过使用 iDRAC UI 启用 Redfish 服务。有关详细信息,请参阅 Dell EMC 支持站点上的 iDRAC 说明文件。

  • 原因:在 OMIMSWAC 中加载硬件资源清册后,如果物理磁盘已移除,则闪烁和取消闪烁操作将失败,并显示错误:Blink may not be supported with <Disk_Name>

    解决方案:插入物理磁盘,单击刷新以在 OMIMSWAC 中重新加载资源清册信息,然后重新运行闪烁和取消闪烁操作。

  • 原因:如果 iDRAC 固件版本低于 3.30.30.30,则无法选择物理磁盘进行闪烁或取消闪烁操作。

    解决方案:将 iDRAC 固件更新到最新版本,然后重试闪烁和取消闪烁操作。

  • 当物理磁盘连接到嵌入式 SATA 控制器且其运行状况为未知时,闪烁和取消闪烁操作将失败,这表示磁盘可能不支持闪烁或取消闪烁操作。

许可状态为“未知”或“未经授权”

如果许可证状态为未知未经授权,请确保:
  • 许可证未过期。
  • 许可证存在于每个目标节点上。
  • 目标节点未处于重新启动状态,并已开机。
  • Redfish 已启用。
  • Azure stack HCI 许可证或 PowerEdge 服务器许可证已导入到相应的硬件上。不支持将 Azure stack HCI 许可证导入到 PowerEdge 服务器或将 PowerEdge 服务器许可证导入到 Azure stack HCI 服务器。
如果问题仍然存在:
  1. 转至 iDRAC。
  2. 确保 Redfish 服务已启用。
  3. 禁用操作系统到 iDRAC 的直通,然后再将其启用。

    有关启用或禁用操作系统到 iDRAC 直通的更多信息,请参阅 iDRAC 用户指南。

许可日志的可用性

许可证相关日志位于以下路径中,且可以通过在清理文件中搜索 DellLicenseCollection 找到。
  • 网关系统:<Windows Directory>\ServiceProfiles\NetworkService\AppData\Local\Temp\generated\logs\CleanupXXXXXXXXXXXXXX.log
  • Windows 10 网关系统:<Windows installed drive>\Users\<user_name>\AppData\Local\Temp\generated\logs\CleanupXXXXXXXXXXXXXX.log

下载服务器和群集感知更新操作所需的组件时,作业失败。

原因:使用 Dell EMC Repository Manager (DRM) 导出存储库时,导出作业的完成状态可能为“部分成功”。在此情况下,存储库可能缺少一个或多个 DUP。

解决方案:在 DRM 中重试导出存储库,并确保作业成功完成。

原因:选择更新源作为联机源时,可能无法下载一个或多个组件。

解决方案:确保存在互联网连接,然后重试从联机源下载目录。有关更多信息,请参阅 Dell EMC Repository Manager 用户指南。

更新期间,CredSSP 失败

  • 原因:更新群集时,使用 CredSSP 的凭据委派可能会失败。

    解决方案:使用完全限定域名重新连接群集,然后单击将此凭据用于所有服务器复选框。

    例如,如果域名为 test.dev.com,则使用 test.dev.com\administrator 作为域名,然后单击将此凭据用于所有服务器复选框。

  • 原因:使用 CredSSP 身份验证在远程计算机上运行脚本时,更新作业可能会失败并显示错误。

    问题在于网关计算机中已禁用 CredSSP。

    解决方案:要解决此问题,请执行以下步骤:
    1. 在 PowerShell 窗口中,运行 gpedit
    2. 在“组策略编辑器”窗口中,单击计算机配置 > 管理模板 > 系统 > 凭据委派
    3. 选择允许使用仅 NTLM 服务器身份验证委派新凭据,并将其启用。
    4. 在 PowerShell 中执行 gpupdate /force

启用 CredSSP 委派

原因:当您从 OpenManage Integration 导航至 HCI 或故障切换解决方案下的其他工具,然后再导航回 OpenManage Integration 时,会显示以下错误:启用 CredSSP 委派

解决方案:忽略该错误,因为 OpenManage Integration 和 Windows Admin Center 的功能未被阻止。

生成合规性报告时,作业失败

原因:生成合规性报告时,合规性报告生成可能失败并在日志中显示以下错误:
在远程服务器上启动命令失败,并显示以下错误消息:WinRM 客户端向远程 WS 管理服务发送了请求,随后被告知请求大小超出了配置的 MaxEnvelopeSize 配额。有关更多信息,请参阅远程故障处理帮助主题。
解决方案:请确保:
  • 网关系统和目标节点之间的网络连接完好无损。
  • 网关系统和目标节点之间的文件复制功能可正常使用。要进行检查,请执行以下操作:
    1. 通过执行以下 PowerShell 命令,创建基于目标节点凭据的会话:

      $SecurePassword = convertto-securestring <password> -asplaintext -force

      $credential = New-Object System.Management.Automation.PSCredential -ArgumentList <userid>, $SecurePassword

      $session = New-PSSession -ComputerName <MN FQDN> -Credential $credential -ErrorAction SilentlyContinue

    2. 将测试文件复制到故障的目标节点,假定“Test.txt”位于 C:\ drive

      Copy-Item -Path "C:\Test.txt" -Destination "C:\" -Recurse -Force -ToSession $session

  • 如果在执行上述操作后问题仍然存在,请尝试重新启动目标节点(文件复制失败)中的 Windows 远程管理 (WS-Management) 服务,然后重新运行合规性。

原因:为群集生成合规性报告时,群集节点的合规性报告生成操作可能会失败。

解决方案:请确保:

  • 使用 Get-ClusterService PowerShell 命令,确保群集服务正在群集节点上运行。
  • 确保群集节点未重新启动或处于关机状态。

原因:在使用 Windows 10 Microsoft Edge 浏览器生成合规性报告时,操作可能会失败,并显示以下错误:无法生成合规性报告。“管理身份”凭据尚未设置或未采用域\用户格式。

解决方案:执行以下任何操作:
  • 使用完全限定域名(例如 domain.lab\username)或顶级域(例如 domain\username)将目标节点与凭据连接。
  • 清除浏览器的高速缓存并重新运行合规性。
  • 确保已在安装 WAC 的系统中正确配置 DNS,以使用正确的凭据连接到目标节点。

原因:当您使用包含以下任何特殊字符的密码连接到服务器或群集时,尝试使用 OMIMSWAC 生成合规性报告,则合规性生成可能失败。特殊字符包括:双引号(")、重音符 (') 和分号 (;)。

解决方案:通过删除特殊字符并重新连接到服务器或群集来重置密码。

更新所选组件时,作业失败。

有时,CAU 或目标节点更新可能会失败。原因和解决方案如下所示:

  • 对于 CAU,在触发群集感知更新之前,先验证群集。有关验证群集的更多信息,请参阅 Microsoft 说明文件验证群集的硬件
  • 原因:生成合规性后,某些节点的合规性资源清册文件不可用,或从节点到网关的文件复制操作失败。

    解决方法:重新运行合规性。

  • 原因:由于互联网连接问题,以下操作可能会失败:
    • DSU 或 IC 的签名验证
    • 联机目录的下载
    • DUP 的下载

    如果上述任何操作失败,则 CAU 或服务器更新也会失败。

    解决方案:确保存在互联网连接,并重新运行合规性和更新。

  • 原因:DSU 安装程序不会从节点中清除,因为安装程序文件有时会被 Windows Admin Center 进程 (sme.exe) 锁定。

    解决方案:从 Windows 服务控制台重新启动 Windows Admin Center 服务。

  • 原因:如果有任何磁盘未处于正常运行状态,则 CAU 会失败。

    解决方案:在触发 CAU 之前,先确保物理磁盘和虚拟磁盘处于正常运行状态。如果有任何磁盘的运行状态不佳,请参阅 Microsoft 说明文件,以使其进入正常运行状态。

  • 原因:如果有任何群集节点被暂停,则 CAU 会失败。

    解决方案:在触发 CAU 之前,先恢复群集节点(故障切换角色)。

更新后,组件显示为非合规

更新后,您可能会看到显示为非合规的组件。

解决方案:在这种情况下,请检查包含 DSU 日志的清理日志,以查看该组件是否存在任何错误。如果在更新之前,组件存在需要满足的任何前提条件,请遵循前提条件,然后重新运行更新。

OpenManage Integration 访问被拒

原因:当您使用不具有管理员权限的网关用户凭据登录 Windows Admin Center (WAC) 并尝试从 WAC 控制台启动 OpenManage Integration 时,可能会出现“拒绝访问”错误。

解决方案:在 Windows Admin Center 中启动 Dell EMC OpenManage Integration 扩展之前,请确保以网关管理员身份登录 WAC。

Dell Update Package 失败

触发更新后,Dell EMC Update Package (DUP) 可能无法更新组件。在更新期间,DUP 失败的原因有多种。请查看以下可能的解决方案以解决问题:
  • 在安装了 Windows Admin Center (WAC) 的计算机中,检查日志文件以获取有关 DUP 下载失败和组件映射的详细信息。提供组件映射以识别 DUP 目录中的组件(选择以更新)。日志文件位于以下路径。

    网关系统:

    • 服务器更新:<Windows Directory>\ServiceProfiles\NetworkService\AppData\Local\Temp\generated\logs\<PrepareUpdate XXXX>
    • CAU:<Windows Directory>\ServiceProfiles\NetworkService\AppData\Local\Temp\generated\logs\Update XXXX
    Windows 10 网关系统:
    • 服务器更新:<Windows installed drive>\Users\<user_name>\AppData\Local\Temp\generated\logs\<PrepareUpdate XXXX>
    • CAU:<Windows installed drive>\Users\<user_name>\AppData\Local\Temp\generated\logs\Update XXXX
  • 日志消息示例如下所示:
    • DUP 下载失败错误日志

      2020-4-28 12:19:18 AM::: 错误>>> 消息:DRM 存储库中不存在某些所选组件的 DUP。

    • 组件映射日志文件

      # # 格式:: > > 组件名称-> 软件包名称

      :>> [0001] Broadcom NetXtreme Gigabit Ethernet -> Network_Firmware_RG25N_WN64_21.60.2_01.EXE

  • 在目标节点中,参阅组件映射、查找与组件相关的 DUP 日志文件,并查看 <Windows Directory>\Dell\UpdatePackage\log\<Package Name> 中指定的返回代码。有关原因和可能的解决方案,请参阅 Dell EMC Update Package 用户指南。

    下面提供了 DUP 故障情形的返回代码示例:

    退出代码 = 1(故障)

    2020-04-21 23:48:27

    更新软件包已完成。退出代码 = 1

  • 尝试将驱动程序组件降级到较低版本时,DUP 可能会失败。在这种情况下,请从操作系统中卸载驱动程序,然后从 OMIMSWAC 重新运行组件更新。有关如何卸载驱动程序的更多信息,请参阅 Microsoft 说明文件。
此外,您还可以尝试以下操作:
  • 重设 iDRAC,并将其更新到版本 4.20.20.20 或更高版本,然后重新运行更新。有关如何重设或更新 iDRAC 的更多信息,请参阅 iDRAC 说明文件。
  • 在目标节点中手动运行更新,方法如下:在 DUP 日志中,通过 <Windows Directory>\Dell\UpdatePackage\log\<Package Name> 指定的路径下载。网络固件的示例为 https://downloads.dell.com/FOLDER06091050M/1/Network_Firmware_TWFF6_WN64_16.26.60.00.EXE
  • 通过在 Dell 支持网站中搜索组件名称,确保所选的操作系统和平台支持选定的 DUP。Dell 支持网站 URL: https://www.dell.com/support/home/in/en/inbsd1/?app=products

由于网络通信错误,群集测试失败

原因:在 iDRAC 中启用 USB NIC 的情况下,如果您运行测试群集命令来验证群集创建就绪性或群集运行状况,则在验证报告中可能会出现错误。该错误表明分配给主机操作系统 USB NIC 的 IPv4 地址不能用于与其他群集网络通信。可以安全地忽略此错误。

解决方案:在运行测试群集命令之前,禁用 USB NIC(默认情况下标记为“以太网”)。

USB NIC 网络显示为已分区群集网络

原因:在 iDRAC 中启用 USB NIC 时,故障切换群集管理器中的群集网络会将与 USB NIC 关联的网络显示为已分区。导致此问题的原因是:在所有网络适配器上默认启用群集通信并且 USB NIC IPv4 地址不能用于外部通信,因此会中断这些 NIC 上的群集通信。可以安全地忽略此错误。

解决方案:从群集管理器禁用与 USB NIC 关联的网络的群集通信。


Rate this content

Accurate
Useful
Easy to understand
Was this article helpful?
0/3000 characters
  Please provide ratings (1-5 stars).
  Please provide ratings (1-5 stars).
  Please provide ratings (1-5 stars).
  Please select whether the article was helpful or not.
  Comments cannot contain these special characters: <>()\