ECS:OBS:如何通过 racadm 或 iDRAC UI 生成 SupportAssist/TSR 日志
Summary: ECS:如何使用 racadm 命令生成 SupportAssist 日志。如何从 iDRAC UI 收集技术支持报告 (TSR) 日志。
Instructions
概览
ECS 硬件型号 - 第 3 代:
- EX300
- EX500
- EXF900
- EX3000(EX3000S、EX3000D)
ObjectScale 硬件型号 — 第 4 代:
- X560的
- XF960系列
- EX5000(EX5000S、EX5000D)
svc_collect配置文件功能:
重要:自 xDoctor 4.8-86 或更高版本起,svc_collect配置文件日志收集功能可在任何 ECS 上运行。如果您没有安装 xDoctor 4.8-86 或更高版本,则必须使用手动日志收集过程。该日志为 PowerEdge EX 系列 ECS 生成所有型号的 TSR 日志、PERC/RAID 控制器日志 (EX3000)、PERC/RAID 控制器术语日志 (EX3000) 和 PERC/RAID 控制器事件 (EX3000)。必须按照 PowerEdge 团队的要求,从 PowerEdge 服务器手动完成更多收集。
- 对要进行故障处理的节点运行 svc_collect 中的日志收集命令,以运行该命令。
命令:
# svc_collect start -p ic_poweredge -n r<rack number>n<node number>
从机架 1 节点 1 收集的示例:
提醒:如果在不标识节点的情况下运行该命令,它将在整个 VDC 上运行。
admin@node2:~> svc_collect start -p ic_poweredge -n r1n1 svc_collect v1.3.2 (svc_tools v2.6.0-a3) Started 2022-07-29 21:13:02 ---------------------------------------------------------------------------------------------------------------- Starting data collection for: VDC1 Using collection profile: ic_poweredge Collect only from nodes: 'r1n1' Collect configuration files: True Collect log files: True Collect command outputs: True Log file Start time: 2022-07-29 20:53:02 Log file Stop time: 2022-07-29 21:13:02 Maximum root disk util %: 80 Maximum collect size: 10240MB Collect file name: /tmp/svc_collect-ic_poweredge-VDC1-20220729_211302.zip Creating manifest file /tmp/svc_collect-VDC1-20220729_211302/MANIFEST.INF Collecting node command output from nodes [Gathering Service Tag] [Gathering raid log EX3000 only] [Gathering term log] [Gathering events log] [Generating TSR log] [Gathering TSR log - waiting up to 10 minutes to complete] Exporting TSR: SUCCESS Collecting Fabric and OS logs Getting logs for *.raid.log* on node r1n1 Getting logs for *.term.log* on node r1n1 Getting logs for *.events.log* on node r1n1 Getting logs for *_tsr_report.zip* on node r1n1 Collect saved as file /tmp/svc_collect-ic_poweredge-VDC1-20220729_211302.zip Runtime: 40.0968358517
- 使用安全拷贝协议 (SCP) 客户端 (WinSCP) 收集从收集运行生成的.zip,然后使用戴尔服务编号 (DST) 提取文件中的集合,以供 PowerEdge 团队审查。
手动步骤(在 xDoctor 4.8-86 之前)
Command racadm (Remote Access Controller Admin) 是加载在所有 ECS EX 系列节点上的戴尔命令行工具,支持对 Integrated Dell Remote Access Controller (iDRAC) 资源的本地(ECS 主机到 iDRAC 直通)和远程(iDRAC 物理接口)访问。
如果使用 racadm 在本地(现场)或远程(SCG 或 WebEx)连接,则可以生成 SupportAssist 日志。iDRAC UI 仅在本地可用,因为在 EX 系列上,iDRAC 物理接口默认使用 192.168.219.10<node#> 本地 IP 地址。
如何在 EX300、EX500、X560、EXF900、XF960、EX5000 上生成 SupportAssist (SA) 日志:
在本地使用 racadm 连接到 iDRAC(ECS 主机运行,通过 ssh 连接到目标节点)。提醒:EX3000 使用的 iDRAC 版本与上述型号不同,因此请参阅本知识库文章中的进一步步骤:
1.使用 NAN IP 连接到目标节点。
admin:~> ssh 169.254.1.6
2.运行 racadm 命令以创建 TSR 日志收集。
admin:~> sudo -i racadm supportassist collect Job ID = JID_xxxxxx RAC1154: The requested operation is initiated. Run the RACADM jobqueue sub-command, using the job id to check the status of the requested operation.
如果您遇到“EULA not accepted”消息:
admin@node1:~> sudo -i racadm supportassist collect
SRV085: Unable to start the operation because the SupportAssist End User License Agreement (EULA) is not accepted.
Accept the SupportAssist End User License Agreement (EULA) by running racadm supportassist accepteula command.
解决方法是使用以下部分的步骤:“远程使用 racadm 连接到 iDRAC(ECS 主机关闭)”,请参阅下文。
admin@node2:~> sudo -i racadm -r 192.168.219.101 -u root -p passwd techsupreport collect Security Alert: Certificate is invalid - self signed certificate Continuing execution. Use -S option for racadm to stop execution on certificate-related errors. Job ID = JID_8xxxx RAC1154: The requested operation is initiated. Run the RACADM jobqueue sub-command, using the job id to check the status of the requested operation.
然后根据需要转到“使用 racadm 远程连接到 iDRAC(ECS 主机关闭)”部分以提取日志。
如果您遇到“一个本地 RACADM 实例已在执行”消息:
admin@node1:~> sudo -i racadm supportassist collect One Instance of Local RACADM is already executing. Exiting the current session.
有关详细信息,请参阅链接:https://www.dell.com/community/Systems-Management-General/RACADM-is-already-executing-message/td-p/4732148
您需要清除正在运行的 racadm 进程,然后重新运行 racadm。
请注意,检查当时没有其他人需要运行 racadm,因为那时您会清除 racadm 进程。
racadm 进程可能会卡住,必须在节点上使用以下命令将其清除:
admin@node1:~> sudo rm -rf /var/run/local_racadm.pid
然后重新运行 racadm 命令。
在较旧的 iDRAC 固件上,racadm 进程更可能卡住。
如果遇到,请检查 iDRAC 固件级别,并建议进行固件更新(如果适用)。
3.收集请求创建的作业必须成功完成,然后才能将其复制到 ECS 节点。使用预览步骤中提供的作业 ID 运行以下命令,以显示作业状态。
admin:~> sudo -i racadm jobqueue view -i JID_8xxxxx ---------------------------- JOB ------------------------- [Job ID=JID_8xxxxx] Job Name=SupportAssist Collection Status=Completed Start Time=[Not Applicable] Expiration Time=[Not Applicable] Message=[SRV088: The SupportAssist Collection Operation is completed successfully.] Percent Complete=[100] ----------------------------------------------------------
4.获取要在下一步中使用的节点的戴尔服务编号 (DST)。
admin:~> sudo -i racadm getsvctag Cxxxxx
5.将 TSR 报告从 iDRAC 复制到 ECS 节点上名称 <为 DST#>_tsr_report.zip 的目录位置。默认情况下,日志导出为.zip格式。导出可能需要几分钟时间。
admin:~> sudo -i racadm supportassist exportlastcollection -f /home/admin/Cxxxxx_tsr_report.zip Support Assist exported successfully. admin:~> ls -alt /home/admin/Cxxxxx_tsr_report.zip -rwxr-xr-x 1 root root 943054 Nov 5 21:07 /home/admin/xxxxx_tsr_report.zip
6.根据需要,使用 SCP 或其他传输工具将 /home/admin/Bxxxxx_tsr_report.zip 文件复制到外部位置。
远程使用 racadm 连接到 iDRAC(ECS 主机关闭):
1.连接到目标节点所在的机架中的任何作节点。
admin:~> ssh 169.254.1.1
提醒:默认情况下,只能从连接到同一后端网络(机架)的另一个节点访问 iDRAC 物理网络。
2.使用 iDRAC root 登录信息/密码在目标 192.168.219.10<node#> IP 上远程运行 racadm 命令,以创建 TSR 日志收集。
admin:~> sudo -i racadm -r 192.168.219.106 -u root -p passwd techsupreport collect Job ID = JID_4xxxxxx RAC1154: The requested operation is initiated. Run the RACADM jobqueue sub-command, using the job id to check the status of the requested operation.
3.收集请求创建的作业必须成功完成,然后才能将其复制到 ECS 节点。
使用预览步骤中提供的作业 ID 运行以下命令,以显示作业状态。
admin:~> sudo -i racadm -r 192.168.219.106 -u root -p passwd jobqueue view -i JID_4xxxxxxx ---------------------------- JOB ------------------------- [Job ID=JID_4xxxxxxx] Job Name=TSR_Collect Status=Completed Start Time=[Not Applicable] Expiration Time=[Not Applicable] Message=[SYS018: Job completed successfully.] Percent Complete=[100] ----------------------------------------------------------
4.获取要在下一步中使用的节点的戴尔服务编号 (DST)。
admin:~> sudo -i racadm -r 192.168.219.106 -u root -p passwd getsvctag CX1TBM2
5.将 TSR 报告从 iDRAC 复制到 ECS 节点上名称 <为 DST#>_tsr_report.zip 的目录位置。日志的导出默认采用.zip格式 b。导出可能需要几分钟时间。
admin:~> sudo -i racadm -r 192.168.219.106 -u root -p passwd techsupreport export -f /home/admin/Cxxxxx_tsr_report.zip Progress = 100 percent Tech Support Report exported successfully. admin:~> ls -alt /home/admin/Cxxxxx_tsr_report.zip -rwxr-xr-x 1 root root 447811 Oct 31 18:42 /home/admin/Cxxxxxx_tsr_report.zip
6.根据需要,使用 SCP 或其他传输工具将 /home/admin/Cxxxxxx_tsr_report.zip 文件复制到外部位置。
7.要查看 EX3000 TSR 信息,请执行以下作:传输到 Windows 笔记本电脑后,在 Windows 中打开xxx_tsr_report.zip文件,显示文件,其中一个将为 TSR<编号>_DST#<>.pl.zip。打开此文件,打开 tsr 目录,然后双击“viewer.html.
如何在 EX3000 上捕获技术支持报告 (TSR) 日志:
在本地使用 racadm 连接到 iDRAC(ECS 主机运行,通过 ssh 连接到目标节点)。提醒:EX3000 使用与上述型号不同的 iDRAC 版本,因此执行以下步骤:
1.使用 NAN IP 连接到目标节点。
admin:~> ssh 169.254.1.6
2.运行 racadm 命令以创建 TSR 日志收集。
admin:~> sudo -i racadm techsupreport collect Job ID = JID_xxxxxx RAC1154: The requested operation is initiated. Run the RACADM jobqueue sub-command, using the job id to check the status of the requested operation.
3.收集请求创建的作业必须成功完成,然后才能将其复制到 ECS 节点。
使用预览步骤中提供的作业 ID 运行以下命令,以显示作业状态。
admin:~> sudo -i racadm jobqueue view -i JID_xxxxx ---------------------------- JOB ------------------------- [Job ID=JID_xxxxxx] Job Name=TSR_Collect Status=Completed Start Time=[Not Applicable] Expiration Time=[Not Applicable] Message=[SYS018: Job completed successfully.] Percent Complete=[100] ----------------------------------------------------------
4.获取要在下一步中使用的节点的戴尔服务编号 (DST)。
admin:~> sudo -i racadm getsvctag xxxxxx
5.将 TSR 报告从 iDRAC 复制到 ECS 节点上名称 <为 DST#>_tsr_report.zip 的目录位置。日志的导出默认采用.zip格式 b。导出可能需要几分钟时间。
admin:~> sudo -i racadm techsupreport export -f /home/admin/xxxxxx_tsr_report.zip Tech Support Report exported successfully. admin:~> ls -alt /home/admin/xxxxxxx_tsr_report.zip -rwxr-xr-x 1 root root 447811 Oct 31 18:42 /home/admin/xxxxxx_tsr_report.zip
6.根据需要,使用 SCP 或其他传输工具将 /home/admin/xxxxxxx_tsr_report.zip 文件复制到外部位置。
7.要查看 EX3000 TSR 信息,请执行以下作:传输到 Windows 笔记本电脑后,在 Windows 中打开xxx_tsr_report.zip文件,其中显示 TSR<编号>_DST#<>.pl.zip 个文件。打开此文件,打开 tsr 目录,然后双击“viewer.html.
注意:如果这是针对 EX3000 上与磁盘相关的问题,则将请求 megacli 日志,并按照此知识库文章收集以下信息:KB ECS:EX3000:如何收集 RAID 控制器日志
使用 racadm 远程连接到 iDRAC(ECS 主机关闭):
1.连接到目标节点所在的机架中的任何作节点。
admin:~> ssh 169.254.1.1
提醒:默认情况下,只能从连接到同一后端网络(机架)的另一个节点访问 iDRAC 物理网络。
2.使用 iDRAC root 登录信息/密码在目标 192.168.219.10<node#> IP 上远程运行 racadm 命令,以创建 TSR 日志收集。
admin:~> sudo -i racadm -r 192.168.219.106 -u root -p passwd techsupreport collect Job ID = JID_xxxxx RAC1154: The requested operation is initiated. Run the RACADM jobqueue sub-command, using the job id to check the status of the requested operation.
3.收集请求创建的作业必须成功完成,然后才能将其复制到 ECS 节点。
使用预览步骤中提供的作业 ID 运行以下命令,以显示作业状态。
admin:~>sudo -i racadm -r 192.168.219.106 -u root -p passwd jobqueue view -i JID_xxxxx ---------------------------- JOB ------------------------- [Job ID=JID_xxxxxx] Job Name=TSR_Collect Status=Completed Start Time=[Not Applicable] Expiration Time=[Not Applicable] Message=[SYS018: Job completed successfully.] Percent Complete=[100] ----------------------------------------------------------
4.获取要在下一步中使用的节点的戴尔服务编号 (DST)。
admin:~> sudo -i racadm -r 192.168.219.106 -u root -p passwd getsvctag xxxxxx
5.将 TSR 报告从 iDRAC 复制到 ECS 节点上名称 <为 DST#>_tsr_report.zip 的目录位置。日志的导出默认采用.zip格式 b。导出可能需要几分钟时间。
admin:~> sudo -i racadm -r 192.168.219.106 -u root techsupreport export -f /home/admin/xxxxxx_tsr_report.zip Progress = 100 percent Tech Support Report exported successfully. admin:~> ls -alt /home/admin/xxxxxxx_tsr_report.zip -rwxr-xr-x 1 root root 447811 Oct 31 18:42 /home/admin/xxxxxxx_tsr_report.zip
6.根据需要,使用 SCP 或其他传输工具将 /home/admin/xxxxxx_tsr_report.zip 文件复制到外部位置。
7.要查看 EX3000 TSR 信息,请执行以下作:传输到 Windows 笔记本电脑后,在 Windows 中打开xxx_tsr_report.zip文件,其中显示 TSR<编号>_DST#<>.pl.zip 个文件。打开此文件,打开 tsr 目录,然后双击“viewer.html.