ECS:奧布斯:如何透過 racadm 或 iDRAC UI 產生 SupportAssist/TSR 記錄
Summary: ECS:如何使用 racadm 命令產生 SupportAssist 記錄。如何從 iDRAC UI 收集技術支援報告 (TSR) 記錄。
Instructions
概觀
ECS 硬體型號 - Gen 3:
- EX300
- EX500
- EXF900
- EX3000 (EX3000S、EX3000D)
ObjectScale 硬體模型 - Gen 4:
- X560
- XF960
- EX5000 (EX5000S、EX5000D)
svc_collect設定檔功能:
要:自 xDoctor 4.8-86 或更新版本起,svc_collect設定檔記錄收集功能可在任何 ECS 上執行。如果您未安裝 xDoctor 4.8-86 或更新版本,則必須使用手動記錄收集程序。此記錄會產生所有機型的 TSR 記錄,包括 PowerEdge EX 系列 ECS 的 PERC/RAID 控制器記錄 (EX3000)、PERC/RAID 控制器術語記錄 (EX3000) 及 PERC/RAID 控制器事件 (EX3000)。必須依 PowerEdge 團隊的要求,從 PowerEdge 伺服器手動完成更多集合。
- 從 svc_collect 執行記錄收集命令,針對您要進行故障診斷的節點執行。
命令:
# svc_collect start -p ic_poweredge -n r<rack number>n<node number>
從機架 1 節點 1
收集範例:注意:如果您在未識別節點的情況下執行命令,則它會在整個 VDC 上執行。
admin@node2:~> svc_collect start -p ic_poweredge -n r1n1 svc_collect v1.3.2 (svc_tools v2.6.0-a3) Started 2022-07-29 21:13:02 ---------------------------------------------------------------------------------------------------------------- Starting data collection for: VDC1 Using collection profile: ic_poweredge Collect only from nodes: 'r1n1' Collect configuration files: True Collect log files: True Collect command outputs: True Log file Start time: 2022-07-29 20:53:02 Log file Stop time: 2022-07-29 21:13:02 Maximum root disk util %: 80 Maximum collect size: 10240MB Collect file name: /tmp/svc_collect-ic_poweredge-VDC1-20220729_211302.zip Creating manifest file /tmp/svc_collect-VDC1-20220729_211302/MANIFEST.INF Collecting node command output from nodes [Gathering Service Tag] [Gathering raid log EX3000 only] [Gathering term log] [Gathering events log] [Generating TSR log] [Gathering TSR log - waiting up to 10 minutes to complete] Exporting TSR: SUCCESS Collecting Fabric and OS logs Getting logs for *.raid.log* on node r1n1 Getting logs for *.term.log* on node r1n1 Getting logs for *.events.log* on node r1n1 Getting logs for *_tsr_report.zip* on node r1n1 Collect saved as file /tmp/svc_collect-ic_poweredge-VDC1-20220729_211302.zip Runtime: 40.0968358517
- 使用安全複製通訊協定 (SCP) 用戶端 (WinSCP) 收集從集合產生的.zip,然後解壓縮檔案中含有 Dell 產品服務編號 (DST) 的檔案,集合中的檔案供 PowerEdge 團隊檢閱。
手動步驟 (在 xDoctor 4.8-86 之前)
命令 racadm (遠端存取控制器管理員) 是載入至所有 ECS EX 系列節點的 Dell 命令列工具,可讓本機 (ECS 主機至 iDRAC 傳遞) 和遠端 (iDRAC 實體介面) 存取 Integrated Dell Remote Access Controller (iDRAC) 資源。
如果透過本機 (現場) 連線或使用 racadm 遠端連線 (SCG 或 WebEx),就會產生 SupportAssist 記錄。iDRAC UI 只能在本機使用,因為在 EX 系列上,iDRAC 實體介面預設使用 192.168.219.10<node#> 本機 IP 位址。
如何在 EX300、EX500、X560、EXF900、XF960、EX5000 上產生 SupportAssist (SA) 記錄:
使用本機 racadm 連線至 iDRAC (ECS 主機可運作,SSH 至目標節點)。注意:EX3000 使用的 iDRAC 版本與上述型號不同,因此請參閱本 KB 中的進一步步驟:
1.使用 NAN IP 連線至目標節點。
admin:~> ssh 169.254.1.6
2.執行 racadm 命令以建立記錄的 TSR 集合。
admin:~> sudo -i racadm supportassist collect Job ID = JID_xxxxxx RAC1154: The requested operation is initiated. Run the RACADM jobqueue sub-command, using the job id to check the status of the requested operation.
如果您遇到「未接受 EULA」訊息:
admin@node1:~> sudo -i racadm supportassist collect
SRV085: Unable to start the operation because the SupportAssist End User License Agreement (EULA) is not accepted.
Accept the SupportAssist End User License Agreement (EULA) by running racadm supportassist accepteula command.
解決方法是使用以下部分的步驟:「使用 racadm 遠端連線至 iDRAC (ECS 主機關閉)」,請參閱下方。
admin@node2:~> sudo -i racadm -r 192.168.219.101 -u root -p passwd techsupreport collect Security Alert: Certificate is invalid - self signed certificate Continuing execution. Use -S option for racadm to stop execution on certificate-related errors. Job ID = JID_8xxxx RAC1154: The requested operation is initiated. Run the RACADM jobqueue sub-command, using the job id to check the status of the requested operation.
然後視需要前往「使用 racadm 遠端連線至 iDRAC (ECS 主機關閉)」區段以解壓縮記錄。
如果您遇到「本機 RACADM 的一個例項已在執行」訊息:
admin@node1:~> sudo -i racadm supportassist collect One Instance of Local RACADM is already executing. Exiting the current session.
然後查看連結以取得更多資訊:https://www.dell.com/community/Systems-Management-General/RACADM-is-already-executing-message/td-p/4732148
您必須清除執行中的 racadm 程序,然後重新執行 racadm。
請注意,請檢查當時沒有其他人需要執行 racadm,因為這樣您就可以清除 racadm 程序。
racadm 程序可能會停滯,且必須在節點上使用下列命令加以清除:
admin@node1:~> sudo rm -rf /var/run/local_racadm.pid
然後重新執行您的 racadm 命令。
在舊版 iDRAC 韌體上更有可能出現停滯的 racadm 程序。
若遇到此情況,請檢查 iDRAC 韌體層級,並在適當情況下建議韌體更新。
3.集合要求建立的工作必須先順利完成,才能複製到 ECS 節點。使用預覽步驟中提供的工作 ID 執行以下命令以顯示工作狀態。
admin:~> sudo -i racadm jobqueue view -i JID_8xxxxx ---------------------------- JOB ------------------------- [Job ID=JID_8xxxxx] Job Name=SupportAssist Collection Status=Completed Start Time=[Not Applicable] Expiration Time=[Not Applicable] Message=[SRV088: The SupportAssist Collection Operation is completed successfully.] Percent Complete=[100] ----------------------------------------------------------
4.取得節點的 Dell 產品服務編號 (DST),以便在下一個步驟中使用。
admin:~> sudo -i racadm getsvctag Cxxxxx
5.將 TSR 報告從 iDRAC 複製到 ECS 節點上具有 DST#>_tsr_report.zip 名稱<的目錄位置。紀錄的匯出預設為.zip格式。匯出可能需要幾分鐘。
admin:~> sudo -i racadm supportassist exportlastcollection -f /home/admin/Cxxxxx_tsr_report.zip Support Assist exported successfully. admin:~> ls -alt /home/admin/Cxxxxx_tsr_report.zip -rwxr-xr-x 1 root root 943054 Nov 5 21:07 /home/admin/xxxxx_tsr_report.zip
6.視需要,使用 SCP 或其他傳輸工具將 /home/admin/Bxxxxx_tsr_report.zip 檔案複製到外部位置。
使用 racadm 遠端連線至 iDRAC (ECS 主機關閉):
1.連線至機架中目標節點所在的任何作業節點。
admin:~> ssh 169.254.1.1
注意:根據預設,iDRAC 實體網路只能從連接至相同後端網路 (機架) 的另一個節點存取。
2.使用 iDRAC 根登入/密碼,在目標 192.168.219.10<node#> IP 上遠端執行 racadm 命令,以建立 TSR 記錄集合。
admin:~> sudo -i racadm -r 192.168.219.106 -u root -p passwd techsupreport collect Job ID = JID_4xxxxxx RAC1154: The requested operation is initiated. Run the RACADM jobqueue sub-command, using the job id to check the status of the requested operation.
3.集合要求建立的工作必須先順利完成,才能複製到 ECS 節點。
使用預覽步驟中提供的工作 ID 執行以下命令以顯示工作狀態。
admin:~> sudo -i racadm -r 192.168.219.106 -u root -p passwd jobqueue view -i JID_4xxxxxxx ---------------------------- JOB ------------------------- [Job ID=JID_4xxxxxxx] Job Name=TSR_Collect Status=Completed Start Time=[Not Applicable] Expiration Time=[Not Applicable] Message=[SYS018: Job completed successfully.] Percent Complete=[100] ----------------------------------------------------------
4.取得節點的 Dell 產品服務編號 (DST),以便在下一個步驟中使用。
admin:~> sudo -i racadm -r 192.168.219.106 -u root -p passwd getsvctag CX1TBM2
5.將 TSR 報告從 iDRAC 複製到 ECS 節點上具有 DST#>_tsr_report.zip 名稱<的目錄位置。記錄的匯出採用 .zip 格式 b 預設。匯出可能需要幾分鐘。
admin:~> sudo -i racadm -r 192.168.219.106 -u root -p passwd techsupreport export -f /home/admin/Cxxxxx_tsr_report.zip Progress = 100 percent Tech Support Report exported successfully. admin:~> ls -alt /home/admin/Cxxxxx_tsr_report.zip -rwxr-xr-x 1 root root 447811 Oct 31 18:42 /home/admin/Cxxxxxx_tsr_report.zip
6.根據需要,使用 SCP 或其他傳輸工具將 /home/admin/Cxxxxxx_tsr_report.zip 檔複製到外部位置。
7.若要檢視 EX3000 TSR 資訊:傳輸至 Windows 筆記型電腦後,在 Windows 中開啟xxx_tsr_report.zip檔案,其中會顯示檔案,其中一個為 TSR<編號>_<DST#>.pl.zip。開啟此檔案,開啟 tsr 目錄,然後按兩下「viewer.html
如何在 EX3000 上擷取技術支援報告 (TSR) 記錄:
使用本機 racadm 連線至 iDRAC (ECS 主機可運作,SSH 至目標節點)。注意:EX3000 使用與上述機型不同的 iDRAC 版本,因此執行下列步驟:
1.使用 NAN IP 連線至目標節點。
admin:~> ssh 169.254.1.6
2.執行 racadm 命令以建立記錄的 TSR 集合。
admin:~> sudo -i racadm techsupreport collect Job ID = JID_xxxxxx RAC1154: The requested operation is initiated. Run the RACADM jobqueue sub-command, using the job id to check the status of the requested operation.
3.集合要求建立的工作必須先順利完成,才能複製到 ECS 節點。
使用預覽步驟中提供的工作 ID 執行以下命令以顯示工作狀態。
admin:~> sudo -i racadm jobqueue view -i JID_xxxxx ---------------------------- JOB ------------------------- [Job ID=JID_xxxxxx] Job Name=TSR_Collect Status=Completed Start Time=[Not Applicable] Expiration Time=[Not Applicable] Message=[SYS018: Job completed successfully.] Percent Complete=[100] ----------------------------------------------------------
4.取得節點的 Dell 產品服務編號 (DST),以便在下一個步驟中使用。
admin:~> sudo -i racadm getsvctag xxxxxx
5.將 TSR 報告從 iDRAC 複製到 ECS 節點上具有 DST#>_tsr_report.zip 名稱<的目錄位置。記錄的匯出採用 .zip 格式 b 預設。匯出可能需要幾分鐘。
admin:~> sudo -i racadm techsupreport export -f /home/admin/xxxxxx_tsr_report.zip Tech Support Report exported successfully. admin:~> ls -alt /home/admin/xxxxxxx_tsr_report.zip -rwxr-xr-x 1 root root 447811 Oct 31 18:42 /home/admin/xxxxxx_tsr_report.zip
6.根據需要,使用 SCP 或其他傳輸工具將 /home/admin/xxxxxxx_tsr_report.zip 檔複製到外部位置。
7.若要檢視 EX3000 TSR 資訊:傳輸至 Windows 筆記型電腦後,請在 Windows 中開啟xxx_tsr_report.zip檔案,其中會顯示檔案,其中一個檔案為 TSR<編號>_<DST#>.pl.zip。開啟此檔案,開啟 tsr 目錄,然後按兩下「viewer.html
便條:如果這是針對 EX3000 上的磁碟相關問題,則會要求 megacli 記錄的要求,並遵循此 KB 收集此資訊:KB ECS:EX3000:如何收集 RAID 控制器記錄
使用 racadm 遠端連線至 iDRAC (ECS 主機關閉):
1.連線至機架中目標節點所在的任何作業節點。
admin:~> ssh 169.254.1.1
注意:根據預設,iDRAC 實體網路只能從連接至相同後端網路 (機架) 的另一個節點存取。
2.使用 iDRAC 根登入/密碼,在目標 192.168.219.10<node#> IP 上遠端執行 racadm 命令,以建立 TSR 記錄集合。
admin:~> sudo -i racadm -r 192.168.219.106 -u root -p passwd techsupreport collect Job ID = JID_xxxxx RAC1154: The requested operation is initiated. Run the RACADM jobqueue sub-command, using the job id to check the status of the requested operation.
3.集合要求建立的工作必須先順利完成,才能複製到 ECS 節點。
使用預覽步驟中提供的工作 ID 執行以下命令以顯示工作狀態。
admin:~>sudo -i racadm -r 192.168.219.106 -u root -p passwd jobqueue view -i JID_xxxxx ---------------------------- JOB ------------------------- [Job ID=JID_xxxxxx] Job Name=TSR_Collect Status=Completed Start Time=[Not Applicable] Expiration Time=[Not Applicable] Message=[SYS018: Job completed successfully.] Percent Complete=[100] ----------------------------------------------------------
4.取得節點的 Dell 產品服務編號 (DST),以便在下一個步驟中使用。
admin:~> sudo -i racadm -r 192.168.219.106 -u root -p passwd getsvctag xxxxxx
5.將 TSR 報告從 iDRAC 複製到 ECS 節點上具有 DST#>_tsr_report.zip 名稱<的目錄位置。記錄的匯出採用 .zip 格式 b 預設。匯出可能需要幾分鐘。
admin:~> sudo -i racadm -r 192.168.219.106 -u root techsupreport export -f /home/admin/xxxxxx_tsr_report.zip Progress = 100 percent Tech Support Report exported successfully. admin:~> ls -alt /home/admin/xxxxxxx_tsr_report.zip -rwxr-xr-x 1 root root 447811 Oct 31 18:42 /home/admin/xxxxxxx_tsr_report.zip
6.根據需要,使用 SCP 或其他傳輸工具將 /home/admin/xxxxxx_tsr_report.zip 檔複製到外部位置。
7.若要檢視 EX3000 TSR 資訊:傳輸至 Windows 筆記型電腦後,請在 Windows 中開啟xxx_tsr_report.zip檔案,其中會顯示檔案,其中一個檔案為 TSR<編號>_<DST#>.pl.zip。開啟此檔案,開啟 tsr 目錄,然後按兩下「viewer.html