NetWorker:如何偵錯備份操作

摘要: 系統會列出幾個選項來除錯失敗的 NetWorker 備份。

本文章適用於 本文章不適用於 本文無關於任何特定產品。 本文未識別所有產品版本。

說明

有幾種不同的選項可用來偵錯 NetWorker 備份故障。本知識文章涵蓋不同的調試選項,具體取決於您要調試的備份過程功能。 

1.記錄檔:

除錯備份失敗的主要記錄是位於下列位置 的原則記錄檔


Linux: /nsr/logs/policy_name/workflow_name/action_name
Windows (預設): C:\Program Files\EMC NetWorker\nsr\logs\policy_name\workflow_name\action_name


以下 有原始格式的工作流紀錄檔 /nsr/logs/policy/policy_name/workflow_name/jobid.raw 以及每個操作的子目錄。操作的每個子操作都有自己的紀錄檔,其中包含 jobid 那個孩子的工作。當父操作啟動子操作時,NetWorker 會為這些子操作日誌創建一個目錄。

範例:

記錄大小會因備份期間使用的偵錯層級而有所不同。原始檔案是工作流日誌,而 backup_[jobid]_logs 目錄包含動作記錄和子動作記錄。

原則記錄資料夾內容範例 
 

所有 NetWorker 作業的主要 NetWorker 記錄檔為 daemon.raw 記錄檔。 
 

Linux: /nsr/logs/daemon.raw
Windows (預設): C:\Program Files\EMC NetWorker\nsr\logs\daemon.raw


若要讀取此紀錄,請使用 nsr_render_log 命令,請參閱:NetWorker:如何使用nsr_render_log呈現.raw紀錄檔

範例:

呈現 NetWorker 原始記錄的範例

其他資源:

2. save 在 NetWorker 用戶端上:

NetWorker 用戶端型備份會使用儲存程序。儲存程序會與 NetWorker 伺服器、儲存節點 (若適用) 或目標備份裝置媒體通訊。若要在儲存程式上啟用除錯,方法是使用 NetWorker Management Console (NMC) 或使用 nsradmin 命令。

在 NMC 中,您將相關用戶端屬性中的「備份命令」欄位更改為”save -D9':

範例:

設定 NetWorker 用戶端的偵錯備份

您可以使用 nsradmin 命令執行相同的作業:

範例:

從 nsradmin 設定備份偵錯

其他資源:

 

3.NetWorker 伺服器上的工作流程作業: 

需要調試工作流操作的啟動和詳細的調試輸出。

nsrworkflow -D9 -p [policy] -w [workflow]

這會將工作流作業除錯輸出記錄到原始檔案中:

/nsr/logs/policy/policy_name/workflow_name/

範例:

除錯 NSR 工作流程 
 

執行 nsrworkflow 命令會手動啟動工作,但使用與排定自動化備份相同的排程和層級組態選項。另一種可能性是使用 -a 標誌來定義 nsrworkflowadhoc 備份,可讓您覆寫備份排程或層級。若要指定所需的備份等級 (而不是為今天的工作流程執行所設定的等級),請使用 -l (或 -L 用於虛擬機器備份)。

範例:

nsrworkflow -p [policy] -w [workflow] -A "'[action]' -l [level]" -a
nsrworkflow -p Mona -w Bokonon_wf -A "'backup' -l full" -a

其他資源:

4. savefs 在 NetWorker 用戶端上:

可使用 savefs 命令會在用戶端型備份期間使用。在 NetWorker 伺服器上啟動備份後,它就會傳送到 NetWorker 用戶端。 savefs 此程序負責判斷要備份的檔案和目錄,以在用戶端上執行特定備份。

您可以從原則記錄中的原始檔案中,取得用戶端執行的確切 savefs 命令 (/nsr/logs/policy/[policy name]/[workflow name])。然後在用戶端執行此命令,新增 -D9 選項:

範例:

在 NetWorker 伺服器上: 

SaveFS 程序範例  

然後在用戶端:

從命令列執行 savefs 除錯 

5.在 NetWorker 伺服器上指派目標媒體:

正確的備份目標磁碟區的指派是由 nsrd NetWorker 伺服器上的進程。若要對此進行調試,必須暫時提高 nsrd 使用 NetWorker 伺服器的 dbgcommand

範例:

kA5f10000004JErCAM_2_7

調試完成後,必須通過將調試級別設置回零來禁用調試:

kA5f10000004JErCAM_2_8

dbgcommand 可用於行程名稱或行程 ID (PID),例如:

dbgcommand -n PROCESS_NAME Debug=DEBUG_LEVEL
dbgcommand -p PROCESS_ID Debug=DEBUG_LEVEL

其他資源:

警告:只有在對問題進行故障排除時才能啟用進程調試。故障診斷完成後,必須停用程序偵錯。啟用調試后,某些進程可能會生成大量消息。這可能會導致檔案系統增長和空間問題。

6.等待可寫入磁碟區的備份:

如果 NetWorker 伺服器找不到適合寫入的 NetWorker 磁碟區,它會停止回應並產生警示。在這種情況下,作業處於“活動”狀態。您可以使用 nsrpolicy monitor 命令為貴組織設定主要和次要 IT 連絡人。

範例:

nsrpolicy monitor 的範例

NetWorker Management Console 中的警示提供更詳細的說明,說明您要尋找的磁碟區類型以及在哪個儲存節點上。

範例:

等待 1 個可寫入磁碟區的 NMC 警示

其他資源:

7.由於平行處理,備份意外停止回應:

如果 NetWorker 伺服器因為沒有可用的平行處理插槽而判定無法繼續備份,則工作會處於「佇列」狀態。

為了調試並行性,您需要增加 nsrjobd NetWorker 伺服器上的程序,如下所示。守護程式日誌檔輸出大量相對於並行性的調試數據。

範例:

啟用 nsrjobd 除錯的範例 

精靈記錄顯示平行度錯誤

其他資源:

8.Client Direct 備份無法如預期運作:

「Client direct」備份會直接從 NetWorker 用戶端將資料傳送至目標媒體,無需先寫入 NetWorker 儲存節點。

您可以在客戶機屬性中定義是否應對此客戶機實例使用客戶機直接備份。

NetWorker 用戶端直接備份設定

為了解決客戶端直接是否正常工作,您必須按照以下範例檢查日誌:

範例:

記錄輸出:用戶端直接操作。

可使用 daemon.raw 檔案中 NetWorker 伺服器:

91787 MM/DD/YYYY HH:mm:SS  nsrmmd NSR notice Save-set ID '4091251191' (vm-lego-231:/NetWorker) is using direct file save with Data Domain device 'dd4500-dd.local_onetwoone'.

lsof 在 NetWorker 用戶端上

[root@vm-lego-231 ~]# lsof -i TCP | grep save
save       9831    root    3u  IPv4 111668      0t0  TCP vm-lego-231:23178->vm-lego-121:8985 (ESTABLISHED)
save       9831    root    5u  IPv4 111695      0t0  TCP vm-lego-231:19752->vm-lego-121:9417 (ESTABLISHED)
save       9831    root    7u  IPv4 111720      0t0  TCP vm-lego-231:31095->vm-lego-121:9035 (ESTABLISHED)
save       9831    root    8u  IPv4 111728      0t0  TCP vm-lego-231:12421->vm-lego-121:9653 (ESTABLISHED)
save       9831    root    9u  IPv4 111731      0t0  TCP vm-lego-231:33739->dd4500-dd.local:nfs (ESTABLISHED)
save       9831    root   10u  IPv4 111736      0t0  TCP vm-lego-231:60278->dd4500-dd.local:midnight-tech (ESTABLISHED)

 

注意: lsof 列出從用戶端到 NetWorker 伺服器和 DD 的開放 TCP 連線。若要判斷 NetWorker 伺服器連接到哪些程序,您可以使用 lsof 在伺服器上。第四列是正在使用的檔描述符。

在 Windows 主機上,您可以使用 SysInternals Procmon 執行類似的診斷。此超連結會帶您前往 Dell Technologies 以外的網站。


9: Client Direct 備份未使用 Client Direct:

可使用 daemon.raw 檔案中 NetWorker 伺服器:

91797 MM/DD/YYYY HH:mm:SS nsrmmd NSR severe Unable to perform direct file save with Data Domain device 'ONETWOONE'; setting up traditional save for save-set ID '4024143566' (vm-lego-231:/NetWorker)

 

注意:尋找這個詞 traditional 在日誌中快速為您提供此輸出。請參閱《 NetWorker 管理指南》清單中的用戶端直接運作必須符合的條件清單。最常見的原因是用戶端無法透過直接網路存取 Data Domain,或其名稱解析無法正常運作。

lsof 在 NetWorker 用戶端上:
[root@vm-lego-231 ~]# lsof -i TCP | grep save
save      10114    root    3u  IPv4 123335      0t0  TCP vm-lego-231:46461->vm-lego-121:8985 (ESTABLISHED)
save      10114    root    5u  IPv4 123369      0t0  TCP vm-lego-231:12593->vm-lego-121:9417 (ESTABLISHED)
save      10114    root    7u  IPv4 123392      0t0  TCP vm-lego-231:63952->vm-lego-121:9035 (ESTABLISHED)
save      10114    root    8u  IPv4 123400      0t0  TCP vm-lego-231:29597->vm-lego-121:9653 (ESTABLISHED)
注意:此處僅開啟與 NetWorker 伺服器 (在此範例中亦為儲存節點) 的 TCP 連線。沒有通向 DD 的 TCP 連線開啟。所有資料都將進入儲存節點。

其他資源:


10.並行儲存串流 (PSS) 備份:

若要偵錯 PSS 備份。請確定 NetWorker Management Console 用戶端資源中的「平行儲存串流」屬性已勾選。修改 save 命令,以按照第 2 節將其放入調試中。此外,在以下位置建立空檔案: ../nsr/debug 叫”mbsdopen」。這可在用戶端上提供額外的除錯記錄 /nsr/tmp 以及在 NetWorker 伺服器上的原則記錄中 (請參閱第 1 節)。

範例:

NetWorker 用戶端資源中已啟用 PSS 選項

MBSDFOPEN 檔案

將 MBS 檔案儲存在 tmp 目錄中 

其他資源:

11.NetWorker 儲存節點 nsrmmd 寫入目標媒體時,程序無法如預期運作:

您可以提高 nsrmmd 使用 dbgcommand (請參閱第 5 節)。您可以提高所有 nsrmmd 行程或使用作業系統工具來識別哪些 nsrmmd 程序為作用中:

nsrmmd 程序 

其他資源:

其他資訊

受影響的產品

NetWorker

產品

NetWorker, NetWorker Series
文章屬性
文章編號: 000010035
文章類型: How To
上次修改時間: 30 1月 2026
版本:  8
向其他 Dell 使用者尋求您問題的答案
支援服務
檢查您的裝置是否在支援服務的涵蓋範圍內。