NetWorker:如何偵錯備份操作
Summary: 系統會列出幾個選項來除錯失敗的 NetWorker 備份。
Instructions
記錄檔:
除錯備份失敗的主要記錄是位於下列位置 的原則記錄檔 。
Linux:/nsr/logs/policy_name/workflow_name/action_name
Windows:..程式檔案EMC NetWorker srlogspolicy_nameworkflow_nameaction_name
在 /nsr/logs/policy/policy_name/workflow_name/jobid.raw 下有原始格式的工作流程記錄檔,以及每個動作的子目錄。操作的每個子操作都有自己的日誌檔,其中包含該子作業的 jobid。當父操作啟動子操作時,NetWorker 會為這些子操作日誌創建一個目錄。
範例:
我們可在此處看到原則記錄的位置 根據備份期間使用的除錯層級而定 記錄的大小也有所不同 原始檔是工作流日誌,而 backup_[jobid]_logs 目錄包含操作日誌和子操作日誌。
所有 NetWorker 作業的主要 NetWorker 記錄檔是 daemon.raw 記錄檔。
這位於 [NetWorker_install_dir] 記錄中。
Windows:C:Program FilesEMC NetWorker srlogs
若要讀取此日誌,請使用 nsr_render_log 命令。
範例:
更多資源:
503582 :NetWorker 記錄檔以及如何收集以進行分析
469489 :NetWorker 要收集
的記錄清單457094 :要收集並提供給支援一般 NetWorker 問題的
記錄檔和資訊NetWorker 命令參考指南
節省使用 NetWorker 用戶端
NetWorker 用戶端型備份會使用儲存程序。儲存程序會與 NetWorker 伺服器、儲存節點 (若適用) 或目標備份裝置媒體通訊。若要在儲存程序上啟用除錯,方法是使用 NetWorker Management Console (NMC) 或使用 nsradmin 命令將 -D debug 旗標傳遞至儲存程序。
在 NMC 中,您將相關用戶端屬性中的「備份命令」欄位變更為「save -D9」:
範例:
您可以使用 nsradmin 命令執行相同的作業:
範例:
或者,在 Linux 系統上,您可以使用 printf 命令在一行內進行此 nsradmin 變更:
範例:
printf "show
. type : NSR Client; name : vm-lego-231; save set : /alice
update backup command : save -D9
" | nsradmin -i -
更多資源:
NetWorker 命令參考指南
如何使用 NetWorker nsradmin 驗證檢查
NetWorker nsradmin 程式的特殊用途技術備註
NetWorker 伺服器上的工作流程作業
需要調試工作流操作的啟動和詳細的調試輸出。
nsrworkflow -d9 -p [policy] -w [workflow]
這會將工作流作業除錯輸出記錄到原始檔案中:
/nsr/logs/policy/policy_name/workflow_name/
範例:
執行 nsrworkflow 命令會手動啟動工作,但使用與排定自動化備份相同的排程和層級組態選項。 另一種可能性是使用 -a 旗標將 nsrworkflow 執行定義為可覆寫備份排程或層級的臨時備份。 要指定所需的備份級別(而不是為今天的工作流運行設置的級別),請使用 -l(或 -L 用於虛擬機備份)。
範例:
nsrworkflow -p [policy] -w [workflow] -A “'[action]' -l [level]” -a
nsrworkflow -p Mona -w Bokonon_wf -A “'backup' -l full” -a
更多資源:
516616 : 如何使用 NetWorker nsrworkflow 命令
513030 :如何使用 NetWorker nsrpolicy 命令
NetWorker 9.1.x 版本資訊:
NetWorker 命令參考指南
在 NetWorker 用戶端上儲存
savefs 命令是在用戶端型備份期間使用。在 NetWorker 伺服器上啟動備份後,它就會傳送到 NetWorker 用戶端。 saveFS 是此程序,負責決定要為此用戶端上執行的特定備份的檔案和目錄。
您可以從原則記錄中的原始檔案 (/nsr/logs/policy/[policy name]/[workflow name]) 取得用戶端執行的確切 savefs 命令。 然後在用戶端執行命令,新增 -D9 選項:
範例:
在 NetWorker 伺服器上:
然後在用戶端:
更多資源:
在 NetWorker 伺服器上指派目標媒體
備份的正確目標磁碟區的指派是由 NetWorker 伺服器上的 nsrd 程序管理。 若要對此進行偵錯,您必須使用 dbg命令,暫時提高 NetWorker 伺服器上 nsrd 程序的偵錯層級。
範例:
除錯完成後,您必須像以下方式關閉除錯:
更多資源:
正在等待可寫入磁碟區的備份
如果 NetWorker 伺服器找不到適合寫入的 NetWorker 磁碟區,它將會停止回應並產生警示。 在這種情況下,作業將處於“活動”狀態。 您可以使用 nsrpolicy monitor 命令來檢查工作的狀態。
範例:
NetWorker Management Console 中的警示提供更詳細的說明,說明您要尋找的磁碟區類型以及在哪個儲存節點上。
範例:
更多資源:
由於平行處理,備份意外停止回應
如果 NetWorker 伺服器因為沒有可用的平行處理插槽,判定無法繼續備份。 在這種情況下,作業處於「排隊」狀態。
若要偵錯平行度,您必須提高 NetWorker 伺服器上 nsrjobd 程序的偵錯層級,如下所示。 守護程式日誌檔輸出大量相對於並行性的調試數據。
範例:
更多資源:
Client Direct 備份未如預期運作
「Client direct」備份會直接從 NetWorker 用戶端將資料傳送至目標媒體,無需先寫入 NetWorker 儲存節點。
您可以在客戶機屬性中定義是否應對此客戶機實例使用客戶機直接備份。
為了解決客戶端直接是否正常工作,您必須按照以下範例檢查日誌:
範例:
記錄輸出:用戶端直接在操作。
NetWorker 伺服器上的精靈記錄檔:
91787 08/01/2014 01:37:35 PM nsrmmd NSR 通知儲存集 ID 「4091251191」(vm-lego-231:/NetWorker) 使用與 Data Domain 裝置「dd4500-dd.local_onetwoone」的直接檔案儲存。
NetWorker 用戶端上的 lsof
[root@vm樂高-231 ~]# lsof -i TCP |grep 保存
保存 9831 根 3u IPv4 111668 0t0 TCP vm-lego-231:23178-vm-lego-121>:8985 (已建立)
保存 9831 根 5u IPv4 111695 0t0 TCP vm-lego-231:19752-vm-lego-121>:9417 (已建立)
保存 9831 根 7u IPv4 111720 0t0 TCP vm-lego-231:31095-vm-lego-121>:9035 (已建立)
保存 9831 根 8u IPv4 111728 0t0 TCP vm-lego-231:12421-vm-lego-121>:9653 (已建立)
保存 9831 根 9u IPv4 111731 0t0 TCP vm-lego-231:33739-dd4500-dd.local>:nfs (已建立)
保存 9831 根 10u IPv4 111736 0t0 TCP vm-lego-231:60278-dd4500-dd.local>:midnight-tech (已成立)
注意:我們可以看到,從用戶端到 NetWorker 伺服器和 DD 都有開啟的 TCP 連線。 如果您需要知道 NetWorker 伺服器上的哪些程序確切地連接到,您可以與伺服器上的 lsof 進行交叉檢查。 第四列是正在使用的檔描述符。
在 Windows 系統上,您可以使用 resmon 看到類似的輸出: 開始 - 執行 - resmon - 網路標籤 - TCP 連線
記錄輸出: 備份未使用 Client Direct。
NetWorker 伺服器上的精靈記錄檔:
91797 08/01/2014 01:57:51 PM nsrmmd NSR 嚴重 無法使用 Data Domain 裝置「ONETWOONE」執行直接檔案儲存;為儲存集 ID 「4024143566」設定傳統儲存 (vm-lego-231:/NetWorker)
注意: 在日誌中查找「傳統」一詞可快速獲得此輸出。 如果您需要瞭解其未使用用戶端直接的原因,請從《NetWorker 管理指南》清單中列出用戶端直接運作時必須符合的條件清單開始。 最常見的原因是用戶端無法從其使用的 NIC 直接透過網路存取 DD,或是無法從用戶端正確運作名稱解析。
NetWorker 用戶端上的 lsof:
[root@vm樂高-231 ~]# lsof -i TCP |grep 儲存
儲存 10114 根 3u IPv4 123335 0t0 TCP vm-lego-231:46461-vm-lego-121>:8985 (已建立)
保存 10114 根 5u IPv4 123369 0t0 TCP vm-lego-231:12593-vm-lego-121>:9417 (已建立)
保存 10114 根 7u IPv4 123392 0t0 TCP vm-lego-231:63952-vm-lego-121>:9035 (已建立)
保存 10114 根 8u IPv4 123400 0t0 TCP vm-lego-231:29597-vm-lego-121>:9653 (已建立)
注意: 此處僅開啟與 NetWorker 伺服器 (在此範例中亦為儲存節點) 的 TCP 連線。 沒有通向 DD 的 TCP 連線開啟。 所有資料都將進入儲存節點。
更多資源:
並行儲存串流備份
若要偵錯 PSS 備份。請確定 NetWorker Management Console 用戶端資源中的「平行儲存串流」屬性已勾選。 修改 save 命令,使其依上方數字 1 進行除錯。 此外,在 . 中創建一個空檔。/nsr/debug 稱為「mbsdopen」。 這可在用戶端的 /nsr/tmp 和 NetWorker 伺服器上的原則記錄中提供額外的偵錯記錄 (請參閱上方的步驟 1)。
範例:
更多資源:
如何故障診斷 NetWorker 並行儲存串流備份
NetWorker 效能最佳化規劃指南
NetWorker 儲存節點 nsrmmd 程式在寫入目標媒體時無法如預期運作。
您可以使用 dbg命令 (如上述數字 7 所述) 提高 nsrmmd 程序的除錯層級。 您可以提高所有 nsrmmd 程序的偵錯層級,或使用作業系統工具來識別哪個 nsrmmd 程序處於作用中狀態:
更多資源:
479665 : 分級文章:故障診斷 NetWorker
中的磁帶庫問題NetWorker Data Domain Boost 整合指南











