NetWorker:故障診斷 NetWorker 中的磁帶庫問題
摘要: 本文旨在協助 NetWorker 支援和 NetWorker 備份系統管理員處理磁帶庫相關問題並進行故障診斷。
本文章適用於
本文章不適用於
本文無關於任何特定產品。
本文未識別所有產品版本。
說明
注意:Dell 員工必須在登入支援網站時檢閱本文,才能查看內部備註。庫操作的出現可能與磁帶設備、磁帶盒或常規 NetWorker 功能有關。本文協助故障診斷顯示,在元素之間移動磁帶匣時發生故障。
在調查磁帶庫問題之前,必須考慮以下事項:
- 磁帶機可讀取和寫入資料和標籤至媒體,並提供所有媒體功能,無法自行移動磁帶匣
- 磁帶庫將媒體磁帶匣從一個元素移動到另一個元素:請勿讀取或寫入任何資料
如果 NetWorker 作業因無法移動磁帶匣而失敗,則有幾種可能的一般原因:
- 圖書館機器人或內部的硬體或固件問題
- 從 NetWorker 主機到圖書館的連線問題,透過運送自動裝置
- NetWorker 主機和程式庫之間的作業系統、驅動程式或相容性問題
- 與磁帶庫類型、狀態和定址相關的 NetWorker 組態問題
按時間順序執行以下步驟,以幫助確定問題的性質,並可能解決問題。如果本文件無法解決問題,則會提供可縮小問題範圍的測試,並協助專研人員繼續工作。
1.環境資訊
從 NetWorker 伺服器和受影響的儲存節點:
- 主機名稱、作業系統類型和版本。
- NetWorker 版本和組建編號。
注意:如需上述兩點的協助,請參閱:NetWorker:識別 NetWorker 軟體版本的方法
- ' 的輸出
inquire命令顯示磁帶和庫。 - 目前的壓縮複本
nsrdb(如果需要,保留當前的自動儲存塔資訊,以進行回滾)
Linux:/nsr/res/nsrdb
Windows (預設):C:\Program Files\EMC NetWorker\nsr\res\nsrdb - 儲存節點、程式庫的 NetWorker 名稱,以及受影響節點、裝置和磁碟區的清單
- 問題的共性 (特定磁碟區、特定磁碟機、特定節點等)
注意:收集包含上述內容的完整初始資料集最簡單的方法是執行
nsrget -o:d 在受影響的伺服器和節點上。
警示:請勿使用
-o:d 在任何具有磁帶且磁帶正忙於寫入的主機上。您可以從監控 ->裝置下的 NetWorker Management Console (NMC) 檢查。
下列文章提供取得和使用 NSRGET 的相關資訊:NetWorker:如何使用 NSRGet NetWorker 資料收集工具
2.測試庫的就緒情況
- 檢查受影響程式庫的儲存節點擁有者是否已啟用且準備就緒:
- 在 NMC 中,前往 裝置 ->儲存節點。
- 確定 已啟用檢視 ->診斷模式 。
- 檢查右側窗格中的 已啟用 和 就緒 列。
- 如果預計要啟用的儲存節點未啟用,請以滑鼠右鍵按一下該儲存節點,然後按一下 啟用/停用 以 啟用 。
- 如果存儲節點無法在一兩分鐘內就緒 ,則必須單獨跟進;程式庫沒有回應,因為無法存取其儲存節點。
- 檢查受影響的程式庫是否已啟用且已就緒:
- 在 NMC 中,前往裝置 ->程式庫。
- 確定 已啟用檢視 ->診斷模式 。
- 檢查右側窗格中的 已啟用 和 就緒 列。如果磁帶庫顯示 就緒 狀態,請繼續執行 [
4]. - 如果未啟用,您可以右鍵按下左側的庫實例,然後選擇“啟用/禁用”以重新啟用它。
- 啟用后,等待一兩分鐘,再次單擊庫容器,然後查看“就緒”列中是否出現綠色勾號。
- 如果庫尚未就緒,請右鍵單擊左側的庫實例,選擇 “屬性”,然後在 “常規 ”選項卡上,確保 “控制埠 ”值與
scsidev@#.#.#您從中看到的地址inquire命令為貴組織設定主要和次要 IT 連絡人。 - 如果 控制埠 不匹配,請將啟用 設置為 否 ,然後按兩下 確定;然後重新輸入屬性,並更改 控制埠 以符合
inquire地址已發現。更新 控制連接埠後,將「啟用 」變更回 「是」,然後再次按一下「 確定 」以重新啟用。請花一兩分鐘時間查看庫是否 已準備就緒。 - 最後,如果在更正 後控制埠 值不允許庫變 為就緒,請最後一次輸入庫的屬性;在下面 高級 標籤,設置 調試跟蹤級別 為 5;並再次 禁用 並 重新啟用 以捕獲守護程式日誌中的啟動順序兩分鐘。
在區段 [2.2],確認 nsrlcpd 從預定的存儲節點啟動。此外,請檢查它是否不是獨立停止或重新開機。如果進程 ID (PID) 繼續更改,則表示該進程已被軟體或轉儲核心停止或終止。還要警惕伺服器和存儲節點之間的名稱解析問題,這可能會阻止啟動。伺服器為節點解析的名稱應與節點自己的 nsrladb 名稱和節點的伺服器名稱匹配。
- 請參閱 故障診斷 NetWorker 中的磁帶庫準備程度問題, 以取得有關磁帶庫準備程度問題的進階故障診斷資訊。
- 請參閱 NetWorker 故障診斷指南:如果您看到或懷疑節點的
nsrexecd小nsrsnmd,或nsrlcpd是核心傾銷。
如需每個主機程序的 NetWorker 詳細概觀,請參閱:NetWorker 程序和連接埠
有關這些服務的消息會記錄在主機的 daemon.raw:
- Linux:
/nsr/logs/daemon.raw - Windows (預設):
C:\Program Files\EMC NetWorker\nsr\logs\daemon.raw - NetWorker:如何使用nsr_render_log呈現.raw紀錄檔
3.確定庫的回應能力:
如果磁帶庫未就緒,且您無法判斷原因,請確定可以聯絡磁帶庫本身:
- 檢查
inquire節點的輸出來自 [1.3],並確保庫在輸出中顯示為“自動轉換器”,並記下 SCSI#.#.#位址。 - 如果庫未出現在
inquire輸出,檢查以確保作業系統可以檢測到它。如果 NetWorker 中已設定並啟用程式庫,Solaris 主機不會報告該程式庫。如需協助,請參閱故障診斷 NetWorker 中的磁帶庫偵測問題。 - 確保庫回應基本庫命令。在 [ 中使用 SCSI 位址
3.1],執行:'sjisn #.#.#」。如需更多有關程式庫測試命令的資訊,請參閱 NetWorker 中的磁帶庫存取問題疑難排解。 - 如果 SJI 命令失敗,請考慮傳輸或硬體問題的可能性:請參閱故障診斷 NetWorker 中的磁帶庫硬體問題 以取得協助。
- 如果問題是作業系統無法探索程式庫,且正確回應 SJI 命令,NetWorker 無法探索,請嘗試使用
jbconfig命令並選擇選項 2;如果這樣做無法解決,請嘗試選項 4,並手動提供磁帶庫位址並設定為標準磁帶庫 (選項 56)。如需詳細資訊 ,請參閱故障診斷 NetWorker 中的磁帶庫組態問題 。
4.測試磁帶移動和磁碟區健全狀況
如果庫已準備就緒且看似回應迅速,但在載入卷時遇到問題,則有許多不同的可能原因。
- 盡可能清空整個庫;如果您可以停止其他操作,請以滑鼠右鍵按一下,然後從裝置 ->磁帶庫標籤重設磁帶庫。
- 嘗試將單個盒式磁帶載入到單個設備中,其中兩者都被認為受到載入問題的影響;每次嘗試後視需要卸載。
- 比較不同磁碟機中的相同磁碟區,以及認為受影響的磁碟機中的不同磁碟區;請注意錯誤和模式(如果有)。
- 如果捲載入可靠地失敗,無論設備如何,請嘗試以下標籤檢查:
- 載入卷而不安裝 如果盒式磁帶移動沒有錯誤,則您已驗證臂的機械功能正常。
- 執行
nsrmm -pv -f networker_device如果回應的標籤已驗證,則表示您已驗證媒體也有效且狀況良好。 - 在 “庫”的屬性中,在啟用 “診斷模式 ”的情況下,轉到“ 計時器 ”選項卡,將 “載入睡眠 ”設置為 “60 ”,然後再單擊 “確定”。
- 卸載磁碟區,然後嘗試重新載入磁碟區 如果現在成功,則問題可能是計時問題 (您可以嘗試降低 Sleep 值,直到它再次開始失敗)。
- 如果
nsrmm命令失敗,需要進一步測試。以滑鼠右鍵按一下並選取 啟用/停用,以在 NMC 中停用有問題的磁碟機。- 執行
scanner裝置上的命令:- 若為 NetWorker 伺服器的本機儲存節點,請執行:
scanner -nizv local_device - 若為在「遠端」NetWorker 儲存節點上,請執行:
scanner -s server -nizv local_device
- 若為 NetWorker 伺服器的本機儲存節點,請執行:
- 在 ~20 行之後換行並檢查標籤讀取消息;成功的標誌如下
8936:scanner: scanning media_type tape volume_name on device_name。 - 如果
scanner返回消息意外文件號,想要 2,收到 higher_number 發生數據丟失,很可能是由於 SCSI 重置;檢查在 NetWorker 中故障診斷覆寫標籤和 SCSI 重設。
- 執行
- 如果
scanner傳回message 8945:scanner: Read: -1 bytes判斷該磁碟區是否可在其他節點或磁碟機上讀取,並判斷問題的趨勢。如果您發現某些磁碟區在某些節點上可以讀取,但不能在其他節點上讀取,並且設備是 LTO-4 或更高版本,請考慮驅動器解密失敗:LTO 硬體加密與 NetWorker。
有關更高級的媒體驗證資訊,請參閱:針對 NetWorker 中的媒體掛接問題進行故障診斷。
5. 測試磁碟機訂購問題
如果載入和掛接命令成功,但標籤讀取或簡單掛接失敗,則問題可能涉及錯誤的驅動器順序。
- 盡可能清空整個庫;如果您可以停止其他操作,請按一下滑鼠右鍵,並從「裝置 ->程式庫」重設程式庫。
- 嘗試將單個盒式磁帶載入到單個設備中,其中兩者都被認為受到載入問題的影響;每次嘗試後視需要卸載。
- 比較不同磁碟機中的相同磁碟區,以及認為受影響的磁碟機中的不同磁碟區;請注意錯誤和模式(如果有)。
- 如果載入可靠失敗,請嘗試以下標籤檢查:
有關庫載入問題的更多高級説明,請參閱:故障診斷 NetWorker 中的磁帶庫載入問題。
如果所有這些測試都失敗,而您沒有進一步失敗,請確保您記錄了本文中每個步驟的結果,並與 NetWorker 支援部門接洽。明確的細節對於加快解決方案和確保限制「重複步驟」至關重要。
其他資訊
受影響的產品
NetWorker產品
NetWorker Family文章屬性
文章編號: 000031465
文章類型: How To
上次修改時間: 23 1月 2026
版本: 6
向其他 Dell 使用者尋求您問題的答案
支援服務
檢查您的裝置是否在支援服務的涵蓋範圍內。