NetWorker:故障診斷 NetWorker 中的磁帶庫問題

摘要: 本文旨在協助 NetWorker 支援和 NetWorker 備份系統管理員處理磁帶庫相關問題並進行故障診斷。

本文章適用於 本文章不適用於 本文無關於任何特定產品。 本文未識別所有產品版本。

說明

注意:Dell 員工必須在登入支援網站時檢閱本文,才能查看內部備註。庫操作的出現可能與磁帶設備、磁帶盒或常規 NetWorker 功能有關。本文協助故障診斷顯示,在元素之間移動磁帶匣時發生故障。

在調查磁帶庫問題之前,必須考慮以下事項:

  • 磁帶機可讀取和寫入資料和標籤至媒體,並提供所有媒體功能,無法自行移動磁帶匣
  • 磁帶庫將媒體磁帶匣從一個元素移動到另一個元素:請勿讀取或寫入任何資料

如果 NetWorker 作業因無法移動磁帶匣而失敗,則有幾種可能的一般原因:

  • 圖書館機器人或內部的硬體或固件問題
  • 從 NetWorker 主機到圖書館的連線問題,透過運送自動裝置
  • NetWorker 主機和程式庫之間的作業系統、驅動程式或相容性問題
  • 與磁帶庫類型、狀態和定址相關的 NetWorker 組態問題

按時間順序執行以下步驟,以幫助確定問題的性質,並可能解決問題。如果本文件無法解決問題,則會提供可縮小問題範圍的測試,並協助專研人員繼續工作。

1.環境資訊

從 NetWorker 伺服器和受影響的儲存節點:

  1. 主機名稱、作業系統類型和版本。
  2. NetWorker 版本和組建編號。
注意:如需上述兩點的協助,請參閱:NetWorker:識別 NetWorker 軟體版本的方法
  1. ' 的輸出inquire命令顯示磁帶和庫。
  2. 目前的壓縮複本 nsrdb (如果需要,保留當前的自動儲存塔資訊,以進行回滾)
    Linux: /nsr/res/nsrdb
    Windows (預設): C:\Program Files\EMC NetWorker\nsr\res\nsrdb
  3. 儲存節點、程式庫的 NetWorker 名稱,以及受影響節點、裝置和磁碟區的清單
  4. 問題的共性 (特定磁碟區、特定磁碟機、特定節點等)
注意:收集包含上述內容的完整初始資料集最簡單的方法是執行 nsrget -o:d 在受影響的伺服器和節點上。
警示:請勿使用 -o:d 在任何具有磁帶且磁帶正忙於寫入的主機上。您可以從監控 ->裝置下的 NetWorker Management Console (NMC) 檢查。

下列文章提供取得和使用 NSRGET 的相關資訊:NetWorker:如何使用 NSRGet NetWorker 資料收集工具

2.測試庫的就緒情況

  1. 檢查受影響程式庫的儲存節點擁有者是否已啟用且準備就緒:
    1. 在 NMC 中,前往 裝置 ->儲存節點。
    2. 確定 已啟用檢視 ->診斷模式
    3. 檢查右側窗格中的 已啟用就緒 列。
    4. 如果預計要啟用的儲存節點未啟用,請以滑鼠右鍵按一下該儲存節點,然後按一下 啟用/停用啟用
    5. 如果存儲節點無法在一兩分鐘內就緒 ,則必須單獨跟進;程式庫沒有回應,因為無法存取其儲存節點。
  2. 檢查受影響的程式庫是否已啟用且已就緒: 
    1. 在 NMC 中,前往裝置 ->程式庫
    2. 確定 已啟用檢視 ->診斷模式
    3. 檢查右側窗格中的 已啟用就緒 列。如果磁帶庫顯示 就緒 狀態,請繼續執行 [4].
    4. 如果未啟用,您可以右鍵按下左側的庫實例,然後選擇“啟用/禁用”以重新啟用它。
    5. 啟用后,等待一兩分鐘,再次單擊庫容器,然後查看“就緒”列中是否出現綠色勾號。
    6. 如果庫尚未就緒,請右鍵單擊左側的庫實例,選擇 “屬性”,然後在 “常規 ”選項卡上,確保 “控制埠 ”值與 scsidev@#.#.# 您從中看到的地址 inquire 命令為貴組織設定主要和次要 IT 連絡人。
    7. 如果 控制埠 不匹配,請將啟用 設置為 ,然後按兩下 確定;然後重新輸入屬性,並更改 控制埠 以符合 inquire 地址已發現。更新 控制連接埠後,將「啟用 」變更回 「是」,然後再次按一下「 確定 」以重新啟用。請花一兩分鐘時間查看庫是否 已準備就緒
    8. 最後,如果在更正 後控制埠 值不允許庫變 為就緒,請最後一次輸入庫的屬性;在下面 高級 標籤,設置 調試跟蹤級別5;並再次 禁用重新啟用 以捕獲守護程式日誌中的啟動順序兩分鐘。

在區段 [2.2],確認 nsrlcpd 從預定的存儲節點啟動。此外,請檢查它是否不是獨立停止或重新開機。如果進程 ID (PID) 繼續更改,則表示該進程已被軟體或轉儲核心停止或終止。還要警惕伺服器和存儲節點之間的名稱解析問題,這可能會阻止啟動。伺服器為節點解析的名稱應與節點自己的 nsrladb 名稱和節點的伺服器名稱匹配。

如需每個主機程序的 NetWorker 詳細概觀,請參閱:NetWorker 程序和連接埠

有關這些服務的消息會記錄在主機的 daemon.raw

3.確定庫的回應能力:

如果磁帶庫未就緒,且您無法判斷原因,請確定可以聯絡磁帶庫本身:

  1. 檢查 inquire 節點的輸出來自 [1.3],並確保庫在輸出中顯示為“自動轉換器”,並記下 SCSI #.#.# 位址。
  2. 如果庫未出現在 inquire 輸出,檢查以確保作業系統可以檢測到它。如果 NetWorker 中已設定並啟用程式庫,Solaris 主機不會報告該程式庫。如需協助,請參閱故障診斷 NetWorker 中的磁帶庫偵測問題
  3. 確保庫回應基本庫命令。在 [ 中使用 SCSI 位址3.1],執行:'sjisn #.#.#」。如需更多有關程式庫測試命令的資訊,請參閱 NetWorker 中的磁帶庫存取問題疑難排解。
  4. 如果 SJI 命令失敗,請考慮傳輸或硬體問題的可能性:請參閱故障診斷 NetWorker 中的磁帶庫硬體問題 以取得協助。
  5. 如果問題是作業系統無法探索程式庫,且正確回應 SJI 命令,NetWorker 無法探索,請嘗試使用 jbconfig 命令並選擇選項 2;如果這樣做無法解決,請嘗試選項 4,並手動提供磁帶庫位址並設定為標準磁帶庫 (選項 56)。如需詳細資訊 ,請參閱故障診斷 NetWorker 中的磁帶庫組態問題

4.測試磁帶移動和磁碟區健全狀況

如果庫已準備就緒且看似回應迅速,但在載入卷時遇到問題,則有許多不同的可能原因。

  1. 盡可能清空整個庫;如果您可以停止其他操作,請以滑鼠右鍵按一下,然後從裝置 ->磁帶庫標籤重設磁帶庫。
  2. 嘗試將單個盒式磁帶載入到單個設備中,其中兩者都被認為受到載入問題的影響;每次嘗試後視需要卸載。
  3. 比較不同磁碟機中的相同磁碟區,以及認為受影響的磁碟機中的不同磁碟區;請注意錯誤和模式(如果有)。
  4. 如果捲載入可靠地失敗,無論設備如何,請嘗試以下標籤檢查:
    1. 載入卷而不安裝 如果盒式磁帶移動沒有錯誤,則您已驗證臂的機械功能正常。
    2. 執行 nsrmm -pv -f networker_device   如果回應的標籤已驗證,則表示您已驗證媒體也有效且狀況良好。
    3. “庫”的屬性中,在啟用 “診斷模式 ”的情況下,轉到“ 計時器 ”選項卡,將 “載入睡眠 ”設置為 “60 ”,然後再單擊 “確定”
    4. 卸載磁碟區,然後嘗試重新載入磁碟區 如果現在成功,則問題可能是計時問題 (您可以嘗試降低 Sleep 值,直到它再次開始失敗)。
  5. 如果 nsrmm 命令失敗,需要進一步測試。以滑鼠右鍵按一下並選取 啟用/停用,以在 NMC 中停用有問題的磁碟機。
    1. 執行 scanner 裝置上的命令:
      1. 若為 NetWorker 伺服器的本機儲存節點,請執行: scanner -nizv local_device
      2. 若為在「遠端」NetWorker 儲存節點上,請執行: scanner -s server -nizv local_device
    2. 在 ~20 行之後換行並檢查標籤讀取消息;成功的標誌如下 8936:scanner: scanning media_type tape volume_name on device_name
    3. 如果 scanner 返回消息意外文件號,想要 2,收到 higher_number 發生數據丟失,很可能是由於 SCSI 重置;檢查在 NetWorker 中故障診斷覆寫標籤和 SCSI 重設
  6. 如果 scanner 傳回 message 8945:scanner: Read: -1 bytes 判斷該磁碟區是否可在其他節點或磁碟機上讀取,並判斷問題的趨勢。如果您發現某些磁碟區在某些節點上可以讀取,但不能在其他節點上讀取,並且設備是 LTO-4 或更高版本,請考慮驅動器解密失敗:LTO 硬體加密與 NetWorker

有關更高級的媒體驗證資訊,請參閱:針對 NetWorker 中的媒體掛接問題進行故障診斷

5.  測試磁碟機訂購問題

如果載入和掛接命令成功,但標籤讀取或簡單掛接失敗,則問題可能涉及錯誤的驅動器順序。

  1. 盡可能清空整個庫;如果您可以停止其他操作,請按一下滑鼠右鍵,並從「裝置 ->程式庫」重設程式庫。
  2. 嘗試將單個盒式磁帶載入到單個設備中,其中兩者都被認為受到載入問題的影響;每次嘗試後視需要卸載。
  3. 比較不同磁碟機中的相同磁碟區,以及認為受影響的磁碟機中的不同磁碟區;請注意錯誤和模式(如果有)。
  4. 如果載入可靠失敗,請嘗試以下標籤檢查:

有關庫載入問題的更多高級説明,請參閱:故障診斷 NetWorker 中的磁帶庫載入問題

如果所有這些測試都失敗,而您沒有進一步失敗,請確保您記錄了本文中每個步驟的結果,並與 NetWorker 支援部門接洽。明確的細節對於加快解決方案和確保限制「重複步驟」至關重要。

其他資訊


受影響的產品

NetWorker

產品

NetWorker Family
文章屬性
文章編號: 000031465
文章類型: How To
上次修改時間: 23 1月 2026
版本:  6
向其他 Dell 使用者尋求您問題的答案
支援服務
檢查您的裝置是否在支援服務的涵蓋範圍內。