故障診斷 NetWorker 中的磁帶庫存取問題

摘要: 本文旨在協助支援和 NetWorker 系統管理員判斷偵測到機器人無法接受命令的原因。

本文章適用於 本文章不適用於 本文無關於任何特定產品。 本文未識別所有產品版本。

症狀

 

  • 無法存取在 NetWorker 儲存節點或伺服器上偵測到的磁帶庫安裝
  • 由於備份硬體無法使用,因此無法備份資料
  • 存取機器人時發生錯誤:
    • 0x29
    • Device busy
    • The requested resource is busy
    • Str=<There is an input or output error.>
    • No such device
    • No such file or directory
    • Inappropriate ioctl for device

原因

如果程式庫之前可正常運作,但突然無法運作,請考慮將最後一個已知變更視為可能原因:

  • 裝置重新開機、重新探索及重新命名後,磁帶庫位址的未處理變更
  • 可能因電源突波、停電或其他環境事件造成的損壞
  • 傳輸硬體的故障事件或重新設定
  • 安裝、更改或刪除與運輸或機器人相關的軟體或驅動程式

如果磁帶庫從未運作過,請在 NetWorker 硬體相容性指南中確認硬體受支援(需要 Dell 支援帳戶登入)。請記住,庫可能部分功能正常;僅探索並不能保證可用性或支援性。

解析度

要排查庫訪問失敗問題,請查看最近的更改。然後使用基本和第三方比較測試來確認是否有任何主機或進程可以觸發機器人的回應。

有時,需要根據現有證據測試特定功能。如果主機 A 可以查詢機器人,但主機 B 不能,則機器人回應迅速。主機 A 的驅動程式可能正在鎖定機器人。如果主機 B 在所有主機未分區後仍收到錯誤,則可能是驅動程式、組態或軟體發生問題。

如果主機在問題發生之前訪問了機器人,則審核項很可能已更改。調查故障或事件發生後已知的組態變更。

偵測到程式庫後,請使用下列命令測試儲存傳輸的基本 SCSI 作業,而非乙太網路或 Web UI。請務必確保作業系統修補程式為最新狀態,尤其是儲存裝置方面。

注意:收集包含上述內容的完整初始資料集最簡單的方法是執行 nsrget -o:d 在受影響的伺服器和節點上。
警示:請勿使用 -o:d 在任何具有磁帶且磁帶正忙於寫入的主機上。您可以在 NetWorker Management Console (NMC) 的「監控 -> 裝置」下檢查此項目。 

下列文章提供取得和使用 NSRGET 的相關資訊:NetWorker:如何使用 NSRGet NetWorker 資料收集工具


圖書館存取:作業系統:

  • Windows:在 Windows 中沒有查詢磁帶庫的本機方法; mtx 是一個免費軟體實用程式,如果需要,可以進行測試。它在發出命令時使用更改器設備句柄,而不是 SCSI 位址(這可能會對測試產生影響)。
loaderinfo -f \\.\changer#
mtx -f \\.\changer# inquiry
 
  • Linux:像 Windows,沒有本機命令可供查詢,但也有一個 mtx 連接埠,這需要裝置驅動程式句柄 (同樣,與 NetWorker 存取的方式不同)。
loaderinfo -f /dev/sg#
mtx -f /dev/sg# inquiry
 
  • Solaris:Solaris 包括 sgen 支援原生磁帶庫的驅動程式,但沒有 mtx 埠也不存在其他本機庫命令。請參閱 NetWorker 命令一節,改為測試程式庫存取 (下方)。
     
  • AIX:AIX 沒有任何本機磁帶庫支援 (lus 改用),而否 mtx 連接埠可供 it 使用。請參閱 NetWorker 命令一節,改為測試程式庫存取 (下方)。
  • HP-UX: mc 是用於介質變更器操作的本機 HP-UX 命令:
mc -p $(ioscan  FnkC autoch | grep /dev/rac) -r MIDS -q
 
  • NetWorker:這些命令是在相對原子的層級上運作,而且雖然是由 NetWorker 支援所寫入、編譯和測試,但是不需要執行中的 NetWorker 例項即可運作,也不需要 NetWorker 的任何組態。通常,它們被認為是可靠的、低級的、獨立於軟體的測試實用程式。要增加大多數實用程式的調試,您可以添加以下環境變數:

SJI_DEBUG=9
LUS_DEBUG=9 (lusdebug ffff on AIX)
CDI_DEBUG=9
SCSI_DEBUG=9
JBDEBUG=9

在下面,'<changer address>」依作業系統而有所不同:

Windows: Initiator.Target.LUN (正如所揭示的那樣 inquire 命令) 或 \\.\changer# 驅動程式句柄
Linux: Intiator.Target.LUN (正如所揭示的那樣 inquire 命令) 或 /dev/sg# 驅動程式控點
Solaris: /dev/scsi/changer/c#t#d# 驅動程式句柄
AIX: Initiator.Target.LUN (正如所揭示的那樣 inquire command)
HP-UX: Initiator.Target.LUN (正如所揭示的那樣 inquire 命令) 或 /dev/rac/c#t#d# 驅動程式把手

sjirjc <changer address>
從機器人請求數據,例如驅動器數量、支援的功能等。

sjisn <changer address>
向機器人請求驅動元件和序列號資訊。

sjirdtag <changer address>
要求磁帶匣到元素位置資料

cdi_inq -f <changer driver handle> -v
要求重要的產品資料(需要使用驅動程式手柄)
 
ielem -a <changer address>
嘗試重新初始化元素 - 可能會造成中斷。
 

圖書館存取:重設磁帶庫:

庫可能會遇到週期性、暫時性問題,從而導致它們出現引導周期問題;您可以採取幾種措施來嘗試緩解內部問題:

nsrjb -HEvvvvv
向有問題的庫發出重置命令,並強制元素重新初始化。

nsrjb -IIvvvvv
根據媒體庫報告的條碼和媒體資料庫中的對應值,強制更新和重新整理 NetWorker nsr 自動儲存塔 物件。

nsrjb -HH
強制自動儲存塔卸載所有卷並嘗試軟重置。
 
注意:上述命令僅在工作流的後期階段起作用,特別是在庫單元“準備好”接受命令後。因此,本節僅提供有關如何在庫處於“就緒”狀態的情況下修復“訪問”問題的步驟。 ielem -a 大致相當於 nsrjb -E NetWorker 不需要功能正常的 NSR 自動儲存塔
 

傳輸 - 組態

  • 適用於 SAN:請確定機器人和預期的 NetWorker 機器人控制主機都已正確登入交換器,並檢閱機器人的分區,以確保可以進行端對端連線。
  • 機器人不應由多個主機訪問或控制;除非有需求 (例如分割的機器人),否則請確定只有預期的 NetWorker 機器人控制器主機經過分區,才能查看機器人。
  • 可以測試SAS擴展器以確保建立機器人連接;像SCSI這樣的純點對點技術需要測試來自相關主機的連接。

傳輸 - 硬體

  • 如果在主機或傳輸硬體級別檢測到問題,請考慮測試交換機或擴展器,或以「已知良好」的範例替換電纜以排除電纜問題。
  • 查看傳輸硬體的固件以及機器人本身的固件以獲取貨幣。
  • 對於SCSI,請確保端接器放置正確且安裝緊密,遵守電纜長度限制並使用適當的電壓。

主機傳輸 - 組態

  • 確保相關主機具有其傳輸驅動程式的最新驅動程式和韌體 - 使用 EMCReports (隨附於 nsrget -o:e)。
  • 請務必針對作業系統適當完成所需的任何主機匯流排配接卡 (HBA) 驅動程式組態。

主機軟體 - 資源鎖定

  • 對於任何被分區以查看機器人的主機(理想情況下 - 僅指定的 NetWorker 主機),請檢查任何可能嘗試存取機器人的軟體,例如其他備份軟體、監控軟體或可能嘗試存取機器人的獨立公用程式。
  • 若為 Solaris 10,當連接 nsrlcpd NetWorker 程序時,無法存取機器人;因此,在停用 NetWorker 中的程式庫之前,它可能看起來無法存取 (甚至無法偵測) (強制 nsrlcpd 分離並死亡)。
  • 如果懷疑有任何非 NetWorker 程序鎖定或存取自動機或任何磁碟機,請參閱 故障診斷標籤和 NetWorker 中的 SCSI 重設,以取得故障診斷和識別的詳細資訊。

如果操作系統檢測到庫,但庫不回應命令,則它在某種程度上可以正常工作。它可能被其他程序或主機鎖定、受到傳輸問題影響,或遇到元件層級故障。

如果除了要控制機器人的 NetWorker 儲存節點之外,沒有任何程序或主機可判斷要存取機器人,請參閱 故障診斷 NetWorker 中的磁帶庫硬體問題 ,以判斷機器人本身是否有問題。

其他資訊

請務必瞭解,若機器人問題在 NetWorker 的應用程式範圍外 (閱讀:無法使用標準作業系統方法存取),則不在 NetWorker 支援範圍內。
NetWorker:故障診斷 NetWorker

中的磁帶庫問題支援部門可以使用上述條件提供指導,但我們沒有操作系統、HBA 或機器人供應商資源。此限制可能導致長時間的故障排除失敗。

受影響的產品

NetWorker
文章屬性
文章編號: 000116098
文章類型: Solution
上次修改時間: 23 1月 2026
版本:  4
向其他 Dell 使用者尋求您問題的答案
支援服務
檢查您的裝置是否在支援服務的涵蓋範圍內。