NetWorker:故障診斷 NetWorker 中的磁帶庫載入問題
摘要: 本文旨在幫助支援者和管理員解決庫或應用程式級別的庫載入問題。確定問題是邏輯問題還是物理問題,以及問題是機器人、驅動器還是介質盒的問題。
本文章適用於
本文章不適用於
本文無關於任何特定產品。
本文未識別所有產品版本。
症狀
- 在磁帶庫中載入磁帶匣時出現零星或一致的錯誤
- 無法從磁帶庫媒體執行備份或復原
- 庫可偵測、已確認功能正常且已就緒
- 無法執行載入或標記作業
- 膠帶被標記為「未標記」
- 系統或應用程式記錄中可能出現的 ASC/ASCQ/SCSI 感知錯誤或訊息
- 執行特定或隨機庫操作的零星或一致的錯誤
原因
如果磁帶庫組態先前可運作,但突然遇到問題,請考慮可能會妨礙偵測和組態的變更:
- 機器人、開關或配接卡韌體、驅動程式或組態變更
- 新增、更換或移除磁碟機、磁帶匣或其他磁帶庫元件
- 變更 NetWorker 軟體版本、作業系統修補程式
- 任何硬體事件,例如資料路徑中任何元件斷電或重新開機
- NetWorker 組態與磁帶庫之間的差異 (例如,磁帶匣移出 NetWorker 控制之外)
如果磁帶庫從未運作過,請在 NetWorker 硬體相容性指南 中確認硬體是否受支援(需要 Dell 支援帳戶登入)。請記住,庫可能部分功能正常;僅探索並不能保證可用性或支援性。
解析度
為了解決庫載入問題,在考慮最後已知更改后,通過將進程下放到其原始成分並單獨測試它們來進行故障排除。
已收集所需的資料 NSRGet 執行時使用 -o:d 切換值。NetWorker:如何使用 NSRGet NetWorker 資料收集工具
不限於那些如果手動嘗試可能被視為危險的操作。
警告:其中一些命令可能會導致 SCSI 重設,進而導致磁帶設備倒帶。如果有主機可存取的任何作用中磁帶,請勿使用。
庫載入:通訊
- 同樣,請確保庫回應迅速且準備就緒,然後再繼續。如果沒有,請:
庫載入:實體操作
- 檢查以確保庫操作在基本級別實際上是可能的。確保在庫處於非活動狀態時完成測試,並將磁帶盒更換為其原始位置。
首先確定盒式磁帶位移:
sjirdtag <changer address>
然後在元素之間移動磁帶並再次移動磁帶:
sjimm <changer address> <drive|slot|inlt|mt> <element_number> <drive|slot|inlt|mt> <element_number>
- 在某些情況下,可能會出現錯誤;例如,未在庫層級啟用自動退出的庫在嘗試從驅動器移動到任何其他元素時會收到錯誤(磁帶盒必須在
mt -f <device_handle> offline命令,然後再移出元素)。 - 如果在嘗試機器人操作時偶爾或一致地返回錯誤,則 SCSI ASC/ASCQ 代碼錯誤,請考慮將錯誤升級到庫供應商以供審查。
庫載入:邏輯運算
一旦我們確定物理操作沒有錯誤(至少表面上是這樣),我們就可以嘗試在 NetWorker 中跟蹤問題。
- 確定庫的佈局並確保其準備就緒,將 NSR 點唱機狀態資訊與機器人的磁帶盒資訊進行比較:
nsrjb [<-j library_name>] -C sjirdtag <changer address>
- 嘗試以高詳細程度將受影響的磁帶載入至受影響的磁碟機:
nsrjb [<-j library_name>] -lvvvvv -f <device_handle> -S <slot_number>
如果庫重複載入而沒有出現問題,則載入問題可能是由特定情境因素引起的,而不是持續性故障。應盡一切努力隔離導致負載故障的條件,並隨後調試條件(見下文)。
- 如果常規載入操作失敗,特別是卷標記為“未標記”,則標籤讀取在載入嘗試期間失敗(導致 裝載 失敗)。嘗試以高詳細程度將相同的磁帶重新載入至相同的驅動器,而不掛載:
nsrjb [<-j library_name>] -lnvvvvv -f <device_handle> -S <slot_number>
- 執行獨立的標籤驗證,以測試標籤讀取失敗是暫時性的還是一致的:
nsrmm -pvvvvv -f <device_handle>
- 如果成功讀取標籤,則問題可能會解決為在物理載入磁帶設備後準備就緒之前進行的標籤讀取嘗試。在這種情況下,您可以嘗試在系統環境或啟動腳本中設置變數:
MAX_LOAD_RETRIES=10
如果在設置變數后的複合載入/掛載(標籤讀取)操作期間載入操作似乎仍然失敗,請轉到調試部分。
庫載入:偵錯
如果所有其他方法都失敗,請收集適當的數據以幫助調試問題,然後再諮詢主題專家 (SME):
- 在 NetWorker 中重現問題之前,請將 NSR 自動儲存塔資源中的 偵錯追蹤層級 變更為 5
- 也使用
dbgcommand為了提高執行中的除錯層級nsrd和nsrmmgd行程到 5dbgcommand -n PROCESS_NAME Debug=5- 若要停用:
dbgcommand -n PROCESS_NAME Debug=0 - NetWorker:除錯資訊層級
- 考慮
truss/tusc/strace小pstack小gcore/gencore在適當的nsrlcpd問題事件發生之前和期間 - 在系統環境 (Windows) 或啟動指令檔 (UNIX) 中設定偵錯變數,以取得更豐富的除錯資料:
SJI_DEBUG=9 LUS_DEBUG=9 CDI_DEBUG=9 SCSI_DEBUG=9 JBDEBUG=9
警告: 除非在啟動后快速重現問題,否則調試日誌記錄可能會過多。服務關閉以從運行中刪除環境變數。
如果以上建議都沒有幫助,如果從調試中收集的證據顯示有任何內部異常,請根據需要聯繫您的庫供應商支持,方法是根據 NetWorker 中的磁帶庫檢測問題故障診斷和 NetWorker 中的磁帶庫存取問題;否則,請確定偵錯輸出已在 NetWorker 支援中呈報,以追蹤程式碼瑕疵的可能性。
其他資訊
本文是使用 NetWorker 故障診斷磁帶庫中的系列文章之一。
受影響的產品
NetWorker產品
NetWorker Series文章屬性
文章編號: 000079463
文章類型: Solution
上次修改時間: 30 3月 2026
版本: 4
向其他 Dell 使用者尋求您問題的答案
支援服務
檢查您的裝置是否在支援服務的涵蓋範圍內。