Avamar:如何將 Avamar Server 設定為已知的受控狀態
摘要: 本文說明如何將 Avamar 伺服器設定為已知受控狀態。
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
Avamar 伺服器上有許多自動化工作,可能會影響故障診斷和解決工作。
此程序記錄如何將 Avamar 置於所謂的「已知受控狀態」,以防止發生非預期或不良活動。
執行手動和進階維護工作時,應遵循以下檢查清單。例如:
這不是執行狀況檢查解決方案。這假定 Avamar 伺服器狀況不良。
此程序記錄如何將 Avamar 置於所謂的「已知受控狀態」,以防止發生非預期或不良活動。
執行手動和進階維護工作時,應遵循以下檢查清單。例如:
- 重新建置 Stripe
- 重新建置節點
- 重新開機離線節點
這不是執行狀況檢查解決方案。這假定 Avamar 伺服器狀況不良。
原因
必須在 Avamar Server 上執行手動或進階維護工作。
解决方案
警示:如果使用不當,下面引用的某些命令可能會導致數據完整性問題或數據丟失。如果您不瞭解命令或執行命令的後果,請向 Dell 支援 或您當地的 Dell 合作夥伴代表尋求協助。
先決條件:
先決條件:
- 所有命令都應以系統管理員身分執行,並依據文章 Avamar 載入 SSH 金鑰:如何登入 Avamar Server 並載入各種金鑰。
- 某些命令可能不會提供反饋或立即生效;不應多次運行命令。
- 對於任何
avmaint config --ava命令,請始終確認更改已生效。執行命令:
avmaint config --ava | grep <setting>
- 應避免手動維護。允許維護計劃程式盡可能管理維護任務。
- 在處理任何系統之前,應使用這些命令來瞭解 Avamar 伺服器的一般狀態,以回答下列問題:
- 最近驗證的檢查點是幾舊的?
cplist
- 所有的條紋都在線嗎?所有節點都在線上嗎?
status.dpn
- 所有服務都已恢復正常嗎?
dpnctl status
- 檢查是否執行維護,並視需要取消維護:
- 使用維護計劃程式掛起維護活動,以確保它們在停止後不會再次啟動。
avmaint sched suspend cp --ava avmaint sched suspend hfscheck --ava
請勿暫停 垃圾收集 (GC),這可能會導致不必要的復原。
- 執行以下命令,並檢查是否有執行中的維護活動。
status.dpn
- 如果檢查點正在運行,請讓它完成。
- 如果 HFScheck 正在執行,則在伺服器未處於管理模式 (waitcgsan 階段),或 HFScheck 幾乎已完成時,可以將其停止:
avmaint hfscheckstop --ava
- 如果 GC 正在執行,則可以將其終止:
avmaint gckill --ava
這可能需要一些時間才能完成,因為當前通行證必須完成。
- 不再執行維護後,應停止維護排程器:
dpnctl stop maint
- 停止備份排程器、停止執行備份或還原,以及掛起新連線:
- 防止 MCS 啟動任何新的備份:
dpnctl stop sched
- 列出所有執行中的備份:
avmaint sessions --ava | grep sessionid
如果正在執行複寫以外的還原,請諮詢使用者以判斷是否應允許還原完成。
- 收到使用者的核准後,可使用 UI 乾淨地終止備份 (建立部分備份),或使用以下方式不乾淨地終止:
avmaint kill -waittime=0 <sessionid>
- 列出上一個命令未列出的任何其他備份:
avmaint sessions --full
- 視要執行的作業而定,可能無法接受執行任何備份類型作業 (即 avmaint getrefby)。因此,請暫停分派器以不允許任何手動備份:
avmaint suspend
- 停止複製(複製源或目標)。
- 若為複寫來源 (還原),請使用 UI 或 EM,或終止程序以停止複寫。
- 針對複寫目標 (備份),請確認是否正在執行複寫:
avmaint sessions | grep path
- 在路徑中尋找 /REPLICATE 網域。使用步驟 4a 中的方法停止源網格上的複製。
- 使用以下命令關閉嘎吱聲:
avmaint config --ava asynccrunching=false
嘎吱嘎吱最多可能需要 15 分鐘才能停止,請檢查資料節點的 GSAN 記錄是否有任何「嘎吱嘎吱」訊息。
- 關閉平衡
- 檢查平衡是否正在執行:
avmaint config --ava | grep balancemin
通常,不應啟用平衡(0 以外的任何值),但檢查它仍然很重要。
- 若要停用平衡:
avmaint config --ava balancemin=0
平衡可能需要長達 15 分鐘才能停止,請檢查 status.dpn 以查看是否有任何 stripe 正在遷移,以確認平衡已完成。
- 檢查容量:
- 檢查作業系統容量:
avmaint nodelist --ava | grep fs-perc
- 檢查檢查點的大小:
mapall copy ~/cps # only if cps does not exist on the data nodes mapall --noerror './cps'
- 檢查檢查點清單以確定必須保留哪些檢查點 (所有節點上最後一個驗證的檢查點):
cplist
根據上述結果,確定可以保留多少個檢查點、哪些檢查點是關鍵檢查點以及可以創建多少個新檢查點。
如需容量的相關資訊,請參閱文章 Avamar:容量管理概念和訓練
- 注意節點的順序以及邏輯節點號和物理節點號之間的差異:
nodenumbers status.dpn mapall --noerror 'tail -2 /data01/cur/gsan.log'
- 檢閱硬體
- 現在應停止所有自動化任務。
- 伺服器應該幾乎沒有活動,並且應該可以安全地繼續執行任何手動任務或命令。
透過檢查資料節點上的 GSAN 記錄來檢查伺服器。驗證記錄的活動是否很少或沒有記錄。
也可以使用 mapall 執行連續運作時間命令,以檢查資料節點的「平均負載」是否較低 (介於 0.01 和 0.05 之間),
例如:
例如:
mapall --noerror 'uptime' (0.0) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.01, 0.02, 0.01 (0.1) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.02, 0.01, 0.01 (0.2) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.02, 0.01, 0.01上述步驟會將伺服器設為非生產狀態。請在完成所有手動工作後,一律還原變更。
其他信息
受影响的产品
Avamar, Avamar Server文章属性
文章编号: 000170876
文章类型: Solution
上次修改时间: 06 8月 2025
版本: 15
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。