Avamar:如何將 Avamar Server 設定為已知的受控狀態
Summary: 本文說明如何將 Avamar 伺服器設定為已知受控狀態。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Avamar 伺服器上有許多自動化工作,可能會影響故障診斷和解決工作。
此程序記錄如何將 Avamar 置於所謂的「已知受控狀態」,以防止發生非預期或不良活動。
執行手動和進階維護工作時,應遵循以下檢查清單。例如:
這不是執行狀況檢查解決方案。這假定 Avamar 伺服器狀況不良。
此程序記錄如何將 Avamar 置於所謂的「已知受控狀態」,以防止發生非預期或不良活動。
執行手動和進階維護工作時,應遵循以下檢查清單。例如:
- 重新建置 Stripe
- 重新建置節點
- 重新開機離線節點
這不是執行狀況檢查解決方案。這假定 Avamar 伺服器狀況不良。
Cause
必須在 Avamar Server 上執行手動或進階維護工作。
Resolution
警示:如果使用不當,下面引用的某些命令可能會導致數據完整性問題或數據丟失。如果您不瞭解命令或執行命令的後果,請向 Dell 支援 或您當地的 Dell 合作夥伴代表尋求協助。
先決條件:
先決條件:
- 所有命令都應以系統管理員身分執行,並依據文章 Avamar 載入 SSH 金鑰:如何登入 Avamar Server 並載入各種金鑰。
- 某些命令可能不會提供反饋或立即生效;不應多次運行命令。
- 對於任何
avmaint config --ava命令,請始終確認更改已生效。執行命令:
avmaint config --ava | grep <setting>
- 應避免手動維護。允許維護計劃程式盡可能管理維護任務。
- 在處理任何系統之前,應使用這些命令來瞭解 Avamar 伺服器的一般狀態,以回答下列問題:
- 最近驗證的檢查點是幾舊的?
cplist
- 所有的條紋都在線嗎?所有節點都在線上嗎?
status.dpn
- 所有服務都已恢復正常嗎?
dpnctl status
- 檢查是否執行維護,並視需要取消維護:
- 使用維護計劃程式掛起維護活動,以確保它們在停止後不會再次啟動。
avmaint sched suspend cp --ava avmaint sched suspend hfscheck --ava
請勿暫停 垃圾收集 (GC),這可能會導致不必要的復原。
- 執行以下命令,並檢查是否有執行中的維護活動。
status.dpn
- 如果檢查點正在運行,請讓它完成。
- 如果 HFScheck 正在執行,則在伺服器未處於管理模式 (waitcgsan 階段),或 HFScheck 幾乎已完成時,可以將其停止:
avmaint hfscheckstop --ava
- 如果 GC 正在執行,則可以將其終止:
avmaint gckill --ava
這可能需要一些時間才能完成,因為當前通行證必須完成。
- 不再執行維護後,應停止維護排程器:
dpnctl stop maint
- 停止備份排程器、停止執行備份或還原,以及掛起新連線:
- 防止 MCS 啟動任何新的備份:
dpnctl stop sched
- 列出所有執行中的備份:
avmaint sessions --ava | grep sessionid
如果正在執行複寫以外的還原,請諮詢使用者以判斷是否應允許還原完成。
- 收到使用者的核准後,可使用 UI 乾淨地終止備份 (建立部分備份),或使用以下方式不乾淨地終止:
avmaint kill -waittime=0 <sessionid>
- 列出上一個命令未列出的任何其他備份:
avmaint sessions --full
- 視要執行的作業而定,可能無法接受執行任何備份類型作業 (即 avmaint getrefby)。因此,請暫停分派器以不允許任何手動備份:
avmaint suspend
- 停止複製(複製源或目標)。
- 若為複寫來源 (還原),請使用 UI 或 EM,或終止程序以停止複寫。
- 針對複寫目標 (備份),請確認是否正在執行複寫:
avmaint sessions | grep path
- 在路徑中尋找 /REPLICATE 網域。使用步驟 4a 中的方法停止源網格上的複製。
- 使用以下命令關閉嘎吱聲:
avmaint config --ava asynccrunching=false
嘎吱嘎吱最多可能需要 15 分鐘才能停止,請檢查資料節點的 GSAN 記錄是否有任何「嘎吱嘎吱」訊息。
- 關閉平衡
- 檢查平衡是否正在執行:
avmaint config --ava | grep balancemin
通常,不應啟用平衡(0 以外的任何值),但檢查它仍然很重要。
- 若要停用平衡:
avmaint config --ava balancemin=0
平衡可能需要長達 15 分鐘才能停止,請檢查 status.dpn 以查看是否有任何 stripe 正在遷移,以確認平衡已完成。
- 檢查容量:
- 檢查作業系統容量:
avmaint nodelist --ava | grep fs-perc
- 檢查檢查點的大小:
mapall copy ~/cps # only if cps does not exist on the data nodes mapall --noerror './cps'
- 檢查檢查點清單以確定必須保留哪些檢查點 (所有節點上最後一個驗證的檢查點):
cplist
根據上述結果,確定可以保留多少個檢查點、哪些檢查點是關鍵檢查點以及可以創建多少個新檢查點。
如需容量的相關資訊,請參閱文章 Avamar:容量管理概念和訓練
- 注意節點的順序以及邏輯節點號和物理節點號之間的差異:
nodenumbers status.dpn mapall --noerror 'tail -2 /data01/cur/gsan.log'
- 檢閱硬體
- 現在應停止所有自動化任務。
- 伺服器應該幾乎沒有活動,並且應該可以安全地繼續執行任何手動任務或命令。
透過檢查資料節點上的 GSAN 記錄來檢查伺服器。驗證記錄的活動是否很少或沒有記錄。
也可以使用 mapall 執行連續運作時間命令,以檢查資料節點的「平均負載」是否較低 (介於 0.01 和 0.05 之間),
例如:
例如:
mapall --noerror 'uptime' (0.0) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.01, 0.02, 0.01 (0.1) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.02, 0.01, 0.01 (0.2) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.02, 0.01, 0.01上述步驟會將伺服器設為非生產狀態。請在完成所有手動工作後,一律還原變更。
Additional Information
Affected Products
Avamar, Avamar ServerArticle Properties
Article Number: 000170876
Article Type: Solution
Last Modified: 06 Aug 2025
Version: 15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.