Avamar:如何將 Avamar Server 設定為已知的受控狀態

摘要: 本文說明如何將 Avamar 伺服器設定為已知受控狀態。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

Avamar 伺服器上有許多自動化工作,可能會影響故障診斷和解決工作。

此程序記錄如何將 Avamar 置於所謂的「已知受控狀態」,以防止發生非預期或不良活動。

執行手動和進階維護工作時,應遵循以下檢查清單。例如:
  • 重新建置 Stripe
  • 重新建置節點
  • 重新開機離線節點
此為檢查清單,並非如何執行作業或解讀結果的指南。

這不是執行狀況檢查解決方案。這假定 Avamar 伺服器狀況不良。

原因

必須在 Avamar Server 上執行手動或進階維護工作。

解决方案

警示:如果使用不當,下面引用的某些命令可能會導致數據完整性問題或數據丟失。如果您不瞭解命令或執行命令的後果,請向 Dell 支援 或您當地的 Dell 合作夥伴代表尋求協助。

先決條件:
avmaint config --ava | grep <setting>
  • 應避免手動維護。允許維護計劃程式盡可能管理維護任務。
程序:
  1. 在處理任何系統之前,應使用這些命令來瞭解 Avamar 伺服器的一般狀態,以回答下列問題:
  • 最近驗證的檢查點是幾舊的?
cplist
  • 所有的條紋都在線嗎?所有節點都在線上嗎?
status.dpn
  • 所有服務都已恢復正常嗎?
dpnctl status
  1. 檢查是否執行維護,並視需要取消維護:
    1. 使用維護計劃程式掛起維護活動,以確保它們在停止後不會再次啟動。
avmaint sched suspend cp --ava
avmaint sched suspend hfscheck --ava
請勿暫停 垃圾收集 (GC),這可能會導致不必要的復原。
  1. 執行以下命令,並檢查是否有執行中的維護活動。
status.dpn
  • 如果檢查點正在運行,請讓它完成。
  • 如果 HFScheck 正在執行,則在伺服器未處於管理模式 (waitcgsan 階段),或 HFScheck 幾乎已完成時,可以將其停止:
avmaint hfscheckstop --ava
  • 如果 GC 正在執行,則可以將其終止:
avmaint gckill --ava
這可能需要一些時間才能完成,因為當前通行證必須完成。
  1. 不再執行維護後,應停止維護排程器:
dpnctl stop maint
  1. 停止備份排程器、停止執行備份或還原,以及掛起新連線:
    1. 防止 MCS 啟動任何新的備份:
dpnctl stop sched
  1. 列出所有執行中的備份:
avmaint sessions --ava | grep sessionid
如果正在執行複寫以外的還原,請諮詢使用者以判斷是否應允許還原完成。
  1. 收到使用者的核准後,可使用 UI 乾淨地終止備份 (建立部分備份),或使用以下方式不乾淨地終止:
avmaint kill -waittime=0 <sessionid>
  1. 列出上一個命令未列出的任何其他備份:
avmaint sessions --full
  1. 視要執行的作業而定,可能無法接受執行任何備份類型作業 (即 avmaint getrefby)。因此,請暫停分派器以不允許任何手動備份:
avmaint suspend
  1. 停止複製(複製源或目標)。
    1. 若為複寫來源 (還原),請使用 UI 或 EM,或終止程序以停止複寫。
    2. 針對複寫目標 (備份),請確認是否正在執行複寫: 
avmaint sessions | grep path
  1. 在路徑中尋找 /REPLICATE 網域。使用步驟 4a 中的方法停止源網格上的複製。
  1. 使用以下命令關閉嘎吱聲:
avmaint config --ava asynccrunching=false
嘎吱嘎吱最多可能需要 15 分鐘才能停止,請檢查資料節點的 GSAN 記錄是否有任何「嘎吱嘎吱」訊息。
  1. 關閉平衡
    1. 檢查平衡是否正在執行:
avmaint config --ava | grep balancemin
通常,不應啟用平衡(0 以外的任何值),但檢查它仍然很重要。
  1. 若要停用平衡:
avmaint config --ava balancemin=0
平衡可能需要長達 15 分鐘才能停止,請檢查 status.dpn 以查看是否有任何 stripe 正在遷移,以確認平衡已完成。
  1. 檢查容量:
    1. 檢查作業系統容量: 
avmaint nodelist --ava | grep fs-perc
  1. 檢查檢查點的大小:
mapall copy ~/cps                # only if cps does not exist on the data nodes
mapall --noerror './cps'
  1. 檢查檢查點清單以確定必須保留哪些檢查點 (所有節點上最後一個驗證的檢查點):
cplist
根據上述結果,確定可以保留多少個檢查點、哪些檢查點是關鍵檢查點以及可以創建多少個新檢查點。
如需容量的相關資訊,請參閱文章 Avamar:容量管理概念和訓練
  1. 注意節點的順序以及邏輯節點號和物理節點號之間的差異:
nodenumbers
status.dpn
mapall --noerror 'tail -2 /data01/cur/gsan.log'
  1. 檢閱硬體
  • 現在應停止所有自動化任務。 
  • 伺服器應該幾乎沒有活動,並且應該可以安全地繼續執行任何手動任務或命令。 
透過檢查資料節點上的 GSAN 記錄來檢查伺服器。驗證記錄的活動是否很少或沒有記錄。
也可以使用 mapall 執行連續運作時間命令,以檢查資料節點的「平均負載」是否較低 (介於 0.01 和 0.05 之間),

例如:
mapall --noerror 'uptime' 

(0.0) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.01, 0.02, 0.01 
(0.1) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01 
(0.2) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01
上述步驟會將伺服器設為非生產狀態。請在完成所有手動工作後,一律還原變更

其他信息

 

受影响的产品

Avamar, Avamar Server
文章属性
文章编号: 000170876
文章类型: Solution
上次修改时间: 06 8月 2025
版本:  15
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。