由於資料分割區作業系統容量>89%,Avamar 維護工作因「MSG_ERR_DISKFULL」而失敗

摘要: 作業系統容量超過建議的限制,導致維護工作失敗。這是因為備份用戶端的變更數量過多所導致。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

Avamar 用戶端備份的資料突然發生大量變更,可能會對系統產生負面影響。如果在任何特定時間從 Avamar 新增或移除過多的資料,作業系統容量可能會大幅增加,導致維護無法使用MSG_ERR_DISKFULL。

檢查點會追蹤 Avamar 上的變更,以便如果需要回復,可以將 Avamar 傳回到該時間點。新增或移除大量資料時,檢查點會變大,並在作業系統中耗用額外的空間。

請注意,維護活動 (垃圾收集和檢查點) 如何在MSG_ERR_DISKFULL時失敗。
status.dpn
Wed Jul 27 17:58:15 IST 2016  [XX.XXX.XX.XX] Wed Jul 27 12:28:15 2016 UTC (Initialized Thu Sep 25 01:15:04 2014 UTC)
Node   IP Address     Version   State   Runlevel  Srvr+Root+User Dis Suspend Load UsedMB Errlen  %Full   Percent Full and Stripe Status by Disk
0.0    XX.XXX.XX.XX   7.0.2-43  ONLINE fullaccess mhpu+0hpu+0000   1  true   0.46 6984 12272277  64.1%  64%(onl:445) 64%(onl:443) 64%(onl:444) 64%(onl:445) 64%(onl:443) 64%(onl:444) 64%(onl:447) 64%(onl:444) 64%(onl:444) 64%(onl:446) 64%(onl:444) 64%(onl:446)
Srvr+Root+User Modes = migrate + hfswriteable + persistwriteable + useraccntwriteable

All reported states=(ONLINE), runlevels=(fullaccess), modes=(mhpu+0hpu+0000)
System-Status: ok
Access-Status: admin


Checkpoint failed with result MSG_ERR_DISKFULL : cp.20160726183227 started Wed Jul 27 00:02:57 2016 ended Wed Jul 27 00:02:57 2016, completed 0 of 5335 stripes
Last GC: finished Wed Jul 27 15:09:55 2016 after 00m 30s >> recovered 0.00 KB (MSG_ERR_DISKFULL)
Last hfscheck: finished Mon May 23 00:25:47 2016 after 23m 13s >> checked 1359 of 1359 stripes (OK)

Maintenance windows scheduler capacity profile is active.
  WARNING: Scheduler is STOPPED.
  Next backup window start time: Thu Jul 28 10:00:00 2016 IST
  Next maintenance window start time: Thu Jul 28 00:00:00 2016 IST


Avamar 伺服器的使用者容量和高作業系統容量都很高。

mccli server show-prop

admin@avamar:~/>: mccli server show-prop
0,23000,CLI command completed successfully.
Attribute                                    Value
-------------------------------------------- ----------------------------
State                                        Suspended
Active sessions                              0
Total capacity                               11.6 TB
Capacity used                                11.6 TB
Server utilization                           98.9%
Bytes protected (client pre-comp size)       3.1 TB
Bytes protected quota (client pre-comp size) Not configured
License expiration                           Never
Time since Server initialization             3088 days 17h:48m
Last checkpoint                              2023-03-02 16:06:05 BRT
Last validated checkpoint                    2023-03-02 16:00:42 BRT
System Name                                  AVAMAR.XXX.XXX
System ID                                    1234567890@00:1E:67:75:C8:AD
HFSAddr                                      10.123.123.123
HFSPort                                      27000
IP address                                   10.123.123.123
Number of nodes                              3
Nodes Online                                 0
Nodes Offline                                0
Nodes Read-only                              3
Nodes Timed-out                              0
admin@avamar:~/>:
avmaint nodelist | grep fs-percent-full | sort | tail -3

admin@avamar:~/>: avmaint nodelist | grep fs-percent-full | sort | tail -3
        fs-percent-full="96.9"
        fs-percent-full="96.9"
        fs-percent-full="96.9"
admin@avamar:~/>:


如果 Avamar 伺服器為多重節點,下列命令可協助識別每個節點的高作業系統容量:

 
avmaint nodelist | egrep 'nodetag|fs-percent-full'

admin@avamar:~/>: avmaint nodelist | egrep 'nodetag|fs-percent-full'
      nodetag="0.2"
        fs-percent-full="96.7"
        fs-percent-full="96.9"
        fs-percent-full="96.9"
      nodetag="0.1"
        fs-percent-full="96.9"
        fs-percent-full="96.4"
        fs-percent-full="96.8"
      nodetag="0.0"
        fs-percent-full="96.3"
        fs-percent-full="96.8"
        fs-percent-full="96.7"
admin@avamar:~/>:

原因

每日變更速率太高,Avamar 網格無法跟上速度。在一天之內進行大量資料變更,可能會導致作業系統容量突然暴增。變更表示大量接收新資料和快速移除舊資料。可能的話,在 Avamar 中逐步進行變更。系統越完整,變更資料暴增的影響就越高。

容量sh工具有助於追蹤表格上的變更速率。

如需如何使用容量的相關資訊sh腳本,檢閱下列文章。
    文章編號 000060149:Avamar:如何使用 capacity.sh 腳本來管理 Avamar 系統的

    容量例子:
    capacity.sh
    
      DATE     AVAMAR NEW     #BU    DDR NEW     #BU    SCANNED       REMOVED     MINS PASS AVAMAR NET      CHG RATE
    ========== ============= ==== ============= ==== ============= =============  ==== ==== ============= ==========
    2015-09-04    1770185 mb  367   36590255 mb 4414  427354917 mb   -1155011 mb   179   36     615174 mb      8.98%
    2015-09-05    1799386 mb  366   35834788 mb 4384  424229450 mb    -967906 mb   158   36     831480 mb      8.87%
    2015-09-06    1641614 mb  366   36339601 mb 4387  422918309 mb    -715952 mb    95   36     925662 mb      8.98%
    2015-09-07    1482274 mb  368   36021600 mb 4382  422096834 mb   -1369565 mb   182   35     112708 mb      8.89%
    2015-09-08    1476971 mb  376   35466632 mb 4379  418749502 mb    -882663 mb   120   36     594307 mb      8.82%
    2015-09-09    2338688 mb  377   36564862 mb 4408  426949173 mb    -521711 mb   102   36    1816976 mb      9.11%
    2015-09-10    1830728 mb  482   36776445 mb 4303  423650873 mb    -369845 mb    80   36    1460882 mb      9.11%
    2015-09-11   10323736 mb  478   33010286 mb 4416  435953105 mb   -1016271 mb   159   34    9307465 mb      9.94%
    2015-09-12    8773933 mb  473   32431241 mb 4399  442013401 mb    -167120 mb    64   35    8606813 mb      9.32%
    2015-09-13    8834627 mb  485   31265504 mb 4378  434459112 mb    -186507 mb    60   35    8648119 mb      9.23%
    2015-09-14    8605313 mb  479   31150950 mb 4391  434117515 mb     -32753 mb    41   35    8572559 mb      9.16%
    2015-09-15   10727441 mb  478   32164212 mb 4393  435520200 mb     -58643 mb    53   36   10668797 mb      9.85%
    2015-09-16   10133770 mb  477   31557436 mb 4396  432462001 mb     -55780 mb    43   36   10077989 mb      9.64%
    2015-09-17    9941271 mb  477   30824614 mb 4419  434292081 mb     -68284 mb    53   35    9872986 mb      9.39%
    2015-09-18   10147447 mb  416   24608011 mb 3237  319673822 mb    -577890 mb   124   35    9569557 mb     10.87%
    ================================================================================================================
    14 DAY AVG   5988492 mb  431   33373763 mb 4312  422296020 mb    -543060 mb   101   35    5445432 mb      9.32%
    30 DAY AVG   3622366 mb  403   36648167 mb 4353  427001356 mb   -1326697 mb   150   34    2295669 mb      9.43%
    60 DAY AVG   3047161 mb  392   34199043 mb 4323  417800256 mb   -1489983 mb   159   34    1557178 mb      8.91%
    

    解决方案

    確認檢查點保留已設定為預設值。
    avmaint config --ava | grep -i "cpmostrecent\|cphfschecked"
    cpmostrecent="2"
    cphfschecked="1"

    停用異動性,以便在故障診斷程式期間不會繼續增加作業系統容量。

    avmaint config --ava asynccrunching=false
    admin@avamar:~/>: avmaint config --ava asynccrunching=false
    <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <gsanconfig asynccrunching="true"/>
    admin@avamar:~/>:

    檢查作業系統容量的目前狀態:

    avmaint nodelist | grep fs-percent-full | sort | tail -3
    
    admin@avamar:~/>: avmaint nodelist | grep fs-percent-full | sort | tail -3
            fs-percent-full="90.9"
            fs-percent-full="91.0"
            fs-percent-full="91.2"
    admin@avamar:~/>:
    此命令的輸出會決定下一步的動作:

    案例 #1 作業系統容量超過 89%,但低於 96%。

    檢查仍然完成。當 Avamar 進入下一個維護週期時,作業系統容量會降低。

    案例 #2 作業系統容量超過 96%,但低於 98%。

    確認檢查點保留已設為情況 1 中所述的正確值。如果檢查點有正確的保留設定,請以支援開啟案例。

    案例 #3 作業系統容量超過 98%。

    以支援開啟案例。 

    其他信息

    如需 Avamar 作業系統容量問題的進一步資訊,請參閱:Avamar:容量管理概念和訓練

    Avamar 維護活動需要一定數量的可用作業系統空間,才能如下圖所示執行。

    如果作業系統容量為預設設定
    • >89% == > 垃圾收集將無法開始
    • >執行 96% == > 檢查點
     
    100%   "---------------------" <-- 100% Data partition capacity
           " CP cannot run >96%  "
           "                     "   
           " GC cannot run >89%  "
    89%    "---------------------"  
           " Reserved for        "
           " checkpoint          "
           " overhead            "
           "                     "
    65%    "---------------------" <-- 100% User Capacity
           " Commonality         "     Can be monitored
           " factored data       "     from the Admin
           " & RAIN parity       "     GUI.
           " data                "    
           "                     "
           "                     "
           "                     "
           "                     "
           "                     "
           "                     "
           "                     "
    0%     "---------------------"
    

     

    受影响的产品

    Avamar

    产品

    Avamar, Avamar Server
    文章属性
    文章编号: 000040861
    文章类型: Solution
    上次修改时间: 15 5月 2025
    版本:  28
    从其他戴尔用户那里查找问题的答案
    支持服务
    检查您的设备是否在支持服务涵盖的范围内。