Avamar:如何将 Avamar Server 设置为已知受控状态

摘要: 本文介绍如何将 Avamar Server 设置为已知受控状态。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

Avamar Server 上有许多自动化任务,它们可能会影响故障处理和解决工作。

此过程记录了如何将 Avamar 置于所谓的“已知受控状态”,以防止发生意外或不良活动。

执行手动和高级维护任务时,应遵循以下核对表。例如:
  • 重建条带
  • 重建节点
  • 重新启动离线节点
这是一个核对表,而不是有关如何执行操作或解释结果的指南。

这不是运行状况检查解决方案。它假定 Avamar Server 运行状况不佳。

原因

必须在 Avamar Server 上运行手动或高级维护任务。

解决方案

注意:如果使用不正确,下面引用的一些命令可能会导致数据完整性问题或数据丢失。如果您不理解某个命令或运行该命令的后果,请向 戴尔支持 或您当地的戴尔合作伙伴代表寻求帮助。

先决条件:
avmaint config --ava | grep <setting>
  • 应避免手动维护。允许维护计划程序尽可能管理维护任务。
过程:
  1. 在处理任何系统之前,应使用这些命令来了解 Avamar Server 的常规状态,从而回答以下问题:
  • 上一个经过验证的检查点是多久?
cplist
  • 所有的条纹都在线吗?所有节点是否都联机?
status.dpn
  • 所有服务都正常运行了吗?
dpnctl status
  1. 检查正在运行的维护,并在需要时取消维护:
    1. 使用维护计划程序暂停维护活动,以确保它们在停止后不会再次启动。
avmaint sched suspend cp --ava
avmaint sched suspend hfscheck --ava
请勿暂停 垃圾数据收集 (GC),因为这可能会导致不必要的回滚。
  1. 运行以下命令并检查是否正在运行维护活动。
status.dpn
  • 如果检查点正在运行,请让它完成。
  • 如果 HFScheck 正在运行,并且服务器未处于管理员模式(waitcgsan 阶段),或者 HFScheck 几乎已完成,则可以将其停止:
avmaint hfscheckstop --ava
  • 如果 GC 正在运行,则可以将其终止:
avmaint gckill --ava
这可能需要一些时间才能完成,因为当前阶段必须完成。
  1. 不再运行维护后,应停止维护计划程序:
dpnctl stop maint
  1. 停止备份计划程序,停止运行备份或还原,并暂停新连接:
    1. 阻止 MCS 启动任何新备份:
dpnctl stop sched
  1. 列出所有正在运行的备份:
avmaint sessions --ava | grep sessionid
如果正在运行复制以外的还原,请咨询用户以确定是否应允许完成还原。
  1. 收到用户的批准后,可以使用 UI 或不干净地使用以下方法完全终止备份(创建部分备份):
avmaint kill -waittime=0 <sessionid>
  1. 列出上一个命令未列出的任何其他备份:
avmaint sessions --full
  1. 根据要执行的操作,可能无法运行任何备份类型的操作(即 avmaint getrefby)。因此,请暂停调度程序以不允许任何手动备份:
avmaint suspend
  1. 停止复制(复制源或目标)。
    1. 对于复制源(还原),请使用 UI 或 EM 或终止进程以停止复制。
    2. 对于复制目标(备份),请验证复制是否正在运行: 
avmaint sessions | grep path
  1. 在路径中查找 /REPLICATE 域。使用步骤 4a 中的方法停止源网格上的复制。
  1. 使用以下命令关闭 crunching:
avmaint config --ava asynccrunching=false
处理可能需要长达 15 分钟才能停止,请检查来自数据节点的 GSAN 日志中是否有任何“crunch”消息。
  1. 关闭平衡
    1. 检查平衡是否正在运行:
avmaint config --ava | grep balancemin
通常不应启用平衡(除 0 以外的任何值),但检查仍然很重要。
  1. 要禁用平衡,请执行以下操作:
avmaint config --ava balancemin=0
停止平衡最多可能需要 15 分钟,请检查 status.dpn 以查看是否有条带正在迁移,以确认平衡已完成。
  1. 检查容量:
    1. 检查操作系统容量: 
avmaint nodelist --ava | grep fs-perc
  1. 检查检查点的大小:
mapall copy ~/cps                # only if cps does not exist on the data nodes
mapall --noerror './cps'
  1. 检查检查点列表以确定必须保留哪些检查点(所有节点上最后一个经过验证的检查点):
cplist
根据上述结果,确定可以保留多少个检查点、哪些是关键检查点以及可以创建多少个新检查点。
有关容量的信息,请参阅文章 Avamar:容量管理概念和培训
  1. 了解节点的顺序以及逻辑节点编号与物理节点编号之间的差异:
nodenumbers
status.dpn
mapall --noerror 'tail -2 /data01/cur/gsan.log'
  1. 查看硬件
  • 现在应停止所有自动任务。 
  • 服务器应该几乎没有活动,并且继续执行任何手动任务或命令应该是安全的。 
通过检查数据节点上的 GSAN 日志来检查服务器。验证记录的活动很少或没有。
也可以使用 mapall 运行 uptime 命令,以检查数据节点上的“平均负载”是否较低(介于 0.01 和 0.05 之间),

例如:
mapall --noerror 'uptime' 

(0.0) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.01, 0.02, 0.01 
(0.1) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01 
(0.2) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01
上述步骤将服务器设置为非生产状态。完成所有手动任务后,请始终恢复更改

其他信息

 

受影响的产品

Avamar, Avamar Server
文章属性
文章编号: 000170876
文章类型: Solution
上次修改时间: 06 8月 2025
版本:  15
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。