Avamar:如何将 Avamar Server 设置为已知受控状态
摘要: 本文介绍如何将 Avamar Server 设置为已知受控状态。
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
Avamar Server 上有许多自动化任务,它们可能会影响故障处理和解决工作。
此过程记录了如何将 Avamar 置于所谓的“已知受控状态”,以防止发生意外或不良活动。
执行手动和高级维护任务时,应遵循以下核对表。例如:
这不是运行状况检查解决方案。它假定 Avamar Server 运行状况不佳。
此过程记录了如何将 Avamar 置于所谓的“已知受控状态”,以防止发生意外或不良活动。
执行手动和高级维护任务时,应遵循以下核对表。例如:
- 重建条带
- 重建节点
- 重新启动离线节点
这不是运行状况检查解决方案。它假定 Avamar Server 运行状况不佳。
原因
必须在 Avamar Server 上运行手动或高级维护任务。
解决方案
注意:如果使用不正确,下面引用的一些命令可能会导致数据完整性问题或数据丢失。如果您不理解某个命令或运行该命令的后果,请向 戴尔支持 或您当地的戴尔合作伙伴代表寻求帮助。
先决条件:
先决条件:
- 所有命令都应以管理员身份运行,并按照文章 Avamar 的说明加载 SSH 密钥:如何登录到 Avamar Server 并加载各种密钥。
- 某些命令可能不会提供反馈或立即生效;一个命令不需要多次运行。
- 对于任何
avmaint config --ava命令,始终确认更改已生效。运行命令:
avmaint config --ava | grep <setting>
- 应避免手动维护。允许维护计划程序尽可能管理维护任务。
- 在处理任何系统之前,应使用这些命令来了解 Avamar Server 的常规状态,从而回答以下问题:
- 上一个经过验证的检查点是多久?
cplist
- 所有的条纹都在线吗?所有节点是否都联机?
status.dpn
- 所有服务都正常运行了吗?
dpnctl status
- 检查正在运行的维护,并在需要时取消维护:
- 使用维护计划程序暂停维护活动,以确保它们在停止后不会再次启动。
avmaint sched suspend cp --ava avmaint sched suspend hfscheck --ava
请勿暂停 垃圾数据收集 (GC),因为这可能会导致不必要的回滚。
- 运行以下命令并检查是否正在运行维护活动。
status.dpn
- 如果检查点正在运行,请让它完成。
- 如果 HFScheck 正在运行,并且服务器未处于管理员模式(waitcgsan 阶段),或者 HFScheck 几乎已完成,则可以将其停止:
avmaint hfscheckstop --ava
- 如果 GC 正在运行,则可以将其终止:
avmaint gckill --ava
这可能需要一些时间才能完成,因为当前阶段必须完成。
- 不再运行维护后,应停止维护计划程序:
dpnctl stop maint
- 停止备份计划程序,停止运行备份或还原,并暂停新连接:
- 阻止 MCS 启动任何新备份:
dpnctl stop sched
- 列出所有正在运行的备份:
avmaint sessions --ava | grep sessionid
如果正在运行复制以外的还原,请咨询用户以确定是否应允许完成还原。
- 收到用户的批准后,可以使用 UI 或不干净地使用以下方法完全终止备份(创建部分备份):
avmaint kill -waittime=0 <sessionid>
- 列出上一个命令未列出的任何其他备份:
avmaint sessions --full
- 根据要执行的操作,可能无法运行任何备份类型的操作(即 avmaint getrefby)。因此,请暂停调度程序以不允许任何手动备份:
avmaint suspend
- 停止复制(复制源或目标)。
- 对于复制源(还原),请使用 UI 或 EM 或终止进程以停止复制。
- 对于复制目标(备份),请验证复制是否正在运行:
avmaint sessions | grep path
- 在路径中查找 /REPLICATE 域。使用步骤 4a 中的方法停止源网格上的复制。
- 使用以下命令关闭 crunching:
avmaint config --ava asynccrunching=false
处理可能需要长达 15 分钟才能停止,请检查来自数据节点的 GSAN 日志中是否有任何“crunch”消息。
- 关闭平衡
- 检查平衡是否正在运行:
avmaint config --ava | grep balancemin
通常不应启用平衡(除 0 以外的任何值),但检查仍然很重要。
- 要禁用平衡,请执行以下操作:
avmaint config --ava balancemin=0
停止平衡最多可能需要 15 分钟,请检查 status.dpn 以查看是否有条带正在迁移,以确认平衡已完成。
- 检查容量:
- 检查操作系统容量:
avmaint nodelist --ava | grep fs-perc
- 检查检查点的大小:
mapall copy ~/cps # only if cps does not exist on the data nodes mapall --noerror './cps'
- 检查检查点列表以确定必须保留哪些检查点(所有节点上最后一个经过验证的检查点):
cplist
根据上述结果,确定可以保留多少个检查点、哪些是关键检查点以及可以创建多少个新检查点。
有关容量的信息,请参阅文章 Avamar:容量管理概念和培训
- 了解节点的顺序以及逻辑节点编号与物理节点编号之间的差异:
nodenumbers status.dpn mapall --noerror 'tail -2 /data01/cur/gsan.log'
- 查看硬件
- 现在应停止所有自动任务。
- 服务器应该几乎没有活动,并且继续执行任何手动任务或命令应该是安全的。
通过检查数据节点上的 GSAN 日志来检查服务器。验证记录的活动很少或没有。
也可以使用 mapall 运行 uptime 命令,以检查数据节点上的“平均负载”是否较低(介于 0.01 和 0.05 之间),
例如:
例如:
mapall --noerror 'uptime' (0.0) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.01, 0.02, 0.01 (0.1) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.02, 0.01, 0.01 (0.2) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.02, 0.01, 0.01上述步骤将服务器设置为非生产状态。完成所有手动任务后,请始终恢复更改。
其他信息
受影响的产品
Avamar, Avamar Server文章属性
文章编号: 000170876
文章类型: Solution
上次修改时间: 06 8月 2025
版本: 15
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。