Avamar:如何将 Avamar Server 设置为已知受控状态
Summary: 本文介绍如何将 Avamar Server 设置为已知受控状态。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Avamar Server 上有许多自动化任务,它们可能会影响故障处理和解决工作。
此过程记录了如何将 Avamar 置于所谓的“已知受控状态”,以防止发生意外或不良活动。
执行手动和高级维护任务时,应遵循以下核对表。例如:
这不是运行状况检查解决方案。它假定 Avamar Server 运行状况不佳。
此过程记录了如何将 Avamar 置于所谓的“已知受控状态”,以防止发生意外或不良活动。
执行手动和高级维护任务时,应遵循以下核对表。例如:
- 重建条带
- 重建节点
- 重新启动离线节点
这不是运行状况检查解决方案。它假定 Avamar Server 运行状况不佳。
Cause
必须在 Avamar Server 上运行手动或高级维护任务。
Resolution
注意:如果使用不正确,下面引用的一些命令可能会导致数据完整性问题或数据丢失。如果您不理解某个命令或运行该命令的后果,请向 戴尔支持 或您当地的戴尔合作伙伴代表寻求帮助。
先决条件:
先决条件:
- 所有命令都应以管理员身份运行,并按照文章 Avamar 的说明加载 SSH 密钥:如何登录到 Avamar Server 并加载各种密钥。
- 某些命令可能不会提供反馈或立即生效;一个命令不需要多次运行。
- 对于任何
avmaint config --ava命令,始终确认更改已生效。运行命令:
avmaint config --ava | grep <setting>
- 应避免手动维护。允许维护计划程序尽可能管理维护任务。
- 在处理任何系统之前,应使用这些命令来了解 Avamar Server 的常规状态,从而回答以下问题:
- 上一个经过验证的检查点是多久?
cplist
- 所有的条纹都在线吗?所有节点是否都联机?
status.dpn
- 所有服务都正常运行了吗?
dpnctl status
- 检查正在运行的维护,并在需要时取消维护:
- 使用维护计划程序暂停维护活动,以确保它们在停止后不会再次启动。
avmaint sched suspend cp --ava avmaint sched suspend hfscheck --ava
请勿暂停 垃圾数据收集 (GC),因为这可能会导致不必要的回滚。
- 运行以下命令并检查是否正在运行维护活动。
status.dpn
- 如果检查点正在运行,请让它完成。
- 如果 HFScheck 正在运行,并且服务器未处于管理员模式(waitcgsan 阶段),或者 HFScheck 几乎已完成,则可以将其停止:
avmaint hfscheckstop --ava
- 如果 GC 正在运行,则可以将其终止:
avmaint gckill --ava
这可能需要一些时间才能完成,因为当前阶段必须完成。
- 不再运行维护后,应停止维护计划程序:
dpnctl stop maint
- 停止备份计划程序,停止运行备份或还原,并暂停新连接:
- 阻止 MCS 启动任何新备份:
dpnctl stop sched
- 列出所有正在运行的备份:
avmaint sessions --ava | grep sessionid
如果正在运行复制以外的还原,请咨询用户以确定是否应允许完成还原。
- 收到用户的批准后,可以使用 UI 或不干净地使用以下方法完全终止备份(创建部分备份):
avmaint kill -waittime=0 <sessionid>
- 列出上一个命令未列出的任何其他备份:
avmaint sessions --full
- 根据要执行的操作,可能无法运行任何备份类型的操作(即 avmaint getrefby)。因此,请暂停调度程序以不允许任何手动备份:
avmaint suspend
- 停止复制(复制源或目标)。
- 对于复制源(还原),请使用 UI 或 EM 或终止进程以停止复制。
- 对于复制目标(备份),请验证复制是否正在运行:
avmaint sessions | grep path
- 在路径中查找 /REPLICATE 域。使用步骤 4a 中的方法停止源网格上的复制。
- 使用以下命令关闭 crunching:
avmaint config --ava asynccrunching=false
处理可能需要长达 15 分钟才能停止,请检查来自数据节点的 GSAN 日志中是否有任何“crunch”消息。
- 关闭平衡
- 检查平衡是否正在运行:
avmaint config --ava | grep balancemin
通常不应启用平衡(除 0 以外的任何值),但检查仍然很重要。
- 要禁用平衡,请执行以下操作:
avmaint config --ava balancemin=0
停止平衡最多可能需要 15 分钟,请检查 status.dpn 以查看是否有条带正在迁移,以确认平衡已完成。
- 检查容量:
- 检查操作系统容量:
avmaint nodelist --ava | grep fs-perc
- 检查检查点的大小:
mapall copy ~/cps # only if cps does not exist on the data nodes mapall --noerror './cps'
- 检查检查点列表以确定必须保留哪些检查点(所有节点上最后一个经过验证的检查点):
cplist
根据上述结果,确定可以保留多少个检查点、哪些是关键检查点以及可以创建多少个新检查点。
有关容量的信息,请参阅文章 Avamar:容量管理概念和培训
- 了解节点的顺序以及逻辑节点编号与物理节点编号之间的差异:
nodenumbers status.dpn mapall --noerror 'tail -2 /data01/cur/gsan.log'
- 查看硬件
- 现在应停止所有自动任务。
- 服务器应该几乎没有活动,并且继续执行任何手动任务或命令应该是安全的。
通过检查数据节点上的 GSAN 日志来检查服务器。验证记录的活动很少或没有。
也可以使用 mapall 运行 uptime 命令,以检查数据节点上的“平均负载”是否较低(介于 0.01 和 0.05 之间),
例如:
例如:
mapall --noerror 'uptime' (0.0) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.01, 0.02, 0.01 (0.1) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.02, 0.01, 0.01 (0.2) ssh -x admin@10.xx.xx.xxx 'uptime' 16:39:29 up 100 days, 6:39, 0 users, load average: 0.02, 0.01, 0.01上述步骤将服务器设置为非生产状态。完成所有手动任务后,请始终恢复更改。
Additional Information
Affected Products
Avamar, Avamar ServerArticle Properties
Article Number: 000170876
Article Type: Solution
Last Modified: 06 Aug 2025
Version: 15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.