Avamar. Как перевести Avamar Server в известное управляемое состояние

Summary: В этой статье объясняется, как привести сервер Avamar в известное контролируемое состояние.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

На сервере Avamar Server существует множество автоматизированных задач, которые могут повлиять на действия по поиску и устранению неполадок.

В этой процедуре описано, как перевести Avamar в так называемое «известное контролируемое состояние» для предотвращения непредвиденных или нежелательных действий.

Приведенный ниже контрольный список следует использовать при выполнении задач технического обслуживания вручную и расширенных задач. Пример.
  • Восстановление полос
  • Перестроение узлов
  • Перезапуск автономных узлов
Это контрольный список, который не является руководством по выполнению операций или интерпретации результатов.

Это НЕ решение для диагностики системы. Предполагается, что Avamar Server неработоспособен.

Cause

На сервере Avamar Server должны выполняться вручную или расширенные задачи обслуживания.

Resolution

Внимание! При неправильном использовании некоторые из приведенных ниже команд могут привести к проблемам с целостностью или потере данных. Если вы не понимаете команду или последствия ее выполнения, обратитесь за помощью в службу поддержки Dell или к местному представителю партнера Dell.

Необходимые условия:
  • Все команды должны выполняться от имени администратора с ключами SSH, загруженными в соответствии со статьей Avamar: Как выполнить вход в Avamar Server и загрузить разные ключи.
  • Некоторые команды могут не давать обратную связь или вступают в силу немедленно; Не должно быть необходимости выполнять команду более одного раза.
  • Для любого avmaint config --ava всегда подтверждайте, что изменение вступило в силу. Выполните команду:
avmaint config --ava | grep <setting>
  • Следует избегать ручного обслуживания. По возможности позвольте планировщику обслуживания управлять задачами обслуживания.
Процедура:
  1. Эти команды необходимо ответить, чтобы понять общее состояние сервера Avamar перед началом работы в любой системе:
  • Сколько лет последней проверенной контрольной точке?
cplist
  • Все ли полоски в сети? Все ли узлы в режиме онлайн?
status.dpn
  • Все службы работают?
dpnctl status
  1. Проверьте наличие запущенных процедур обслуживания и при необходимости отмените их:
    1. Приостановите операции обслуживания с помощью планировщика обслуживания, чтобы они не запускались снова после остановки.
avmaint sched suspend cp --ava
avmaint sched suspend hfscheck --ava
Не приостанавливайте сборку мусора (GC), так как это может привести к ненужному откату.
  1. Выполните следующую команду и проверьте наличие запущенных операций обслуживания.
status.dpn
  • Если контрольная точка выполняется, дождитесь ее завершения.
  • Если HFScheck запущен, его можно остановить, если сервер не находится в режиме администратора (фаза waitcgsan) или проверка HFScheck почти завершена:
avmaint hfscheckstop --ava
  • Если сборка мусора запущена, она может быть уничтожена:
avmaint gckill --ava
Это может занять некоторое время, так как должен завершиться текущий проход.
  1. Как только обслуживание больше не выполняется, планировщик обслуживания должен быть остановлен.
dpnctl stop maint
  1. Остановите работу планировщика резервного копирования, прекратите выполнение резервного копирования или восстановления, а также приостановите новые подключения:
    1. Запретите MCS запускать новые операции резервного копирования:
dpnctl stop sched
  1. Выведите список всех запущенных резервных копий.
avmaint sessions --ava | grep sessionid
Если выполняется восстановление, отличное от репликации, посоветуйтесь с пользователем, нужно ли разрешить завершение восстановления.
  1. После получения разрешения от пользователя резервные копии можно удалить без очистки (создаются частичные резервные копии) с помощью пользовательского интерфейса или нечисто с помощью:
avmaint kill -waittime=0 <sessionid>
  1. Перечислите все дополнительные резервные копии, не перечисленные предыдущей командой:
avmaint sessions --full
  1. В зависимости от выполняемой операции может быть недопустимо выполнение каких-либо операций типа резервного копирования (т. е. avmaint getrefby). Поэтому приостановите работу диспетчеров, чтобы не разрешать ручное резервное копирование:
avmaint suspend
  1. Остановка репликации (исходной или целевой системы репликации).
    1. В качестве источника репликации (восстановления) используйте пользовательский интерфейс или EM либо завершите процесс, чтобы остановить репликацию.
    2. Для целевого ресурса репликации (резервного копирования) проверьте, выполняется ли репликация: 
avmaint sessions | grep path
  1. Найдите домен /REPLICATE в пути. Остановите репликацию в исходной сети с помощью методов, описанных на шаге 4a.
  1. Отключите кранч с помощью команды:
avmaint config --ava asynccrunching=false
Для прекращения обработки может потребоваться до 15 минут. Проверьте журналы GSAN узлов данных на наличие сообщений о «сжатии».
  1. Отключить балансировку
    1. Проверьте, выполняется ли балансировка.
avmaint config --ava | grep balancemin
Обычно балансировка не должна быть включена (любое значение, кроме 0), но проверить все равно важно.
  1. Чтобы отключить балансировку, выполните следующие действия.
avmaint config --ava balancemin=0
Остановка балансировки может занять до 15 минут. Проверьте, не переносятся ли какие-либо полосы, чтобы убедиться в завершении балансировки.
  1. Проверьте емкость:
    1. Проверьте емкость ОС: 
avmaint nodelist --ava | grep fs-perc
  1. Проверьте размер контрольных точек:
mapall copy ~/cps                # only if cps does not exist on the data nodes
mapall --noerror './cps'
  1. Проверьте список контрольных точек, чтобы определить, какие контрольные точки НЕОБХОДИМО сохранить (последняя проверенная контрольная точка на всех узлах):
cplist
В зависимости от приведенных выше результатов определите, сколько контрольных точек можно сохранить, какие из них являются критическими и сколько новых контрольных точек можно создать.
Сведения о емкости см. в статье Avamar. Концепции управления ресурсами и обучение
  1. Ознакомьтесь с порядком узлов и различиями между номерами логических узлов и номерами физических узлов.
nodenumbers
status.dpn
mapall --noerror 'tail -2 /data01/cur/gsan.log'
  1. Проверка оборудования
  • Теперь все автоматизированные задачи должны быть остановлены. 
  • Активность сервера должна быть небольшой, и можно безопасно выполнять любые задачи или команды, выполняемые вручную. 
Проверьте сервер, проверив журналы GSAN на узлах данных. Убедитесь, что в журнал практически не регистрируется активность.
Команду uptime также можно выполнить с помощью mapall, чтобы убедиться, что «средняя нагрузка» на узлах данных низкая (от 0,01 до 0,05)Например

:
mapall --noerror 'uptime' 

(0.0) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.01, 0.02, 0.01 
(0.1) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01 
(0.2) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01
Описанные выше действия переводят сервер в непроизводственное состояние. Всегда отменяйте изменения после выполнения всех задач, выполненных вручную.

Additional Information

 

Affected Products

Avamar, Avamar Server
Article Properties
Article Number: 000170876
Article Type: Solution
Last Modified: 06 Aug 2025
Version:  15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.