Авамар: Як перевести сервер Avamar у відомий контрольований стан

Summary: У цій статті пояснюється, як перевести сервер Avamar у відомий контрольований стан.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

На сервері Avamar є багато автоматизованих завдань, які можуть вплинути на зусилля з усунення несправностей і їх усунення.

Ця процедура документує, як перевести Avamar у так званий «відомий контрольований стан», щоб запобігти виникненню несподіваної або небажаної активності.

Наведеного нижче контрольного списку слід дотримуватися під час виконання ручних і розширених завдань з технічного обслуговування. Наприклад:
  • Відбудова смуг
  • Перебудова вузлів
  • Перезапуск автономних вузлів
Це чек-лист, який не є керівництвом щодо того, як виконувати операції чи інтерпретувати результати.

Це НЕ рішення для перевірки здоров'я. Він передбачає, що сервер Avamar працює нездорово.

Cause

Ручні або розширені завдання з обслуговування повинні виконуватися на сервері Avamar.

Resolution

Обережність: У разі неправильного використання деякі з наведених нижче команд можуть спричинити проблеми з цілісністю даних або втрату даних. Якщо ви не розумієте команду або наслідки її виконання, зверніться за допомогою до служби підтримки Dell або місцевого представника партнера Dell.

Передумови:
  • Всі команди повинні виконуватися від імені адміністратора з ключами SSH, завантаженими для кожної статті Avamar: Як увійти на сервер Avamar і завантажити різні ключі.
  • Деякі команди можуть не давати зворотного зв'язку або не набувати негайного ефекту; Не обов'язково запускати команду більше одного разу.
  • Для будь-якого avmaint config --ava команди, завжди підтверджуйте, що зміни набули чинності. Виконати команду:
avmaint config --ava | grep <setting>
  • Слід уникати ручного обслуговування. Дозвольте планувальнику технічного обслуговування керувати завданнями технічного обслуговування, коли це можливо.
Процедура:
  1. За допомогою цих команд слід відповісти на наступні питання, щоб зрозуміти загальний стан сервера Avamar перед роботою з будь-якою системою:
  • Скільки років останньому валідованому КПП?
cplist
  • Чи всі смуги онлайн? Чи всі вузли онлайн?
status.dpn
  • Чи всі послуги працюють?
dpnctl status
  1. Перевірте наявність поточного технічного обслуговування та скасуйте його, якщо потрібно:
    1. Призупиніть дії з технічного обслуговування за допомогою планувальника технічного обслуговування, щоб переконатися, що вони не почнуться знову після їх зупинки.
avmaint sched suspend cp --ava
avmaint sched suspend hfscheck --ava
Не призупиняйте збір сміття (GC), оскільки це може призвести до непотрібного відкату.
  1. Запустіть наведену нижче команду та перевірте, чи виконуються заходи з технічного обслуговування.
status.dpn
  • Якщо контрольна точка працює, нехай вона завершується.
  • Якщо HFScheck запущено, його можна зупинити, якщо сервер не знаходиться в режимі адміністратора (фаза очікуванняcgsan), або перевірка HFScheck майже завершена:
avmaint hfscheckstop --ava
  • Якщо ГК запущений, його можна вбити:
avmaint gckill --ava
Це може зайняти деякий час, оскільки поточний пропуск має закінчитися.
  1. Як тільки технічне обслуговування більше не виконується, планувальник технічного обслуговування слід зупинити:
dpnctl stop maint
  1. Зупиніть планувальник резервного копіювання, припиніть запуск резервного копіювання або відновлення та призупиніть нові підключення.
    1. Заборонити MCS запускати будь-які нові резервні копії:
dpnctl stop sched
  1. Перерахуйте всі запущені резервні копії:
avmaint sessions --ava | grep sessionid
Якщо виконується відновлення, відмінне від реплікації, проконсультуйтеся з користувачем, щоб визначити, чи слід дозволити йому завершити відновлення.
  1. Після отримання схвалення від користувача про те, що резервні копії можуть бути знищені чисто (створюються часткові резервні копії) за допомогою інтерфейсу користувача або нечисто за допомогою:
avmaint kill -waittime=0 <sessionid>
  1. Перелічіть будь-які додаткові резервні копії, які не вказані попередньою командою:
avmaint sessions --full
  1. Залежно від дії, яку потрібно виконати, виконання будь-яких операцій типу резервного копіювання може бути неприйнятним (тобто avmaint getrefby). Тому призупиніть диспетчерів, щоб не допускати резервних копій вручну:
avmaint suspend
  1. Зупинити реплікацію (джерело або ціль реплікації).
    1. Для джерела реплікації (відновлення) використовуйте інтерфейс користувача або EM або завершіть процес, щоб зупинити реплікацію.
    2. Для об'єкта реплікації (резервної копії) перевірте, чи виконується реплікація: 
avmaint sessions | grep path
  1. Знайдіть домен /REPLICATE у шляху. Зупиніть реплікацію на вихідній сітці, використовуючи методи, описані на кроці 4a.
  1. Вимкніть хрускіт командою:
avmaint config --ava asynccrunching=false
Для припинення хрускоту може знадобитися до 15 хвилин, перевірте журнали GSAN з вузлів даних на наявність повідомлень про «хрускіт».
  1. Як вимкнути балансування
    1. Перевірте, чи працює балансування:
avmaint config --ava | grep balancemin
Зазвичай балансування не повинно бути включено (будь-яке значення, крім 0), але перевірити все одно важливо.
  1. Щоб вимкнути балансування:
avmaint config --ava balancemin=0
Зупинка балансування може зайняти до 15 хвилин, перевірте status.dpn, щоб побачити, чи мігрують якісь смуги, щоб підтвердити, що балансування завершено.
  1. Перевірте місткість:
    1. Перевірте пропускну здатність ОС: 
avmaint nodelist --ava | grep fs-perc
  1. Перевірте розмір контрольно-пропускних пунктів:
mapall copy ~/cps                # only if cps does not exist on the data nodes
mapall --noerror './cps'
  1. Перевірте список контрольних точок, щоб визначити, які контрольні точки ПОВИННІ бути збережені (остання перевірена контрольна точка на всіх вузлах):
cplist
Залежно від наведених вище результатів, визначте, скільки контрольних точок можна зберегти, які з них є критичними та скільки нових контрольних точок можна створити.
Для отримання інформації про місткість дивіться статтю Avamar: Концепції управління потенціалом та навчання
  1. Ознайомтеся з порядком вузлів і відмінностями між номерами логічних вузлів і фізичними номерами вузлів:
nodenumbers
status.dpn
mapall --noerror 'tail -2 /data01/cur/gsan.log'
  1. Перегляньте обладнання
  • Тепер усі автоматизовані завдання мають бути зупинені. 
  • Сервер повинен мати невелику активність, і він повинен бути безпечним для виконання будь-яких ручних завдань або команд. 
Перевірте сервер, перевіривши журнали GSAN на вузлах даних. Переконайтеся, що активність незначна або взагалі не реєструється.
Команду uptime також можна виконати за допомогою mapall, щоб перевірити, чи "середнє навантаження" у вузлах даних є низьким (від 0,01 до 0,05)

Наприклад:
mapall --noerror 'uptime' 

(0.0) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.01, 0.02, 0.01 
(0.1) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01 
(0.2) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01
Наведені вище кроки переводять сервер у неробочий стан. Завжди скасовуйте зміни , коли всі ручні завдання будуть виконані.

Additional Information

 

Affected Products

Avamar, Avamar Server
Article Properties
Article Number: 000170876
Article Type: Solution
Last Modified: 06 Aug 2025
Version:  15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.