PowerProtect Data Domain. Предварительная проверка модернизации DDHA
요약: В этой статье базы знаний описаны подробные рекомендации по подготовке к модернизации системы Data Domain High Availability (DDHA). Соблюдение этих инструкций гарантирует успешное обновление. ...
지침
Функция высокой доступности (HA) позволяет настроить две системы защиты в виде пары «активный-резервный», обеспечивая резервирование на случай сбоя системы. Высокая доступность обеспечивает синхронизацию активной и резервной систем. Это делается для того, чтобы в случае сбоя активного узла из-за проблем с оборудованием или программным обеспечением резервный узел мог взять на себя функции этого отказавшего узла.
Высокая доступность поддерживается в следующих системах:
- Data Domain DD6800
- PowerProtect DD6900
- Data Domain DD9300
- PowerProtect DD9400
- PowerProtect DD9410
- Data Domain DD9800
- PowerProtect DD9900
- PowerProtect DD9910
Подготовка систем DDHA к модернизации
Перед началом модернизации убедитесь, что оба узла работают оптимально. Модернизация, когда один из узлов скомпрометирован, может привести к сбою и прерыванию обслуживания. Прежде чем продолжить модернизацию, выполните следующие проверки:
Информация о системе
Проверьте имя хоста системы, серийный номер, модель, текущую версию DDOS и время безотказной работы.
| Активный узел | Резервный узел |
|
# имя хоста # system show serialno # system show model # Отображение версии системы # аптайм |
# имя хоста # system show serialno # system show model # Отображение версии системы # аптайм |
Конфигурация iDRAC
Убедитесь, что контроллер iDRAC настроен, так как это ценный инструмент для мониторинга и устранения неполадок во время перезагрузки.
| Активный узел | Резервный узел |
| # ipmi показать конфигурацию | # ipmi показать конфигурацию |
Это не значит, что iDRAC недоступен на устаревших системах Dell DD6800, DD9300 и DD9800.
Состояние файловой системы
Убедитесь, что файловая система включена и работает.
| Активный узел | Резервный узел |
| # Состояние FilesYs | Эта команда недоступна на этом узле. |
Оповещения и сбои оборудования
Просмотрите все текущие системные оповещения и устраните любые сбои оборудования.
| Активный узел | Резервный узел |
| # оповещения показывают текущий | # оповещения показывают текущий |
Оповещения не всегда совместно используются активным и резервным узлами. Обязательно проверьте оба узла по отдельности на наличие активных оповещений, которые могут указывать на основные проблемы. Большинство оповещений отображаются только на одном узле, поэтому крайне важна проверка двух узлов.
Состояние системы высокой доступности
Прежде чем инициировать обновление, убедитесь в том, что система находится в состоянии высокой доступности.
| Активный узел | Резервный узел |
| # Сведения о статусе высокой доступности | См. выходные данные активного узла |
Емкость системы
Оцените общую емкость системы.
| Активный узел | Резервный узел |
| # df -h | Эта команда недоступна на этом узле. |
Чтобы обеспечить бесперебойный процесс обновления DDOS, рекомендуется поддерживать не менее 10% свободного пространства в системе Data Domain при модернизации до версии DDOS до 7.x и не менее 5% свободного места для обновления до DDOS 7.x и более поздней версии. Это доступное пространство необходимо для обработки временных файлов и любых изменений индекса или метаданных. Это помогает свести к минимуму риск сбоев или снижения производительности во время модернизации.
Версии микропрограммы
Убедитесь, что на всех компонентах системы установлена последняя версия микропрограммы.
| Активный узел | Резервный узел |
| # Системная прошивка Показать все | См. выходные данные активного узла |
Если целевой код более ранний, чем 7.7.5.1, 7.10.1.0 или 7.11.x, проверьте версию микропрограммы диска и ознакомьтесь со статьей базы знаний 000204252 для получения инструкций.
| Активный узел | Резервный узел |
| # Показать оборудование на диске | См. выходные данные активного узла |
Конфигурация сети
Проверьте сетевую конфигурацию системы и убедитесь, что все интерфейсы работают с соответствующими IP-адресами.
| Активный узел | Резервный узел |
| # net показать настройки | # net показать настройки |
В системах DDHA сетевые интерфейсы могут быть настроены как плавающие или фиксированные. Каждый тип имеет определенное поведение и требования к проверке:
- Плавающие интерфейсы: Для интерфейсов, настроенных как плавающие, убедитесь, что каждый порт сетевой платы (NIC), псевдоним или интерфейс виртуального Ethernet (veth) находится в состоянии включения и работы как на активном, так и на резервном узлах. Ожидается, что в плавающих интерфейсах IP-адрес на активном узле отображается, а на резервном — N/A.
- Фиксированные интерфейсы: Для интерфейсов, помеченных как фиксированные, убедитесь, что каждый настроенный порт сетевой платы, псевдоним или veth находится в включенном и работающем состоянии. В отличие от плавающих интерфейсов, фиксированные интерфейсы не обязательно должны иметь идентичные конфигурации на обоих узлах.
- HA Interconnect (veth99): Убедитесь в наличии межсоединения высокой доступности (veth99), а также в том, что все необходимые порты включены и работают.
- Количество необходимых подключений и расположение их слотов для veth99 зависят от модели Data Domain.
Состояние диска
Оцените состояния диска и убедитесь в отсутствии неисправных (F) дисков, восстанавливающихся (R), копий (C) или отсутствующих (A) дисков.
| Активный узел | Резервный узел |
| # состояние отображения диска | # состояние отображения диска |
В конфигурации DDHA резервный узел не обрабатывает и не обслуживает данные. В результате диски полки, подключенные к резервному узлу, не имеют состояния «Используемые диски». Вместо этого все диски отображаются в состоянии «Known Disks», что указывает на то, что система распознает их, но они не активны. Это ожидаемое поведение, так как активный узел обрабатывает все операции с данными.
Состояние шасси
Убедитесь, что все устройства корпуса работают должным образом.
| Активный узел | Резервный узел |
| # Корпус Показать все | # Корпус Показать все |
Топология шасси
Проверьте топологию шасси на обоих узлах.
| Активный узел | Резервный узел |
| # Отображение топологии полки | # Отображение топологии полки |
Примечания.
- Выходные данные должны зеркально отражать изображения.
- Найдите звездочку (*) рядом с enc.ctrl.port и просмотрите поле «Сообщение об ошибке» на предмет таких проблем, как сбои контроллера или кабеля.
- Такие символы, как ?, !, или !! указывают на ошибки.
- Убедитесь, что все номера полок верны и согласованы.
Статус репликации
Убедитесь, что репликация не инициализируется. Если это так, см. статью базы знаний 000014079.
| Активный узел | Резервный узел |
| # Состояние репликации | Эта команда недоступна на этом узле. |
Начиная с версии DDOS 7.7.1, репликация каталогов больше не поддерживается. Если выполняется модернизация с версии, предшествующей 7.7.1, и настроена репликация каталогов, перед обновлением ознакомьтесь с разделом «Directory-to-MTree Replication Migration» руководства по администрированию DDOS.
Оценка работоспособности оборудования
Инициировать комплексную диагностику оборудования в системах Data Domain.
| Активный узел | Резервный узел |
| # поддержка оборудования для проверки работоспособности | # поддержка оборудования для проверки работоспособности |
Эта команда несовместима со всеми платформами DD. Подробнее см. в статье базы знаний 000326481.
Очистка файловой системы
Убедитесь, что выполняется очистка файловой системы. Если этот параметр активен, дождитесь завершения или вручную остановите его, выполнив команду # filesys clean stop на активном узле.
| Активный узел | Резервный узел |
| # Состояние очистки файловой системы | Эта команда недоступна на этом узле. |
Очистка облака
Проверьте, выполняется ли очистка облака. Если этот параметр активен, дождитесь завершения или вручную остановите его, выполнив команду # cloud clean stop на активном узле.
| Активный узел | Резервный узел |
| # Состояние очистки облака | Эта команда недоступна на этом узле. |
Перемещение данных
Для систем с Cloud Tier проверьте, выполняется ли перемещение данных. Если активен, вручную остановите его, выполнив команду # data-movement stop all на активном узле.
| Активный узел | Резервный узел |
| # data-movement status | Эта команда недоступна на этом узле. |
Резервное копирование и восстановление
Если выполняется какое-либо резервное копирование или восстановление, приостановите или остановите его, прежде чем продолжить.
| Активный узел | Резервный узел |
| # Система показывает статистику | # Система показывает статистику |
Тест переключения HA при отказе
Целью тестирования переключения при отказе является проверка высокой доступности путем инициации переключения при отказе с активного узла на резервный. После завершения передачи выполните второе переключение при отказе, чтобы вернуть управление первоначальному узлу, чтобы обеспечить полную функциональность двустороннего переключения при отказе.
Активный узел:
- Выполните команду
ha statusдля подтверждения того, что система находится в состоянии высокой доступности, и оба узла находятся в режиме онлайн. - Выполните
ha failover precheck(доступно в DDOS версии 7.8 и более поздних), чтобы подтвердить готовность к переключению при отказе. - Выполните
ha failoverна активном узле для переключения с активного узла на резервный.
Новый активный узел (предыдущий резервный узел):
- Выполните команду
ha statusдля подтверждения того, что система находится в состоянии высокой доступности, и оба узла находятся в режиме онлайн. - Выполните
ha failover precheck(доступно в DDOS версии 7.8 и более поздних), чтобы убедиться, что система готова к переключению при отказе. - Выполните
ha failoverна новом активном узле для переключения обратно в режим ожидания.
Обновление RPM-пакета
Загрузите RPM-пакет обновления на активный узел. После выполнения команды предварительной проверки модернизации системы пакет автоматически копируется на резервный узел.
RPM-пакеты обновления доступны на странице Системы хранения Data Domain Deduplication .
- Перенесите файл RPM с клиентского сервера на активный узел с помощью следующей команды:
client-server# scp <rpm file> sysadmin@<active-node-hostname-or-IP-address>:/ddr/var/releases/
-
- Система запрашивает пароль, который установил пользователь. Целевой каталог на активном узле — /ddr/var/releases.
- После завершения передачи файла проверьте сведения о системном пакете об активном узле, выполнив команду:
active-node# system package list
Предварительная проверка модернизации системы
На активном узле запустите команду system upgrade precheck <file> . Если предварительная проверка завершится успешно без ошибок, система готова к продолжению модернизации DDOS. Подробные инструкции по модернизации системы DDHA см. в статье базы знаний 000009653.