VPLEX. Диагностика и мониторинг проблем с серверной частью с помощью улучшенного управления внутренними путями (BEPM) в GeoSynchrony 6.2
Summary: В этой статье рассматривается функция управления путями внутренней части (BE), которая была добавлена в GeoSynchrony 6.2 и более поздних версий. В нем также рассматривается обработка перегрузки внутренней сети с помощью измененной функциональности управления путями BE. ...
Symptoms
В версии, предшествующей GeoSynchrony 6.2, VPLEX не удается изолировать некоторые пути к внутренним томам хранилища с высокой задержкой из-за перегрузки фабрики или проблем с массивом хранения данных. В версии 6.2 VPLEX автоматически изолирует малопроизводительные пути к томам хранения данных (пути с высокой задержкой) и автоматически восстанавливает их, когда производительность восстанавливается до приемлемых уровней.
В GeoSynchrony 6.2 появились новые колл-дома:
0x8a6b6001 - bepm/1 - Производительность внутреннего ИТ-соединения упала ниже допустимых уровней.
0x8a6b6004 - bepm/4 - Во внутреннем ИТ-связце обнаружены неоднократные периоды низкой производительности.
0x8a6b6007 bepm/7 — Все LUN инициатора-целевого устройства (ITL) на логическом устройстве на этом директоре показывают низкую производительность, поэтому логическая единица помечается как испорченная.
Внутренние пути состоят из инициатора (BE-порт VPLEX) и целевого устройства (порт в массиве) и называются ИТ-связями.
Новые команды интерфейса командной строки для проверки того, какие пути BE могут находиться в состоянии ограниченной функциональности.back-end degraded list и back-end degraded recover
Дополнительные сведения об использовании этих команд см. в руководстве по интерфейсу командной строки VPLEX 6.2.
Тем back-end degraded list показывает все I-T, характеристики которых ухудшились в VPLEX из-за высокой задержки.
Ниже показано использование метода help (-h) с командой, чтобы увидеть, как можно использовать команду:
VPlexcli:/>back-end degraded list -h
synopsis: list [<options>]Это
отображает список деградированных I-Ts:
options (* = обязательно):
-h | --help
Отображает способы использования команды.
--verbose
Предоставляет дополнительные выходные данные во время выполнения команды. Это может не затрагивать некоторые команды.
-g | --group-by= <group_by>
Группирует ухудшенные связи I-T по указанному полю. Поддерживаемые поля: дисковый массив, директор
Пример ИТ-компонентов, помеченных как испорченные, отображается с пометкой Degradation Reason из Degraded performance:
VPlexcli:/>список ухудшения производительности
серверной части I-T:
Director Director Port Инициатор Target Array Degradation Причина
-------------- ------------- ------------------ ------------------ --------------------------- --------------------
director-1-1-A A1-FC00 0xc00144878f110800 0x50060160086429bb EMC-CLARiiON-APM00140624008 Снижение производительности
A1-FC00 0xc00144878f110800 0xc00144878f3d0000 EMC-Invista-LABRATS4900007 Снижение производительности
A1-FC00 0xc00144878f110800 0xc00144878f3d0200 EMC-Invista-LABRATS4900007 Снижение производительности
A1-FC01 0xc00144878f110900 0xc00144878f3d0100 EMC-Invista-LABRATS4900007 Снижение производительности
A1-FC01 0xc00144878f110900 0xc00144878f3d0300 EMC-Invista-LABRATS4900007 Снижение производительности
Директор 1-1-Б B1-FC00 0xc00144878f118800 0xc00144878f3d0000 EMC-Invista-LABRATS4900007 Снижение производительности
B1-FC00 0xc00144878f118800 0xc00144878f3d0200 EMC-Invista-LABRATS4900007 снижение производительности
B1-FC01 0xc00144878f118900 0xc00144878f3d0100 EMC-Invista-LABRATS4900007 Снижение производительности
B1-FC01 0xc00144878f118900 0xc00144878f3d0300 EMC-Invista-LABRATS4900007 пониженная производительность
Если во внутреннем ИТ-пути обнаруживается, что три раза в течение 30 минут он переключается между состоянием деградации и отсутствием деградации (колебаниями), то ИТ-связь считается нестабильной, а VPLEX автоматически прекращает использовать ИТ-связь для операций ввода-вывода на основе хоста и сообщает о событии «звонок домой» 0x8a6b6004 или bepm/4 в журналах микропрограммы. В этом состоянии back-end degraded list Списки команд Degradation Reason как Isolated due to unstable performance.
В этом случае работоспособность ИТ-связя будет оставаться неработоспособной до тех пор, пока конечный пользователь не восстановит ее вручную с помощью команды интерфейса командной строки back-end degraded recoverили достигается четырехчасовое пороговое значение по умолчанию, после чего ИТ-связь помечается как Performance degraded в то время как процесс восстановления проверяет его состояние перед отменой деградации (и автоматически повторно включает путь для обслуживания операций ввода-вывода на основе хоста, если тесты производительности пройдены).
Пример нестабильного состояния (периодического снижения производительности) Degradation Reason есть Isolated due to unstable performance:
VPlexcli:/>список ухудшения
работоспособности серверной части Degraded I-T:
Director Director Инициатор Причина
снижения производительности целевого массива-------------- порт ------------------ ------------------ ------------------------------- -----------------------
-------------- ------------ ------------------ ------------------ ------------------------------- -----------------------
director-1-1-A A1-FC00 0xc001448798b90800 0x5000097398037804 EMC-SYMMETRIX-197600222 Изолировано из-за нестабильной производительности
A1-FC00 0xc001448798b90800 0x5000097398037805 EMC-SYMMETRIX-197600222 Изолировано из-за нестабильной производительности
Если нет путей, то back-end degraded list команда сообщает следующее:
VPlexcli:/>список ухудшения
производительности серверной части В настоящее время нет путей с пониженной производительностью.
Другая новая CLI-команда, back-end degraded recover— для серверных путей с ухудшенной производительностью. Ниже показано использование метода help (-h) с параметром back-end degraded recover команда, чтобы увидеть, как можно использовать команду:
VPlexcli:/>back-end degraded recover -h
synopsis: recover [<options>]
Восстанавливает указанные деградированные I-Ts:
options (* = обязательно):
-h | --help
Отображает способы использования команды.
--verbose
Предоставляет дополнительные выходные данные во время выполнения команды. Это может не затрагивать некоторые команды.
-p | --paths= <paths>
Ухудшенные связи I-T, подлежащие восстановлению. Каждая связь I-T должна быть выражена как пара в виде «(<инициатор>,<цель>)».
--все
Восстановление всех испорченных I-T в настоящее время.
Пример одного I-T для восстановления, отображаемый с помощью Degradation Reason из Isolated due to unstable performance:
VPlexcli:/>back-end degraded recover -p (0xc00144878bda0900,0x5006016547e01af9)
Восстановленные I-T:
Порт директора-директора Инициатор порта целевого массива Причина
-------------- ------------- ------------------ ------------------ --------------------------- ------------------
director-1-1-A A1-FC01 0xc00144878bda0900 0x5006016547e01af9 EMC-CLARiiON-APM00164919257 Изолирован из-за нестабильной производительности
Пример всех испорченных I-T, подлежащих восстановлению:
VPlexcli:/>Восстановление ухудшения производительности серверной части --all
восстановлено I-T:
директор Порт инициатора Снижение производительности целевого массива Причина
-------------- ------------- ------------------ ------------------ --------------------------- ------------------
director-1-1-A A1-FC00 0xc00144878bda0800 0x5000144260321e00 EMC-Invista-rc-surry-1 Изолирован из-за нестабильной производительности
Директор 1-1-B B1-FC01 0xc00144878bda8900 0x5006016547e01af9 EMC-CLARiiON-APM00164919257 Изолирован из-за нестабильной производительности
Если проблема с периодической задержкой для затронутого ИТ-связя сохраняется и пользователь не может быстро устранить основную причину, рекомендуется обратиться в службу поддержки клиентов VPLEX через чат, чтобы вручную пометить ИТ-связь как испорченный, чтобы исключить путь из использования до тех пор, пока не будет устранена основная проблема.
Cause
Проблемы вне VPLEX, такие как перегрузка сетевой топологии или проблемы с дисковым массивом, могут вызывать внутренние проблемы VPLEX. Хотя для более эффективной обработки внутренней перегрузки такого рода предназначено программное обеспечение GeoSynchrony 6.2, перегрузку рекомендуется устранить как можно скорее.
Чтобы обнаружить источник перегрузки, Dell предлагает функцию мониторинга портов FC, которая отслеживает ошибки в фабрике любого порта BE FC. Результаты могут помочь сузить число проблем с сетью в топологии. Начиная с GeoSynchrony 6.2, монитор портов FC включен по умолчанию.
Если вы все еще используете какую-либо версию GeoSynchrony 6.0.x или 6.1.x и еще не готовы к обновлению до 6.2.x, но хотите, чтобы сценарий мониторинга портов FC был загружен в ваш VPLEX, обратитесь в службу поддержки Dell для загрузки сценария.
Resolution
Программное обеспечение GeoSynchrony 6.2 предназначено для более эффективной обработки перегрузки сети такого типа. Когда активируется функция BEPM кода VPLEX, это указывает на проблемы, внешние для VPLEX. Необходимо немедленно устранить причины перегрузки сети или проблем с массивом хранения данных. Данные, предоставленные журналами VPLEX, можно использовать для сужения области поиска проблем. После устранения проблемы VPLEX автоматически восстановит I-T, которые теперь будут работоспособны.