Сообщения FPIN (уведомления о влиянии на производительность Fabric). Что они собой представляют и что означают
Summary: Сообщения FPIN (уведомления о влиянии на производительность Fabric). Что они собой представляют и что означают.
Instructions
Сообщения Fabric Performance Impact Ification (FPIN) предназначены для заблаговременного оповещения устройств в сети фабрики о конкретных условиях, которые могут повлиять на производительность.
Уведомления фабрики служат системой раннего предупреждения для устранения любых негативных последствий для производительности фабрики. Они были разработаны для оптимизации поведения операций ввода-вывода и предотвращения нарушения путей путем уведомления устройств о текущем состоянии фабрики.
К ним относятся уведомления о целостности каналов, уведомления о доставке и проблемы с перегрузкой.
Уведомления фабрики — это механизм, который предоставляет конечным устройствам дополнительные сведения о событиях в фабрике и предназначен для помощи (пользователю) в решении проблем с потоками данных, возникающих в современных сетях SAN Fibre Channel.
Уведомления, по сути, сообщают конечному устройству: "You are sending too much into the fabric" or "Beware, there is a problem ahead—slow down or switch paths."
Конечное устройство получает сведения о проблеме и может инициировать корректирующие действия, роактивно уведомляя передающие или принимающие устройства о перегрузке до тех пор, пока не развернется событие на всей фабрике.
Поток данных FC и его влияние:
- На поток данных FC могут повлиять три проблемы в
- Целостность канала. Сомнительные/неисправные компоненты (SFP, кабели, коммутационные панели) на пути SAN могут оказывать серьезное воздействие и зачастую приводят к ухудшению работы приложений, сбоям и перебоям в работе.
-
- Неправильные параметры многопутевого ввода-вывода (MPIO). В большинстве настроек MPIO по умолчанию используется «циклический перебор». При возникновении проблемы целостности канала или перегрузки MPIO, настроенный на циклический перебор, будет продолжать использовать поврежденный (имеющий нарушения, но рабочий) путь для отправки данных в Fabric, что часто приводит к перегрузке или ухудшению состояния.
- Перегрузка. Возникает, когда частота кадров, поступающих в Fabric, превышает частоту кадров, выходящих из Fabric. Это часто рассматривается как замедление.
-
-
- Превышение лимита, что возникает, когда поступает больше кадров, чем может быть обработано (несоответствие пропускной способности).
- Сегодня это представляет более серьезную проблему, поскольку массивы хранения данных с повышенной скоростью 32 Гбит/с смешиваются с устаревшими системами Fabric на 4 Гбит/с, 8 Гбит/с и 16 Гбит/с.
- Зависание разрешения на передачу данных возникает, когда устройство перестает возвращать такие разрешения, что приводит к остановке канала.
- Устройство с зависанием разрешения на передачу данных рассматривается как «замедление».
- Потери разрешений на передачу данных, которые возникают, когда физические ошибки повреждают кадры или ответ с разрешением на передачу данных и уменьшают емкость канала.
- Превышение лимита, что возникает, когда поступает больше кадров, чем может быть обработано (несоответствие пропускной способности).
-
Элементы и требования:
Два типа уведомлений Fabric
-
- Программные сообщения ELS (Extended Link Services) с уведомлениями о влиянии на производительность Fabric (FPIN)
- Аппаратные примитивы сигнала перегрузки (CSP)
Для получения уведомлений Fabric в системе необходимо внедрить три критически важных службы Fabric / Core Extended Link Services (ELS), работающих на контроллерах Fabric (коммутаторе)
-
- Возможности диагностики Exchange (EDC)
- Функции диагностики регистрации (RDF)
- Уведомления о влиянии на производительность Fabric (FPIN)
- Как устройства регистрируются на получение уведомлений:
- Устройство должно поддерживать стандарты уведомлений T11.
- Широкий спектр поддержки от поставщиков программного обеспечения для хранилищ, коммутаторов, HBA-адаптеров, ОС и многопутевого управления.
- В следующем техническом документе об уведомлениях Fabric подробно рассматриваются устройства поддержки, микропрограммы и ОС/
- Конечные устройства, заинтересованные в получении сигналов и FPIN, регистрируются в контроллере Fabric (обычно коммутаторе) после входа в систему (FLOGI).
- Устройство должно поддерживать стандарты уведомлений T11.
- Для успешного получения уведомлений устройство должно:
- Быть зарегистрировано для получения определенного типа уведомлений;
- Перейти в состояние уведомления;
- Быть одноранговым устройством в зоне, где существует это состояние.
Конечные устройства, заинтересованные в получении сигналов и FPIN, регистрируются с помощью EDC (возможность диагностики Exchange) и RDF (функции диагностики регистрации) соответственно в контроллере Fabric после входа в систему (FLOGI).
Для получения уведомлений устройство должно быть зарегистрировано, чтобы получать конкретное уведомление, перейти в состояние уведомления и быть одноранговым устройством в зоне, где это состояние существует.
Существует 4 типа событий, для которых могут создаваться FPIN (программные):
- Целостность канала. Драйверы MPIO получают уведомления о целостности канала и управляют выбором пути. Когда MPIO подключен к поврежденному пути, затронутые хосты MPIO получают уведомления, чтобы они выполнить действия.
Информация включает причину (сбой канала, потеря сигнала, недопустимый CRC и т. д.) и пороговое значение, которое было нарушено.
- Перегрузка. В случае обнаружения состояния перегрузки на порту F Fabric, соответствующее уведомление будет отправлено подключенному конечному устройству.
Уведомления о перегрузке FPIN — это ценная информация для конечных устройств, которые могут оптимизировать планирование ввода-вывода. Например, замедление скорости передачи данных или выполнение операций ввода-вывода с последовательным чтением.
Как правило, уведомления о перегрузке указывают, почему может возникать длительное время завершения обмена.
- Перегрузка однорангового узла. Уведомления о перегрузке одноранговых узлов отправляются всем зарегистрированным в зоне одноранговым узлам конечных устройств, которые испытывают перегрузку.
Существуют различные средства, которые одноранговые узлы могут использовать для устранения перегрузки такого типа.
Например, если порт однорангового узла мог выполнить автосогласование быстрее, чем порт назначения, одноранговый узел может ограничить скорость передачи данных, чтобы она соответствовала скорости узла назначения.
- Прерывание доставки. Когда Fabric отклоняет пакет, система Fabric Notifications уведомляет инициатора об ошибке, отправив уведомление о доставке FPIN.
Независимо от того, отклонена ли команда со стороны ISL или подключения к конечному устройству, инициатор получает уведомление.
Информация включает код причины (Timeout, No route и т. д.) и заголовок отклоненного пакета, используемый для вывода потоков, затронутых отклонением.
Типы уведомлений Fabric — CSP (аппаратные)
- Аппаратные примитивы сигнала перегрузки (CSP)
- Обычно отправляются с уровня FC-1 обнаруживающего порта (обычно с помощью микропрограммы низкого уровня) на зарегистрированные устройства.
- Состоит из оптических кодов (не кадров), которые передаются по каналу между напрямую подключенными устройствами Fibre Channel. Не подвержены проблемам с задержкой Fabric.
- Быстрое обнаружение (в режиме реального времени) внезапных перегрузок и мгновенное реагирование в порядке направления сигнала в физически подключенный порт.
- Не поддерживается с Powermax.
- Сигнал перегрузки.
Как правило, это происходит с уровня FC-1 обнаруживающего порта (обычно с помощью микропрограммы низкого уровня) на зарегистрированные устройства.
Сигналы требуются в дополнение к FPIN, поскольку примитивы могут передаваться на перегруженный порт, даже в отсутствие разрешений на передачу данных (кадр FPIN должен ждать, когда нет разрешений на передачу данных).
Таким образом, в отличие от FPIN, сигналы можно рассматривать как индикаторы перегрузки в режиме реального времени с лучшей гарантией доставки.
Требования к Fabric.
- Brocade
- Поддерживается коммутатор Connectrix DS-66xx, коммутатор MP-7810/7850B и оборудование директор ED-DCX6B или более поздней версии.
- Brocade поддерживает уведомления Fabric с ОС Fabric OS 9.0 или более поздней версии.
- Интеграция PowerMax поддерживается, начиная с Fabric OS 9.2.0a или более поздней версии.
- В операционной системе Fabric OS 9.2.0a установлены более точные пороги для уведомлений Fabric.
- Требуется лицензия Fabric Vision для FPIN-LI.
- Политика MAPS (консервативная, умеренная или агрессивная) должна быть включена.
- Cisco MDS
- Cisco поддерживает уведомления Fabric с ОС Fabric OS 9.3.1 или более поздней версии.
- Проведено тестирование интеграции PowerMax с версией 9.3(2a)
- Поддерживаются любые коммутаторы или директоры, способные работать с этими версиями.
- Уведомления Fabric не включены по умолчанию и требуются действия для их включения
- Cisco поддерживает уведомления Fabric с ОС Fabric OS 9.3.1 или более поздней версии.
- Для MPIO и PowerPath требуются ОС и HBA-адаптеры, которые поддерживают уведомления Fabric.
- Все компоненты не обязаны поддерживать уведомления Fabric.
- Например, старые HBA-адаптеры 4G и 8G, где устаревание оптических модулей и перегрузка являются значительными проблемами.
Для поиска и устранения неисправностей порта FC по умолчанию всегда следуйте инструкциям в статье самопомощи:
Connectrix. Как устранить неполадки, связанные с подключением узла Fibre Channel к порту коммутатора или SFP, путем исключения, самостоятельное устранение неисправностей.
Additional Information
Администраторы массивов SAN и фабрик могут устранить эти неполадки, надлежащим образом очистив оптические разъемы на кабелях. Дополнительные сведения см. в разделе Все продукты: Загрязнения, например пыль на торцевой поверхности оптоволоконного разъема, приводят к снижению производительности ввода-вывода