Dell Unity. Как происходит аварийное переключение LUN в массиве Unity.
Summary: Как происходит аварийное переключение LUN в массиве Dell Unity?
Instructions
Операция аварийного переключения LUN происходит по нескольким причинам. На стороне Unity аварийное переключение LUN происходит при сбое сервисного процессора (SP) для одного из процессоров СХД или хоста, использующего неоптимизированный предназначенный путь. В этом случае принадлежащие LUN аварийно переключаются на другой процессор СХД.
Unity использует асимметричный доступ к логическим модулям (ALUA) для доступа к хосту. Это позволяет использовать несколько путей для операций ввода-вывода, при этом некоторые пути оптимизируются, а другие не оптимизированы. Пути, обозначенные как оптимизированные, подключаются к процессору СХД, которому принадлежит этот конкретный ресурс. Если ввод-вывод отправляется по неоптимизированному пути, одноранговый процессор СХД использует внутреннюю шину CMI (Common Messaging Interface) для перенаправления ввода-вывода процессору СХД, которому принадлежит ресурс. Эта операция прозрачна для хоста и устраняет необходимость аварийного переключения ресурса для завершения ввода-вывода. При этом предполагается, что были соблюдены передовые подходы для подключения хоста: два HBA-адаптера на хост, два коммутируемых порта и два порта SP на каждый процессор СХД. Это настроено для четырех путей — см. второе изображение ниже.
Пример. Ниже приведены различные сценарии аварийного переключения LUN на другой процессор СХД, который изначально не имеет владельца.Сценарий
1.На
рисунке ниже, если процессор SPA выходит из строя, принадлежащие ему LUN аварийно перемещаются из SPA в SPB. После возобновления работы процессора SPA права владения LUN перенаправляются обратно первоначальному владельцу, который аварийно перешел обратно в SPA.
Сценарий 2.
Если по неоптимизированному пути поступает много операций ввода-вывода, Unity аварийно перенаправляет LUN на соседний одноранговый процессор СХД, чтобы оптимизировать путь прохождения данных.
Более поздний сценарий происходит, когда по ошибке хост отправляет свои данные по неверному пути, поэтому Unity автоматически переключения LUN для оптимизации пути прохождения данных.
Таким образом Unity позволяет избежать высокой нагрузки на процессор СХД, у которого нет определенного LUN.
Сценарий 3.
На рисунке ниже, в случае сбоя процессора СХД LUN аварийно переключается на оставшийся процессор СХД и продолжает обслуживать операции ввода-вывода, так как подключен к тем же коммутаторам. В случае сбоя коммутатора оставшийся коммутатор обеспечивает доступ к обоим процессорам СХД, что избавляет от необходимости использовать неоптимизированный путь. Если произошел сбой хоста, кластер инициирует аварийное переключение на другой хост и переводит приложение в режим онлайн. Любой сбой пути из-за неисправного кабеля или порта не вызывает никаких проблем, поскольку можно использовать второй оптимизированный путь.
Эта конфигурация также может выдержать несколько сбоев, если они не относятся к одному и тому же компоненту. Например, можно допустить сбой хоста B, коммутатора A и SPA, поскольку для доступа к LUN можно использовать работающие компоненты. В этом случае хост A может подключиться через коммутатор B и получить доступ к тому LUN, который аварийно переключен на процессор SPB.