VPLEX: Cómo optimizar las opciones de reenvío de I/O para una NDU exitosa de VPLEX Director
Resumen: En este artículo, se explica cómo administrar la fase de reenvío de I/O durante una NDU de VPLEX Director mediante las opciones --io-fwd-ask-for-confirmation y --io-fwd-timeout. Esto permite a los usuarios configurar el tiempo de espera más breve que aún cumpla con los requisitos del usuario. ...
Instrucciones
Hardware de VPLEX afectado:
VPLEX VS6 y VS2: se agregó la funcionalidad de Metro y Local
a las versiones de código de VPLEX GeoSynchrony:
VPLEX GeoSynchrony 6.2.x
¿Qué es I/O Forward y cuál es su función durante la NDU?
- I/O-Forward es un mecanismo en el que las I/O se reenvían de un director a otro director para su procesamiento. Es el director el que lee/escribe en el back-end y devuelve el reconocimiento de la I/O al primer director.
- Durante una NDU, una vez que los primeros actualizadores (directores A) se han actualizado con la nueva versión de software y sus puertos de front-end (FE) están abiertos, es necesario que todos los hosts detecten que los primeros actualizadores están nuevamente en línea e inicien I/O en los primeros actualizadores antes de que los segundos actualizadores (directores B) se desactiven.
- Esta situación precisa, cuando los primeros actualizadores están en la nueva versión del código de VPLEX y los segundos en la versión anterior, da la apariencia de que los primeros actualizadores están gestionando las I/O del host, pero internamente, los primeros actualizadores reenvían las I/O a los segundos actualizadores.
¿Cuál es el comportamiento esperado?
- Durante la NDU, cuando se produce el reenvío de I/O, se espera que todos los iniciadores de host que tienen conectividad con los primeros actualizadores inicien sesión en los puertos FE de los primeros actualizadores, como antes de la NDU. Cuando los segundos actualizadores se desactivan, los primeros actualizadores continúan brindando servicio a las I/O del host sin causar ninguna falta de disponibilidad de datos (DU).
- El estado de reenvío de I/O está presente durante 6 minutos (tradicionalmente) y la expectativa es que todos los hosts inicien sesión en los primeros actualizadores dentro de la ventana de 6 minutos . Dado que esto no sucede dentro del intervalo de tiempo predeterminado durante todos los eventos de NDU, se modificó el diseño de NDU de VPLEX para proporcionar más control, como se describe a continuación.
¿Qué cambios hay en el procedimiento de NDU de VPLEX?
El procedimiento de NDU de VPLEX ahora incluye una opción para extender la fase de reenvío de I/O y algunas opciones para determinar si se le debe solicitar durante la fase de reenvío de I/O antes de continuar con la NDU. Para completar correctamente la NDU, es necesario comunicarse con el usuario con anticipación para determinar su disponibilidad durante la NDU a fin de evaluar el estado de los inicios de sesión del iniciador de host durante la fase de reenvío de I/O. Según la disponibilidad del usuario durante la NDU, determine qué opción usar para la visualización del indicador y cuánto tiempo se debe establecer la configuración de tiempo de espera agotado.
En la siguiente tabla, se describen las opciones de solicitud disponibles.
| Argumento | Descripción | Pronto |
|---|---|---|
--io-fwd-ask-for-confirmation always |
Después de un período de espera inicial de 6 minutos, se comprueba el estado de los inicios de sesión del iniciador de host y se muestran los detalles. Se le solicitarán las opciones aquí. Puede continuar escribiendo Refresh según sea necesario, antes de que se agote el tiempo de espera de la fase de reenvío de I/O.
Elija esta opción si tiene hosts que requieren un análisis manual para que las rutas estén visibles. Se requiere asistencia del cliente para verificar que las rutas del iniciador en los hosts estén activas. Si la ruta no está disponible, resuelva el problema dentro del período de tiempo de espera que especificó. |
Continuar: La NDU continúa incluso cuando faltan inicios de sesión del iniciador. Asegúrese de que el cliente sepa que los inicios de sesión faltantes pueden causar DU.
Reversión: La NDU se revierte y se evita la DU. El usuario puede comprobar el host, resolver el problema que provocó que faltaran los inicios de sesión del iniciador y volver a ejecutar la NDU. Actualizar: Obtenga la nueva lista de iniciadores. Si todos los iniciadores iniciaron sesión, VPLEX muestra los indicadores para avanzar. |
--io-fwd-ask-for-confirmation on-missing-logins |
Se requiere asistencia del usuario para determinar si los iniciadores faltantes provienen de hosts críticos. Si las rutas no están disponibles desde los hosts críticos, el usuario debe resolver el problema antes de continuar con la NDU.
Después de un período de espera inicial de 6 minutos, se comprueban los estados de los inicios de sesión del iniciador de host. Si se detectan todos los inicios de sesión del iniciador, la NDU continúa automáticamente (sin mostrar ningún indicador). Si faltan inicios de sesión del iniciador de host, se muestran y se le solicitan las opciones. Puede continuar escribiendo Refresh según sea necesario, antes de que venza el tiempo de espera de la fase de reenvío de I/O. |
Continuar: La NDU continúa incluso cuando faltan inicios de sesión del iniciador. Asegúrese de que el usuario sepa que los inicios de sesión faltantes pueden causar DU.
Reversión: La NDU se revierte y se evita la DU. El usuario puede comprobar el host, resolver el problema que provocó que faltaran los inicios de sesión del iniciador y volver a ejecutar la NDU. Actualizar: Obtenga la nueva lista de iniciadores. Después de que todos los iniciadores hayan iniciado sesión, la NDU continúa sin mostrar ningún indicador. |
--io-fwd-ask-for-confirmation never |
No se requiere interacción o el usuario no está disponible para comprobar la conectividad del host. La NDU espera a que todos los iniciadores vuelvan a iniciar sesión dentro del período de tiempo de espera agotado especificado. Resuelva cualquier problema dentro de este período. Si VPLEX identifica inicios de sesión faltantes después del período de tiempo de espera agotado, la NDU se revierte.
|
Esta opción no crea ningún símbolo del sistema. Después de un período de espera inicial de 6 minutos, se comprueban los inicios de sesión del iniciador de host. Si se detectan todos los inicios de sesión del iniciador, la NDU continúa automáticamente (sin mostrar ningún indicador). Si faltan inicios de sesión del iniciador, se comprueban nuevamente cada 10 segundos de manera automática hasta que se agote el tiempo de espera de la fase de reenvío de I/O. La NDU se revierte automáticamente (sin mostrar ningún indicador). Si los inicios de sesión faltantes del iniciador no se detectan dentro del período de tiempo de espera, la NDU continúa. |
Control del tiempo de espera agotado de la fase de reenvío de I/O
Durante la NDU, el primer conjunto de directores se inicia en el software GeoSynchrony de destino y, cuando vuelven a estar activos, se espera que los iniciadores de host vuelvan a iniciar sesión en ellos. A medida que los iniciadores vuelven a iniciar sesión, las I/O proporcionadas por el primer conjunto de directores se reenvían al segundo conjunto de directores. Esto se conoce como la fase de reenvío de I/O y la --io-fwd-timeout permite que el usuario controle la duración de esta fase. De manera predeterminada, esta fase dura 180 minutos, pero este período de tiempo de espera se puede modificar a un mínimo de 6 minutos y un máximo de 12 horas mediante el uso del comando --io-fwd-timeout= time , donde time es el período que desea establecer. Para especificar una hora, escriba una de las siguientes letras después de la hora en números:
spor segundosmdurante minutoshdurante horasddurante días
Es posible que algunos clientes tengan hosts con circunstancias especiales que requieran más tiempo para volver a iniciar sesión en el primer conjunto de directores antes de que el segundo conjunto se desactive para la actualización (es posible que se requiera un escaneo manual para esto), o es posible que algunos clientes deseen verificar que todas las rutas estén activas en sus hosts críticos antes de continuar. Estas circunstancias justifican el uso de una fase de reenvío de I/O extendida. Sin embargo, existen riesgos significativos involucrados en una fase prolongada de reenvío de I/O, que incluyen:
- Degradación del rendimiento debido a que solo la mitad de los directores procesan las I/O (esto es especialmente riesgoso si la utilización de CPU de los directores es alta antes de la NDU)
- Mayor riesgo de una interrupción total del clúster en sistemas de un solo motor (si un segundo director del actualizador deja de funcionar durante la fase de reenvío de I/O)
- Mayor riesgo de DU debido a una partición de sitio, ya que el servidor de testigo de clúster está deshabilitado durante la NDU
- Mayor riesgo de reversión de NDU debido a cambios que requieren actualizaciones de metadatos (falla de replicación de RecoverPoint, cambios en la accesibilidad al almacenamiento RAID 1, etc.)
- Bloqueo del acceso a la interfaz de usuario y la CLI RESTful durante la NDU
- Se deshabilitó el estado de Call-Home durante la NDU
Por lo tanto, se recomienda utilizar el tiempo de espera más corto que satisfaga las necesidades de los clientes, especialmente cuando no se selecciona ninguna interacción (--io-fwd-ask-for-confirmation = never).
/var/log/VPlex/cli en el servidor de administración).
¿Cuál es el uso recomendado de la función --io-fwd-ask-for-confirmation ¿opción?
Opción --io-fwd-ask-for-confirmation always Se debe utilizar en las siguientes situaciones:
- Si las aplicaciones críticas se ejecutan detrás de VPLEX
- Si los usuarios o los administradores de host están disponibles para ayudar durante la NDU
- Si existe una preocupación especial, debe tener precaución durante la NDU
- Si hay puertos de iniciador de host que no ven al menos un puerto de destino en los directores del primer y segundo actualizador, entonces la opción
--io-fwd-ask-for-confirmation alwaysse debe utilizar durante la NDU.
Nota: Para todos los demás casos de uso, utilice la opción
--io-fwd-ask-for-confirmation on-missing-logins. Utilice las opciones de actualización para obtener la información más reciente antes de decidir continuar o revertir la NDU.
Nota: Si la solicitud en
ndu pre-check muestra una advertencia que indica que los puertos del iniciador no pueden detectar al menos un puerto de destino en los conjuntos del primer y segundo actualizador, este problema se debe resolver antes de iniciar la NDU. Si no se corrige, se produce una interrupción de la DU para cada host afectado durante la actualización. Este problema no se puede corregir durante la NDU, especialmente durante la fase de transferencia de I/O. Además, si los iniciadores de host están conectados a un solo conjunto de actualizadores, esos hosts experimentan una DU hasta que ese conjunto de directores se reinicia, el host inicia sesión y reanuda las operaciones de I/O.