VxFlex: Algunos dispositivos SDS cifrados con Cloudlink marcados como error después del reinicio del nodo SDS
Summary: VxFlex: Algunos dispositivos SDS cifrados con Cloudlink marcados como error después del reinicio del nodo SDS
Symptoms
Después de reiniciar el SDS, algunos dispositivos cifrados con Cloudlink continúan funcionando, mientras que el resto se marca como Error.
Varios dispositivos SDS marcados en el estado "Error" en el SDS que se reinició. Esto puede causar una reducción de la capacidad y, potencialmente, un tiempo de reconstrucción más prolongado.
En SDS trc:
21/06 13:09:34.917236 0x7fed52ebbeb0:mosAsyncIO_OpenFileEx:00376: WARNING: Failed to open IO file /dev/mapper/svm_sdg with rc 3 21/06 13:09:34.917238 0x7fed52ebbeb0:file_OpenEx:00707: Open error /dev/mapper/svm_sdg, NOT_FOUND 21/06 13:09:34.917241 0x7fed52ebbeb0:phyDev_ReadDevId:02649: failed to open file: path=/dev/mapper/svm_sdg, NOT_FOUND
El SDS cfg/partitions incluye una o más entradas con los dispositivos SDS con el prefijo mapper/svm_sd y una o más sin prefijo.
En el ejemplo siguiente se muestran ambos tipos de entradas.
8 96 1875374424 mapper/svm_sdg 8 112 1875374424 sdh The device errors can be cleared after the affected SDS has been restarted.
La versión de ScaleIO en uso es superior a 2.0.1.3 y KB 000158993 no se aplica, aunque el síntoma es similar.
Cause
CloudLink tiene problemas con la comprobación de disco y solo desbloquea algunos dispositivos antes de iniciar SDS. Cuando se inicia SDS, el /dev/mapper/svm_sd* Los archivos de dispositivo para los discos que aún no se han desbloqueado aún no se crean, por lo que se informan errores de dispositivos SDS.
Resolution
Este problema se resolvió en Cloud Link 6.8. Consulte la matriz de soporte para asegurarse de que el entorno siga siendo compatible.
Para recuperarse de este problema, reinicie manualmente el servicio SDS y borre los errores del dispositivo SDS afectado.
Para evitar que se produzca el problema, inicie el SDS después de que CloudLink haya desbloqueado todos los discos:
- Antes de apagar el nodo, ejecute "/opt/emc/scaleio/sds/bin/delete_service.sh"; después del reinicio, espere hasta que se desbloqueen todos los discos utilizados como dispositivos SDS (se mostrará "svm status" o el centro de control de CloudLink) y, a continuación, ejecute "/opt/emc/scaleio/sds/bin/create_service.sh"; o
- Edite "/opt/emc/extra/pre_run.sh" e inserte "sleep 30" arriba de la última línea (considere ajustar este número 30 más alto si el problema persiste, es decir, no todos los dispositivos se desbloquean cuando se inicia el proceso de SDS):
... sleep 30 echo pre_run returned...$(date) >> /var/log/svm-sds
Additional Information
NOTA: La solución alternativa para el sueño anterior no se encuentra en una actualización (a 6.7, ya que aún no incluye la corrección permanente para este problema) y es posible que deba volver a aplicarse.
Este no es un problema del software de ScaleIO. El problema se encuentra en Cloud Link 6.6 y 6.7, y se resolvió en Cloud Link 6.8.
Mantenga #CCTFY25Q4 como palabra clave en todas las versiones para fines de seguimiento.