VxFlex: Alguns dispositivos SDS criptografados pelo CloudLink marcaram erro após a reinicialização do nó SDS
Summary: VxFlex: Alguns dispositivos SDS criptografados pelo CloudLink marcaram erro após a reinicialização do nó SDS
Symptoms
Após a reinicialização do SDS, alguns dispositivos criptografados pelo CloudLink permanecem funcionando, enquanto os demais são marcados como Error.
Vários dispositivos SDS marcados com o estado "Error" no SDS que foi reinicializado. Isso pode causar capacidade reduzida e, possivelmente, um tempo de reconstrução mais longo.
No SDS trc:
21/06 13:09:34.917236 0x7fed52ebbeb0:mosAsyncIO_OpenFileEx:00376: WARNING: Failed to open IO file /dev/mapper/svm_sdg with rc 3 21/06 13:09:34.917238 0x7fed52ebbeb0:file_OpenEx:00707: Open error /dev/mapper/svm_sdg, NOT_FOUND 21/06 13:09:34.917241 0x7fed52ebbeb0:phyDev_ReadDevId:02649: failed to open file: path=/dev/mapper/svm_sdg, NOT_FOUND
Os SDS cfg/partitions arquivo inclui uma ou mais entradas com os dispositivos SDS prefixados com mapeador/svm_sd e uma ou mais sem prefixo.
O exemplo a seguir mostra os dois tipos de entradas.
8 96 1875374424 mapper/svm_sdg 8 112 1875374424 sdh The device errors can be cleared after the affected SDS has been restarted.
A versão do ScaleIO em uso é superior à 2.0.1.3 e o 000158993 KB não se aplica, embora o sintoma seja semelhante.
Cause
O CloudLink tem problemas com a verificação de disco e só desbloqueia alguns dispositivos antes de iniciar o SDS. Quando o SDS é iniciado, o /dev/mapper/svm_sd* os arquivos de dispositivo para esses discos que ainda não foram desbloqueados ainda não foram criados, relatando assim erros de dispositivo SDS.
Resolution
Esse problema foi corrigido no Cloud Link 6.8. Consulte a matriz de suporte para garantir que o ambiente ainda seja compatível.
Para se recuperar desse problema, reinicie manualmente o serviço SDS e limpe os erros do dispositivo SDS afetado.
Para evitar que o problema ocorra, inicie o SDS depois que o CloudLink desbloquear todos os discos:
- Antes de desligar o nó, execute "/opt/emc/scaleio/sds/bin/delete_service.sh"; após a reinicialização, aguarde até que todos os discos usados como dispositivos SDS sejam desbloqueados ("svm status" ou o centro de controle do CloudLink será exibido) e execute "/opt/emc/scaleio/sds/bin/create_service.sh"; ou
- Edite "/opt/emc/extra/pre_run.sh" e insira "sleep 30" acima da última linha (considere ajustar esse número 30 a mais se o problema ainda ocorrer, ou seja, nem todos os dispositivos serão desbloqueados quando o processo do SDS for iniciado):
... sleep 30 echo pre_run returned...$(date) >> /var/log/svm-sds
Additional Information
Nota: A solução temporária de suspensão acima não está em um upgrade (para a versão 6.7, pois ainda não inclui a correção permanente para esse problema) e talvez precise ser aplicada novamente.
Esse não é um problema do software ScaleIO. O problema está no Cloud Link 6.6 e 6.7 e foi corrigido no Cloud Link 6.8.
Mantenha #CCTFY25Q4 como a palavra-chave em todas as versões para fins de rastreamento.