VxRail: A adição de novo nó falha quando o ambiente está usando o KMS (Key Management Service, serviço de gerenciamento de chaves)
Summary: Em um ambiente que usa servidores KMS, o processo para adicionar um novo nó falha.
Symptoms
Durante o processo para adicionar o novo nó, o processo foi interrompido na etapa "Building vSAN disk groups on cluster" e você recebe a mensagem abaixo.
Failed to retrieve key from key management server cluster.
Os eventos abaixo são registrados nos logs do VxRail.
short.term e long.term
microservice.do-storage "2022-09-08T19:51:28.483599063Z stderr F reason = 'Failed to retrieve key from key management server cluster "
microservice.ms-day2 "2022-09-08T19:51:28.976169781Z stdout F 2022-09-08 19:51:28,976 [INFO] <ThreadPoolExecutor-0_19:140190995695360> pri_exp_state_service.py update_wfe_config_step_status_to_operation_status() (175): update config step status to operation status: {'level': 'step', 'id': 'host_vsan_diskgroups_create.default.host_vsan_diskgroups_create', 'state': 'FAILED', 'progress': 56, 'status': {'id': 'host_vsan_diskgroups_create', 'internal_id': 'host_vsan_diskgroups_create.default.host_vsan_diskgroups_create_False____exp9ce4bac8_65cd_9df01be3cc', 'internal_family': 'host_vsan_diskgroups_create.default.host_vsan_diskgroups_create', 'status': 'FAILED', 'startTime': 1662666560665, 'stage': 'default', 'params': {'vc_conn_info': {'host': 'FQDN.Domain.com', 'username': 'administrator@vsphere.local', '****** 'datacenter_name': 'VxRail-Datacenter', 'host_conn_info': {'host': node_IP, 'username': 'root', '****** 'host_name': 'node_namde', 'host_storage': {}, 'hw_model': 'VxRail P570F', 'customer_supplied': 'false', 'host_sn': 'XXXXXXX', 'disk_group_type': None}, 'error': {'result': {'error': {'code': 'E3100_Storage_4', 'params': [node_name], 'message': 'Failed to create multiplue disk group node_name'}}}}}"
microservice.do-storage "2022-09-08T19:51:28.449335382Z stderr F [2022-09-08 19:51:28,449: ERROR/MainProcess] Create multi DGs failed."
Cause
O novo nó do VxRail não tem acesso ao servidor KMS. Se um cluster KMS estiver em uso, o nó do VxRail não terá acesso a um dos nós do servidor KMS.
Resolution
O novo nó do VxRail deve ter acesso a todos os nós de cluster do KMS.
Se o novo nó do VxRail não tiver acesso ao servidor KMS ou tiver acesso a apenas um nó KMS, o processo para adicionar o nó apresentará falha.
A porta KMS padrão geralmente é 5696, mas o cliente pode especificar outra porta durante a implementação do KMS.
Adicionei o exemplo de configuração do KMS abaixo, e você pode ver lá qual porta está em uso.