VxRail: Düğümün "esxcli" komutuna yanıt vermemesi nedeniyle fiziksel görünüm gösterilmiyor

Summary: VxRail kümesi düğümünün fiziksel görünümü eksik, düğüm "esxcli" komutuna yanıt vermiyor, NTP senkronize değil.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  1. Tüm düğümlerin fiziksel görünümleri eksik.
    web.log'dan itibaren, API ağ geçidi, fiziksel görünüm verileri getirildikten 10 dakika sonra zaman aşımına uğradı:

    2023-11-20T09:24:31.039Z <7527c8d153655e9bbb43b32dcd312443> marvin [ERROR] <261> ApplianceServiceImpl.java populatePvCache() (276): failed to fetch data.
    javax.ws.rs.ServerErrorException: HTTP 504 Gateway Time-out
    	at org.glassfish.jersey.client.JerseyInvocation.createExceptionForFamily(JerseyInvocation.java:1125) ~[jersey-client-2.27.jar:?]
    	at org.glassfish.jersey.client.JerseyInvocation.convertToException(JerseyInvocation.java:1105) ~[jersey-client-2.27.jar:?]
    	at org.glassfish.jersey.client.JerseyInvocation.translate(JerseyInvocation.java:883) ~[jersey-client-2.27.jar:?]
    	at org.glassfish.jersey.client.JerseyInvocation.lambda$invoke$1(JerseyInvocation.java:767) ~[jersey-client-2.27.jar:?]
    	at org.glassfish.jersey.internal.Errors.process(Errors.java:316) ~[jersey-common-2.27.jar:?]
    	at org.glassfish.jersey.internal.Errors.process(Errors.java:298) ~[jersey-common-2.27.jar:?]
    	at org.glassfish.jersey.internal.Errors.process(Errors.java:229) ~[jersey-common-2.27.jar:?]
    	at org.glassfish.jersey.process.internal.RequestScope.runInScope(RequestScope.java:414) ~[jersey-common-2.27.jar:?]
    	at org.glassfish.jersey.client.JerseyInvocation.invoke(JerseyInvocation.java:765) ~[jersey-client-2.27.jar:?]
    	at org.glassfish.jersey.client.JerseyInvocation$Builder.method(JerseyInvocation.java:456) ~[jersey-client-2.27.jar:?]
    	at org.glassfish.jersey.client.JerseyInvocation$Builder.post(JerseyInvocation.java:357) ~[jersey-client-2.27.jar:?]
    	at com.vce.commons.domainowner.graphq.DefaultQueryExecutorImpl.doJsonRequestExecution(DefaultQueryExecutorImpl.java:139) ~[commons-7.0.480.jar:?]
    	at com.vce.commons.domainowner.graphq.DefaultQueryExecutorImpl.execute(DefaultQueryExecutorImpl.java:94) ~[commons-7.0.480.jar:?]
    	at com.emc.mystic.manager.graphql.client.host.HostQuery.configuredHosts(HostQuery.java:138) ~[do-host-graphql-client-1.20.41.jar:?]
    	at com.emc.mystic.manager.graphql.client.host.HostQuery.configuredHosts(HostQuery.java:102) ~[do-host-graphql-client-1.20.41.jar:?]
    	at com.vce.commons.domainowner.node.NodeRepository.getAllClusterNodeData(NodeRepository.java:1997) ~[commons-7.0.480.jar:?]
    	at com.emc.mystic.manager.cluster.service.ApplianceServiceImpl.getAllHostData(ApplianceServiceImpl.java:543) ~[classes/:?]
    	at com.emc.mystic.manager.cluster.service.ApplianceServiceImpl.populatePvCache(ApplianceServiceImpl.java:260) ~[classes/:?]
    	at com.emc.mystic.manager.cluster.service.ApplianceServiceImpl.lambda$updateCacheTask$6(ApplianceServiceImpl.java:320) ~[classes/:?]
    	at java.util.concurrent.FutureTask.run(FutureTask.java:264) [?:?]
    	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128) [?:?]
    	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628) [?:?]
    	at java.lang.Thread.run(Thread.java:829) [?:?]
    2023-11-20T09:24:31.045Z <7527c8d153655e9bbb43b32dcd312443> marvin [INFO] <261> ApplianceServiceImpl.java lambda$updateCacheTask$6() (321): Success to refresh cache for node: <node SN>
    2023-11-20T09:24:31.046Z <7527c8d153655e9bbb43b32dcd312443> marvin [INFO] <59> ApplianceDataRoot.java refreshVxRailClusterTag() (289): Skip refreshing VxRail-Cluster-Tag triggered by scheduled job as it has already been done within 15 minutes.
    2023-11-20T09:24:31.046Z <7527c8d153655e9bbb43b32dcd312443> marvin [INFO] <59> ApplianceDataRoot.java fetchData() (357): [VXMPERF] PV fetch data execution time in 602 seconds
    
  2. Düğüm fiziksel görünüm verilerini sorgulamak için VxRail yöneticisinde aşağıdaki komutu çalıştırın:

    #curl -X GET --unix-socket /var/lib/vxrail/nginx/socket/nginx.sock http://127.0.0.1/rest/vxm/internal/do/v1/host/query -H 'Content-Type: application/json' -d '{"query":"{ configuredHosts { hardware { sn } } }"}' 2>/dev/null | jq | egrep "name|sn" | awk -F\" '/sn/{print $4}' | sort -u | while read sn; do time curl -X POST --unix-socket /var/lib/vxrail/nginx/socket/nginx.sock -H 'Content-Type: application/json' -d '{"variables":"{\"sn\":\"'${sn}'\"}","query":"query ($sn:[String]){ configuredHosts(sn:$sn) { moid name type summary{ hardware{ cpuNum}} config{ hostUUID isPrimary network{ vnic{ device ipv4 allIpv6s nonLinkLocalIpv6} idrac{ ipAddress ipAddressSource netmask gateway ipAddressV6 gatewayV6 prefixLen ipv6AutoConfig vlan{ enabled id priority}}} localSlotClaims{ slot bay type usage diskgroupId} diskgroup{ slotNum current{ type}} installedComponent{ displayName version model description installedTime}} runtime{ connectionState overallStatus powerState inMaintenanceMode} hardware{ sn psnt slot manufacturer name systemStatusLed tpm model firmware{ id model} firmwareRevisions{ idsdmFwRevision biosFwRevision bmcFwRevision diskCtrlFwRevision bossFwRevision cpldFwRevision expanderBackplane nonExpanderBackplane dcpmFwRevision percDiskCtrlFwRevision} baseline{ sn slot chassisId isMissing} chassis{ name model psnt partNumber serviceTag psus{ sn name slot manufacturer partNumber firmwareVersion baseline{ sn slot isMissing}}} disks{ sn guid capacity slot firmwareVersion diskType diskState manufacturer protocol maxCapableSpeed model ledStatus writeEndurance bay enclosure remainingWriteEnduranceRate encryptionAbility encryptionStatus baseline{ sn slot bay isMissing}} bootDevices{ sn firmwareVersion sataType powerOnHours powerCycleCount avrEraseCount maxEraseCount capacity deviceModel slot health bootDeviceType status blockSizeBytes partNumber manufacturer controllerFirmware controllerModel controllerStatus raidStatus} nics{ mac linkSpeed firmwareFamilyVersion linkStatus fqdd specificNicType wwnn wwpn drivers{ driverName driverVersion}} position{ rackName rackSlot} storageInstance{ securityStatus encryptionMode}}} }","operationName":null}' http://0/rest/vxm/internal/do/v1/host/query; echo ""; echo ""; echo "Done checking $sn"; done
  3. Bir veya daha fazla düğümün verileri 10 dakika içinde döndürmediğini gösteren sonuç:
    Söz konusu düğümlerde "504 Gateway Time-out" hatası döndürülürken, çalışan düğümlerde doğru fiziksel görünüm verileri döndürülür.
    Bir veya daha fazla düğümün verileri 10 dakika içinde döndürmediğini gösteren sonuçlar

  4. Yukarıda belirtilen düğüm SN'sine bağlı olarak düğümde oturum açın ve şunu çalıştırın: esxcli komutu, takıldı ama localcli çalışıyor:
    Esxcli komutunu çalıştırın ve takılıyor ancak localcli çalışıyor

 

Cause

Düğümde NTP senkronizasyon sorunu vardı ve bu sorun esxcli komut takılı kalıyor ve yanıt yok.

VxRail çağrıları fiziksel görünümü esxcli Düğümde bellenim bilgilerini alma komutları, düğüm çalışırken takılı kaldığında bilgileri alamıyor esxcli Komut.

 

Resolution

Çözüm, tüm düğümlerde NTP senkronizasyon sorununu tespit etmek ve düzeltmektir. Düğümlerde NTP'nin durumunu doğrulamak için aşağıdaki adımlara bakın:

  1. Sistem saatinin artık yukarı akış zaman sunucularıyla senkronize edilmediğini belirten hata mesajları için /var/log/vobd.log kontrol edin.

  2. Bu durumda NTP sunucusu durumunu kontrol edin.

    #ntpq -p

    ntpq -p komut örneği

    Erişim" değeri 377 değilse ana bilgisayarda NTP işlemi eksiktir, bu ESXi'deki saat yanlış olabilir ve buna dikkat edilmesi gerekir.

    #ntpq -c

    ntpq -c komut örneği

    "Katman" değeri 2 ila 6 aralığının dışındaysa bu ESXi'deki zaman senkronizasyonunda ek gecikmeler yaşanabilir ve bu da zaman işleyişinin yanlış olmasına neden olabilir.

  3. VxRail Manager veritabanındaki NTP sunucusu adresinin API ile doğru olup olmadığını kontrol edin.

    curl -k --user "[vCenter account]:[vCenter password]" --request GET "https://localhost/rest/vxm/v1/system/ntp"
  4. Aksi takdirde, NTP sunucusu IP adresini güncellemek için mevcut "Nasıl Yapılır" Prosedürlerini (VxRail Prosedürleri → Çeşitli → "Nasıl Yapılır" Prosedürleri → VxRail IP adreslerini değiştirme → Yeni bir NTP Sunucusu IP adresine Yeniden İşaretleme) uygulayın.

  5. Gerekirse çalışan başka bir NTP sunucusu kullanın, düğüm vpxa'sını ve ana bilgisayar hizmetlerini yeniden başlatın. Düğüm vpxa ve ana bilgisayar hizmetlerini yeniden başlatmanın sorunu geçici olarak çözeceğini ancak NTP yeniden senkronize edilemezse sorunun geri döneceğini unutmayın.

    /etc/init.d/vpxa restart
    /etc/init.d/hostd restart

 

Affected Products

VxRail
Article Properties
Article Number: 000224344
Article Type: Solution
Last Modified: 24 May 2024
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.