Risoluzione dei problemi di storage (iSCSI/Fibre Channel) con VMware vSphere ESX/ESXi
Per risolvere i problemi di storage (iSCSI/Fibre Channel) con VMware vSphere ESX/ESXi, procedere come segue:
- Determinare se esiste un problema di rete o fibre channel che potrebbe causare problemi di storage.
Nota: si consiglia di raccogliere un bundle vm-support prima di eventuali modifiche e di disporre di una buona conoscenza di VMware. Si consiglia inoltre di testare le modifiche in un ambiente di sviluppo/test prima di apportare modifiche agli ambienti di produzione.
- Se si sposta la VM in una LUN diversa, le prestazioni migliorano?
- Se si riduce il numero di VM per LUN, le prestazioni migliorano?
- Vengono segnalati errori SCSI nel registro eventi della VM guest o all'interno di messaggi?
- Il problema si verifica su tutti gli host ESX/ESXi o solo su uno di essi?
- Esiste una base di riferimento di prestazioni previste?
- La latenza presenta dei picchi in un determinato momento o è relativamente costante?
- La latenza appare correlata a una VM o a una particolare connessione iSCSI o LUN?
- Se la latenza è correlata a una iSCSI o Fibre Channel LUN, ci sono altre LUN nello stesso dispositivo di storage che si comportano correttamente?
- Se più dispositivi di storage sono collegati tramite iSCSI o Fibre Channel, lo stesso problema si verifica su entrambi i dispositivi SAN?
- Esaminare la scheda delle prestazioni tramite il client VMware o utilizzare esxtop dalla CLI di ESX/ESXi
- Esaminare il file /var/log/vmkernel.log o /var/log/messages in base alla versione di ESX/ESXi e verificare l'eventuale presenza di diciture contenenti "SCSI reservation conflict".
- Segmentare o isolare il traffico iSCSI dal traffico di IO normale e di gestione.
- Distribuire in modo uniforme le porte NIC installate sul server per il traffico iSCSI su fabric o switch ridondanti.
- Disabilitare Spanning Tree su tutte le porte dello switch che si collegano ai dispositivi finali e abilitare l'impostazione portfast su tali porte, poiché trattandosi di dispositivi endpoint non possono creare fabric loop.
- Se si utilizza Virtual Switch Tagging (più VLAN o VLAN taggate negli ESXi vSwitch), le porte dello switch devono utilizzare la modalità Trunk.
- Determinare la versione installata della build di VMware e consultare le note di rilascio dell'ultima versione di build di VMware ESX/ESXi.
- Seguire le procedure consigliate di VMware e Dell per quanto riguarda l'applicazione degli aggiornamenti di driver, build e firmware.