PowerFlex : ajout d’une erreur d’appareil dans les journaux de suivi « Time budget exceeded » et IO_HARD_ERROR
Summary: Problème lors de l’ajout de nouveaux périphériques dans VxFlex OS (ScaleIO). Une erreur dans les journaux de suivi indique « Time budget exceeded », puis IO_HARD_ERROR
Symptoms
Tentative d’ajout d’un nouveau périphérique sur un SDS à VxFlex OS
Le client tente d’ajouter le nouvel appareil au SDS et obtient une erreur
Vous trouverez ci-dessous les erreurs dans les journaux de suivi MDM lors de l’ajout de l’appareil :-
04/02 07:44:39.847673 0x7fe714c7deb0:mosEventLog_PostInternal:00590: New event added. Message: "Command add_sds_device received, User: 'USERNAME'. [464880250]". Additional info: "SDS: Name: SDSNAME, SDS Device: name N/A path /dev/sdab, Storage Pool: sas_10k_4, Test Mode: 'Test and activate' Test Time: 0 force_device_takeover flag: Specified" Severity: Info
04/02 07:44:44.435265 0x7fe714c7deb0:mosEventLog_PostInternal:00590: New event added. Message: "Command add_sds_device was not successful. Error code: Add SDS device IO error [464880250]". Additional info: "ID: 0000000000000000" Severity: Warning
D’après les journaux de suivi SDS, les erreurs suivantes s’affichent :
04/02 07:44:43.589785 0x7f6b739aaeb0:AddDevProgress_Trace:00255: AddDevProgress: osThreadId=11cd, devId=3fefb6ae00110006, Start=25f2ee8825 [usec], end=25f2ee9888 [usec], interval= 4195 [usec], Desc=Write PhyDevCombArr
04/02 07:44:44.380440 0x7f6b739aaeb0:file_DoIOSyncEx:02237: Time budget exceeded on reading from /dev/sdab
04/02 07:44:44.380569 0x7f6b739aaeb0:file_ReadIntern:01169: Read error from disk 1548199195, 8 IO_HARD_ERROR
04/02 07:44:44.380653 0x7f6b739aaeb0:file_DoIOSyncEx:02237: Time budget exceeded on reading from /dev/sdab
04/02 07:44:44.380697 0x7f6b739aaeb0:file_ReadIntern:01169: Read error from disk 1548199195, 8 IO_HARD_ERROR
04/02 07:44:44.380777 0x7f6b739aaeb0:contDev_SendDeviceError:01761: Sending device error to MDM: DevId:3fefb6ae00110006 deviceName: /dev/sdab readError: TRUE WriteError: FALSE
04/02 07:44:44.415846 0x7f6b739aaeb0:file_WriteIntern:00937: Write error to disk 64, 2 IO_HARD_ERROR
04/02 07:44:44.415978 0x7f6b739aaeb0:file_WriteIntern:00937: Write error to disk 64, 2 IO_HARD_ERROR
04/02 07:44:44.416061 0x7f6b739aaeb0:contDev_SendDeviceError:01761: Sending device error to MDM: DevId:3fefb6ae00110006 deviceName: /dev/sdab readError: TRUE WriteError: TRUE
04/02 07:44:44.426672 0x7f6b739aaeb0:phyDev_InitWithBuf:02279: Io error
04/02 07:44:44.426839 0x7f6b739aaeb0:mosAsyncIO_CloseFileIntern:00503: Closing device path:/dev/sdab
Cause
Si l’on se concentre sur les événements « Time Budget exceeded », il semble que cet appareil soit trop lent à être ajouté ou qu’il y ait des problèmes matériels qui peuvent être dus à un problème de contrôleur ou à un bloc défectueux sur le disque ci-dessus.
Dans le cadre de la phase de test lors de l’ajout d’un nouvel appareil, SIO doit être capable d’écrire ~200 Mo de données en ~4,5 secondes. Cela peut être dû à des problèmes de contrôleur ou à des blocs défectueux sur l’appareil, ou le problème semble être que le disque est trop lent, lorsque nous voyons l’erreur « Time budget exceeded » et IO_HARD_ERROR
Resolution
Il ne s’agit pas d’un problème lié au système d’exploitation VxFlex. Il s’agit plutôt d’un problème matériel.
Le fournisseur de matériel doit être impliqué pour la procédure d’enquête.
1. Vérifiez s’il y a des problèmes sur le contrôleur RAID.
2. Vérifiez s’il y a des problèmes sur le disque ou s’il s’agit d’un disque lent.
3. Si possible, essayez d’obtenir un autre disque et de l’ajouter. Si le nouveau disque est ajouté avec succès, cela signifie que le disque précédent a rencontré des problèmes.
4. Si plusieurs nouveaux disques rencontrent le même problème lors de l’ajout d’un SDS, vérifiez s’il y a des problèmes sur le contrôleur RAID. Assurez-vous également que les versions prises en charge du pilote et du firmware du contrôleur RAID.