Технологія PowerFlex: Несправний диск із неправильним ідентифікатором пристрою
Summary: Системний диск ScaleIO відображається як несправний, коли він використовувався на іншому вузлі SDS.
Symptoms
Сценарій
Коли клієнт використовує один і той самий дисковий корпус для двох вузлів SDS або більше, він повинен налаштувати автономний/онлайн-режим для кожного диска та вузла, до якого він належить.
Іноді замовник може помилитися і включити в мережу один і той же диск на обидва SDS вузла, і тоді ми бачимо один диск як вийшов з ладу.
Можливі помилки:
- Клієнт підключає один і той же диск на обидва вузли SDS, і тоді ми бачимо один диск як несправний.
- Клієнт обмінюється дисками, тобто кожен диск підключений до мережі на неправильному вузлі, у цьому випадку ми бачимо два несправні диски, по одному на кожному вузлі SDS.
Симптоми
Неправильний ідентифікатор дискового пристрою, знайдений вузлом SDS, і процес SDS встановив на диску стан FAILED.
При запуску процесу SDS після mosConf частина процесу SDS переходить до виявлення фізичних пристроїв, коли диск не призначений для використання scaleio (наприклад, диск системної ОС або безкоштовний диск) буде показана помилка "Невірний підпис заголовка пристрою" (перший рядок у виводі). Коли диск використовується ScaleIO, пристрій знаходить, а ID пристрою відображається поруч із ним.
На першому виводі нижче (trc файл з сервера 1) ми можемо бачити, що було знайдено 12 пристроїв, але уважно придивившись, ми бачимо, що два пристрої різні (L,M) - 12-й символ в ID пристрою дорівнює 3, а не 0, як у всіх інших ідентифікаторів пристроїв.
На другому виведенні нижче (trc файл з сервера 2) було знайдено 12 дисків і знову два диски різні (K,L) - 12-й символ в ID пристрою дорівнює 0, а не 3 як у всіх інших ID пристроїв.
Після процесу виявлення процес SDS переходить до додавання пристроїв назад до SDS, коли SDS не знайде, результат rc диска буде NOT_FOUND (файл trc з сервера 1), як ми можемо бачити в прикладах нижче, на кожному SDS у нас є диски з ID пристрою, що не належить його SDS, SDS покаже ці диски як FAILED, тому що вони NOT_FOUND (trc файл з сервера 1).
Файл TRC з сервера 1
30/04 09:48:16.328000 000000A170629EA0:phyDev_ReadDevId:02679: Invalid device header signature : path=C, devVersion=2807280628052804, sigStart=2803280228012800, sigEnd=283b283a28392838
30/04 09:48:16.328000 000000A170629EA0:phyDevMap_ReloadSpecific:00128: Failed to read DeviceId of C. rc=351
30/04 09:48:16.329000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device F ,a2901dcd00000000
30/04 09:48:16.330000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device G ,a2901dce00000001
30/04 09:48:16.331000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device H ,a2901dcf00000002
30/04 09:48:16.332000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device I ,a2901dd000000003
30/04 09:48:16.333000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device J ,a2901dd100000004
30/04 09:48:16.333000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device K ,a29044bf00000005
30/04 09:48:16.337000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device L ,a29044c400030006
30/04 09:48:16.342000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device M ,a29044c000030005
30/04 09:48:16.343000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device N ,a29044cb00000008
30/04 09:48:16.344000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device O ,a2906bcf00000009
30/04 09:48:16.345000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device P ,a2906bd30000000a
30/04 09:48:16.345000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device Q ,fbd792df0000000b
...
30/04 09:48:16.345000 000000A1730BCEA0:contCmd_AddDev:01204: DevId a2901dce00000001 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A173086EA0:contCmd_AddDev:01204: DevId a29044c700000007 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A173098EA0:contCmd_AddDev:01204: DevId a2906bd30000000a - Start rc = SUCCESS
30/04 09:48:16.346000 000000A1730E0EA0:contCmd_AddDev:01204: DevId fbd792e50000000c - Start rc = SUCCESS
30/04 09:48:16.346000 000000A1730B3EA0:contCmd_AddDev:01204: DevId a2901dcf00000002 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A17310DEA0:contCmd_AddDev:01204: DevId a2901dcd00000000 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A173062EA0:contCmd_AddDev:01204: DevId a29044cb00000008 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A1730C5EA0:contCmd_AddDev:01204: DevId a2901dd100000004 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A1730E0EA0:contCmd_AddDev:01391: DevId fbd792e50000000c - Done rc = NOT_FOUND
30/04 09:48:16.348000 000000A1730A1EA0:contCmd_AddDev:01204: DevId fbd792ee0000000e - Start rc = SUCCESS
30/04 09:48:16.348000 000000A1730A1EA0:contCmd_AddDev:01391: DevId fbd792ee0000000e - Done rc = NOT_FOUND
30/04 09:48:16.349000 000000A1730F2EA0:contCmd_AddDev:01204: DevId fbd792e90000000d - Start rc = SUCCESS
30/04 09:48:16.349000 000000A17306BEA0:contCmd_AddDev:01204: DevId a2901dd000000003 - Start rc = SUCCESS
30/04 09:48:16.349000 000000A17307DEA0:contCmd_AddDev:01204: DevId a2906bcf00000009 - Start rc = SUCCESS
30/04 09:48:16.349000 000000A173074EA0:contCmd_AddDev:01204: DevId a29044bf00000005 - Start rc = SUCCESS
30/04 09:48:16.349000 000000A173086EA0:contCmd_AddDev:01391: DevId a29044c700000007 - Done rc = NOT_FOUND
30/04 09:48:16.349000 000000A1730F2EA0:contCmd_AddDev:01391: DevId fbd792e90000000d - Done rc = NOT_FOUND
30/04 09:48:16.351000 000000A1730FBEA0:contCmd_AddDev:01204: DevId fbd792ef0000000f - Start rc = SUCCESS
30/04 09:48:16.352000 000000A1730FBEA0:contCmd_AddDev:01391: DevId fbd792ef0000000f - Done rc = NOT_FOUND
30/04 09:48:16.352000 000000A173104EA0:contCmd_AddDev:01391: DevId a29044c300000006 - Done rc = NOT_FOUND
Файл TRC з сервера 2
30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device F ,a2901dc800030000
30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device G ,a2901dc900030001
30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device H ,a2901dca00030002
30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device I ,a2901dcb00030003
30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device J ,a2901dcc00030004
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device K ,a29044c300000006
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device L ,a29044c700000007
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device M ,a29044c800030007
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device N ,a29044cc00030008
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device O ,a2906bd000030009
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device P ,a2906bd40003000a
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device Q ,fbda92e00003000b
Пояснення ідентифікатора пристрою SDS
Кожен пристрій SDS має роз'єм, збережений на своєму64-му LB.
Заголовок має наступну структуру:
64-бітний підпис
64-розрядна версія пристрою
64-бітний ідентифікатор SDS
64-бітний ідентифікатор пристрою SDS ß те, що ви шукаєте.
Ідентифікатор пристрою SDS, також відомий як TgtDevId, складається з наступного:
Унікальний ID 32 біта
Індекс TGT 16 біт
Індекс пристрою 16 біт
Наприклад: SDS з ідентифікатором 2df4737600000002 матиме два пристрої з ідентифікаторами: 7fff29ea00020000, 7fff29eb00020001
Так чи інакше, якщо пристрій, що належить до SDS x, було замінено на SDS y, то при повторному приєднанні пристрою до SDS y він виявляє, що він належить до іншого SDS, перевіряючи ідентифікатор SDS, збережений у заголовку.
Можливо, ви зможете побачити це в журналах SDS, якщо введете запит «Неправильний пристрій»
Вплив
Перебудова та перебалансування системи в міру того, як диск знаходиться в стані FAILED.
Cause
Ідентифікатор дискового пристрою належить іншому вузлу SDS, тому ScaleIO ніколи його не використовуватиме.
Resolution
Додавання диска до потрібного вузла SDS.
Версії, яких це стосується
Усі версії PowerFlex
Виправлено у версії
Робота в якості дизайну.