Isilon OneFS: En felaktig DIMM som orsakar backend-latens

Summary: En felaktig minnesmodul (DIMM) i en nod kan orsaka backend-latens.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Klienter rapporterar dåliga prestanda och det är hög belastning och CPU-användning på en nod på grund av isi_mca_dump process. 
 

# isi_for_array -s uptime
xxxxx-1:   1:37AM  up 216 days,  9:16, 1 users, load averages: 7.95, 6.69, 6.87
xxxxx-2:   1:37AM  up 216 days,  9:17, 2 users, load averages: 12.69, 7.75, 6.18
xxxxx-3:   1:37AM  up 216 days,  9:13, 0 users, load averages: 9.18, 5.96, 5.79
xxxxx-4:   1:37AM  up 128 days,  4:51, 1 users, load averages: 9.49, 6.47, 5.90
xxxxx-5:   1:37AM  up 216 days,  9:13, 0 users, load averages: 10.18, 6.25, 6.06
xxxxx-6:   1:37AM  up 216 days,  9:13, 0 users, load averages: 9.10, 6.52, 5.58
xxxxx-7:   1:37AM  up 216 days,  9:13, 0 users, load averages: 5.99, 4.45, 4.14
xxxxx-8:   1:37AM  up 90 days, 11:17, 2 users, load averages: 15.96, 26.64, 28.16 
xxxxx-9:   1:37AM  up 216 days,  9:13, 1 users, load averages: 5.99, 4.88, 5.12
xxxxx-10:  1:37AM  up 216 days,  9:13, 1 users, load averages: 12.52, 7.48, 6.28

# isi_for_array -n8 top
xxxxx-8: last pid: 75601;  load averages: 20.75, 19.19, 23.94  up 90+11:21:47    01:42:08
xxxxx-8: 135 processes: 5 running, 129 sleeping, 1 zombie
xxxxx-8:
xxxxx-8: Mem: 1310M Active, 69G Inact, 157G Wired, 96G Buf, 5078M Free
xxxxx-8: Swap:
xxxxx-8:
xxxxx-8:
xxxxx-8:   PID USERNAME       THR PRI NICE   SIZE    RES STATE   C   TIME    WCPU COMMAND
xxxxx-8: 73859 root             1 103    0   122M 10148K CPU19  19   6:00 100.00% isi_mca_dump
xxxxx-8: 74626 root             1 103    0   122M 10172K CPU26  26   3:01  98.97% isi_mca_dump
 

Cause

MCA (Machine Check Architecture) är en felrapporteringsmekanism för processorn och minnet. På grund av den felaktiga DIMM-modulen finns det en fördröjning i de data som skrivs till eller läses från den berörda noden. Den här fördröjningen kan orsaka serverdelsfördröjning och så småningom påverka den övergripande klusterprestandan. I värsta fall kan svarstiden leda till en situation där data inte är tillgängliga (DU).

Resolution

Byt ut den felaktiga DIMM-modulen.

Affected Products

Isilon

Products

Isilon, PowerScale OneFS
Article Properties
Article Number: 000069748
Article Type: Solution
Last Modified: 26 جمادى الآخرة 1447
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.