Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

วิธีแก้ปัญหาหน่วยความจําหรือแบตเตอรี่ผิดพลาดในคอนโทรลเลอร์ PERC บนเซิร์ฟเวอร์ Dell PowerEdge

Summary: ที่นี่คุณสามารถค้นหาข้อมูลโดยละเอียดเกี่ยวกับวิธีแก้ไขปัญหาหน่วยความจําและแบตเตอรี่ในตัวควบคุม PowerEdge RAID (PERC) ซึ่งใช้ในเซิร์ฟเวอร์ของ Dell

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

บทความนี้ให้ข้อมูลเกี่ยวกับวิธีการแก้ไขปัญหา "ตรวจพบปัญหาหน่วยความจํา/แบตเตอรี่" อะแด็ปเตอร์ได้กู้คืนแล้ว แต่ข้อมูลที่แคชหายไป กดปุ่มใดๆ เพื่อดําเนินการต่อ" ข้อผิดพลาดและข้อผิดพลาดอื่นๆ ที่เกี่ยวข้องกับหน่วยความจําที่อาจเกิดขึ้นบนคอนโทรลเลอร์ Dell PERC บนเซิร์ฟเวอร์ Dell PowerEdge
 

สารบัญ:

  1. ข้อความแสดงข้อผิดพลาดของตัวควบคุม RAID ระหว่างการติดประกาศ
  2. เงื่อนไขการแก้ไขปัญหาที่นําไปสู่ข้อความแสดงข้อผิดพลาด
    1. รีบูตเป็นระบบปฏิบัติการ
    2. ล้างแคชตัวควบคุม
    3. ตรวจสอบตัวควบคุม PERC ทางกายภาพ
  3. ข้อมูลเพิ่มเติม
    1. การบํารุงรักษาแบตเตอรี่ PERC
    2. การใช้แคช 
       

1. ข้อความแสดงข้อผิดพลาดของตัวควบคุม RAID ระหว่างการติดประกาศ

ระหว่าง POST คอนโทรลเลอร์ RAID จะแสดงข้อความ:

ตรวจพบปัญหาหน่วยความจํา/แบตเตอรี่ อะแด็ปเตอร์ได้กู้คืนแล้ว แต่ข้อมูลแคชอาจสูญหาย กดแป้นใดๆ เพื่อดําเนินการต่อ

สําหรับข้อผิดพลาดที่ปรากฏบนหน้าจอ LCD หรือขณะเรียกใช้การวินิจฉัย ให้ดูบทความต่อไปนี้:

การตีความข้อความเหตุการณ์ LCD และการวินิจฉัยแบบฝังตัว (ePSA) 

กลับไปที่ด้านบน
 


2. เงื่อนไขการแก้ไขปัญหาที่นําไปสู่ข้อความแสดงข้อผิดพลาด

ข้อความนี้สามารถเกิดขึ้นได้ตามปกติเมื่อมีเงื่อนไขใดเงื่อนไขหนึ่งต่อไปนี้เกิดขึ้น การแก้ไขปัญหาเหตุการณ์ที่เกี่ยวข้องอาจทําให้ข้อความนี้ไม่สามารถเกิดขึ้นได้

  • ระบบปฏิบัติการระบุว่าการปิดเครื่องผิดปกติ
  • ระบบปฏิบัติการระบุว่ามีข้อผิดพลาดเกิดขึ้น (หน้าจอสีน้ําเงินเกิดขึ้นใน Windows)
  • สภาพการสูญเสียพลังงานที่เกิดขึ้นเอง

ขั้นตอนการแก้ไขปัญหาทั่วไป ได้แก่
 

1. รีบูตเป็นระบบปฏิบัติการ

หากการบูตระบบปฏิบัติการสําเร็จการรีบูตอีกครั้งไม่ควรส่งผลให้ไม่มีข้อความปรากฏขึ้น

2. ล้างแคชตัวควบคุม

  1. CTRL-M สําหรับคอนโทรลเลอร์ SCSI (PERC 3, PERC 4)
  2. CTRL-R สําหรับตัวควบคุม SAS/SATA (PERC 5, PERC 6 และคอนโทรลเลอร์รุ่นใหม่)
  3. รอห้านาทีเพื่ออนุญาตให้เนื้อหาของแคชถูกกําจัด
  4. รีบูตเครื่องกลับเป็น BIOS ของคอนโทรลเลอร์
    หมายเหตุ: หากมีข้อผิดพลาดยังคงอยู่ โอกาสที่ข้อผิดพลาดของฮาร์ดแวร์จะเพิ่มขึ้น โปรดติดต่อฝ่ายสนับสนุนด้านเทคนิคสําหรับขั้นตอนการแก้ไขปัญหาเพิ่มเติม
  5. หากข้อผิดพลาดถูกตัดออกให้บูตไปที่ระบบปฏิบัติการ
  6. หากการบูตระบบปฏิบัติการยังไม่สําเร็จและ / หรือข้อผิดพลาดยังคงมีอยู่นี่อาจบ่งบอกถึงปัญหากับระบบปฏิบัติการ โปรดติดต่อฝ่ายสนับสนุนด้านเทคนิคสําหรับขั้นตอนการแก้ไขปัญหาเพิ่มเติมหากคุณมีการรับประกันที่ใช้งานอยู่

กลับไปที่ด้านบน
 

3. ตรวจสอบตัวควบคุม PERC ทางกายภาพ

 

  1. ตรวจสอบซ็อกเก็ต DIMM และ DIMM เพื่อหาความเสียหาย
    1. ปิดระบบและถอดสายไฟออกจากระบบ
    2. ปล่อยให้ระบบนั่งเป็นเวลา 30 วินาทีเพื่อให้พลังหมัดที่เหลืออยู่ระบายออก
    3. ถอดตัวควบคุม PERC ออก สําหรับข้อมูลเกี่ยวกับการลบและการเปลี่ยนชิ้นส่วนในระบบนี้ โปรดดูคู่มือผู้ใช้ที่อยู่ที่ Dell Support
    4. ถอดแบตเตอรี่หน่วยความจํา RAID ออก อย่าลืมติดตั้งแบตเตอรี่หน่วยความจําใหม่หลังจากใส่ DIMM
    5. ถอด DIMM หน่วยความจําออกจากคอนโทรลเลอร์ (ถ้ามี)
    6. ตรวจสอบซ็อกเก็ต DIMM สําหรับหมุดงอหรือความเสียหายอื่น ๆ ตรวจสอบขั้วต่อขอบของหน่วยความจํา DIMM เพื่อหาความเสียหายใด ๆ
  2. หากคอนโทรลเลอร์มีหน่วยความจําฝังตัวหรือซ็อกเก็ตหน่วยความจําเสียหาย PERC Controller จะต้องเปลี่ยนใหม่
  3. หากหน่วยความจําเสียหาย หน่วยความจําคอนโทรลเลอร์จําเป็นต้องเปลี่ยน
  4. หากไม่มีความเสียหาย ให้เปลี่ยนหน่วยความจํา DIMM และติดตั้งคอนโทรลเลอร์ใหม่
  5. สลับหน่วยความจําคอนโทรลเลอร์ด้วยหน่วยความจําที่ดีที่รู้จัก (ถ้าเป็นไปได้)
    1. ไม่มีหน่วยความจําที่ดีที่รู้จัก: ติดต่อฝ่ายสนับสนุน
    2. ข้อผิดพลาดไม่เกิดขึ้นกับหน่วยความจําที่ดีที่รู้จัก: แทนที่หน่วยความจํา
    3. ข้อผิดพลาดยังคงอยู่กับหน่วยความจําที่ดีที่รู้จัก: แทนที่คอนโทรลเลอร์ PERC
 

กลับไปที่ด้านบน



3. ข้อมูลเพิ่มเติม


ข้อความแสดงข้อผิดพลาดนี้แสดงระหว่าง POST ระบุว่าแคชของคอนโทรลเลอร์ไม่มีข้อมูลที่คาดไว้ทั้งหมด หรือมีข้อมูลที่ถูกกําหนดไว้สําหรับฮาร์ดไดรฟ์ที่ไม่สามารถหรือยังไม่ได้เขียนลงในไดรฟ์ สาเหตุที่พบบ่อยที่สุดที่ข้อผิดพลาดนี้อาจแสดงคือ:
 

  • เซิร์ฟเวอร์ไม่ดําเนินการปิดเครื่องตามปกติ- การขัดข้องของพลังงานและ/หรือการรีสตาร์ทที่เกิดขึ้นเองอาจทําให้ข้อมูลไม่สมบูรณ์หรือเสียหายยังคงอยู่ในแคชที่ไม่สามารถเขียนลงในไดรฟ์ได้
  • หน่วยความจําแคชชํารุด- หน่วยความจําแคชเสียอาจทําให้ข้อมูลเสียหายได้ สิ่งนี้อาจทําให้เกิดปัญหาที่เกี่ยวข้องกับระบบปฏิบัติการและการรีบูตที่เกิดขึ้นเอง
  • การสูญเสียพลังงานแบตเตอรี่ในขณะที่เซิร์ฟเวอร์ปิดเครื่อง- คอนโทรลเลอร์ที่ไม่ได้ใช้หน่วยความจํา NVCACHE (Non-Volatile Cache) ใช้แบตเตอรี่ที่สามารถเก็บเนื้อหาของแคชได้ในเวลา จํากัด (24-72 ชั่วโมง) ในขณะที่เซิร์ฟเวอร์ไม่ได้เปิดอยู่ เมื่อแบตเตอรี่หมดเนื้อหาทั้งหมดของแคชจะหายไปและคอนโทรลเลอร์จะรับรู้ว่าหน่วยความจําแคชไม่มีข้อมูลทั้งหมดที่คาดไว้ คอนโทรลเลอร์ที่ใช้ NVCache (คอนโทรลเลอร์ H700/H800 บางตัวและคอนโทรลเลอร์รุ่นใหม่เช่น H710, H710P, H810) ไม่น่าจะพบปัญหานี้เนื่องจากแบตเตอรี่ต้องรักษาพลังงานไว้เพียง 30 วินาทีหรือน้อยกว่าในกรณีส่วนใหญ่


กลับไปที่ด้านบน

1. การบํารุงรักษาแบตเตอรี่ PERC


แบตเตอรี่ PERC ที่สงสัยว่าล้มเหลวหรือมีสัญลักษณ์คําเตือนแสดงในผู้ดูแลระบบเซิร์ฟเวอร์ OpenManage (OMSA) ควรมี วงจรการเรียนรู้ ด้วยตนเอง  วงจรการเรียนรู้ทําให้แบตเตอรี่คายประจุและชาร์จใหม่และควรคืนค่าแบตเตอรี่ให้กลับสู่สภาพที่ทํางานได้อย่างสมบูรณ์ ในบางกรณี อาจต้องใช้ขั้นตอน Learn Cycle หลายขั้นตอนเพื่อคืนค่าแบตเตอรี่ให้กลับสู่สถานะที่ชาร์จได้อย่างมีประสิทธิภาพ เมื่อต้องการดําเนินการเรียนรู้รอบการเรียนรู้ด้วยตนเอง ให้เลือกเริ่มเรียนรู้วงจรจากเมนูดรอปดาวน์ งานแบตเตอรี่ ใน OMSA

SLN130018_en_US__1I_PERC_Battery_JM_V1
รูปที่ 1: เมนูดรอปดาวน์งานแบตเตอรี่ OMSA

กลับไปที่ด้านบน

2. การใช้แคช

ตัวควบคุม RAID ของฮาร์ดแวร์ใช้แคช (ที่เก็บข้อมูลชั่วคราว) สําหรับการทํางานปกติ แคชการทํางานปกติประกอบด้วยหน่วยความจํา DRAM ซึ่งเหมือนกับหน่วยความจําระบบจะเก็บข้อมูลไว้ในขณะที่ขับเคลื่อน

เท่านั้น คอนโทรลเลอร์รุ่นใหม่ใช้ NVCache ซึ่งใช้เมื่อเซิร์ฟเวอร์ปิดเครื่อง หน่วยความจํา NVCache มีทั้งหน่วยความจํา DRAM (สําหรับการทํางานปกติ) และหน่วยความจําแฟลช (ไม่ระเหย) แบตเตอรี่คอนโทรลเลอร์ (ถ้าใช้งานได้) จะจ่ายไฟให้กับหน่วยความจํา DRAM ในระหว่างที่สูญเสียพลังงาน เพื่อให้สามารถคัดลอกเนื้อหาลงในหน่วยความจําแฟลชเพื่อการจัดเก็บที่ไม่มีกําหนด
 

เนื้อหาของแคชสามารถแบ่งออกเป็นสามส่วน:
  1. การกําหนดค่า RAID และข้อมูลเมตา- ข้อมูลเกี่ยวกับอาร์เรย์ RAID รวมถึงข้อมูลการกําหนดค่าสมาชิกดิสก์บทบาทของดิสก์ ฯลฯ
  2. บันทึกตัวควบคุม- ตัวควบคุม RAID จะเก็บแฟ้มบันทึกไว้หลายแฟ้ม ช่างเทคนิคของ Dell ใช้บันทึก TTY เป็นบันทึกหลักสําหรับการแก้ไขปัญหา RAID และฮาร์ดไดรฟ์ต่างๆ
  3. ข้อมูล RAID - นี่คือข้อมูลจริงที่ถูกกําหนดให้เขียนลงในฮาร์ดไดรฟ์แต่ละตัว ข้อมูลถูกเขียนลงในแคชของตัวควบคุมทั้งในโหมดนโยบายแคชแบบเขียนผ่านและเขียนกลับ


กลับไปที่ด้านบน


Cause

-

Resolution

-

Article Properties


Affected Product

PowerEdge, OEMR R720xd

Last Published Date

25 Mar 2022

Version

6

Article Type

Solution