跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表
  • 使用“Company Administration”(公司管理),管理Dell EMC站点、产品和产品级联系人。

วิธีแก้ปัญหาหน่วยความจําหรือแบตเตอรี่ผิดพลาดในคอนโทรลเลอร์ PERC บนเซิร์ฟเวอร์ Dell PowerEdge

摘要: ที่นี่คุณสามารถค้นหาข้อมูลโดยละเอียดเกี่ยวกับวิธีแก้ไขปัญหาหน่วยความจําและแบตเตอรี่ในตัวควบคุม PowerEdge RAID (PERC) ซึ่งใช้ในเซิร์ฟเวอร์ของ Dell

本文可能已自动翻译。如果您对其质量有任何反馈,请使用此页面底部的表单告知我们。

文章内容


症状

บทความนี้ให้ข้อมูลเกี่ยวกับวิธีการแก้ไขปัญหา "ตรวจพบปัญหาหน่วยความจํา/แบตเตอรี่" อะแด็ปเตอร์ได้กู้คืนแล้ว แต่ข้อมูลที่แคชหายไป กดปุ่มใดๆ เพื่อดําเนินการต่อ" ข้อผิดพลาดและข้อผิดพลาดอื่นๆ ที่เกี่ยวข้องกับหน่วยความจําที่อาจเกิดขึ้นบนคอนโทรลเลอร์ Dell PERC บนเซิร์ฟเวอร์ Dell PowerEdge
 

สารบัญ:

  1. ข้อความแสดงข้อผิดพลาดของตัวควบคุม RAID ระหว่างการติดประกาศ
  2. เงื่อนไขการแก้ไขปัญหาที่นําไปสู่ข้อความแสดงข้อผิดพลาด
    1. รีบูตเป็นระบบปฏิบัติการ
    2. ล้างแคชตัวควบคุม
    3. ตรวจสอบตัวควบคุม PERC ทางกายภาพ
  3. ข้อมูลเพิ่มเติม
    1. การบํารุงรักษาแบตเตอรี่ PERC
    2. การใช้แคช 
       

1. ข้อความแสดงข้อผิดพลาดของตัวควบคุม RAID ระหว่างการติดประกาศ

ระหว่าง POST คอนโทรลเลอร์ RAID จะแสดงข้อความ:

ตรวจพบปัญหาหน่วยความจํา/แบตเตอรี่ อะแด็ปเตอร์ได้กู้คืนแล้ว แต่ข้อมูลแคชอาจสูญหาย กดแป้นใดๆ เพื่อดําเนินการต่อ

สําหรับข้อผิดพลาดที่ปรากฏบนหน้าจอ LCD หรือขณะเรียกใช้การวินิจฉัย ให้ดูบทความต่อไปนี้:

การตีความข้อความเหตุการณ์ LCD และการวินิจฉัยแบบฝังตัว (ePSA) 

กลับไปที่ด้านบน
 


2. เงื่อนไขการแก้ไขปัญหาที่นําไปสู่ข้อความแสดงข้อผิดพลาด

ข้อความนี้สามารถเกิดขึ้นได้ตามปกติเมื่อมีเงื่อนไขใดเงื่อนไขหนึ่งต่อไปนี้เกิดขึ้น การแก้ไขปัญหาเหตุการณ์ที่เกี่ยวข้องอาจทําให้ข้อความนี้ไม่สามารถเกิดขึ้นได้

  • ระบบปฏิบัติการระบุว่าการปิดเครื่องผิดปกติ
  • ระบบปฏิบัติการระบุว่ามีข้อผิดพลาดเกิดขึ้น (หน้าจอสีน้ําเงินเกิดขึ้นใน Windows)
  • สภาพการสูญเสียพลังงานที่เกิดขึ้นเอง

ขั้นตอนการแก้ไขปัญหาทั่วไป ได้แก่
 

1. รีบูตเป็นระบบปฏิบัติการ

หากการบูตระบบปฏิบัติการสําเร็จการรีบูตอีกครั้งไม่ควรส่งผลให้ไม่มีข้อความปรากฏขึ้น

2. ล้างแคชตัวควบคุม

  1. CTRL-M สําหรับคอนโทรลเลอร์ SCSI (PERC 3, PERC 4)
  2. CTRL-R สําหรับตัวควบคุม SAS/SATA (PERC 5, PERC 6 และคอนโทรลเลอร์รุ่นใหม่)
  3. รอห้านาทีเพื่ออนุญาตให้เนื้อหาของแคชถูกกําจัด
  4. รีบูตเครื่องกลับเป็น BIOS ของคอนโทรลเลอร์
    หมายเหตุ: หากมีข้อผิดพลาดยังคงอยู่ โอกาสที่ข้อผิดพลาดของฮาร์ดแวร์จะเพิ่มขึ้น โปรดติดต่อฝ่ายสนับสนุนด้านเทคนิคสําหรับขั้นตอนการแก้ไขปัญหาเพิ่มเติม
  5. หากข้อผิดพลาดถูกตัดออกให้บูตไปที่ระบบปฏิบัติการ
  6. หากการบูตระบบปฏิบัติการยังไม่สําเร็จและ / หรือข้อผิดพลาดยังคงมีอยู่นี่อาจบ่งบอกถึงปัญหากับระบบปฏิบัติการ โปรดติดต่อฝ่ายสนับสนุนด้านเทคนิคสําหรับขั้นตอนการแก้ไขปัญหาเพิ่มเติมหากคุณมีการรับประกันที่ใช้งานอยู่

กลับไปที่ด้านบน
 

3. ตรวจสอบตัวควบคุม PERC ทางกายภาพ

 

  1. ตรวจสอบซ็อกเก็ต DIMM และ DIMM เพื่อหาความเสียหาย
    1. ปิดระบบและถอดสายไฟออกจากระบบ
    2. ปล่อยให้ระบบนั่งเป็นเวลา 30 วินาทีเพื่อให้พลังหมัดที่เหลืออยู่ระบายออก
    3. ถอดตัวควบคุม PERC ออก สําหรับข้อมูลเกี่ยวกับการลบและการเปลี่ยนชิ้นส่วนในระบบนี้ โปรดดูคู่มือผู้ใช้ที่อยู่ที่ Dell Support
    4. ถอดแบตเตอรี่หน่วยความจํา RAID ออก อย่าลืมติดตั้งแบตเตอรี่หน่วยความจําใหม่หลังจากใส่ DIMM
    5. ถอด DIMM หน่วยความจําออกจากคอนโทรลเลอร์ (ถ้ามี)
    6. ตรวจสอบซ็อกเก็ต DIMM สําหรับหมุดงอหรือความเสียหายอื่น ๆ ตรวจสอบขั้วต่อขอบของหน่วยความจํา DIMM เพื่อหาความเสียหายใด ๆ
  2. หากคอนโทรลเลอร์มีหน่วยความจําฝังตัวหรือซ็อกเก็ตหน่วยความจําเสียหาย PERC Controller จะต้องเปลี่ยนใหม่
  3. หากหน่วยความจําเสียหาย หน่วยความจําคอนโทรลเลอร์จําเป็นต้องเปลี่ยน
  4. หากไม่มีความเสียหาย ให้เปลี่ยนหน่วยความจํา DIMM และติดตั้งคอนโทรลเลอร์ใหม่
  5. สลับหน่วยความจําคอนโทรลเลอร์ด้วยหน่วยความจําที่ดีที่รู้จัก (ถ้าเป็นไปได้)
    1. ไม่มีหน่วยความจําที่ดีที่รู้จัก: ติดต่อฝ่ายสนับสนุน
    2. ข้อผิดพลาดไม่เกิดขึ้นกับหน่วยความจําที่ดีที่รู้จัก: แทนที่หน่วยความจํา
    3. ข้อผิดพลาดยังคงอยู่กับหน่วยความจําที่ดีที่รู้จัก: แทนที่คอนโทรลเลอร์ PERC
 

กลับไปที่ด้านบน



3. ข้อมูลเพิ่มเติม


ข้อความแสดงข้อผิดพลาดนี้แสดงระหว่าง POST ระบุว่าแคชของคอนโทรลเลอร์ไม่มีข้อมูลที่คาดไว้ทั้งหมด หรือมีข้อมูลที่ถูกกําหนดไว้สําหรับฮาร์ดไดรฟ์ที่ไม่สามารถหรือยังไม่ได้เขียนลงในไดรฟ์ สาเหตุที่พบบ่อยที่สุดที่ข้อผิดพลาดนี้อาจแสดงคือ:
 

  • เซิร์ฟเวอร์ไม่ดําเนินการปิดเครื่องตามปกติ- การขัดข้องของพลังงานและ/หรือการรีสตาร์ทที่เกิดขึ้นเองอาจทําให้ข้อมูลไม่สมบูรณ์หรือเสียหายยังคงอยู่ในแคชที่ไม่สามารถเขียนลงในไดรฟ์ได้
  • หน่วยความจําแคชชํารุด- หน่วยความจําแคชเสียอาจทําให้ข้อมูลเสียหายได้ สิ่งนี้อาจทําให้เกิดปัญหาที่เกี่ยวข้องกับระบบปฏิบัติการและการรีบูตที่เกิดขึ้นเอง
  • การสูญเสียพลังงานแบตเตอรี่ในขณะที่เซิร์ฟเวอร์ปิดเครื่อง- คอนโทรลเลอร์ที่ไม่ได้ใช้หน่วยความจํา NVCACHE (Non-Volatile Cache) ใช้แบตเตอรี่ที่สามารถเก็บเนื้อหาของแคชได้ในเวลา จํากัด (24-72 ชั่วโมง) ในขณะที่เซิร์ฟเวอร์ไม่ได้เปิดอยู่ เมื่อแบตเตอรี่หมดเนื้อหาทั้งหมดของแคชจะหายไปและคอนโทรลเลอร์จะรับรู้ว่าหน่วยความจําแคชไม่มีข้อมูลทั้งหมดที่คาดไว้ คอนโทรลเลอร์ที่ใช้ NVCache (คอนโทรลเลอร์ H700/H800 บางตัวและคอนโทรลเลอร์รุ่นใหม่เช่น H710, H710P, H810) ไม่น่าจะพบปัญหานี้เนื่องจากแบตเตอรี่ต้องรักษาพลังงานไว้เพียง 30 วินาทีหรือน้อยกว่าในกรณีส่วนใหญ่


กลับไปที่ด้านบน

1. การบํารุงรักษาแบตเตอรี่ PERC


แบตเตอรี่ PERC ที่สงสัยว่าล้มเหลวหรือมีสัญลักษณ์คําเตือนแสดงในผู้ดูแลระบบเซิร์ฟเวอร์ OpenManage (OMSA) ควรมี วงจรการเรียนรู้ ด้วยตนเอง  วงจรการเรียนรู้ทําให้แบตเตอรี่คายประจุและชาร์จใหม่และควรคืนค่าแบตเตอรี่ให้กลับสู่สภาพที่ทํางานได้อย่างสมบูรณ์ ในบางกรณี อาจต้องใช้ขั้นตอน Learn Cycle หลายขั้นตอนเพื่อคืนค่าแบตเตอรี่ให้กลับสู่สถานะที่ชาร์จได้อย่างมีประสิทธิภาพ เมื่อต้องการดําเนินการเรียนรู้รอบการเรียนรู้ด้วยตนเอง ให้เลือกเริ่มเรียนรู้วงจรจากเมนูดรอปดาวน์ งานแบตเตอรี่ ใน OMSA

SLN130018_en_US__1I_PERC_Battery_JM_V1
รูปที่ 1: เมนูดรอปดาวน์งานแบตเตอรี่ OMSA

กลับไปที่ด้านบน

2. การใช้แคช

ตัวควบคุม RAID ของฮาร์ดแวร์ใช้แคช (ที่เก็บข้อมูลชั่วคราว) สําหรับการทํางานปกติ แคชการทํางานปกติประกอบด้วยหน่วยความจํา DRAM ซึ่งเหมือนกับหน่วยความจําระบบจะเก็บข้อมูลไว้ในขณะที่ขับเคลื่อน

เท่านั้น คอนโทรลเลอร์รุ่นใหม่ใช้ NVCache ซึ่งใช้เมื่อเซิร์ฟเวอร์ปิดเครื่อง หน่วยความจํา NVCache มีทั้งหน่วยความจํา DRAM (สําหรับการทํางานปกติ) และหน่วยความจําแฟลช (ไม่ระเหย) แบตเตอรี่คอนโทรลเลอร์ (ถ้าใช้งานได้) จะจ่ายไฟให้กับหน่วยความจํา DRAM ในระหว่างที่สูญเสียพลังงาน เพื่อให้สามารถคัดลอกเนื้อหาลงในหน่วยความจําแฟลชเพื่อการจัดเก็บที่ไม่มีกําหนด
 

เนื้อหาของแคชสามารถแบ่งออกเป็นสามส่วน:
  1. การกําหนดค่า RAID และข้อมูลเมตา- ข้อมูลเกี่ยวกับอาร์เรย์ RAID รวมถึงข้อมูลการกําหนดค่าสมาชิกดิสก์บทบาทของดิสก์ ฯลฯ
  2. บันทึกตัวควบคุม- ตัวควบคุม RAID จะเก็บแฟ้มบันทึกไว้หลายแฟ้ม ช่างเทคนิคของ Dell ใช้บันทึก TTY เป็นบันทึกหลักสําหรับการแก้ไขปัญหา RAID และฮาร์ดไดรฟ์ต่างๆ
  3. ข้อมูล RAID - นี่คือข้อมูลจริงที่ถูกกําหนดให้เขียนลงในฮาร์ดไดรฟ์แต่ละตัว ข้อมูลถูกเขียนลงในแคชของตัวควบคุมทั้งในโหมดนโยบายแคชแบบเขียนผ่านและเขียนกลับ


กลับไปที่ด้านบน


原因

-

解决方案

-

文章属性


受影响的产品

PowerEdge, OEMR R720xd

上次发布日期

25 3月 2022

版本

6

文章类型

Solution