บทความนี้ให้ข้อมูลเกี่ยวกับวิธีการแก้ไขปัญหา "ตรวจพบปัญหาหน่วยความจํา/แบตเตอรี่" อะแด็ปเตอร์ได้กู้คืนแล้ว แต่ข้อมูลที่แคชหายไป กดปุ่มใดๆ เพื่อดําเนินการต่อ" ข้อผิดพลาดและข้อผิดพลาดอื่นๆ ที่เกี่ยวข้องกับหน่วยความจําที่อาจเกิดขึ้นบนคอนโทรลเลอร์ Dell PERC บนเซิร์ฟเวอร์ Dell PowerEdge
สารบัญ:
- ข้อความแสดงข้อผิดพลาดของตัวควบคุม RAID ระหว่างการติดประกาศ
- เงื่อนไขการแก้ไขปัญหาที่นําไปสู่ข้อความแสดงข้อผิดพลาด
- รีบูตเป็นระบบปฏิบัติการ
- ล้างแคชตัวควบคุม
- ตรวจสอบตัวควบคุม PERC ทางกายภาพ
- ข้อมูลเพิ่มเติม
- การบํารุงรักษาแบตเตอรี่ PERC
- การใช้แคช
1. ข้อความแสดงข้อผิดพลาดของตัวควบคุม RAID ระหว่างการติดประกาศ
ระหว่าง POST คอนโทรลเลอร์ RAID จะแสดงข้อความ:
ตรวจพบปัญหาหน่วยความจํา/แบตเตอรี่ อะแด็ปเตอร์ได้กู้คืนแล้ว แต่ข้อมูลแคชอาจสูญหาย กดแป้นใดๆ เพื่อดําเนินการต่อ
สําหรับข้อผิดพลาดที่ปรากฏบนหน้าจอ LCD หรือขณะเรียกใช้การวินิจฉัย ให้ดูบทความต่อไปนี้:
การตีความข้อความเหตุการณ์ LCD และการวินิจฉัยแบบฝังตัว (ePSA)
กลับไปที่ด้านบน
2. เงื่อนไขการแก้ไขปัญหาที่นําไปสู่ข้อความแสดงข้อผิดพลาด
ข้อความนี้สามารถเกิดขึ้นได้ตามปกติเมื่อมีเงื่อนไขใดเงื่อนไขหนึ่งต่อไปนี้เกิดขึ้น การแก้ไขปัญหาเหตุการณ์ที่เกี่ยวข้องอาจทําให้ข้อความนี้ไม่สามารถเกิดขึ้นได้
- ระบบปฏิบัติการระบุว่าการปิดเครื่องผิดปกติ
- ระบบปฏิบัติการระบุว่ามีข้อผิดพลาดเกิดขึ้น (หน้าจอสีน้ําเงินเกิดขึ้นใน Windows)
- สภาพการสูญเสียพลังงานที่เกิดขึ้นเอง
ขั้นตอนการแก้ไขปัญหาทั่วไป ได้แก่
1. รีบูตเป็นระบบปฏิบัติการ
หากการบูตระบบปฏิบัติการสําเร็จการรีบูตอีกครั้งไม่ควรส่งผลให้ไม่มีข้อความปรากฏขึ้น
2. ล้างแคชตัวควบคุม
- CTRL-M สําหรับคอนโทรลเลอร์ SCSI (PERC 3, PERC 4)
- CTRL-R สําหรับตัวควบคุม SAS/SATA (PERC 5, PERC 6 และคอนโทรลเลอร์รุ่นใหม่)
- รอห้านาทีเพื่ออนุญาตให้เนื้อหาของแคชถูกกําจัด
- รีบูตเครื่องกลับเป็น BIOS ของคอนโทรลเลอร์
หมายเหตุ: หากมีข้อผิดพลาดยังคงอยู่ โอกาสที่ข้อผิดพลาดของฮาร์ดแวร์จะเพิ่มขึ้น โปรดติดต่อฝ่ายสนับสนุนด้านเทคนิคสําหรับขั้นตอนการแก้ไขปัญหาเพิ่มเติม
- หากข้อผิดพลาดถูกตัดออกให้บูตไปที่ระบบปฏิบัติการ
- หากการบูตระบบปฏิบัติการยังไม่สําเร็จและ / หรือข้อผิดพลาดยังคงมีอยู่นี่อาจบ่งบอกถึงปัญหากับระบบปฏิบัติการ โปรดติดต่อฝ่ายสนับสนุนด้านเทคนิคสําหรับขั้นตอนการแก้ไขปัญหาเพิ่มเติมหากคุณมีการรับประกันที่ใช้งานอยู่
กลับไปที่ด้านบน
3. ตรวจสอบตัวควบคุม PERC ทางกายภาพ
- ตรวจสอบซ็อกเก็ต DIMM และ DIMM เพื่อหาความเสียหาย
- ปิดระบบและถอดสายไฟออกจากระบบ
- ปล่อยให้ระบบนั่งเป็นเวลา 30 วินาทีเพื่อให้พลังหมัดที่เหลืออยู่ระบายออก
- ถอดตัวควบคุม PERC ออก สําหรับข้อมูลเกี่ยวกับการลบและการเปลี่ยนชิ้นส่วนในระบบนี้ โปรดดูคู่มือผู้ใช้ที่อยู่ที่ Dell Support
- ถอดแบตเตอรี่หน่วยความจํา RAID ออก อย่าลืมติดตั้งแบตเตอรี่หน่วยความจําใหม่หลังจากใส่ DIMM
- ถอด DIMM หน่วยความจําออกจากคอนโทรลเลอร์ (ถ้ามี)
- ตรวจสอบซ็อกเก็ต DIMM สําหรับหมุดงอหรือความเสียหายอื่น ๆ ตรวจสอบขั้วต่อขอบของหน่วยความจํา DIMM เพื่อหาความเสียหายใด ๆ
- หากคอนโทรลเลอร์มีหน่วยความจําฝังตัวหรือซ็อกเก็ตหน่วยความจําเสียหาย PERC Controller จะต้องเปลี่ยนใหม่
- หากหน่วยความจําเสียหาย หน่วยความจําคอนโทรลเลอร์จําเป็นต้องเปลี่ยน
- หากไม่มีความเสียหาย ให้เปลี่ยนหน่วยความจํา DIMM และติดตั้งคอนโทรลเลอร์ใหม่
- สลับหน่วยความจําคอนโทรลเลอร์ด้วยหน่วยความจําที่ดีที่รู้จัก (ถ้าเป็นไปได้)
- ไม่มีหน่วยความจําที่ดีที่รู้จัก: ติดต่อฝ่ายสนับสนุน
- ข้อผิดพลาดไม่เกิดขึ้นกับหน่วยความจําที่ดีที่รู้จัก: แทนที่หน่วยความจํา
- ข้อผิดพลาดยังคงอยู่กับหน่วยความจําที่ดีที่รู้จัก: แทนที่คอนโทรลเลอร์ PERC
กลับไปที่ด้านบน
3. ข้อมูลเพิ่มเติม
ข้อความแสดงข้อผิดพลาดนี้แสดงระหว่าง POST ระบุว่าแคชของคอนโทรลเลอร์ไม่มีข้อมูลที่คาดไว้ทั้งหมด หรือมีข้อมูลที่ถูกกําหนดไว้สําหรับฮาร์ดไดรฟ์ที่ไม่สามารถหรือยังไม่ได้เขียนลงในไดรฟ์ สาเหตุที่พบบ่อยที่สุดที่ข้อผิดพลาดนี้อาจแสดงคือ:
- เซิร์ฟเวอร์ไม่ดําเนินการปิดเครื่องตามปกติ- การขัดข้องของพลังงานและ/หรือการรีสตาร์ทที่เกิดขึ้นเองอาจทําให้ข้อมูลไม่สมบูรณ์หรือเสียหายยังคงอยู่ในแคชที่ไม่สามารถเขียนลงในไดรฟ์ได้
- หน่วยความจําแคชชํารุด- หน่วยความจําแคชเสียอาจทําให้ข้อมูลเสียหายได้ สิ่งนี้อาจทําให้เกิดปัญหาที่เกี่ยวข้องกับระบบปฏิบัติการและการรีบูตที่เกิดขึ้นเอง
- การสูญเสียพลังงานแบตเตอรี่ในขณะที่เซิร์ฟเวอร์ปิดเครื่อง- คอนโทรลเลอร์ที่ไม่ได้ใช้หน่วยความจํา NVCACHE (Non-Volatile Cache) ใช้แบตเตอรี่ที่สามารถเก็บเนื้อหาของแคชได้ในเวลา จํากัด (24-72 ชั่วโมง) ในขณะที่เซิร์ฟเวอร์ไม่ได้เปิดอยู่ เมื่อแบตเตอรี่หมดเนื้อหาทั้งหมดของแคชจะหายไปและคอนโทรลเลอร์จะรับรู้ว่าหน่วยความจําแคชไม่มีข้อมูลทั้งหมดที่คาดไว้ คอนโทรลเลอร์ที่ใช้ NVCache (คอนโทรลเลอร์ H700/H800 บางตัวและคอนโทรลเลอร์รุ่นใหม่เช่น H710, H710P, H810) ไม่น่าจะพบปัญหานี้เนื่องจากแบตเตอรี่ต้องรักษาพลังงานไว้เพียง 30 วินาทีหรือน้อยกว่าในกรณีส่วนใหญ่
กลับไปที่ด้านบน
1. การบํารุงรักษาแบตเตอรี่ PERC
แบตเตอรี่ PERC ที่สงสัยว่าล้มเหลวหรือมีสัญลักษณ์คําเตือนแสดงในผู้ดูแลระบบเซิร์ฟเวอร์ OpenManage (OMSA) ควรมี วงจรการเรียนรู้ ด้วยตนเอง วงจรการเรียนรู้ทําให้แบตเตอรี่คายประจุและชาร์จใหม่และควรคืนค่าแบตเตอรี่ให้กลับสู่สภาพที่ทํางานได้อย่างสมบูรณ์ ในบางกรณี อาจต้องใช้ขั้นตอน Learn Cycle หลายขั้นตอนเพื่อคืนค่าแบตเตอรี่ให้กลับสู่สถานะที่ชาร์จได้อย่างมีประสิทธิภาพ เมื่อต้องการดําเนินการเรียนรู้รอบการเรียนรู้ด้วยตนเอง ให้เลือกเริ่มเรียนรู้วงจรจากเมนูดรอปดาวน์ งานแบตเตอรี่ ใน OMSA
รูปที่ 1: เมนูดรอปดาวน์งานแบตเตอรี่ OMSA
กลับไปที่ด้านบน
2. การใช้แคช
ตัวควบคุม RAID ของฮาร์ดแวร์ใช้แคช (ที่เก็บข้อมูลชั่วคราว) สําหรับการทํางานปกติ แคชการทํางานปกติประกอบด้วยหน่วยความจํา DRAM ซึ่งเหมือนกับหน่วยความจําระบบจะเก็บข้อมูลไว้ในขณะที่ขับเคลื่อน
เท่านั้น คอนโทรลเลอร์รุ่นใหม่ใช้ NVCache ซึ่งใช้เมื่อเซิร์ฟเวอร์ปิดเครื่อง หน่วยความจํา NVCache มีทั้งหน่วยความจํา DRAM (สําหรับการทํางานปกติ) และหน่วยความจําแฟลช (ไม่ระเหย) แบตเตอรี่คอนโทรลเลอร์ (ถ้าใช้งานได้) จะจ่ายไฟให้กับหน่วยความจํา DRAM ในระหว่างที่สูญเสียพลังงาน เพื่อให้สามารถคัดลอกเนื้อหาลงในหน่วยความจําแฟลชเพื่อการจัดเก็บที่ไม่มีกําหนด
เนื้อหาของแคชสามารถแบ่งออกเป็นสามส่วน:
- การกําหนดค่า RAID และข้อมูลเมตา- ข้อมูลเกี่ยวกับอาร์เรย์ RAID รวมถึงข้อมูลการกําหนดค่าสมาชิกดิสก์บทบาทของดิสก์ ฯลฯ
- บันทึกตัวควบคุม- ตัวควบคุม RAID จะเก็บแฟ้มบันทึกไว้หลายแฟ้ม ช่างเทคนิคของ Dell ใช้บันทึก TTY เป็นบันทึกหลักสําหรับการแก้ไขปัญหา RAID และฮาร์ดไดรฟ์ต่างๆ
- ข้อมูล RAID - นี่คือข้อมูลจริงที่ถูกกําหนดให้เขียนลงในฮาร์ดไดรฟ์แต่ละตัว ข้อมูลถูกเขียนลงในแคชของตัวควบคุมทั้งในโหมดนโยบายแคชแบบเขียนผ่านและเขียนกลับ
กลับไปที่ด้านบน