บทความนี้มีขั้นตอนการแก้ไขปัญหาสําหรับ (เจาะ) บล็อกเสียบน HDD ในเซิร์ฟเวอร์ PowerEdge ที่มีตัวควบคุม PERC โดยเฉพาะอย่างยิ่งเมื่อไม่สามารถทําการสํารองข้อมูลได้ข้อมูลต่อไปนี้อาจช่วยให้ไดรฟ์เสมือนที่ได้รับผลกระทบกลับสู่สถานะที่เหมาะสม
ผู้ดูแลระบบเซิร์ฟเวอร์ OpenManage (OMSA) แสดง กากบาทสีแดง ที่ด้านหน้าดิสก์เสมือน (รูปที่ 1)
รูปที่ 1: ดิสก์เสมือนที่มีกากบาทสีแดงในสถานะ (ตัวอย่าง H800)
บันทึกของระบบ Windows แสดงข้อผิดพลาด ในบล็อกที่ไม่ถูกต้อง (รูปที่ 2)
รูปที่ 2: ข้อผิดพลาดบล็อกไม่ถูกต้องในบันทึกของระบบ Windows ที่แสดง
บันทึกตัวควบคุม RAID (TTYLOG) แสดงข้อผิดพลาด เช่น
02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f
ค้นหาข้อมูลเพิ่มเติมเกี่ยวกับการรับบันทึกเฉพาะเหล่านี้ในบทความของเรา เกี่ยวกับการรวบรวมบันทึก.
อาร์เรย์ RAID ไม่มีภูมิคุ้มกันต่อข้อผิดพลาดของข้อมูล คอนโทรลเลอร์ RAID และเฟิร์มแวร์ของฮาร์ดไดรฟ์มีฟังก์ชันในการตรวจสอบและแก้ไขข้อผิดพลาดของข้อมูลหลายชนิดก่อนที่จะเขียนไปยังอาร์เรย์/ไดรฟ์ การใช้เฟิร์มแวร์ที่ล้าสมัยอาจส่งผลให้มีการเขียนข้อมูลที่ไม่ถูกต้องไปยังอาร์เรย์/ไดรฟ์ เนื่องจากไม่มีคุณสมบัติการจัดการข้อผิดพลาด/การแก้ไขข้อผิดพลาดที่มีอยู่ในเฟิร์มแวร์รุ่น
ล่าสุด ข้อผิดพลาดของข้อมูลอาจเกิดจากบล็อกที่ไม่ดีทางกายภาพ ตัวอย่างเช่นสิ่งนี้สามารถเกิดขึ้นได้เมื่อหัวอ่าน / เขียนส่งผลกระทบต่อจานหมุน (ที่เรียกว่า "ความผิดพลาดของหัว") บล็อกอาจกลายเป็นไม่ดีเมื่อเวลาผ่านไปเนื่องจากการเสื่อมสภาพของความสามารถของจานในการจัดเก็บบิตแม่เหล็กในสถานที่เฉพาะ บล็อกที่ไม่ดีที่เกิดจากการย่อยสลายของจานมักจะสามารถอ่านได้สําเร็จ บล็อกที่ไม่ดีดังกล่าวอาจตรวจพบเป็นระยะ ๆ หรือมีการวินิจฉัยเพิ่มเติมในไดรฟ์เท่านั้น
บล็อกที่ไม่ดีหรือที่เรียกว่าที่อยู่บล็อกตรรกะ (LBA) ที่ไม่ดีอาจเกิดจากข้อผิดพลาดของข้อมูลทางตรรกะ เหตุการณ์นี้เกิดขึ้นเมื่อข้อมูลถูกเขียนลงในไดรฟ์อย่างไม่ถูกต้องแม้ว่าจะมีการรายงานว่าเป็นการเขียนที่สําเร็จแล้วก็ตาม นอกจากนี้ ข้อมูลที่ดีที่เก็บอยู่บนไดรฟ์สามารถเปลี่ยนแปลงได้โดยไม่ได้ตั้งใจ ตัวอย่างหนึ่งคือ "บิตพลิก" ซึ่งสามารถเกิดขึ้นได้เมื่อหัวอ่าน / เขียนผ่านหรือเขียนไปยังตําแหน่งใกล้เคียงและทําให้ข้อมูลในรูปแบบของศูนย์และคนเพื่อเปลี่ยนเป็นค่าอื่น เงื่อนไขดังกล่าวทําให้ "ความสอดคล้อง" ของข้อมูลเสียหาย ค่าของข้อมูลในบล็อกที่ระบุจะแตกต่างจากข้อมูลเดิมและอาจไม่ตรงกับ checksum ของข้อมูลอีกต่อไป LBA ทางกายภาพเป็นสิ่งที่ดีและสามารถเขียนเพื่อประสบความสําเร็จ แต่ขณะนี้มีข้อมูลที่ไม่ถูกต้องและอาจถูกตีความว่าเป็นบล็อกที่ไม่ดี
สําหรับข้อมูลเพิ่มเติมอ่านบทความของเราเกี่ยวกับความผิดพลาดสองครั้งและการเจาะใน อาร์เรย์ RAID.
การสร้างการสํารองข้อมูลที่ตรวจสอบความถูกต้องในระดับไฟล์
ตรวจสอบให้แน่ใจว่าไดรฟ์ที่ล้มเหลวทั้งหมดที่แสดงความล้มเหลวในการคาดคะเนถูกแทนที่
ลบและสร้างดิสก์เสมือนใหม่
ดําเนินการเตรียมใช้งาน VD แบบเต็ม
ดําเนินการตรวจสอบความสอดคล้องกันของ VD ที่สร้างขึ้นใหม่
ตอนนี้ข้อมูลสามารถกู้คืนไปยัง VD ที่มีสุขภาพดีได้แล้ว
ข้อแนะนํา: ปรับรุ่นเฟิร์มแวร์ของฮาร์ดดิสก์ทั้งหมดให้เป็นรุ่นล่าสุด
OMSA ให้ความสามารถในการล้างคําเตือนบล็อกที่ไม่ดี เมื่อต้องการล้างบล็อกที่ไม่ถูกต้อง
เมื่อทําการสํารองข้อมูลของดิสก์เสมือนโดยเลือกตัวเลือกตรวจสอบ
เรียกใช้การอ่านผ่านสายตรวจ (ภายใต้งานดิสก์เสมือนใน OMSA) และตรวจสอบบันทึกเหตุการณ์ของระบบเพื่อให้แน่ใจว่าไม่พบบล็อกที่ไม่ถูกต้องใหม่ ถ้ายังมีบล็อกที่ไม่ถูกต้องอยู่ ให้ดําเนินการขั้นตอนต่อไป ถ้าไม่เงื่อนไขจะถูกล้าง
เมื่อต้องการล้างบล็อกที่ไม่ดีเหล่านี้ ให้ดําเนินการล้างบล็อกดิสก์เสมือนที่ไม่สามารถบล็อกได้ สามารถทําได้ใน OMSA GUI หรือใช้คําสั่ง cli:
omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id
omreport storage controller
เพื่อแสดงรหัสตัวควบคุม แล้วพิมพ์ omreport storage vdisk controller=ID
เพื่อแสดงรหัสสําหรับดิสก์เสมือน