Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

วิธีจัดการกับการเจาะ (บล็อกเสีย) บนดิสก์เสมือนสําหรับเซิร์ฟเวอร์ PowerEdge

Summary: ขั้นตอนการแก้ไขปัญหาสําหรับ (เจาะ) บล็อกเสียบน HDD ในเซิร์ฟเวอร์ PowerEdge ที่มีตัวควบคุม PERC โดยเฉพาะอย่างยิ่งเมื่อไม่สามารถทําการสํารองข้อมูลได้ข้อมูลต่อไปนี้อาจช่วยให้ไดรฟ์เสมือนที่ได้รับผลกระทบกลับสู่สถานะที่เหมาะสม ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

-

Cause

-

Resolution

บทความนี้มีขั้นตอนการแก้ไขปัญหาสําหรับ (เจาะ) บล็อกเสียบน HDD ในเซิร์ฟเวอร์ PowerEdge ที่มีตัวควบคุม PERC โดยเฉพาะอย่างยิ่งเมื่อไม่สามารถทําการสํารองข้อมูลได้ข้อมูลต่อไปนี้อาจช่วยให้ไดรฟ์เสมือนที่ได้รับผลกระทบกลับสู่สถานะที่เหมาะสม



สารบัญ:

  1. คําอธิบายข้อบกพร่อง

  2. สาเหตุคืออะไร

  3. ขั้นตอนในการแก้ปัญหา

  4. ข้อมูลเพิ่มเติม


 



1. คําอธิบายข้อบกพร่อง

 

ข้อบกพร่องหมายเลข 1:


ผู้ดูแลระบบเซิร์ฟเวอร์ OpenManage (OMSA) แสดง กากบาทสีแดง ที่ด้านหน้าดิสก์เสมือน (รูปที่ 1)  

SLN111146_en_US__11343098652871.1
รูปที่ 1: ดิสก์เสมือนที่มีกากบาทสีแดงในสถานะ (ตัวอย่าง H800)

SLN111146_en_US__2icon หมายเหตุ: ผู้ดูแลระบบเซิร์ฟเวอร์ Dell OpenManage (OMSA) นําเสนอโซลูชันการจัดการระบบแบบตัวต่อตัวที่สมบูรณ์ OMSA สามารถแบ่งออกเป็นสองแอปพลิเคชัน:
- รวม - ส่วนติดต่อผู้ใช้แบบกราฟิกบนเว็บเบราว์เซอร์ (GUI)
- ส่วนติดต่อบรรทัดคําสั่ง (CLI) - ผ่านระบบปฏิบัติการ


 


ข้อบกพร่องหมายเลข 2:


บันทึกของระบบ Windows แสดงข้อผิดพลาด ในบล็อกที่ไม่ถูกต้อง (รูปที่ 2)  

SLN111146_en_US__31343098674763.2 
รูปที่ 2: ข้อผิดพลาดบล็อกไม่ถูกต้องในบันทึกของระบบ Windows ที่แสดง
 


 


ข้อบกพร่องหมายเลข 3:


บันทึกตัวควบคุม RAID (TTYLOG) แสดงข้อผิดพลาด เช่น  

02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f

คำเตือน: บันทึกตัวควบคุม (TTYLOG) อาจไม่แสดงข้อผิดพลาดใดๆ

ค้นหาข้อมูลเพิ่มเติมเกี่ยวกับการรับบันทึกเฉพาะเหล่านี้ในบทความของเรา เกี่ยวกับการรวบรวมบันทึก.
 



2. สาเหตุคืออะไร:


อาร์เรย์ RAID ไม่มีภูมิคุ้มกันต่อข้อผิดพลาดของข้อมูล  คอนโทรลเลอร์ RAID และเฟิร์มแวร์ของฮาร์ดไดรฟ์มีฟังก์ชันในการตรวจสอบและแก้ไขข้อผิดพลาดของข้อมูลหลายชนิดก่อนที่จะเขียนไปยังอาร์เรย์/ไดรฟ์  การใช้เฟิร์มแวร์ที่ล้าสมัยอาจส่งผลให้มีการเขียนข้อมูลที่ไม่ถูกต้องไปยังอาร์เรย์/ไดรฟ์ เนื่องจากไม่มีคุณสมบัติการจัดการข้อผิดพลาด/การแก้ไขข้อผิดพลาดที่มีอยู่ในเฟิร์มแวร์รุ่น
ล่าสุด ข้อผิดพลาดของข้อมูลอาจเกิดจากบล็อกที่ไม่ดีทางกายภาพ  ตัวอย่างเช่นสิ่งนี้สามารถเกิดขึ้นได้เมื่อหัวอ่าน / เขียนส่งผลกระทบต่อจานหมุน (ที่เรียกว่า "ความผิดพลาดของหัว")  บล็อกอาจกลายเป็นไม่ดีเมื่อเวลาผ่านไปเนื่องจากการเสื่อมสภาพของความสามารถของจานในการจัดเก็บบิตแม่เหล็กในสถานที่เฉพาะ  บล็อกที่ไม่ดีที่เกิดจากการย่อยสลายของจานมักจะสามารถอ่านได้สําเร็จ  บล็อกที่ไม่ดีดังกล่าวอาจตรวจพบเป็นระยะ ๆ หรือมีการวินิจฉัยเพิ่มเติมในไดรฟ์เท่านั้น  

บล็อกที่ไม่ดีหรือที่เรียกว่าที่อยู่บล็อกตรรกะ (LBA) ที่ไม่ดีอาจเกิดจากข้อผิดพลาดของข้อมูลทางตรรกะ  เหตุการณ์นี้เกิดขึ้นเมื่อข้อมูลถูกเขียนลงในไดรฟ์อย่างไม่ถูกต้องแม้ว่าจะมีการรายงานว่าเป็นการเขียนที่สําเร็จแล้วก็ตาม  นอกจากนี้ ข้อมูลที่ดีที่เก็บอยู่บนไดรฟ์สามารถเปลี่ยนแปลงได้โดยไม่ได้ตั้งใจ  ตัวอย่างหนึ่งคือ "บิตพลิก" ซึ่งสามารถเกิดขึ้นได้เมื่อหัวอ่าน / เขียนผ่านหรือเขียนไปยังตําแหน่งใกล้เคียงและทําให้ข้อมูลในรูปแบบของศูนย์และคนเพื่อเปลี่ยนเป็นค่าอื่น  เงื่อนไขดังกล่าวทําให้ "ความสอดคล้อง" ของข้อมูลเสียหาย  ค่าของข้อมูลในบล็อกที่ระบุจะแตกต่างจากข้อมูลเดิมและอาจไม่ตรงกับ checksum ของข้อมูลอีกต่อไป  LBA ทางกายภาพเป็นสิ่งที่ดีและสามารถเขียนเพื่อประสบความสําเร็จ แต่ขณะนี้มีข้อมูลที่ไม่ถูกต้องและอาจถูกตีความว่าเป็นบล็อกที่ไม่ดี

สําหรับข้อมูลเพิ่มเติมอ่านบทความของเราเกี่ยวกับความผิดพลาดสองครั้งและการเจาะใน อาร์เรย์ RAID.
 



3. ขั้นตอนในการแก้ปัญหา:
 

SLN111146_en_US__2icon หมายเหตุ: ข้อมูลปัจจุบันบนดิสก์เสมือนเสียหายและจะต้องถูกลบ
  1. การสร้างการสํารองข้อมูลที่ตรวจสอบความถูกต้องในระดับไฟล์
     

    • การสํารองข้อมูลแบบบล็อกจะถ่ายโอนปัญหา
    • การสํารองข้อมูลระดับแฟ้มระบุว่าแฟ้มเสียหาย (แฟ้มเหล่านี้อาจไม่สามารถสํารองข้อมูลได้)
    • ไม่เคยมีการรับประกัน 100% สําหรับการเก็บรักษาข้อมูลทั้งหมดหากมีแถบเจาะอยู่แล้ว
     

     

  2. ตรวจสอบให้แน่ใจว่าไดรฟ์ที่ล้มเหลวทั้งหมดที่แสดงความล้มเหลวในการคาดคะเนถูกแทนที่
     

  3. ลบและสร้างดิสก์เสมือนใหม่
     

    • ขั้นตอนนี้จะลบข้อมูลทั้งหมดออกจาก VD
    • ลบแถวลําดับ
    • สร้างอาร์เรย์ใหม่ตามต้องการ
     

     

  4. ดําเนินการเตรียมใช้งาน VD แบบเต็ม
     

    • ตรวจสอบให้แน่ใจว่าไม่ได้เลือกการเตรียมใช้งานอย่างรวดเร็ว
    • มีเพียง Initalisation แบบเต็ม (= ช้า) เท่านั้นที่แก้ไขปัญหาได้
     

     

  5. ดําเนินการตรวจสอบความสอดคล้องกันของ VD ที่สร้างขึ้นใหม่
     

    • หากความสอดคล้องของการตรวจสอบเสร็จสมบูรณ์โดยไม่มีข้อผิดพลาดอาร์เรย์จะมีสุขภาพดีและการเจาะจะถูกลบออก
     

     

  6. ตอนนี้ข้อมูลสามารถกู้คืนไปยัง VD ที่มีสุขภาพดีได้แล้ว
     

  7. ข้อแนะนํา: ปรับรุ่นเฟิร์มแวร์ของฮาร์ดดิสก์ทั้งหมดให้เป็นรุ่นล่าสุด
     



4. ข้อมูลเพิ่มเติม

OMSA ให้ความสามารถในการล้างคําเตือนบล็อกที่ไม่ดี เมื่อต้องการล้างบล็อกที่ไม่ถูกต้อง

  • เมื่อทําการสํารองข้อมูลของดิสก์เสมือนโดยเลือกตัวเลือกตรวจสอบ

    • การสํารองข้อมูลล้มเหลวในแฟ้มอย่างน้อยหนึ่งแฟ้ม ในกรณีนี้ ให้คืนค่าแฟ้มจากสําเนาสํารองก่อนหน้า หลังจากคืนค่าแฟ้มแล้ว ให้ดําเนินการขั้นตอนถัดไป
    • การสํารองข้อมูลเสร็จสมบูรณ์โดยไม่มีข้อผิดพลาด ซึ่งแสดงว่าไม่มีบล็อกที่แย่ในส่วนที่เขียนของดิสก์เสมือนของคุณ
    SLN111146_en_US__2icon หมายเหตุ: หากคุณยังคงได้รับคําเตือนบล็อกที่ไม่ถูกต้องบล็อกที่ไม่ดีจะอยู่ในพื้นที่ที่ไม่ใช่ข้อมูล

     
  • เรียกใช้การอ่านผ่านสายตรวจ (ภายใต้งานดิสก์เสมือนใน OMSA) และตรวจสอบบันทึกเหตุการณ์ของระบบเพื่อให้แน่ใจว่าไม่พบบล็อกที่ไม่ถูกต้องใหม่ ถ้ายังมีบล็อกที่ไม่ถูกต้องอยู่ ให้ดําเนินการขั้นตอนต่อไป ถ้าไม่เงื่อนไขจะถูกล้าง

    SLN111146_en_US__2icon หมายเหตุ: ต้องปิดใช้งานการอ่านการตระเวนอัตโนมัติก่อนที่ตัวเลือกของการเรียกใช้การกระทํานี้ด้วยตนเองจะปรากฏใน OMSA

     
  • เมื่อต้องการล้างบล็อกที่ไม่ดีเหล่านี้ ให้ดําเนินการล้างบล็อกดิสก์เสมือนที่ไม่สามารถบล็อกได้ สามารถทําได้ใน OMSA GUI หรือใช้คําสั่ง cli:
    omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id

    SLN111146_en_US__2icon หมายเหตุ: เมื่อต้องการรับค่าสําหรับ ID ตัวควบคุมและรหัสดิสก์เสมือน ให้พิมพ์ omreport storage controller เพื่อแสดงรหัสตัวควบคุม แล้วพิมพ์ omreport storage vdisk controller=ID เพื่อแสดงรหัสสําหรับดิสก์เสมือน

     

Article Properties


Affected Product

Servers

Last Published Date

01 Oct 2021

Version

3

Article Type

Solution