Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

如何处理PowerEdge服务器的虚拟磁盘上的穿孔(坏块)

Summary: 对带有 PERC 控制器的 PowerEdge 服务器中硬盘上的(穿孔)坏块进行故障排除的步骤。尤其是没有进行备份时,以下信息可能有助于将受影响的虚拟磁盘恢复到最优状态。

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Cause

Resolution

本文提供对带有 PERC 控制器的 PowerEdge 服务器中硬盘上的(穿孔)坏块进行故障排除的步骤。尤其是没有进行备份时,以下信息可能有助于将受影响的虚拟磁盘恢复到最优状态。



目录:

  1. 故障描述

  2. 原因是什么

  3. 解决问题的步骤

  4. 其他信息


 



1.故障描述

 

故障 1:


OpenManage Server Administrator (OMSA) 在虚拟磁盘前面显示红色叉号(图 1)。  

SLN111146_en_US__11343098652871.1
图 1:状态中显示红色叉号的虚拟磁盘(示例 H800)

SLN111146_en_US__2icon 提醒:Dell OpenManage Server Administrator (OMSA)提供完整的一对一系统管理解决方案。OMSA 可以分为两个应用程序:
集成式 — 基于网页浏览器的图形用户界面 (GUI)
命令行界面 (CLI) — 通过操作系统


 


故障 2:


Windows 系统日志中显示坏块错误(图 2)。  

SLN111146_en_US__31343098674763.2 
图 2:Windows 系统日志中显示的坏块错误
 


 


故障 3:


RAID 控制器日志 (TTYLOG) 显示如下错误:  

02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f

警告:控制器日志 (TTYLOG) 可能显示无任何错误。

在我们关于收集日志的文章中,查找有关接收这些特定日志的详细信息。
 



2.原因是什么:


RAID阵列并非不受数据错误的影响。  RAID控制器和硬盘固件包含检测并纠正多种类型的数据错误的功能,避免这些错误被写入阵列/驱动器。  使用过时的固件可能会导致不正确的数据写入阵列/驱动器,因为它缺少最新固件版本中提供的错误处理/纠错功能。
数据错误也可能由于物理坏块导致。  例如,当读/写磁头影响旋转盘片(称为“磁头崩溃”)时,可能会发生这种情况。  由于盘片在特定位置以磁性方式存储位的功能退化,块也可能随着时间的推移变坏。  由盘片退化导致的坏块通常可成功读取。  这种坏块只可能被间歇性地检测到,或使用驱动器上的扩展诊断程序检测到。  

坏块也称为坏逻辑块地址(LBA),它也可能由逻辑数据错误导致。  当数据被错误写入驱动器时,即使报告为成功写入,也会发生这种情况。  此外,存储在驱动器上的正常数据可能在无意中被更改。  例如“位翻转”,当读/写磁头通过或写入附近位置,导致以0和1形式显示的数据更改为其它值时,可能会发生位翻转。  这种情况可导致数据的“一致性”受损。  特定块上的数据的值与原始数据不同,可能不再与数据的校验和匹配。  物理 LBA 良好,可以成功写入,但当前包含不正确的数据,可能会被解释为坏块。

有关更多信息,请阅读我们关于 RAID 阵列中的双重故障和穿孔的文章。
 



3.解决问题的步骤:
 

SLN111146_en_US__2icon 提醒:虚拟磁盘上的当前数据已损坏,必须删除
  1. 文件级别上创建经过验证的数据备份
     

    • 基于块的备份会传承问题
    • 文件级备份可指出损坏的文件(这些文件应无法备份)
    • 如果已经存在穿孔条带,则不能 100% 保证留存所有数据
     

     

  2. 确保更换所有显示预测性故障的故障驱动器
     

  3. 删除并重新创建虚拟磁盘
     

    • 此步骤将会删除虚拟磁盘中的所有数据
    • 删除阵列
    • 根据需要重新创建阵列
     

     

  4. 执行虚拟磁盘的全面初始化
     

    • 确保不选择“Fast Initialization”(快速初始化)
    • 只有全面(等于慢速)初始化才能解决问题
     

     

  5. 在新创建的虚拟磁盘上执行检查一致性
     

    • 如果检查一致性完成且没有错误,则说明阵列现在运行正常,已去除穿孔
     

     

  6. 现在可以将数据还原到运行良好的虚拟磁盘
     

  7. 建议:将所有硬盘固件升级到最新版本
     



4.其他信息

OMSA 提供清除坏块警告的功能。要清除坏块,建议执行以下步骤:

  • 当选择了验证选项执行虚拟磁盘备份时,可能会出现两种情况:

    • 备份操作在一个或多个文件上失败。在这种情况下,从以前的备份还原文件。还原文件后,继续执行下一步。
    • 备份操作完成,没有错误。这表示虚拟磁盘的写入部分没有坏块。
    SLN111146_en_US__2icon 提醒:如果您仍然收到坏块警告,则说明坏块位于非数据区域。

     
  • 运行巡检读取(在 OMSA 中的虚拟磁盘任务下),然后检查系统事件日志,确保未找到新的坏块。如果仍然存在坏块,请继续下一步。如果没有坏块,则会清除该状况。

    SLN111146_en_US__2icon 提醒:必须先停用自动巡检读取,然后才能在 OMSA 中看到手动运行此操作的选项。

     
  • 要清除这些坏块,请执行清除虚拟磁盘坏块任务。可以在 OMSA GUI 中或使用 cli 命令完成此操作:
    omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id

    SLN111146_en_US__2icon 提醒:要获取控制器 ID 和虚拟磁盘 ID 的值,请键入 omreport storage controller 以显示控制器 ID,然后键入 omreport storage vdisk controller=ID 以显示虚拟磁盘的 ID

     

Article Properties


Affected Product

Servers

Last Published Date

01 Oct 2021

Version

3

Article Type

Solution