Powerflex 后台扫描程序 — 常见问题和解答
Riepilogo: 对于后台扫描程序,用户有很多与行为和设置相关的问题。 本文档旨在回答这些问题。
Questo articolo si applica a
Questo articolo non si applica a
Questo articolo non è legato a un prodotto specifico.
Non tutte le versioni del prodotto sono identificate in questo articolo.
Istruzioni
1) 创建存储池后需要多长时间才能启动?
2) 后台扫描程序在完成一次完整扫描后需要多长时间才能重新启动? 《了解 Dell Technologies PowerFlex v3.5.x》指南的“其他功能”中提到,“一次扫描完成后,该过程会再次启动,从而持续保护您的系统。”这是如何实现的?
3) 是否可以随时为给定存储池启用/禁用后台扫描程序?
4) 可以暂时禁用后台扫描程序吗?
5) 是否默认启用?
6a.) 如何通过命令行检查扫描程序是否在运行?
c.) 扫描结果是否反映在任何特定日志中?
7) 有多少种扫描程序模式,如何检查存储池运行的模式是什么?
8) 这是否意味着扫描程序一直在运行,两个周期之间没有任何间隔?
9) 对于“仅设备模式”,提到扫描程序使用设备的内部校验和机制来验证主数据和辅助数据,请问内部校验和机制是如何运作的?如果某一个设备出现故障,扫描程序如何知道哪个设备(主要和辅助)是故障设备?还提到,扫描程序会尝试使用正常设备中的数据来修复故障设备。我认为这是基于故障错误的,因为它提到如果读取故障区域,但这个错误的机制是什么?
此外,在“仅设备模式”中,提到如果两个设备上的读取都失败,扫描程序会跳到下一个存储块。您能否解释这意味着什么,以及如果数据恢复完成,下一个存储块如何协助数据恢复?
10) “数据比较模式”提到扫描程序会计算和比较它们的校验和,您能否解释这种比较是如何进行的?扫描程序如何知道哪些数据是正确的(主要数据还是辅助数据),因为其中提到,扫描程序会尝试使用主要设备中的数据覆盖辅助设备,但如果主要设备出现故障,会发生什么情况?
11) 如果辅助镜像可能出现故障,比较错误引发的警报示例是什么样的?
12) 如果无法修复故障区块,会显示哪种错误?
13) 对于“数据比较模式”下的故障区块,比较是如何进行的?
14) 日志在哪里生成?
15) 是否有用于计划后台扫描程序的选项?
设备创建后 30 秒,SDS 流程重新启动后 30 秒。
设置将显示在 GUI 中的 Dashboard-> Configuration -> Storage Pools 下,也可以通过运行 scli 命令查看。
设置将显示在 GUI 中的 Dashboard-> Configuration -> Storage Pools 下,也可以通过运行 scli 命令查看。
2) 后台扫描程序在完成一次完整扫描后需要多长时间才能重新启动? 《了解 Dell Technologies PowerFlex v3.5.x》指南的“其他功能”中提到,“一次扫描完成后,该过程会再次启动,从而持续保护您的系统。”这是如何实现的?
启用/禁用扫描程序时以及 SDS 重新启动后,需要 30 秒时间来启动/停止。扫描程序循环地持续运行/无限循环地运行。每次扫描程序启动时,它都会从设备上的不同位置开始。
它会从一个随机梳子开始扫描。
扫描完所有梳子后,它会以大致相同的顺序再次开始扫描(新的梳子会添加到列表的尾部)。
这是一个无限循环。各次完成之间没有停顿。 在重新启动时,扫描程序将不会从同一位置继续。
它会从一个随机梳子开始扫描。
扫描完所有梳子后,它会以大致相同的顺序再次开始扫描(新的梳子会添加到列表的尾部)。
这是一个无限循环。各次完成之间没有停顿。 在重新启动时,扫描程序将不会从同一位置继续。
3) 是否可以随时为给定存储池启用/禁用后台扫描程序?
如果未在现有存储池上启用后台扫描程序,则在新创建的存储池上将默认启用。 然后,只要存储池设置(粒度、零补充和持久校验和)与所请求的扫描程序模式匹配,您就可以在任何给定时间为存储池启用/禁用 BG 扫描程序。
4) 可以暂时禁用后台扫描程序吗?
使用 disable 命令,选项包括 enable 或 disable。 没有用于推迟或延迟操作的选项。
5) 是否默认启用?
在版本 3.5 之后,如果您创建新存储池,则默认启用。 有关此内容的更多信息,请参阅发行说明。
6a.) 如何通过命令行检查扫描程序是否在运行?
使用 scli 命令 --query_all 检查是否在每个存储池上启用了设备扫描程序。 有关 scli 命令的更多信息,请参阅“Dell EMC PowerFlex v3.6.x CLI 参考指南”
相关命令行的示例:
Background device scanner: Enabled, Read Error Action: report and fix, Compare Error Action: report and fix, Bandwidth Limit 3072 KBps per device
命令解释和输出示例:query_all
相关命令行的示例:
Background device scanner: Enabled, Read Error Action: report and fix, Compare Error Action: report and fix, Bandwidth Limit 3072 KBps per device
命令解释和输出示例:query_all
b.) 此外还提到扫描程序会向 SNMP 报告,有没有办法在 SNMP 中查看此报告历史记录?
没有用于查看 SNMP 报告历史记录的选项
c.) 扫描结果是否反映在任何特定日志中?
扫描错误反映在 MDM 事件和相关 SDS 的 SDS 日志中。
要检查后台设备扫描程序检测到的错误,请使用 --query_sds 命令查询 SDS。
“--query_sds --sds_id <SDS_ID>”输出将为每个设备显示一个计数器,其中包含纠正的读取错误数:例如,Name: /dev/sdr Path: /dev/sdr Original-path: /dev/sdr ID: Storage Pool: SP1, Capacity: 1116 GB Error-fixes: 6 scanned 0 MB, Compare errors: 0 State: Normal
此外,所有问题都将报告给主 MDM 上的 events.log,GUI 中的警报选项卡,并可通过 SNMP 发送。例如,设备 ID 上的 SCANNER_COMPARE_REPORT ERROR 后台设备扫描程序
提醒:show events 命令不显示“compare error - succeeded”消息。
要检查后台设备扫描程序检测到的错误,请使用 --query_sds 命令查询 SDS。
“--query_sds --sds_id <SDS_ID>”输出将为每个设备显示一个计数器,其中包含纠正的读取错误数:例如,Name: /dev/sdr Path: /dev/sdr Original-path: /dev/sdr ID: Storage Pool: SP1, Capacity: 1116 GB Error-fixes: 6 scanned 0 MB, Compare errors: 0 State: Normal
此外,所有问题都将报告给主 MDM 上的 events.log,GUI 中的警报选项卡,并可通过 SNMP 发送。例如,设备 ID 上的 SCANNER_COMPARE_REPORT ERROR 后台设备扫描程序
提醒:show events 命令不显示“compare error - succeeded”消息。
7) 有多少种扫描程序模式,如何检查存储池运行的模式是什么?
运行 scli query_all output 命令以查看两种扫描模式。
只能选择一种模式。
- Device only --执行读取操作。使用对等设备数据修复错误。
- Data comparison --执行仅设备测试,并与对等设备比较数据内容。必须启用零填充,才能将后台设备扫描程序设置为数据比较模式。
scli --enable_background_device_scanner (((--protection_domain_id <ID> | --protection_domain_name <NAME>) --storage_pool_name <NAME>) | --storage_pool_id <ID>) --scanner_mode {device_only | data_comparison} [--scanner_bandwidth_limit <LIMIT>]
在精细粒度中,所有存储池均进行零填充,因此两种扫描选项都受支持。
在中等粒度中,零填充是“可选”的,因此适用以下说明:
“执行仅设备测试,并与对等设备比较数据内容。 必须启用零填充,才能将后台设备扫描程序设置为数据比较模式”
只能选择一种模式。
- Device only --执行读取操作。使用对等设备数据修复错误。
- Data comparison --执行仅设备测试,并与对等设备比较数据内容。必须启用零填充,才能将后台设备扫描程序设置为数据比较模式。
scli --enable_background_device_scanner (((--protection_domain_id <ID> | --protection_domain_name <NAME>) --storage_pool_name <NAME>) | --storage_pool_id <ID>) --scanner_mode {device_only | data_comparison} [--scanner_bandwidth_limit <LIMIT>]
在精细粒度中,所有存储池均进行零填充,因此两种扫描选项都受支持。
在中等粒度中,零填充是“可选”的,因此适用以下说明:
“执行仅设备测试,并与对等设备比较数据内容。 必须启用零填充,才能将后台设备扫描程序设置为数据比较模式”
8) 这是否意味着扫描程序一直在运行,两个周期之间没有任何间隔?
启用/禁用扫描程序时,需要几秒钟来启动/停止。扫描程序循环地持续运行。每次启动扫描程序时,它都会从设备上的不同位置开始。在重新启动时,扫描程序将不会从同一位置继续。- 可以随时为给定存储池启用/禁用 - 对于新存储池,扫描程序处于禁用状态 - 新设备从存储池获取其配置。
9) 对于“仅设备模式”,提到扫描程序使用设备的内部校验和机制来验证主数据和辅助数据,请问内部校验和机制是如何运作的?如果某一个设备出现故障,扫描程序如何知道哪个设备(主要和辅助)是故障设备?还提到,扫描程序会尝试使用正常设备中的数据来修复故障设备。我认为这是基于故障错误的,因为它提到如果读取故障区域,但这个错误的机制是什么?
此外,在“仅设备模式”中,提到如果两个设备上的读取都失败,扫描程序会跳到下一个存储块。您能否解释这意味着什么,以及如果数据恢复完成,下一个存储块如何协助数据恢复?
仅设备模式 — 扫描程序尝试从两个拷贝中读取 1MB 区块 — 如果读取成功,则移动到下一个区块 — 如果读取失败,扫描程序将尝试使用另一个拷贝进行修复 — 如果修复成功,则移动到下一个区块 — 如果修复失败,则依赖于设备错误机制移动到下一个区块 — 如果两个拷贝上的读取都失败,则移动到下一个梳子。
如果校验和可用,则用于验证读取的数据。如果不可用,则会尝试读取。如果校验和不匹配或读取失败,则从另一个拷贝复制数据。如果两个拷贝上存在不匹配或读取错误,则无法进行修复。该区块将被报告并跳过。
如果校验和可用,则用于验证读取的数据。如果不可用,则会尝试读取。如果校验和不匹配或读取失败,则从另一个拷贝复制数据。如果两个拷贝上存在不匹配或读取错误,则无法进行修复。该区块将被报告并跳过。
10) “数据比较模式”提到扫描程序会计算和比较它们的校验和,您能否解释这种比较是如何进行的?扫描程序如何知道哪些数据是正确的(主要数据还是辅助数据),因为其中提到,扫描程序会尝试使用主要设备中的数据覆盖辅助设备,但如果主要设备出现故障,会发生什么情况?
如果持久校验和可用且已启用,那么我们知道哪个拷贝不一致。
如果它不可用,则我们假定主拷贝是正确的。在这种情况下,这是最安全的选择,因为用户可能已经从主拷贝读取了数据,因此保持一致性是最好的选择。
如果它不可用,则我们假定主拷贝是正确的。在这种情况下,这是最安全的选择,因为用户可能已经从主拷贝读取了数据,因此保持一致性是最好的选择。
11) 如果辅助镜像可能出现故障,比较错误引发的警报示例是什么样的?
SDS trc.logs 将提供有关数据是否已恢复的详细信息。例如 774078 23a8fec8:raidScan_Start:00669: Comb 205c80158152, offset 11159552 - primary and secondary checksums are different (pri=3420629458, sec=1047435630) 774498 23a8fec8:raidScan_Start:00730: Comb 205c80158152, offset 11159552 - Sent a message to the MDM on compare error 780997 23a8fec8:raidScan_Start:00758: Comb 205c80158152, offset 11159552 - compare error - succeeded to fix the secondary by the primary
12) 如果无法修复故障区块,会显示哪种错误?
计数器显示在 SDS 属性表中的后台设备扫描程序下。错误不应传播到应用程序。
示例: Alerts id SIO02.04.0000007 Background scanner compare error.
示例: Alerts id SIO02.04.0000007 Background scanner compare error.
13) 对于“数据比较模式”下的故障区块,比较是如何进行的?
执行与仅设备模式相同的操作 — 如果两次读取都成功,则在两个拷贝之间进行比较 — 如果拷贝不同,则用主拷贝覆盖辅助拷贝 — ScaleIO 写入两个拷贝,但仅从主拷贝读取。有关详细信息,请参阅用户指南。
14) 日志在哪里生成?
MDM logs /opt/emc/scaleio/mdm/bin/showevents.py
SDS /opt/emc/scaleio/sds/log/trc.x
MDM /opt/emc/scaleio/mdm/log/trc.x
events.txt
SDS /opt/emc/scaleio/sds/log/trc.x
MDM /opt/emc/scaleio/mdm/log/trc.x
events.txt
15) 是否有用于计划后台扫描程序的选项?
是的,有一个 rest api 可用于通过网关进行计划。
Prodotti interessati
Converged Infrastructure, PowerFlex Appliance, PowerEdge R630, PowerEdge R640, PowerEdge R730, PowerEdge R740, PowerEdge R740XD, PowerEdge R840Prodotti
Converged Infrastructure, PowerFlex rack, Servers, Solutions, VxFlex Ready Nodes, PowerFlex Appliance, PowerFlex custom node, PowerFlex appliance R650, PowerFlex appliance R6525, Powerflex appliance R750, PowerFlex custom node
, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R750, VxFlex Ready Node R640, VxFlex Ready Node R740xd, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840
...
Proprietà dell'articolo
Numero articolo: 000193267
Tipo di articolo: How To
Ultima modifica: 26 nov 2025
Versione: 5
Trova risposta alle tue domande dagli altri utenti Dell
Support Services
Verifica che il dispositivo sia coperto dai Servizi di supporto.