PowerScale |了解 L3 缓存和元数据策略
Summary: PowerScale 可以灵活地使用节点池中的固态硬盘 (SSD) 来增强性能。两个主要策略是 L3 缓存和元数据加速。L3 缓存旨在缓存频繁访问的数据和元数据,以提高读取性能。元数据加速将固态硬盘专用于存储和加速元数据作,这对元数据密集型工作负载非常有益。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
了解 L3 高速缓存:
L3 高速缓存:L3 高速缓存是驻留在 SSD 上的辅助高速缓存,是对主内存高速缓存(L1 和 L2)的补充。它作为逐出缓存运行,存储频繁访问的数据和元数据以改善读取延迟。L3 缓存对于涉及随机文件访问的工作流最有利。它可以在归档系列存储节点的仅元数据模式下运行。在具有 SSD 上的现有数据的节点池上启用 L3 缓存,需要驱动器先将该数据转移到 HDD,然后 SSD 才能用于缓存。禁用 L3 高速缓存通常是更快的作。
受益于 L3 缓存的工作流:
-
- L3 缓存有利于具有以下特征的工作流:
- 随机文件访问:对于涉及频繁读取文件的不同非顺序部分的工作负载,L3 高速缓存可显著降低延迟。
- 高读写比:由于 L3 高速缓存主要加速读取,因此使用主要读取组件的工作流受益最大。
- 缓存频繁访问的“热”数据:L3 缓存会自动识别和存储频繁访问的数据,从而提高重复访问的性能。
- 流式传输和并发文件访问(在某种程度上):虽然随机访问的好处最大,但具有流式和并发访问的工作流也可以通过 L3 缓存体验到一些性能改进。
何时选择 L3 缓存:
-
- 当主要性能瓶颈是数据和元数据的随机读取延迟时。
- 在不产生更多 RAM 成本的情况下扩展节点的有效内存容量。
- 适用于对最近从 L2 逐出的数据和元数据进行大量重新读取的工作负载。
- 对于归档类节点,其中文件系统遍历的元数据性能至关重要。
- 当需要更简单的“一劳永逸”的读取性能增强时,无需大量配置开销。
何时选择元数据加速: - 当元数据作(查找、访问、修改)是主要性能瓶颈时。
- 适用于具有大量元数据读取(元数据读取加速)或读取和写入(元数据读/写加速)的工作负载。
- 在地震解释等场景中,即使底层数据驻留在较慢的存储上,快速元数据访问也至关重要。
- 当需要精细控制元数据的驻留位置时。
- 当需要将元数据读取优势扩展到没有本地 SSD 的节点时(在其他节点上使用具有元数据读取加速的 GNA)。
- 主目录、具有繁重文件枚举的工作流以及需要大量比较的活动等工作负载通常表现出较高的元数据读取活动。在这种情况下,直接加速元数据访问可以带来显著的性能改进
了解元数据策略:
元数据策略:可以将 SSD 配置为主要存储和加速元数据作,而不是缓存数据。此策略对于具有大量元数据访问的工作负载非常有益,例如许多小文件、频繁的目录查找和元数据密集型作业引擎任务。OneFS 支持不同的元数据 SSD 策略,包括元数据读取和元数据写入。
元数据读取:SSD 主要用于加速元数据读取作。
元数据写入:SSD 用于加速元数据写入作。
- 元数据策略相较于 L3 缓存的优势:
- 元数据加速 对于如何使用 SSD 增强特定数据集和工作流的元数据性能提供更有针对性和更精细的控制。另一方面,L3 缓存是一个更通用的缓存层,可为更广泛的工作负载带来好处,尤其是那些对数据和元数据具有重复随机读取访问权限的工作负载。虽然 L3 缓存在提高频繁访问数据的读取性能方面表现出色,但专用的元数据策略可以提供特定的优势:
- 改进的元数据性能:对于元数据作成为瓶颈的工作负载(例如,打开、关闭、重命名、列出大量文件),将 SSD 专用于元数据可以显著降低延迟并提高总体吞吐量。
- 增强的作业引擎性能:某些 OneFS 作业引擎任务是元数据密集型任务。加快元数据访问速度可以缩短这些作业的完成时间。
- 元数据密集型工作负载的可预测性能:在元数据活动频繁的一致模式的环境中,与基于逐出的高速缓存相比,专用元数据策略可以提供更可预测和持续的性能改进。
- 与实际数据读取和写入相比,某些应用程序和工作流生成的元数据作数量高得不成比例。示例包括文件归档、媒体资产管理、电子设计自动化 (EDA)、具有频繁编译的软件开发环境,以及涉及大量小文件访问和分析的基因组学管道。在这些情况下,与访问和作元数据相关的延迟可能会成为显著的性能瓶颈
- 涉及浏览复杂目录结构 或列出许多目录内容的作在很大程度上依赖于元数据性能。元数据加速确保系统可以快速访问信息节点信息和目录条目,与依赖 L3 缓存相比,显著加快了这些作的速度,L3 缓存可能由于容量限制或访问频率降低而逐出这些信息
- 备份、 复制和 迁移:这些数据管理任务通常涉及广泛的元数据扫描和处理。通过加速更快地访问元数据可以显著缩短完成这些作业所需的时间,从而更大限度地减少对主要工作负载的中断并提高运营效率。
- 搜索和索引编制:当用户或自动化进程必须根据其元数据属性(例如名称、大小、修改日期)搜索特定文件时,加速元数据访问可加快查询执行速度。这与 MetadataIQ 等解决方案相关,后者可为文件系统元数据编制索引,以便跨多个群集进行高效查询和数据发现
- 何时选择元数据:
- 繁重的目录浏览、文件或数据搜索作、索引编制。
- 文件作,例如打开、关闭、删除、创建目录 (mkdir)。
- 查找、getattr 和访问作。
- 主目录,尤其是具有许多对象的目录。
- 涉及大量枚举或比较的工作流。
- 地震数据解释,其中元数据的及时性至关重要。
- 元数据加速可以显著提高这些类型的活动的性能,增加吞吐量并减少延迟
摘要:何时选择
-
- 如果您的工作负载严重偏向于访问或修改文件元数据的作(浏览、搜索、索引、创建、删除、修改属性),请选择元数据加速策略(元数据读取或元数据读/写)。
- 如果您的工作负载主要是元数据读取密集型,并且您希望使用较少的 SSD 容量,请选择Metadata Read Acceleration。
- 如果您的工作负载涉及大量元数据写入,需要更快的快照删除,或者小型文件 HPC 工作负载(如 EDA)受益于闪存上的内联小文件,请选择 Metadata Read/Write Acceleration。确保您有足够的 SSD 容量。
- 如果您有混合群集(有和没有 SSD 的节点),并且必须加快对整个群集中非 SSD 节点上驻留的数据的元数据读取,请考虑使用 GNA。这与分散的元数据密集型工作负载有关。
- 全局命名空间加速 (GNA):GNA 是一种较旧的机制(旨在在所有节点都具有 SSD 时替换为 L3 高速缓存),它允许没有 SSD 的节点池通过在这些 SSD 上存储额外的元数据镜像来利用群集中其他地方的 SSD。这可加速对存储在纯 HDD 池上的数据执行元数据读取作。L3 缓存和 GNA 可以共存于同一群集中,但通常在不同的节点池上运行。
- 如果您的工作负载涉及大量随机读取,受益于大型工作集的扩展缓存,或者需要提高作业引擎性能(前提是您的节点具有 SSD),请考虑使用 L3 缓存。
工具和命令:
- 性能监控:使用 InsightIQ、CloudIQ 和 MetadataIQ 等工具监视群集运行状况、性能指标和使用情况预测。InsightIQ 可以跟踪性能趋势、识别模式并执行文件分析。它还可以帮助估计群集何时达到最大容量。CloudIQ 提供有关群集性能的见解。MetadataIQ 有助于跨群集进行数据索引和查询,并可用于数据生命周期管理和了解数据分布。
- isi_cache_stats 实用程序可以帮助确定工作数据集大小,这与调整 L2 和 L3 缓存的 SSD 大小相关。一般规则建议 L2 容量 + L3 容量应 >为 = 工作集大小的 150%。
- MetadataIQ (OneFS 9.10+):部署和配置 MetadataIQ,以跨群集索引和创建元数据的全局目录。使用 Kibana 仪表板可视化数据分布、文件计数和元数据属性。这有助于了解数据的构成以及元数据的增长情况。定期同步使元数据数据库保持更新
- InsightIQ 提供有关群集容量的报告,包括总容量、已调配容量和已用容量,使您可以根据历史趋势预测存储需求。它可以监视工作负载性能、延迟、IOPS 和吞吐量,使您能够检测数据增长时的潜在瓶颈。InsightIQ 的文件系统分析报告可以显示文件数量和大小分布,让您深入了解数据的规模和组成,这与 LIN 计数增长直接相关。
Affected Products
Isilon, PowerScale, PowerScale OneFSArticle Properties
Article Number: 000321641
Article Type: How To
Last Modified: 16 May 2025
Version: 1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.