PowerScale | Comprender las estrategias de metadatos y caché L3
Summary: PowerScale ofrece flexibilidad en la forma en que se utilizan las unidades de estado sólido (SSD) dentro de un pool de nodos para mejorar el rendimiento. Dos estrategias principales son la caché L3 y la aceleración de metadatos. La caché L3 está diseñada para almacenar en caché los metadatos y datos a los que se accede con frecuencia a fin de mejorar el rendimiento de lectura. La aceleración de metadatos dedica las SSD a almacenar y acelerar las operaciones de metadatos, lo que puede ser beneficioso para las cargas de trabajo con uso intensivo de metadatos. ...
Instructions
Comprensión de la caché L3:
Caché L3: La caché L3 es un nivel secundario de caché que reside en los discos SSD, que complementa la caché de memoria principal (L1 y L2). Funciona como una caché de expulsión y almacena los metadatos y datos a los que se accede con frecuencia para mejorar la latencia de lectura. La caché L3 es más beneficiosa para los flujos de trabajo que implican acceso aleatorio a archivos. Puede funcionar en un modo de solo metadatos para nodos de almacenamiento de serie de archivos. La habilitación de la caché L3 en un pool de nodos con datos existentes en SSD requiere que las unidades evacuen esos datos a HDD antes de que los SSD se puedan utilizar para el almacenamiento en caché. Por lo general, la deshabilitación de la caché L3 es una operación más rápida.
Flujos de trabajo que se benefician de la caché L3:
-
- La caché L3 es beneficiosa para flujos de trabajo con las siguientes características:
- Acceso aleatorio a archivos: Las cargas de trabajo que implican lecturas frecuentes de diferentes partes no secuenciales de archivos pueden experimentar reducciones significativas de latencia con la caché L3.
- Alta relación de lectura a escritura: Dado que la caché L3 acelera principalmente las lecturas, el flujo de trabajo con un componente de lectura dominante es el que más se beneficia.
- Almacenamiento en caché de los datos "calientes" a los que se accede con frecuencia: La caché L3 identifica y almacena automáticamente los datos a los que se accede con frecuencia, lo que mejora el rendimiento para el acceso repetido.
- Streaming y acceso simultáneo a archivos (hasta cierto punto): Si bien el acceso aleatorio es el mayor beneficio, los flujos de trabajo con acceso simultáneo y de streaming también pueden experimentar algunas mejoras de rendimiento con la caché L3.
Cuándo elegir la caché L3:
-
- Cuando el cuello de botella de rendimiento principal es la latencia de lectura aleatoria para los datos y los metadatos.
- Ampliar la capacidad de memoria efectiva de los nodos sin incurrir en el costo de más RAM.
- Para cargas de trabajo que exhiben una cantidad significativa de relectura de datos y metadatos que se expulsaron recientemente de L2.
- Para los nodos de clase archivo, donde el rendimiento de los metadatos para el recorrido del sistema de archivos es crítico.
- Cuando se desea una mejora del rendimiento de lectura más simple de "configurar y olvidar" sin una sobrecarga de configuración significativa.
Cuándo elegir la aceleración de metadatos: - Cuando las operaciones de metadatos (búsquedas, accesos, modificaciones) son el principal cuello de botella de rendimiento.
- Para cargas de trabajo con un alto volumen de lecturas de metadatos (aceleración de lectura de metadatos) o lecturas y escrituras (aceleración de lectura/escritura de metadatos).
- En escenarios como la interpretación sísmica, donde el acceso rápido a los metadatos es primordial, incluso si los datos subyacentes residen en un almacenamiento más lento.
- Cuando se requiere un control granular sobre dónde residen los metadatos.
- Cuando es necesario extender los beneficios de lectura de metadatos a nodos sin discos SSD locales (mediante GNA con aceleración de lectura de metadatos en otros nodos).
- Las cargas de trabajo, como los directorios principales, los flujos de trabajo con enumeración intensiva de archivos y las actividades que requieren numerosas comparaciones, a menudo presentan una alta actividad de lectura de metadatos. En tales casos, acelerar el acceso directo a los metadatos puede conducir a una mejora significativa del rendimiento
Comprensión de las estrategias de metadatos:
Estrategia de metadatos: En lugar de almacenar datos en caché, las SSD se pueden configurar para almacenar y acelerar principalmente las operaciones de metadatos. Esta estrategia puede ser beneficiosa para las cargas de trabajo con un alto volumen de acceso a metadatos, como muchos archivos pequeños, búsquedas frecuentes en directorios y tareas del motor de trabajos con uso intensivo de metadatos. OneFS es compatible con diferentes estrategias de SSD de metadatos, incluidas la lectura y escritura de metadatos.
Lectura de metadatos: Las SSD se utilizan principalmente para acelerar las operaciones de lectura de metadatos.
Escritura de metadatos: Las SSD se utilizan para acelerar las operaciones de escritura de metadatos.
- Beneficios de la estrategia de metadatos sobre la caché L3:
- La aceleración de metadatos ofrece un control más específico y granular sobre cómo se utilizan los discos SSD para mejorar el rendimiento de los metadatos para conjuntos de datos y flujos de trabajo específicos. La caché L3, por otro lado, es una capa de almacenamiento en caché más general que beneficia a una gama más amplia de cargas de trabajo, especialmente aquellas con acceso de lectura aleatoria repetido a datos y metadatos. Si bien la caché L3 se destaca en la mejora del rendimiento de lectura de los datos a los que se accede con frecuencia, una estrategia de metadatos dedicada puede ofrecer ventajas específicas:
- Rendimiento mejorado de los metadatos: Para las cargas de trabajo en las que las operaciones de metadatos son el cuello de botella (p. ej., abrir, cerrar, cambiar el nombre, enumerar una gran cantidad de archivos), dedicar SSD a los metadatos puede reducir significativamente la latencia y mejorar el rendimiento general.
- Rendimiento mejorado del motor de trabajos: Ciertas tareas del motor de trabajos de OneFS hacen un uso intensivo de metadatos. La aceleración del acceso a los metadatos puede dar lugar a tiempos de finalización más rápidos para estos trabajos.
- Rendimiento predecible para cargas de trabajo con uso intensivo de metadatos: En entornos con un patrón coherente de alta actividad de metadatos, una estrategia de metadatos dedicada puede proporcionar mejoras de rendimiento más predecibles y sostenidas en comparación con una caché basada en expulsiones.
- Ciertas aplicaciones y flujos de trabajo generan una cantidad desproporcionadamente alta de operaciones de metadatos en comparación con las lecturas y escrituras de datos reales. Algunos ejemplos incluyen archivado de archivos, administración de recursos de medios, automatización de diseño electrónico (EDA), entornos de desarrollo de software con compilaciones frecuentes y pipelines de genómica que involucran numerosos accesos y análisis de archivos pequeños. En estos casos, la latencia asociada con el acceso a los metadatos y su manipulación puede convertirse en un cuello de botella de rendimiento importante
- Las operaciones que implican navegar por estructuras de directorios complejas o enumerar el contenido de muchos directorios dependen en gran medida del rendimiento de los metadatos. La aceleración de metadatos garantiza que el sistema pueda acceder rápidamente a la información de inodos y a las entradas del directorio, lo que acelera considerablemente estas operaciones en comparación con depender incluso de una caché L3 que podría haber expulsado esta información debido a limitaciones de capacidad o acceso menos frecuente
- Respaldo, replicación y migración: Estas tareas de administración de datos a menudo implican un extenso escaneo y procesamiento de metadatos. Un acceso más rápido a los metadatos mediante la aceleración puede reducir significativamente el tiempo necesario para completar estos trabajos, lo que minimiza la interrupción de las cargas de trabajo principales y mejora la eficiencia operacional.
- Búsqueda e indexación: Cuando los usuarios o los procesos automatizados deben buscar archivos específicos en función de sus atributos de metadatos (p. ej., nombre, tamaño, fecha de modificación), el acceso acelerado a los metadatos permite una ejecución más rápida de las consultas. Esto es relevante para soluciones como MetadataIQ, que indexa los metadatos del sistema de archivos para consultas y descubrimiento de datos eficientes en varios clústeres
- Cuándo elegir Metadatos:
- Navegación intensiva de directorios, operaciones de búsqueda de archivos o datos, indexación.
- Operaciones de archivos, como abrir, cerrar, eliminar, crear directorios (mkdir).
- Operaciones de búsqueda, getattr y acceso.
- Directorios principales, especialmente aquellos con muchos objetos.
- Flujos de trabajo que impliquen una enumeración o comparación intensivas.
- Interpretación de datos sísmicos, donde la puntualidad de los metadatos es fundamental.
- La aceleración de metadatos puede producir mejoras significativas en el rendimiento para estos tipos de actividades, lo que aumenta el rendimiento y disminuye la latencia
Resumen: Cuándo elegir
-
- Elija una estrategia de aceleración de metadatos (lectura de metadatos o lectura/escritura de metadatos) si la carga de trabajo está muy sesgada hacia las operaciones que acceden a los metadatos de archivos o los modifican (exploración, búsqueda, indexación, creación, eliminación y modificación de atributos).
- Elija Metadata Read Acceleration si la carga de trabajo es principalmente de lectura intensiva de metadatos y desea utilizar menos capacidad de SSD.
- Elija la aceleración de lectura/escritura de metadatos si su carga de trabajo implica una cantidad significativa de escrituras de metadatos, requiere eliminaciones de instantáneas más rápidas o es una carga de trabajo de HPC de archivos pequeños como EDA que se beneficia de archivos pequeños en línea en flash. Asegúrese de tener suficiente capacidad de SSD.
- Considere GNA si tiene un clúster mixto (nodos con y sin unidades SSD) y debe acelerar las lecturas de metadatos para los datos que residen en nodos que no son unidades SSD en todo el clúster. Esto es relevante para las cargas de trabajo con uso intensivo de metadatos que están dispersas.
- Aceleración del espacio de nombres global (GNA): GNA es un mecanismo más antiguo (diseñado para ser reemplazado por caché L3 cuando todos los nodos tienen SSD) que permite que los pools de nodos sin SSD aprovechen los SSD en otras partes del clúster mediante el almacenamiento de espejeados de metadatos adicionales en esos SSD. Esto acelera las operaciones de lectura de metadatos para los datos almacenados en pools de solo HDD. La caché L3 y GNA pueden coexistir en el mismo clúster, pero, por lo general, funcionan en diferentes pools de nodos.
- Considere la caché L3 si la carga de trabajo implica lecturas aleatorias significativas, se beneficia del almacenamiento en caché extendido para un gran conjunto de trabajo o necesita un mejor rendimiento del motor de trabajos, siempre que los nodos tengan SSD.
Herramientas y comandos:
- Monitoreo de rendimiento: Utilice herramientas como InsightIQ, CloudIQ y MetadataIQ para monitorear el estado del clúster, las métricas de rendimiento y la previsión de uso. InsightIQ puede rastrear tendencias de rendimiento, identificar patrones y realizar análisis de archivos. También puede ayudar a calcular cuándo un clúster alcanza la capacidad máxima. CloudIQ proporciona información valiosa sobre el rendimiento del clúster. MetadataIQ facilita la indexación y la consulta de datos en clústeres y se puede utilizar para la administración del ciclo de vida de los datos y para comprender la distribución de datos.
- La utilidad isi_cache_stats puede ayudar a determinar el tamaño del conjunto de datos de trabajo, lo cual es pertinente para dimensionar las unidades SSD para la caché L2 y L3. Una regla general sugiere que la capacidad L2 + capacidad L3 debe ser >= 150% del tamaño del conjunto de trabajo.
- MetadataIQ (OneFS 9.10+): Implemente y configure MetadataIQ para indexar y crear un catálogo global de metadatos entre clústeres. Utilice el panel de Kibana para visualizar la distribución de datos, los recuentos de archivos y los atributos de metadatos. Esto ayuda a comprender la composición de los datos y cómo crecen los metadatos. Las sincronizaciones periódicas mantienen actualizada la base de datos de metadatos
- InsightIQ proporciona informes sobre la capacidad del clúster, incluida la capacidad total, aprovisionada y utilizada, lo que le permite prever las necesidades de almacenamiento en función de las tendencias históricas. Puede monitorear el rendimiento, la latencia, las IOPS y el rendimiento de las cargas de trabajo, lo que le permite detectar posibles cuellos de botella a medida que crecen los datos. Los informes de análisis del sistema de archivos de InsightIQ pueden mostrar el conteo de archivos y la distribución del tamaño, lo que le brinda información valiosa sobre la escala y la composición de sus datos, lo que se relaciona directamente con el crecimiento del conteo de LIN.