PowerScale: Uso de AutoBalanceLin para transferir datos rápidamente fuera de un pool de nodos completo
Summary: En este artículo, se describe cómo utilizar el trabajo AutoBalanceLin para liberar espacio rápidamente si un pool de nodos únicos está lleno o casi al 100 % de su capacidad. Este procedimiento solo se debe utilizar si se agotaron todos los demás métodos de liberación de espacio en disco en un pool de nodos. ...
Instructions
Nota: El siguiente procedimiento requiere la eliminación de las políticas de pools de archivos existentes y el fraccionado de datos en todos los nodos , independientemente del flujo de trabajo al que pertenezcan los datos.
Sin las políticas de pools de archivos, no se produce ninguna administración de datos entre los pools ni entre los niveles.
Asegúrese de comprender completamente el impacto de este procedimiento, ya que puede provocar una degradación del rendimiento.
Solo realice esto como un último esfuerzo después de que se hayan intentado todas las demás opciones para resolver los problemas de capacidad.
Se cree ampliamente que AutoBalance y AutoBalanceLin solo equilibran datos dentro de pools de nodos y no entre pools de nodos. Además, se cree que solo smartpools/smartpoolstree pueden transferir datos entre dos pools de nodos.
Las pruebas en OneFS 8.0 y versiones posteriores demuestran que esto no es del todo cierto. Si el clúster solo tiene la política predeterminada de pools de archivos "anywhere:anywhere", AutoBalanceLin y AutoBalance transfieren los datos entre varios pools de nodos.
Esto solo se debe utilizar como una solución alternativa de emergencia para los clústeres que tienen un pool de nodos completo. Este proceso transfiere los datos rápidamente fuera del pool de nodos completo.
Pregunta: ¿Cuándo se desea utilizar el siguiente procedimiento?
Respuesta: Este procedimiento se utilizaría cuando existan las siguientes condiciones:
a. El clúster contiene varios pools de nodos y uno o más de ellos está completamente lleno.
b. Hay un requisito inmediato para liberar espacio de disco en un pool de nodos completo.
c. La organización exacta de los datos no es una preocupación inmediata.
Pasos:
1) Tome nota y elimine todas las políticas de pools de archivos existentes, excepto la política de pools de archivos "any:any" "predeterminada" que se envía con el clúster.
Antes de continuar con este paso:
a) Registre la configuración actual de la política de pools de archivos antes de eliminar las políticas. Si el tiempo lo permite, se recomienda una recopilación completa de registros.
b) De manera predeterminada, los clústeres de Isilon se configuran con la política de pool de archivos predeterminada configurada para escribir datos en "cualquier lugar:en cualquier lugar". Verifique que la política de pool de archivos predeterminada se revierta a estos ajustes predeterminados antes de continuar.
Example: Default File Pool Policy. Observe that the Storage Targets are set to 'anywhere'.
# isi filepool default-policy view
Set Requested Protection: default
Data Access Pattern: concurrency
Enable Coalescer: Yes
Enable Packing: No
Data Storage Target: anywhere
Data SSD Strategy: metadata
Snapshot Storage Target: anywhere
Snapshot SSD Strategy: metadata
Cloud Pool: -
Cloud Compression Enabled: -
Cloud Encryption Enabled: -
Cloud Data Retention: -
Cloud Incremental Backup Retention: -
Cloud Full Backup Retention: -
Cloud Accessibility: -
Cloud Read Ahead: -
Cloud Cache Expiration: -
Cloud Writeback Frequency: -
Cloud Archive Snapshot Files: -
ID: -
2) Ejecute un trabajo de SmartPools para aplicar nuevas marcas de directorio:
# isi job start smartpools -p 1 --policy medium
Nota: Espere que el trabajo de Smartpools se complete más rápido de lo habitual con solo la política de pool de archivos predeterminada anywhere:anywhere implementada.
3) Ejecute un trabajo de AutoBalanceLin durante algunas horas y monitoree el espacio. (Nota: A diferencia de AutoBalance, que realiza un recorrido completo del árbol antes de transferir los datos, AutoBalanceLin vuelve a fraccionar los datos inmediatamente)
# isi job start autobalancelin -p 1 --policy medium
Casi de inmediato, observe que los datos se desplazan entre los pools de nodos y que el pool de nodos completo se libere en el espacio de disco.
Nota: En este paso, no es necesario que AutoBalanceLin se ejecute hasta su finalización. Monitoree el trabajo de AutoBalanceLin hasta que se logre el objetivo de limpiar el pool de nodos completo y, a continuación, cancele el trabajo. Por ejemplo, puede cancelar el trabajo una vez que el pool de nodos completo haya reducido el 85 % de su capacidad.
Nota: Monitoree la utilización del clúster y confirme que otros trabajos se cancelen o ponga en pausa si el espacio se ve afectado negativamente.
Continúe monitoreando el espacio aproximadamente cada una hora hasta que el espacio esté en un nivel suficiente mediante el siguiente comando:
# isi stat -p -v
Nota: Nuevamente, no se recomienda dejar que AutoBalanceLin se ejecute hasta su finalización. En un momento determinado, el trabajo puede cambiar los datos en una nueva dirección y puede comenzar a producir resultados no deseados. Por ejemplo, invierte la transferencia de datos, lo que posiblemente provoque que el otro pool de nodos se acerque a la capacidad completa a medida que se vacía el pool anterior. Solo ejecute AutobalanceLIN durante algunas horas o hasta que se haya agotado el espacio y, a continuación, cancele una vez que se haya logrado el objetivo.
Una vez que el clúster haya logrado un alivio en el espacio en el pool de nodos completo, cancele el trabajo de AutoBalanceLin:
# isi job cancel autobalancelin
Nota: Para obtener resultados óptimos, los niveles de protección entre los pools de nodos deben tener el mismo valor.
Additional Information
Resultados de las pruebas de laboratorio Dos
pools de nodos, iguales niveles
de protección Esto ocurre antes de lo siguiente:
Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 29.9T (35%) 35.2G (2%) Avail: 55.3T (65%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |881.6| 0|881.6|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) 6|10.5.80.191 |-A-- | 0| 0| 0|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) 7|10.5.80.192 | OK | 0| 0| 0|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK |110.2| 0|110.2|29.9T/85.2T( 35%)|35.2G/ 2.2T( 2%) Node Pool Name: x410_35tb_800gb-ssd_64gbProtection: +2d:1n Pool Storage: HDD SSD Storage Size: 112.8T (125.3T Raw) 2.9T (2.9T Raw) VHS Size: 12.5T Used: 5.6T (5%) 7.9G (< 1%) Avail: 107.2T (95%) 2.9T (> 99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.5.80.186 | OK | 2.9M|82.8M|85.6M| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) 2|10.5.80.187 |-A-- | 104k|38.8k| 143k| 1.4T/30.6T( 5%)| 1.9G/ 738G(< 1%) 3|10.5.80.188 | OK |881.6| 0|881.6| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) 4|10.5.80.189 | OK | 0|25.8k|25.8k| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_35tb_800gb-ssd|-M---| 371k|10.4M|10.7M| 5.6T/112.8T( 5%)| 7.9G/ 2.9T(< 1%) _64gb | | | | | | X410-2# date Thu Jun 14 16:53:29 CDT 2018 one filepool policy set to default any:any X410-2# isi job start autobalancelin -p 1 --policy medium Started job [7159] in as little as 30 minutes you will see data shift between the two pools, i.e. our first node pool, below, dropped from 32% full to 29% X410-2# date Thu Jun 14 17:24:20 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 27.7T (33%) 34.3G (2%) Avail: 57.5T (67%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK | 1.1k|25.8k|26.9k| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) 6|10.5.80.191 |-A-- | 1.1k| 1.2M| 1.2M| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) 7|10.5.80.192 | OK |28.6k| 5.2k|33.7k| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK | 3.8k| 152k| 156k|27.7T/85.2T( 33%)|34.3G/ 2.2T( 2%) Node Pool Name: x410_35tb_800gb-ssd_64gbProtection: +2d:1n Pool Storage: HDD SSD Storage Size: 112.8T (125.3T Raw) 2.9T (2.9T Raw) VHS Size: 12.5T Used: 7.6T (7%) 8.8G (< 1%) Avail: 105.2T (93%) 2.9T (> 99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.5.80.186 | OK |37.9k| 279k| 316k| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) 2|10.5.80.187 |-A-- | 1.4M|34.8M|36.2M| 1.9T/30.6T( 6%)| 2.2G/ 738G(< 1%) 3|10.5.80.188 | OK | 130k|30.9k| 161k| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) 4|10.5.80.189 | OK | 0| 0| 0| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_35tb_800gb-ssd|-M---| 198k| 4.4M| 4.6M| 7.6T/112.8T( 7%)| 8.8G/ 2.9T(< 1%) _64gb | | | | | |
Continúe monitoreando cada hora más o menos hasta que el espacio en disco se encuentre en un nivel suficiente.
Nota: No permita que AutoBalanceLin se ejecute hasta su finalización. El trabajo desplaza los datos en la dirección opuesta, lo que puede comenzar a producir resultados no deseados. El espacio de disco consumido puede revertirse, lo que posiblemente dé lugar a un pool de nodos casi lleno nuevamente. Ejecute el trabajo solo durante unas horas.
Punto de una hora:
X410-2# date Thu Jun 14 17:54:30 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 25.2T (30%) 33.9G (2%) Avail: 60.0T (70%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |881.6|20.6k|21.5k| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) 6|10.5.80.191 |-A-- | 0| 0| 0| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) 7|10.5.80.192 | OK | 2.2k| 216k| 218k| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK |385.7|29.5k|29.9k|25.2T/85.2T( 30%)|33.9G/ 2.2T( 2%) X410-2# date Thu Jun 14 18:54:43 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 21.6T (25%) 26.8G (1%) Avail: 63.6T (75%) 2.1T (99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |22.9k| 1.4M| 1.5M| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) 6|10.5.80.191 |-A-- |881.6| 231k| 232k| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) 7|10.5.80.192 | OK | 0| 0| 0| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK | 3.0k| 210k| 213k|21.6T/85.2T( 25%)|26.8G/ 2.2T( 1%)
El espacio está suficientemente limpio. El trabajo AutoBalanceLIn se puede cancelar, ya que se han logrado los resultados deseados.