Tecnología Intel Cluster-On-Die (COD) en VMware ESXi

Summary: Clúster Intel en troquelado, COD, VMware ESXi, múltiples nodos NUMA por conector de procesador,

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Introducción

    En los sistemas habilitados para NUMA, los canales de memoria se distribuyen entre los procesadores. Todas las operaciones relacionadas con la memoria requieren operaciones de búsqueda a fin de mantener la coherencia de los datos de caché. El snooping se utiliza para sondear el contenido de la caché en los procesadores locales y remotos con el fin de encontrar la copia de los datos solicitados que residen en cualquiera de las cachés.  Si NUMA está deshabilitado (intercalado de nodos habilitado en el BIOS), el modo de búsqueda se deshabilita automáticamente.

        Hay tres tipos de modo de búsqueda disponibles en la microarquitectura Intel Haswell. Los servidores Dell de13.ª generación (13G) soportan los tres modos de búsqueda, como los siguientes:

1) Búsqueda anticipada

2) Fisgoneo en casa

3) Clúster en matriz

En este blog, analizamos el modo de búsqueda Cluster-On-Die (COD) en términos de VMware ESXi. Este blog cubre los siguientes aspectos.

  • Conceptos básicos de COD
  • Requisitos previos para habilitar COD desde el punto de vista del hardware y de VMware ESXi
  • Algunas opciones de línea de comandos en ESXi que muestran la diferencia en la lista de NUMA con COD habilitado y deshabilitado.

Antes de entrar en los detalles de COD, es necesario comprender los tipos de procesadores según el conteo de núcleos en la microarquitectura del procesador Intel Haswell.

Intel clasificó la arquitectura del procesador Haswell en los siguientes tipos:

1) LCC: bajo conteo de núcleos [4-8 núcleos]

2) MCC: conteo de núcleos medianos [10 – 12 núcleos]

3) HCC: alto conteo de núcleos [14-18 núcleos]

                   NOTA: Este tipo de conteo de núcleos varía según las diferentes microarquitecturas Intel.

 

¿Qué es el modo Cluster-On-Die (COD)?

COD es un nuevo modo de búsqueda presentado por la familia de procesadores Intel Haswell que tiene 10 núcleos o más. Para las categorías de procesadores MCC y HCC, Intel incorporó dos controladoras de memoria en un solo conector de procesador, mientras que el procesador LCC solo tiene una controladora de memoria. Cada controladora de memoria en un conector de procesador actúa como un agente local [HA].

En los servidores compatibles con COD, cada procesador divide lógicamente el conector en 2 nodos de NUMA. Cada nodo de NUMA tiene la mitad de la cantidad total de núcleos físicos y la mitad de la caché de último nivel (LLC) con un agente local. El término clúster se forma como núcleos de procesador y la controladora de memoria correspondiente se agrupan y forman como clúster en la matriz del conector. Cada agente local utiliza dos canales de memoria y ve solicitudes de una menor cantidad de núcleos lógicos del procesador, lo que proporciona un mayor ancho de banda de memoria y baja latencia. Este modo de funcionamiento se utiliza principalmente para optimizar las cargas de trabajo NUMA. Para ver el número de nodos de NUMA, los sistemas operativos muestran la lectura de las tablas ACPI SRAT.

Una representación gráfica de COD es la siguiente:
SLN315049_en_US__1COD_Disabled
SLN315049_en_US__2COD_Enabled.jpg
 

En la segunda imagen, se puede ver que la matriz del conector de procesador único se divide en dos nodos lógicos cuando se habilita COD. 

Requisitos previos:

En esta sección, analizamos los requisitos previos desde el punto de vista del hardware y de VMware ESXi.

Hardware:

  • COD solo se puede habilitar en procesadores Intel Haswell-EP con 10 núcleos o más.
  • La memoria se debe ocupar en canales de memoria alternativos (CH0, CH2, CH1 y CH3). Por ejemplo, los servidores R730, R730xd, R630 y T630 tienen 4 canales de memoria por conector.SLN315049_en_US__3Memory_Population

              Tomemos un ejemplo para comprender mejor el requisito previo anterior. Para un servidor con solo dos módulos de memoria ocupados por canal, se deben ocupar las siguientes ranuras para un canal específico

  • A1 y A3 

 Con 4 módulos de memoria,

  • A1, A3 y B1, B3

 Con 8 módulos de memoria,

  • A1, A3, B1, B3 y A2, A4, B2, B4

NOTA: Se debe ocupar un mínimo de dos módulos de memoria para habilitar el pago contra reembolso.

  • El token de clúster en matriz debe estar habilitado en la configuración del BIOS.
SLN315049_en_US__4BIOS_Settings
 
  • La compatibilidad de VMware con COD comenzó en vSphere 6.0 al principio y ahora también es compatible con ESXi 5.5 U3b. Consulte el 2142499 de la base de conocimientos de VMware para obtener más información. 
¿Cómo puedo comprobar el estado de COD desde VMware ESXi?

VMware ESXi lee ACPI SRAT (tablas de afinidad de recursos del sistema) y SLIT (tablas de información de localidad del sistema) para identificar y asignar los recursos de hardware disponibles. Esto también incluye el mapeo de los nodos NUMA. En esta sección, se analizan algunas opciones de línea de comandos que los usuarios pueden utilizar para ver el estado de COD desde VMware ESXi.

  • esxtop proporciona una opción para ver los nodos NUMA rellenados. Cuando se ingrese el comando esxtop, presione "m" para ver los detalles de los nodos de NUMA de la siguiente manera.

Las siguientes capturas de pantalla se tomaron de un sistema con dos conectores de procesador y 128 GB de memoria del sistema. En la configuración predeterminada sin COD habilitado, esxtop mostraría dos nodos NUMA con 64 GB asignados por nodo NUMA. En la siguiente figura, se muestra la salida del comando esxtop en VMware ESXi con el pago contra reembolso deshabilitado. 
SLN315049_en_US__5esxtop_COD_Disabled

Con COD habilitado, esxtop enumera cuatro nodos NUMA en lugar de dos, ya que la matriz del conector de procesador único se divide en dos.

SLN315049_en_US__6esxtop_COD_Enabled.jpg
esxcli proporciona algunas opciones de línea de comandos para mostrar la cantidad de nodos NUMA expuestos desde el hardware.
SLN315049_en_US__7esxcli

Beneficios

En el modo COD, el sistema operativo detecta dos nodos NUMA por conector. COD tiene la mejor latencia local. Cada agente local ve las solicitudes de una menor cantidad de subprocesos, lo que potencialmente ofrece un mayor ancho de banda de memoria. El modo COD tiene compatibilidad con bits de directorio en la memoria. Este modo es el mejor para cargas de trabajo altamente optimizadas NUMA. Consulte un blog publicado por el equipo de HPC de Dell en el que se detallan los diferentes modos de búsqueda. 

Referencias

La base de conocimientos de VMware señala el soporte de contra CoD de Intel Este hipervínculo lo redirige a un sitio web fuera de Dell Technologies.

Cause

No corresponde

Resolution

No corresponde

Article Properties
Article Number: 000147278
Article Type: Solution
Last Modified: 11 Dec 2024
Version:  8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.