Acompanhando o ritmo da eficiência no consumo de energia

Summary: Há anos, sites, artigos e white papers do setor têm alertado sobre o "tsunami de dados". Em geral, a ênfase está na nova tecnologia de armazenamento, mas a capacidade de processar essa enorme quantidade de novos dados também é muito importante. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms


Por mais de uma década, os departamentos de TI têm lutado para lidar com o crescimento esmagador de dados no ambiente computacional.  Há anos, sites, artigos e white papers do setor têm alertado sobre o "tsunami de dados". Em geral, a ênfase está na nova tecnologia de armazenamento, mas a capacidade de processar essa enorme quantidade de novos dados também é muito importante. 

 

O aprendizado de máquina e a IA estão chegando para desempenhar um papel importante nesse espaço. Por sua vez, a pressão por maior capacidade de processamento também se intensificou, levando a recursos de CPU cada vez mais avançados, e resultou no recente aumento do uso de tecnologias aceleradoras (GPU, FPGA) para oferecer a capacidade de processamento paralelo ultra rápida necessária para aplicativos de IA com uso intenso de computação.

Essas tecnologias avançadas de IA e outras necessidades crescentes de computação exigem uma nova arquitetura de potência para oferecer com eficiência mais capacidade de processamento. Embora essa oportunidade de reformulação traga vários benefícios, não é um problema simples de resolver.

O problema de energia

A demanda por recursos de processamento mais avançados gera um problema crucial de design do sistema relacionado ao fornecimento de energia elétrica.  A geometria de fabricação mais fina dos processadores atuais (menos de 10 nm) permite uma comutação de energia mais rápida, resultando em menos atraso e menor latência, exigindo menos tensão, abaixo de 1 V (V), para impulsionar o processamento.  Mas, de acordo com a lei de Ohm (P=V*I), se a potência (P) aumentar e a tensão (V) for menor, a corrente (I) deverá aumentar. Isso se torna um problema porque o fornecimento de corrente mais alta ao "pacote" ou à matriz do processador exige o uso de mais pinos de soquete para transportar a corrente mais alta. E esses pinos de soquete poderiam ser usados para fornecer maior funcionalidade ao sistema (ou seja, E/S, gerenciamento do sistema). Por exemplo, os designs System on a Chip (SoC) colocam mais funcionalidade no próprio chip. Então, a pergunta é: Como entregar mais energia com eficiência sem perder a funcionalidade potencial? Isso é importante porque, em escala, até mesmo pequenos ganhos em eficiência se tornam significativos: um watt por servidor para 100 mil servidores pode economizar centenas de milhares de dólares ao longo dos ciclos de vida desses servidores.

 

Solução de tensão aumentada

Uma das soluções que encontram aceitação no setor atualmente é fornecer maior tensão (como 48 V) ao servidor. No Open Compute Project ("OCP") Summit de 2016, a Google anunciou uma iniciativa para promover a infraestrutura de servidor e distribuição de 48 V como padrão para data centers. Esse modelo envolve várias alterações na arquitetura de entrega (descritas abaixo) que podem oferecer as seguintes vantagens:

 

  • Mais potência para o processador (sem reduzir os pinos e tamanhos do conector e do soquete)
  • Menos perda de energia na conversão (menos conversões e mais eficientes)
  • Menos aglomeração no design da placa-mãe (menos camadas de energia e áreas de rastreamento)
  • Cabos, conectores e barramentos menores
  • Redução da perda de distribuição de energia
  • Limites de energia mais altos em comparação com racks de 12 V

 

A escolha de 48 V foi feita porque não requer limites especiais de segurança. Qualquer valor acima de 60 V é considerado "alta tensão" e exigiria isolamento de segurança adicional. Ao usar a Lei de Ohm, o design de 48 V fornece uma redução de quatro vezes na corrente, mas ainda deixa uma margem de segurança.

Deve-se observar que os servidores de 48 V já foram promovidos pela Intel no final dos anos 90, mas depois perderam para os designs de servidor de 12 V devido à densidade limitada do regulador de tensão e à eficiência de conversão de energia e aos custos mais altos dos componentes na época.

 

Fornecimento de energia

Para entender as vantagens do modelo de energia de 48 V, primeiro é útil entender como a energia é fornecida hoje. Hoje, uma empresa de energia normalmente fornece corrente alternada (CA) de 220 V a 240 V, que, por sua vez, é convertida pela fonte de alimentação (PSU) de um sistema em 12 V. Ela é convertida novamente em um regulador de tensão localizado na placa-mãe do sistema de 12 V para 1,7 V (estamos usando um exemplo de implementação da Intel). Este rail de 1,7 V tem cerca de duas vezes a tensão que a CPU precisa para reduzir a corrente fornecida pela placa-mãe, para que menos pinos possam ser usados para fornecer energia ao substrato do processador. Mas a energia deve ser convertida novamente na matriz e no substrato para chegar aos níveis abaixo de um volt necessários para o processador. 

 

SLN314078_en_US__1iC_Todays_12_volt_delivery_model_BD_v1(1)
Figura 1: Modelo atual de entrega de 12 volts

 

Ineficiências da perda de distribuição elétrica

Em cada estágio da conversão, alguma quantidade de energia/potência é perdida. Em geral, estima-se que as eficiências gerais de energia dos data centers tradicionais atuais (de utilitários a processadores e resfriamento) estejam na faixa de 80%, embora as ineficiências das fontes de alimentação (PSUs) e dos reguladores de tensão (VR) integrados já tenham estado bem acima de 90%.  Além disso, essa energia é perdida na forma de calor, o que faz com que os data centers precisem gastar ainda mais energia (e dinheiro) para resfriar esses sistemas de maior desempenho. O aumento da eficiência no consumo de energia (eliminando a perda de energia), em última análise, permite que os data centers economizem nos custos de resfriamento. Mesmo um único ponto percentual de aumento na eficiência traz ganhos financeiros e ambientais significativos.

 

As perdas de distribuição elétrica são uma função do quadrado da corrente (Potência: I2R).  Então, reduzir a quantidade de corrente (I) por meio de determinada resistência (R) afeta a quantidade de perda.  A redução da corrente pode ser alcançada aumentando a tensão (lei de Ohm), aumentando assim o interesse no modelo de 48 V.

 

 

Novas abordagens de fornecimento de energia

Neste momento, o fornecimento de energia eficaz para os processadores de alta potência continua sendo uma área dinâmica, várias abordagens estão sendo buscadas. Duas dessas abordagens e as vantagens de cada uma delas são descritas abaixo.

 

Uma abordagem para proporcionar maior eficiência foi entregar os 48 volts diretamente ao substrato do pacote do processador e, em seguida, converter para menos de 1 V no substrato. Essa abordagem elimina um estágio de conversão (aumento da eficiência) e permite a entrega de baixa corrente para o substrato (aumento da disponibilidade dos pinos).  No entanto, dado o espaço altamente limitado disponível no substrato do pacote, o conversor de energia de 48 V para menos de um V deve ser de alta densidade e baixo perfil, portanto, a implementação dessa tecnologia ainda é complexa e cara.

 

SLN314078_en_US__2iC_Direct_to_substrate_48_volt_delivery_model_BD_v1
Figura 2: Modelo de entrega de 48 volts direto para o substrato

 

Outra abordagem tem sido entregar os 48 volts à placa-mãe.  Nesse ponto, um regulador de tensão faz a conversão para uma tensão inferior a um (0,85 V) e, em seguida, a fornece diretamente ao processador.  Essa abordagem também elimina uma conversão (aumento da eficiência), mas deve fornecer maior corrente ao substrato, o que não permite economizar no número de pinos de distribuição de energia. Essa abordagem é mais comum porque é menos complexa e mais barata do que o modelo de entrega direta.

 

SLN314078_en_US__3iC_48_volt_to_motherboard_delivery_model_BD_v1
Figura 3: Modelo de fornecimento de 48 volts à placa-mãe

 

Outras vantagens

Algumas outras vantagens também podem ser derivadas da mudança para o modelo de 48 V. Em uma solução em escala de rack totalmente integrada, como um barramento de 48 V carrega 4 vezes menos corrente do que um barramento de 12 volts, é possível economizar 16 vezes (I2) a perda de distribuição elétrica se o mesmo barramento for usado para distribuição de energia do rack.  Isso pode resultar em um design em que os cabos (ou barramentos) são mais finos (calibre superior), pois carregam menos corrente.

 

O espaço e o custo podem ser economizados à medida que os componentes (conectores, capacitores, cabos e barramentos) têm o tamanho reduzido e, à medida que o espaço é liberado, mais opções de design são disponibilizadas aos designers de sistema.

 

No nível do rack, essas vantagens são multiplicadas. O modelo de distribuição de energia de 48 V no rack (semelhante à distribuição de energia de 12 V no rack) oferece a oportunidade de implementar UPS de corrente contínua (CC) distribuída e elimina a necessidade da enorme UPS de corrente alternada (CA) no nível da instalação que, além de volumosa, é inflexível e difícil de manter.  Por outro lado, a UPS de CC distribuída, combinada com as modernas tecnologias de bateria à base de lítio, é mais compacta, leve e fácil de manter.  Ela também tem a vantagem adicional de possibilitar o recurso de pagamento conforme o uso, ou seja, adicionar capacidade dinamicamente sempre que for necessária.

 

O design de 12 volts ainda predomina

Independentemente do interesse nas eficiências de 48 V, as placas-mãe de servidores de 12 V de hoje existem há mais de 20 anos. A infraestrutura de 12 volts é um produto básico. Atualmente, ela existe em grande volume no mundo e agora a cadeia de suprimentos de 12 V é otimizada. Portanto, a conversão para tensão mais alta não será onipresente em toda a infraestrutura. Por exemplo, os discos rígidos ainda terão 12 V para aproveitar a ampla variedade de opções comprovadas no mercado de armazenamento atual. Portanto, os designs de servidor mainstream continuarão a incorporar alimentação de 12 V no futuro. Mas, com a sede insaciável por capacidade de processamento, pode-se esperar mais adoção de cartuchos e placas-mãe com alta tensão, como já estamos vendo nas áreas de IA e aprendizado de máquina.

Sendo bem claro, as soluções de regulador de tensão de 48 V adequadas para aplicativos mainstream de placa-mãe ou pacote de processador (ou seja, com alta densidade, eficiência e custo otimizado) ainda são limitadas.  Mas os principais fornecedores de semicondutores de gerenciamento de energia, juntamente com o setor de conversão de energia, estão trabalhando intensamente nisso, e espera-se que soluções mais viáveis estejam disponíveis nos próximos anos.  Os avanços nas tecnologias de processador e pacotes podem inaugurar uma era em que a conversão do último estágio com taxa de conversão de alta tensão pode acontecer no silício do processador e/ou no substrato do pacote, e uma tensão mais alta pode ser alimentada diretamente neles.

Conclusão

Um dos maiores desafios para os data centers é a melhoria da eficiência no consumo de energia. Em muitos casos, a busca por maior eficiência se resume à economia de energia e ao custo operacional associado e, ao fazer isso, à economia do custo total de propriedade (TCO). Por isso, a necessidade de um uso de energia ainda maior torna muito mais importante extrair os mais altos níveis de eficiência possíveis.  

 

A Dell EMC trabalha com uma ampla variedade de clientes para ajudar a resolver alguns dos problemas mais complexos e interessantes do aprendizado de máquina. O grupo Extreme Scale Infrastructure (ESI) tem o compromisso de se manter a par das mais recentes tecnologias de energia e aplicá-las onde elas fizerem sentido, para que possamos ajudar nossos clientes a atender com eficiência à demanda inesgotável de capacidade de processamento.

 

Para obter mais informações sobre o que o Dell EMC Extreme Scale Infrastructure está fazendo com as tecnologias de energia, entre em contato com ESI@dell.com.

Cause

N/D

Resolution

N/D

Article Properties
Article Number: 000146132
Article Type: Solution
Last Modified: 21 Aug 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.