Allineamento all'efficienza energetica
Summary: I siti web di settore, gli articoli e i white paper mettono in guardia da anni contro lo "tsunami dei dati". Di solito l'enfasi è posta sulle nuove tecnologie di storage, ma altrettanto importante è la capacità di elaborare questa enorme quantità di nuovi dati. ...
Symptoms
Da oltre un decennio, i reparti IT si confrontano con la crescita travolgente dei dati nell'ambiente informatico. I siti web di settore, gli articoli e i white paper mettono in guardia da anni contro lo "tsunami dei dati". Di solito l'enfasi è posta sulle nuove tecnologie di storage, ma altrettanto importante è la capacità di elaborare questa enorme quantità di nuovi dati.
L'apprendimento automatico e l'AI stanno assumendo un ruolo sempre più importante in questo ambito. A sua volta, la spinta verso maggiori capacità di elaborazione si è intensificata, portando a CPU sempre più potenti e, in particolare, a un recente aumento dell'uso di tecnologie di accelerazione (GPU, FPGA) per fornire le capacità di elaborazione parallela ad altissima velocità necessarie per le applicazioni di AI ad elevata intensità computazionale.
Queste tecnologie avanzate di AI, insieme ad altre crescenti esigenze di elaborazione, richiedono una nuova architettura di alimentazione in grado di fornire in modo efficiente maggiore capacità di elaborazione e, sebbene questa opportunità di riprogettazione offra diversi benefici, non si tratta di un problema semplice da risolvere.
Il problema della potenza
La spinta verso capacità di elaborazione sempre più elevate porta con sé una questione cruciale nella progettazione dei sistemi, legata alla distribuzione dell'energia elettrica. La geometria di produzione sempre più fine dei processori odierni (inferiore ai 10 nm) consente una commutazione di potenza più rapida, con conseguente riduzione dei ritardi e della latenza, il che richiede tensioni più basse (inferiori a 1 volt (V)), per alimentare l'elaborazione. Tuttavia, seguendo la legge di Ohm (P=V*I), se la potenza (P) aumenta mentre la tensione (V) si riduce, la corrente (I) deve aumentare. Questo diventa un problema perché fornire una corrente maggiore alla matrice del processore o al "package" richiede l'uso di più pin del socket per trasportarla, pin che altrimenti potrebbero essere utilizzati per offrire funzionalità di sistema aggiuntive (come I/O e gestione del sistema). Ad esempio, le progettazioni System on a Chip (SoC) integrano sempre più funzionalità direttamente sul chip, quindi la domanda diventa: come fornire più potenza in modo efficiente senza sacrificare la potenziale funzionalità? Questo aspetto è importante perché, su larga scala, anche piccoli guadagni in termini di efficienza diventano significativi: un solo watt risparmiato per server, moltiplicato per 100.000 server, può tradursi in centinaia di migliaia di dollari di risparmio durante il ciclo di vita di quei server.
Maggiore soluzione di tensione
Una delle soluzioni che oggi sta trovando accettazione nell'industria è quella di fornire una tensione più elevata (ad esempio, 48 V) ai server. In occasione dell'Open Compute Project (OCP) Summit 2016, Google ha annunciato un'iniziativa per promuovere i server a 48 V e le infrastrutture di distribuzione come standard per i data center. Questo modello comporta diversi cambiamenti nell'architettura di distribuzione (descritti di seguito) che possono offrire i seguenti vantaggi:
- Maggiore potenza al processore (senza ridurre pin e dimensioni di socket e connettori)
- Minore perdita di energia nella conversione (meno conversioni, più efficienti)
- Minore affollamento sul design della scheda madre (meno strati di alimentazione e aree di tracciamento)
- Cavi, connettori e busbar di dimensioni ridotte
- Minori perdite di distribuzione dell'alimentazione
- Limiti di potenza più elevati rispetto ai rack a 12 V
La scelta dei 48 V è stata fatta perché non richiede barriere di sicurezza speciali. Tutto ciò che supera i 60 V è considerato “alta tensione” e richiederebbe un'ulteriore isolamento di sicurezza. Quindi, applicando la legge di Ohm, i 48 V consentono una riduzione di corrente di quattro volte, lasciando comunque un margine di sicurezza.
Va notato che i server a 48 V erano già stati promossi da Intel alla fine degli anni '90, ma persero terreno rispetto ai design a 12 V a causa della limitata densità dei regolatori di tensione e dell'efficienza di conversione energetica di quell'epoca, oltre ai costi più elevati dei componenti.
Erogazione di potenza
Per comprendere i vantaggi del modello di alimentazione a 48 V, è utile capire innanzitutto come viene fornita l'energia oggi. Attualmente, un fornitore di energia elettrica eroga corrente alternata (CA) a 220 V-240 V, che viene poi convertita dall'unità di alimentazione del sistema a 12 V. Successivamente, sulla scheda madre del sistema, un regolatore di tensione converte i 12 V in 1,7 V (stiamo usando come esempio un'implementazione Intel). Questa linea a 1,7 V è circa il doppio della tensione effettivamente necessaria alla CPU: ciò serve a ridurre la corrente erogata dalla scheda madre, così da utilizzare un numero inferiore di pin per fornire potenza al substrato del processore. Tuttavia, la potenza deve essere convertita ancora una volta direttamente sulla matrice e sul substrato per raggiungere i livelli inferiori a 1 volt richiesti dal processore.
Figura 1. Modello di erogazione a 12 volt di oggi
Inefficienze nella distribuzione elettrica
A ogni fase di conversione si perde un certo livello di potenza/energia. È stato stimato che le efficienze energetiche complessive dei data center tradizionali di oggi (dalle utility ai processori fino al raffreddamento) si attestino in genere intorno all'85%, sebbene le inefficienze delle unità di alimentazione e dei regolatori di tensione integrati (VR) superino già il 90%. Inoltre, questa energia viene dissipata sotto forma di calore, costringendo i data center a consumare ancora più energia (e denaro) per raffreddare questi sistemi a prestazioni più elevate. Aumentare l'efficienza energetica (ridurre le perdite) consente in ultima analisi ai data center di risparmiare sui costi di raffreddamento. Anche un singolo punto percentuale di aumento dell'efficienza comporta guadagni significativi sia dal punto di vista economico che ambientale.
Le perdite di distribuzione elettrica sono funzione del quadrato della corrente (Potenza = I²R). Quindi, ridurre la quantità di corrente (I) che attraversa una determinata resistenza (R) influisce sull'entità della perdita. La riduzione della corrente può essere ottenuta aumentando la tensione (legge di Ohm), alimentando così il crescente interesse per il modello a 48 V.
Nuovi approcci all'erogazione della potenza
In questo momento, la distribuzione efficiente della potenza ai processori ad alte prestazioni rimane un'area in continua evoluzione; sono in corso diversi approcci. Due di questi, insieme ai relativi vantaggi, sono descritti di seguito.
Un approccio per ottenere una maggiore efficienza consiste nel fornire i 48 volt direttamente al substrato del package del processore e quindi convertirli a meno di 1 V direttamente sul substrato. Questo metodo elimina uno stadio di conversione (aumentando l'efficienza) e consente di fornire al substrato una corrente ridotta (incrementando la disponibilità di pin). Tuttavia, dato lo spazio estremamente limitato disponibile sul substrato del package, il convertitore di potenza da 48 V a meno di 1 V deve avere un'elevata densità e un profilo ridotto; pertanto, l'implementazione di questa tecnologia rimane ancora complessa e costosa.
Figura 2. Modello di alimentazione diretta a 48 volt sul substrato
Un altro approccio consiste nel fornire i 48 volt direttamente alla scheda madre. A questo punto, un regolatore di tensione li converte a un valore inferiore a 1 volt (ad esempio, 0,85 V) e li fornisce poi direttamente al processore. Anche questo metodo elimina uno stadio di conversione (aumentando l'efficienza), ma deve fornire una corrente più elevata al substrato, senza quindi consentire risparmi nel numero di pin dedicati all'alimentazione. Questo approccio è più comune perché è meno complesso e meno costoso rispetto al modello di alimentazione diretta al substrato.
Figura 3. modello di alimentazione a 48 V verso la scheda madre
Altri vantaggi
Si possono ottenere ulteriori vantaggi passando al modello a 48 V. In una soluzione completamente integrata a livello di rack, poiché un busbar a 48 V trasporta una corrente 4 volte inferiore rispetto a un busbar a 12 V, è possibile ridurre potenzialmente di 16 volte (I²) le perdite di distribuzione elettrica, se si utilizza lo stesso busbar per la distribuzione dell'alimentazione del rack. Questo può portare alla pratica progettuale di utilizzare cavi (o busbar) più sottili (a sezione maggiore) poiché trasportano meno corrente.
Sia lo spazio che i costi possono essere ridotti, in quanto i componenti (connettori, condensatori, cavi e busbar) diventano più piccoli e, man mano che lo spazio si libera, vengono rese disponibili maggiori opzioni per i progettisti di sistemi.
A livello di rack, questi vantaggi si moltiplicano. Il modello di distribuzione dell'alimentazione a 48 V all'interno del rack (simile alla distribuzione a 12 V a livello di rack) offre l'opportunità di implementare sistemi UPS CC distribuiti, eliminando la necessità dei voluminosi UPS CA a livello di impianto che, oltre a occupare molto spazio, risultano rigidi e difficili da sottoporre a manutenzione. Al contrario, gli UPS CC distribuiti, abbinati alle moderne tecnologie di batterie al litio, sono più compatti, leggeri e richiedono una manutenzione semplice. Offrono inoltre il vantaggio aggiuntivo di abilitare una capacità "Pay As You Go", ossia la possibilità di aggiungere capacità in modo dinamico ogni volta che se ne presenta la necessità.
È ancora un mondo a 12 volt
Nonostante l'interesse per l'efficienza dei 48 V, le schede madri dei server a 12 V sono in uso da oltre 20 anni. L'infrastruttura a 12 V è ormai di uso comune: esiste oggi in enormi volumi ed è ottimizzata lungo tutta la supply chain. Pertanto, la conversione a tensioni più elevate non sarà onnipresente in tutta l'infrastruttura. Ad esempio, i dischi rigidi continueranno a funzionare a 12 V per sfruttare l'ampia gamma di soluzioni consolidate disponibili nel mercato dello storage e quindi le progettazioni classiche dei server integreranno comunque un'alimentazione a 12 V ancora per un futuro prevedibile. Tuttavia, con l'incessante domanda di potenza di elaborazione, ci si può aspettare una maggiore adozione di cartucce e schede madri alimentate a tensioni più elevate, come già si osserva nelle aree dell'AI e dell'apprendimento automatico.
Per essere chiari, le soluzioni di regolatori di tensione a 48 V adatte alle applicazioni classiche su schede madri o package di processore (ossia ad alta densità, efficienti e ottimizzate nei costi) sono ancora limitate. Tuttavia, i principali fornitori di semiconduttori per la gestione dell'alimentazione, insieme all'industria della conversione energetica, stanno lavorando intensamente su questo fronte e ci si aspetta che nei prossimi anni diventino disponibili soluzioni più valide. I progressi nelle tecnologie dei processori e dei package potrebbero inaugurare un'era in cui l'ultima fase di conversione, con un elevato rapporto di trasformazione della tensione, potrà avvenire direttamente all'interno del silicio del processore e/o sul suo substrato, consentendo di alimentare direttamente a tensioni più elevate.
Conclusione
Una delle maggiori sfide per i data center è il miglioramento dell'efficienza energetica. In molti casi, la ricerca di una maggiore efficienza si traduce nel risparmio di energia e dei relativi costi operativi e, di conseguenza, nella riduzione del costo totale di proprietà (TCO). Pertanto, la necessità di un consumo energetico sempre maggiore rende ancora più importante ottenere i massimi livelli di efficienza possibili.
Dell EMC collabora con un'ampia gamma di clienti per contribuire a risolvere alcuni dei problemi di apprendimento automatico più complessi e interessanti. Il gruppo Extreme Scale Infrastructure (ESI) si impegna a rimanere aggiornato sulle più recenti tecnologie di alimentazione e ad applicarle laddove abbiano senso, in modo da supportare i clienti nel soddisfare in modo efficiente la loro crescente domanda di capacità di elaborazione.
Per ulteriori informazioni sulle iniziative di Dell EMC Extreme Scale Infrastructure nel campo delle tecnologie di alimentazione, contattare ESI@dell.com.
Cause
N/D
Resolution
N/D