Gelijke tred houden met energie-efficiëntie
Summary: Branchewebsites, artikelen en whitepapers waarschuwen al jaren voor de 'data-tsunami'. Meestal ligt de nadruk op nieuwe storagetechnologie, maar net zo belangrijk is de mogelijkheid om deze enorme hoeveelheid nieuwe data te verwerken. ...
Symptoms
Al meer dan tien jaar worstelen IT-bedrijven met de overweldigende groei van data in de computeromgeving. Branchewebsites, artikelen en whitepapers waarschuwen al jaren voor de 'data-tsunami'. Meestal ligt de nadruk op nieuwe storagetechnologie, maar net zo belangrijk is de mogelijkheid om deze enorme hoeveelheid nieuwe data te verwerken.
Machine learning en AI gaan een grote rol spelen in deze ruimte. Op zijn beurt is de drang naar meer verwerkingsmogelijkheden ook geïntensiveerd, wat heeft geleid tot CPU-mogelijkheden met steeds meer vermogen, en in het bijzonder heeft dit geleid tot de recente toename van het gebruik van versnellertechnologieën (GPU, FPGA) om de ultrasnelle parallelle verwerkingsmogelijkheden te leveren die nodig zijn voor rekenintensieve AI-toepassingen.
Deze geavanceerde AI-technologieën en andere toenemende rekenbehoeften vragen om een nieuwe energiearchitectuur om op efficiënte wijze meer verwerkingscapaciteit te leveren, en hoewel deze mogelijkheid tot herontwerp verschillende voordelen met zich meebrengt, is het geen eenvoudig op te lossen probleem.
Het stroomprobleem
De drang naar hogere verwerkingsmogelijkheden brengt een cruciaal systeemontwerpprobleem met zich mee met betrekking tot de elektrische stroomvoorziening. De fijnere productiegeometrie van de huidige processors (minder dan 10 nm) maakt sneller schakelen tussen voeding mogelijk, wat resulteert in minder vertraging en lagere latentie, waarvoor op zijn beurt een lagere spanning nodig is, sub-1 volt (V), om de verwerking aan te sturen. Maar, volgens de wet van Ohm (P=V*I), als het vermogen (P) toeneemt en de spanning (V) lager is, dan moet de stroom (I) toenemen. Dit wordt een probleem omdat het leveren van een hogere stroom aan de processormatrijs of het "pakket" vereist dat er meer socketpinnen worden gebruikt om de hogere stroom te transporteren - socketpinnen die anders zouden kunnen worden gebruikt om meer systeemfunctionaliteit te bieden (dat wil zeggen, I/O, systeembeheer). System on a Chip (SoC)-ontwerpen leggen bijvoorbeeld meer functionaliteit op de chip zelf, dus de vraag wordt dan: hoe lever je op een efficiënte manier meer vermogen, zonder potentiële functionaliteit te verliezen. Dit is belangrijk omdat op grote schaal zelfs kleine efficiëntiewinsten aanzienlijk worden; Eén watt per server voor 100.000 servers kan honderdduizenden dollars besparen gedurende de levenscyclus van die servers.
Oplossing voor verhoogde spanning
Een van de oplossingen die tegenwoordig in de industrie wordt geaccepteerd, is het leveren van een hogere spanning (zoals in, 48V) aan de server. Tijdens de Open Compute Project ("OCP") Summit 2016 kondigde Google een initiatief aan om 48V server- en distributie-infrastructuur te promoten als standaard voor datacenters. Dit model omvat verschillende wijzigingen in de leveringsarchitectuur (hieronder beschreven) die de volgende voordelen kunnen bieden:
- Meer kracht voor de processor (zonder het verminderen van socket- en connectorpinnen en -formaten)
- Minder energieverlies bij energieconversie (minder, efficiëntere conversies)
- Minder drukte in het ontwerp van het moederbord (minder voedingslagen en sporengebieden)
- Kleinere kabels, connectors en rails
- Lagere verliezen bij stroomverdeling
- Hogere vermogenslimieten in vergelijking met 12V-racks
De keuze voor 48V is gemaakt omdat er geen speciale veiligheidsgrenzen nodig zijn. Alles boven de 60V wordt beschouwd als "hoogspanning" en vereist extra veiligheidsisolatie. Dus, bij het gebruik van de wet van Ohm, biedt 48V een viervoudige vermindering van de stroom, maar laat nog steeds een veiligheidsmarge.
Opgemerkt moet worden dat 48V-servers ooit werden gepromoot door Intel in de late jaren 1990, maar vervolgens verloren van 12V-serverontwerpen vanwege de beperkte dichtheid van de spanningsregelaar en de efficiëntie van de energieconversie in die tijd en hogere componentkosten.
Stroomvoorziening
Om de voordelen van het 48V-voedingsmodel te begrijpen, helpt het om eerst te begrijpen hoe vandaag de dag stroom wordt geleverd. Tegenwoordig levert een energiebedrijf meestal wisselstroom (AC) van 220 V tot 240 V, die op zijn beurt door de voedingseenheid (PSU) van een systeem wordt omgezet in 12 V. Het wordt opnieuw omgezet in een spanningsregelaar op het moederbord van het systeem van 12V naar 1.7V (we gebruiken een voorbeeld van een Intel-implementatie). Deze rail van 1,7 V heeft ongeveer twee keer de spanning die de CPU uiteindelijk nodig heeft om de stroom die door het moederbord wordt geleverd te verminderen, zodat er minder pinnen kunnen worden gebruikt om stroom te leveren aan het processorsubstraat. Maar de stroom moet opnieuw worden omgezet op de matrijs en het substraat om de sub-één volt-niveaus te bereiken die nodig zijn voor de processor.
Afbeelding 1: Het huidige 12-volt leveringsmodel
Inefficiëntie door verlies van elektrische distributie
Bij elke omzettingsfase gaat een bepaald niveau van vermogen/energie verloren. Geschat wordt dat de algehele energie-efficiëntie van de huidige traditionele datacenters (van nutsvoorzieningen tot processors tot koeling) doorgaans in het midden van de 80% ligt, hoewel de inefficiëntie van de huidige voedingseenheden (PSU's) en ingebouwde spanningsregelaars (VR) al ruim boven de 90% ligt. Bovendien gaat deze energie verloren in de vorm van warmte, waardoor datacenters nog meer energie (en kosten) moeten besteden om deze krachtigere systemen te koelen. Door de energie-efficiëntie te verhogen (waardoor energieverlies wordt geëlimineerd) kunnen datacenters uiteindelijk besparen op koelingskosten. Zelfs een verhoging van de efficiëntie met één procentpunt brengt aanzienlijke financiële en milieuvoordelen met zich mee.
Elektrische distributieverliezen zijn een functie van het kwadraat van de stroom (vermogen = I2R). Dus het verminderen van de hoeveelheid stroom (I) door een bepaalde weerstand (R) heeft invloed op de hoeveelheid verlies. Het verminderen van de stroom kan worden bereikt door de spanning te verhogen (de wet van Ohm), waardoor de belangstelling voor het 48V-model groter wordt.
Nieuwe benaderingen voor vermogenslevering
Op dit moment blijft de effectieve stroomtoevoer naar de krachtige processors een dynamisch gebied; Er worden verschillende benaderingen gevolgd. Twee van dergelijke benaderingen en de voordelen van elk worden hieronder beschreven.
Een manier om de efficiëntie te verhogen was om de 48 volt rechtstreeks aan het substraat van het processorpakket te leveren en vervolgens om te zetten in sub-1V op het substraat. Deze aanpak elimineert één conversiefase (het verhogen van de efficiëntie) en maakt het mogelijk om een lage stroom aan het substraat te leveren (waardoor de beschikbaarheid van de pinnen toeneemt). Gezien de zeer beperkte beschikbare ruimte op het verpakkingssubstraat, moet de stroomomvormer van 48V naar sub-één volt echter een hoge dichtheid en een laag profiel hebben, dus het implementeren van deze technologie is nog steeds complex en duur.
Afbeelding 2: Direct naar substraat 48 volt leveringsmodel
Een andere benadering is geweest om de 48 volt op het moederbord te leveren. Op dat moment zet een spanningsregelaar deze om in een sub-één spanning (zoals in, 0,85V) en levert deze vervolgens rechtstreeks aan de processor. Deze aanpak elimineert ook één conversie (waardoor de efficiëntie toeneemt), maar moet een hogere stroom aan het substraat leveren, waardoor er geen besparing op het aantal voedingspinnen mogelijk is. Deze aanpak komt vaker voor omdat deze minder complex en goedkoper is dan het directe leveringsmodel.
Afbeelding 3: 48 volt naar moederbord Leveringsmodel
Andere voordelen
Er kunnen ook enkele andere voordelen worden ontleend aan de overstap naar het 48V-model. Omdat een 48V-rail 4x minder stroom draagt dan een 12V-rail, kan dit mogelijk 16x (I2) aan elektrische distributieverlies besparen als dezelfde railbar wordt gebruikt voor de stroomverdeling van het rack. Dit kan ertoe leiden dat kabels (of rails) dunner zijn (met een hogere spoorwijdte) omdat ze minder stroom voeren.
Zowel ruimte als kosten kunnen worden bespaard omdat componenten (connectoren, condensatoren, kabels en rails) worden verkleind en naarmate er ruimte vrijkomt, worden er meer ontwerpopties beschikbaar gesteld aan systeemontwerpers.
Op rackniveau worden deze voordelen nog vermenigvuldigd. Het 48V in-rack stroomdistributiemodel (vergelijkbaar met 12V stroomverdeling op rackniveau) biedt de mogelijkheid om gedistribueerde gelijkstroom (DC) UPS te implementeren en elimineert de noodzaak van de omvangrijke wisselstroom (AC) UPS op faciliteitsniveau, die niet alleen volumineus is, maar ook inflexibel en moeilijk te onderhouden. Gedistribueerde DC UPS daarentegen, in combinatie met moderne op lithium gebaseerde batterijtechnologieën, is compacter, lichter en gemakkelijk te onderhouden. Dit heeft ook het voordeel dat een pay-as-you-go-mogelijkheid mogelijk is, dat wil zeggen dat capaciteit dynamisch wordt toegevoegd wanneer er extra capaciteit nodig is.
Het is nog steeds een 12 volt wereld
Ongeacht de interesse in 48V-efficiëntie, de huidige moederborden van 12V-servers bestaan al 20+ jaar. Twaalf volt infrastructuur is een commodity - het bestaat tegenwoordig in enorme hoeveelheden in de wereld - en de huidige 12V-toeleveringsketen is geoptimaliseerd. De conversie naar hogere spanning zal dus niet alomtegenwoordig zijn in de infrastructuur. Zo zullen harde schijven nog steeds 12V zijn om te kunnen profiteren van het brede scala aan beproefde opties in de huidige storagemarkt, zodat mainstream serverontwerpen in de nabije toekomst 12V-vermogen zullen blijven bevatten. Maar met de onverzadigbare dorst naar verwerkingskracht, kan men meer adopties verwachten van cartridges en moederborden met een hogere spanning, zoals we al zien op het gebied van AI en Machine Learning.
Voor alle duidelijkheid: 48V spanningsregelaars die geschikt zijn voor mainstream moederbord- of processorpakkettoepassingen (d.w.z. met een hoge dichtheid, efficiëntie en kostenoptimalisatie) zijn nog steeds beperkt. Maar toonaangevende leveranciers van halfgeleiders op het gebied van energiebeheer, samen met de energieconversie-industrie, werken er intensief aan, en de verwachting is dat er de komende jaren meer haalbare oplossingen beschikbaar komen. Vooruitgang in processor- en verpakkingstechnologieën zou een tijdperk kunnen inluiden waarin de conversie van de laatste fase met een hoge spanningsconversieratio kan plaatsvinden in het silicium van de processor en/of op het verpakkingssubstraat, en hogere spanning er rechtstreeks op kan worden gevoerd.
Conclusie
Een van de grootste uitdagingen voor datacenters is het verbeteren van de energie-efficiëntie. In veel gevallen komt het streven naar meer efficiëntie neer op het besparen van energie en de daarmee gepaard gaande operationele kosten, en daarmee op het besparen van de total cost of ownership (TCO). De behoefte aan een nog hoger stroomverbruik maakt het dus des te belangrijker om er de hoogst mogelijke efficiëntie uit te persen.
Dell EMC werkt samen met een breed scala aan klanten om enkele van de meest complexe en interessante problemen op het gebied van machine learning op te lossen. De Extreme Scale Infrastructure (ESI)-groep zet zich in om op de hoogte te blijven van de nieuwste energietechnologieën en deze toe te passen waar ze zinvol zijn, zodat we onze klanten kunnen helpen om efficiënt te voldoen aan hun onverminderde vraag naar verwerkingscapaciteit.
Voor meer informatie over wat Dell EMC Extreme Scale Infrastructure doet met energietechnologieën, neemt u contact op met ESI@dell.com.
Cause
N.v.t.
Resolution
N.v.t.