Håller jämna steg med energieffektiviteten
Summary: Branschwebbplatser, artiklar och whitepapers har varnat för "datatsunamin" i åratal. Vanligtvis ligger tonvikten på ny lagringsteknik, men lika viktigt är förmågan att bearbeta denna enorma mängd nya data. ...
Symptoms
I mer än ett decennium har IT-butiker brottats med den överväldigande tillväxten av data i datormiljön. Branschwebbplatser, artiklar och whitepapers har varnat för "datatsunamin" i åratal. Vanligtvis ligger tonvikten på ny lagringsteknik, men lika viktigt är förmågan att bearbeta denna enorma mängd nya data.
Maskininlärning och AI kommer att spela en stor roll inom detta område. Efterfrågan på större bearbetningskapacitet har i sin tur också intensifierats, vilket har lett till allt högre processorkapacitet, och i synnerhet har det lett till den senaste tidens ökning av användningen av acceleratorteknik (GPU, FPGA) för att leverera de parallella bearbetningsfunktioner med ultrahög hastighet som behövs för beräkningsintensiva AI-program.
Dessa avancerade AI-tekniker, och andra ökande beräkningsbehov, kräver en ny energiarkitektur för att effektivt leverera mer bearbetningskapacitet, och även om denna möjlighet till omdesign ger flera fördelar är det inte ett enkelt problem att lösa.
Problemet med strömförsörjningen
Strävan efter högre bearbetningskapacitet för med sig en avgörande systemdesignfråga relaterad till elektrisk strömförsörjning. Den finare tillverkningsgeometrin hos dagens processorer (mindre än 10 nm) möjliggör snabbare strömväxling, vilket resulterar i mindre fördröjning och lägre latens, vilket i sin tur kräver lägre spänning - under 1 volt (V) - för att driva bearbetning. Men enligt Ohms lag (P=V*I), om effekten (P) ökar och spänningen (V) är lägre, måste strömmen (I) öka. Detta blir ett problem eftersom leverans av högre ström till processormatrisen eller "paketet" kräver att man använder fler sockelstift för att bära den högre strömmen - uttagsstift som annars skulle kunna användas för att ge större systemfunktionalitet (det vill säga I/O, systemhantering). Till exempel lägger System on a Chip (SoC) mer funktionalitet på själva chipet, så frågan blir då: hur levererar du mer kraft effektivt, utan att förlora potentiell funktionalitet. Detta är viktigt eftersom även små effektivitetsvinster blir betydande i stor skala. En watt per server för 100 000 servrar kan spara hundratusentals dollar under dessa servrars livscykler.
Lösning med högre spänning
En av de lösningar som får acceptans i branschen idag är att leverera ökad spänning (som i 48V) till servern. Vid Open Compute Project ("OCP") Summit 2016 tillkännagav Google ett initiativ för att främja 48V-server- och distributionsinfrastruktur som standard för datacenter. Den här modellen omfattar flera ändringar i leveransarkitekturen (beskrivs nedan) som kan ge följande fördelar:
- Mer effekt till processorn (utan att minska sockel- och kontaktstift och storlekar)
- Mindre energiförlust vid effektomvandling (färre, effektivare omvandlingar)
- Mindre trängsel på moderkortets design (färre strömlager och spårområden)
- Mindre kablar, kontakter och samlingsskenor
- Lägre effektdistributionsförluster
- Högre effektgränser jämfört med 12 V-rack
Valet av 48V gjordes eftersom det inte kräver några speciella säkerhetsgränser. Allt över 60V anses vara "högspänning" och skulle kräva ytterligare säkerhetsisolering. Så genom att använda Ohms lag ger 48V en fyrfaldig minskning av strömmen, men lämnar fortfarande en säkerhetsmarginal.
Det bör noteras att 48V-servrar en gång marknadsfördes av Intel i slutet av 1990-talet, men sedan förlorade mot 12V-serverkonstruktioner på grund av den erans begränsade spänningsregulatortäthet och effektomvandlingseffektivitet och högre komponentkostnader.
Kraftförsörjning
För att förstå fördelarna med 48V-effektmodellen hjälper det att först förstå hur ström levereras idag. Idag levererar ett elbolag vanligtvis växelström (AC) vid 220 V till 240 V, som i sin tur omvandlas av systemets strömförsörjningsenhet (PSU) till 12 V. Den konverteras igen i en spänningsregulator på systemets moderkort från 12 V till 1,7 V (vi använder ett Intel-implementeringsexempel). Denna 1,7 V-skena är ungefär dubbelt så hög som den spänning som processorn slutligen behöver för att minska strömmen som levereras från moderkortet så att färre stift kan användas för att leverera strömmen till processorsubstratet. Men kraften måste omvandlas ännu en gång på matrisen och substratet för att komma till de nivåer under en volt som behövs för processorn.
Bild 1: Dagens 12-volts leveransmodell
Ineffektivitet i eldistributionen
Vid varje omvandlingssteg går en viss nivå av effekt/energi förlorad. Det har uppskattats att den totala energieffektiviteten i dagens traditionella datacenter (från elnät till processorer till kylning) vanligtvis har legat i mitten av 80 %, även om ineffektiviteten hos dagens nätaggregat (PSU) och inbyggda spänningsregulatorer (VR) redan har legat långt över 90 %. Dessutom går denna energi förlorad i form av värme, vilket resulterar i att datacenter behöver spendera ännu mer energi (och kostnad) för att kyla dessa system med högre prestanda. Ökad energieffektivitet (eliminerar energiförlust) gör att datacenter kan spara på kylningskostnader. Även en enda procentenhets ökning av effektiviteten ger betydande ekonomiska och miljömässiga vinster.
Eldistributionsförluster är en funktion av kvadraten på strömmen (Effekt = I2R). Så, att minska mängden ström (I) genom ett visst motstånd (R) påverkar förlusten. Att minska strömmen kan uppnås genom att öka spänningen (Ohms lag), vilket ökar intresset för 48V-modellen.
Nya metoder för strömförsörjning
Vid denna tidpunkt är effektiv strömförsörjning till högeffektprocessorer fortfarande ett dynamiskt område; Olika tillvägagångssätt tillämpas. Två sådana tillvägagångssätt och fördelarna med var och en beskrivs nedan.
Ett sätt att ge högre effektivitet har varit att leverera 48 volt direkt till processorpaketets substrat och sedan konvertera till sub 1V på substratet. Detta tillvägagångssätt eliminerar ett omvandlingssteg (ökar effektiviteten) och möjliggör leverans av låg ström till substratet (vilket ökar stifttillgängligheten). Men med tanke på det mycket begränsade utrymmet som finns tillgängligt på förpackningssubstratet måste effektomvandlaren från 48V till sub-one volt ha hög densitet och låg profil, så att implementera denna teknik är fortfarande komplicerat och dyrt.
Bild 2: Direkt-till-substrat 48 volt leveransmodell
Ett annat tillvägagångssätt har varit att leverera 48 volt till moderkortet. Då omvandlar en spänningsregulator den till en spänning under ett (0,85 V) och skickar den sedan direkt till processorn. Detta tillvägagångssätt eliminerar också en omvandling (ökad effektivitet), men måste leverera högre ström till substratet, vilket inte tillåter någon besparing i antalet strömförsörjningsstift. Den här metoden är vanligare eftersom den är mindre komplex och billigare än direktleveransmodellen.
Bild 3: 48 volt till moderkortets leveransmodell
Andra fördelar
Vissa andra fördelar kan också härledas från att flytta till 48V-modellen. För en helt integrerad rackvågslösning, eftersom en 48 V-samlingsskena bär 4 gånger mindre ström än en 12 volts samlingsskena, kan den potentiellt spara 16 gånger (I2) eldistributionsförlusten om samma samlingsskena används för rackströmdistribution. Detta kan leda till en designpraxis där kablar (eller samlingsskenor) är tunnare (högre spårvidd) eftersom de bär mindre ström.
Både utrymme och kostnader kan sparas eftersom komponenter (kontakter, kondensatorer, kablar och samlingsskenor) minskar i storlek, och när utrymme frigörs görs fler designalternativ tillgängliga för systemkonstruktörer.
På racknivå mångfaldigas dessa fördelar. 48V strömfördelningsmodellen i rack (liknande 12V strömdistribution på racknivå) ger möjlighet att implementera distribuerad likström (DC) UPS och eliminerar behovet av den skrymmande växelströmsUPS:en på anläggningsnivå (AC) som, förutom att den är voluminös, är oflexibel och svår att underhålla. Däremot är distribuerad DC UPS, i kombination med modern litiumbaserad batteriteknik, mer kompakt, lätt och enkel att serva. Det har också den extra fördelen att det möjliggör en pay-as-you-go-funktion – det vill säga att lägga till kapacitet dynamiskt, när som helst ytterligare kapacitet behövs.
Det är fortfarande en 12 volts värld
Oavsett intresset för 48V-effektivitet har dagens 12V-servermoderkort funnits i 20+ år. Tolvvoltsinfrastruktur är en handelsvara - den finns i enorma volymer i världen idag - och dagens 12V-försörjningskedja är optimerad. Så omvandlingen till högre spänning kommer inte att vara allestädes närvarande i hela infrastrukturen. Till exempel kommer hårddiskar fortfarande att vara 12 V-hårddiskar för att dra nytta av det breda utbudet av beprövade alternativ på dagens lagringsmarknad, så vanliga serverkonstruktioner kommer att fortsätta att införliva 12 V-ström under en överskådlig framtid. Men med den omättliga törsten efter processorkraft kan man förvänta sig fler användningar av kassetter och moderkort med högre spänning, vilket vi redan ser inom AI- och maskininlärningsområdena.
För att vara helt tydlig, 48V spänningsregulatorlösningar som lämpar sig för vanliga moderkorts- eller processorpaketapplikationer (det vill säga med hög densitet, effektivitet och kostnadsoptimerad) är fortfarande begränsade. Men ledande leverantörer av halvledare för krafthantering, tillsammans med kraftomvandlingsindustrin, arbetar intensivt med det, och det förväntas att mer genomförbara lösningar blir tillgängliga under de kommande åren. Framsteg inom processor- och förpackningsteknik kan inleda en era där den sista stegomvandlingen med högspänningsomvandlingsförhållande kan ske i processorns kisel och/eller på dess förpackningssubstrat, och högre spänning kan matas direkt på dem.
Slutsats
En av de största utmaningarna för datacenter är förbättringen av energieffektiviteten. I många fall handlar strävan efter ökad effektivitet om att spara energi och tillhörande driftskostnader, och på så sätt spara den totala ägandekostnaden (TCO). Så behovet av ännu större strömförbrukning gör det så mycket viktigare att pressa ut högsta möjliga effektivitet.
Dell EMC arbetar med ett brett utbud av kunder för att hjälpa till att lösa några av de mest komplexa och intressanta maskininlärningsproblemen. ESI-gruppen (Extreme Scale Infrastructure) strävar efter att hålla sig à jour med de senaste kraftteknikerna och tillämpa dem där det är lämpligt, så att vi kan hjälpa våra kunder att effektivt möta deras oavbrutna efterfrågan på processorkapacitet.
Om du vill ha mer information om vad Dell EMC Extreme Scale Infrastructure gör med kraftteknik kontaktar du ESI@dell.com.
Cause
Ej tillämpligt
Resolution
Ej tillämpligt