Holde tritt med energieffektiviteten
Summary: Bransjenettsteder, artikler og whitepapers har advart om "datatsunamien" i årevis. Vanligvis legges det vekt på ny lagringsteknologi, men like viktig er evnen til å behandle denne enorme mengden nye data. ...
Symptoms
I mer enn et tiår har IT-butikker kjempet med den overveldende veksten av data i databehandlingsmiljøet. Bransjenettsteder, artikler og whitepapers har advart om "datatsunamien" i årevis. Vanligvis legges det vekt på ny lagringsteknologi, men like viktig er evnen til å behandle denne enorme mengden nye data.
Maskinlæring og AI kommer til å spille en stor rolle i dette rommet. I sin tur har presset for større prosesseringsmuligheter også intensivert, noe som fører til stadig høyere CPU-kapasiteter, og spesielt har det resultert i den nylige økningen i bruken av akseleratorteknologier (GPU, FPGA) for å levere de ultrahøyhastighets parallelle prosesseringsfunksjonene som trengs for beregningsintensive AI-applikasjoner.
Disse avanserte AI-teknologiene, og andre økende databehandlingsbehov, krever en ny kraftarkitektur for effektivt å levere mer prosesseringsevne, og selv om denne muligheten til å redesigne gir flere fordeler, er det ikke et enkelt problem å løse.
Strømproblemet
Presset til høyere prosesseringskapasitet bringer med seg et avgjørende systemdesignproblem knyttet til elektrisk kraftlevering. Den finere produksjonsgeometrien til dagens prosessorer (mindre enn 10 nm) muliggjør raskere strømveksling, noe som resulterer i mindre forsinkelse og lavere ventetid, noe som igjen krever lavere spenning - under 1 volt (V) - for å drive prosesseringen. Men etter Ohms lov (P = V * I), hvis strømmen (P) øker og spenningen (V) er lavere, må strømmen (I) øke. Dette blir et problem fordi levering av høyere strøm til prosessordysen eller "pakken" krever bruk av flere socketpinner for å bære høyere strøm - socketpinner som ellers kunne brukes til å gi større systemfunksjonalitet (det vil si I / O, systemadministrasjon). For eksempel setter System on a Chip (SoC) design mer funksjonalitet på selve brikken, så spørsmålet blir da: hvordan leverer du mer strøm effektivt, uten å miste potensiell funksjonalitet. Dette er viktig fordi selv små effektivitetsgevinster i stor skala blir betydelige; en watt per server for 100K-servere kan spare hundretusenvis av dollar i løpet av livssyklusene til disse serverne.
Økt spenningsløsning
En av løsningene som finner aksept i bransjen i dag, er å levere økt spenning (som i, 48V) til serveren. På Open Compute Project ("OCP") Summit 2016 annonserte Google et initiativ for å fremme 48V server- og distribusjonsinfrastruktur som standard for datasentre. Denne modellen omfatter flere endringer i leveringsarkitekturen (beskrevet nedenfor) som kan gi følgende fordeler:
- Mer kraft til prosessoren (uten reduksjon av sokkel- og kontaktpinner og størrelser)
- Mindre energitap i kraftkonvertering (færre, mer effektive konverteringer)
- Mindre trengsel på hovedkortdesignen (færre strømlag og sporingsområder)
- Mindre kabler, kontakter og samleskinner
- Lavere tap i kraftdistribusjon
- Høyere strømgrenser sammenlignet med 12 V-rack
Valget av 48V ble gjort fordi det ikke krever noen spesielle sikkerhetsgrenser. Alt over 60V regnes som "høyspenning" og vil kreve ekstra sikkerhetsisolasjon. Så ved bruk av Ohms lov gir 48V en fire ganger reduksjon i strømmen, men etterlater fortsatt en sikkerhetsmargin.
Det skal bemerkes at 48V-servere en gang ble fremmet av Intel på slutten av 1990-tallet, men deretter mistet ut til 12V-serverdesign på grunn av den tidens begrensede spenningsregulatortetthet og kraftkonverteringseffektivitet og høyere komponentkostnader.
Strømforsyning
For å forstå fordelene med 48V strømmodell, hjelper det å først forstå hvordan strøm leveres i dag. I dag leverer et kraftselskap vanligvis vekselstrøm (AC) ved 220V til 240V, som igjen konverteres av et systems strømforsyningsenhet (PSU) til 12V. Den konverteres igjen i en spenningsregulator plassert på systemets hovedkort fra 12V til 1.7V (vi bruker et Intel-implementeringseksempel). Denne 1.7V-skinnen er omtrent dobbelt så stor spenning som CPU-en til slutt trenger for å redusere strømmen som leveres fra hovedkortet, slik at færre pinner kan brukes til å levere strømmen til prosessorunderlaget. Men strømmen må konverteres enda en gang på matrisen og underlaget for å komme til sub-one volt-nivåene som trengs for prosessoren.
Figur 1: Dagens 12-volts leveringsmodell
Ineffektivitet ved tap av elektrisk distribusjon
På hvert konverteringstrinn går et visst nivå av strøm / energi tapt. Det er anslått at den totale strømeffektiviteten til dagens tradisjonelle datasentre (fra verktøy til prosessorer til kjøling) vanligvis har vært i midten av 80 %, selv om ineffektiviteten til dagens strømforsyningsenheter (PSU-er) og innebygde spenningsregulatorer (VR) allerede har vært godt over 90 %. Denne energien går også tapt i form av varme, noe som resulterer i at datasentre må bruke enda mer energi (og kostnader) for å kjøle ned disse systemene med høyere ytelse. Økt energieffektivitet (eliminering av energitap) gjør det mulig for datasentrene å spare kjølekostnader. Selv ett enkelt prosentpoeng økning i effektiviteten gir betydelige økonomiske og miljømessige gevinster.
Elektrisk distribusjonstap er en funksjon av kvadratet av strømmen (Power = I2R). Så, å redusere mengden strøm (I) gjennom viss motstand (R) påvirker mengden tap. Reduksjon av strøm kan oppnås ved å øke spenningen (Ohms lov), og dermed øke interessen for 48V-modellen.
Nye tilnærminger til strømforsyning
På dette tidspunktet forblir effektiv strømforsyning til høyeffektsprosessorene et dynamisk område; Ulike tilnærminger blir forfulgt. To slike tilnærminger og fordelene ved hver er beskrevet nedenfor.
En tilnærming til å gi større effektivitet har vært å levere 48 volt direkte til prosessorpakkeunderlaget og deretter konvertere til sub 1V på underlaget. Denne tilnærmingen eliminerer ett konverteringstrinn (øker effektiviteten) og tillater levering av lav strøm til underlaget (øker pinnetilgjengeligheten). Men gitt den svært begrensede plassen som er tilgjengelig på pakkeunderlaget, må strømomformeren fra 48V til sub-en volt ha høy tetthet og lav profil, så implementering av denne teknologien er fortsatt kompleks og kostbar.
Figur 2: Direkte til underlag 48 volt leveringsmodell
En annen tilnærming har vært å levere 48 volt til hovedkortet. På det tidspunktet konverterer en spenningsregulator den til en underspenning (som i 0,85V) og leverer den deretter direkte til prosessoren. Denne tilnærmingen eliminerer også en konvertering (øker effektiviteten), men må levere høyere strøm til underlaget, noe som ikke tillater besparelser i antall kraftleveringspinner. Denne tilnærmingen er mer vanlig fordi den er mindre kompleks og billigere enn den direkte leveringsmodellen.
Figur 3: 48 volt til hovedkort leveringsmodell
Andre fordeler
Noen andre fordeler kan også utledes ved å flytte til 48V-modellen. Fordi en 48 V samleskinne bærer 4 ganger mindre strøm enn en 12 volts samleskinne for en fullstendig integrert rackskaleringsløsning, kan den potensielt spare 16 ganger (I2) for elektrisk distribusjon hvis den samme samleskinnen brukes til strømdistribusjon i rack. Dette kan resultere i en designpraksis der kabler (eller samleskinner) er tynnere (høyere sporvidde) fordi de bærer mindre strøm.
Både plass og kostnader kan spares ettersom komponenter (kontakter, kondensatorer, kabler og samleskinner) reduseres i størrelse, og etter hvert som plass frigjøres, blir flere designalternativer gjort tilgjengelige for systemdesignere.
På racknivå multipliseres disse fordelene. Den 48 V strømdistribusjonsmodellen i rack (tilsvarende 12 V strømdistribusjon på racknivå) gir mulighet til å implementere distribuert likestrøm (DC) UPS, og eliminerer behovet for den store vekselstrøms-UPS-en på anleggsnivå (AC) som, i tillegg til å være voluminøs, er ufleksibel og vanskelig å betjene. I motsetning til dette er distribuert DC UPS, kombinert med moderne litiumbaserte batteriteknologier, mer kompakt, lett og enkel å vedlikeholde. Den har også den ekstra fordelen at den aktiverer en forbruksbetalt funksjon – det vil si å legge til kapasitet dynamisk, når som helst det er behov for ekstra kapasitet.
Det er fortsatt en 12 volt verden
Uavhengig av interessen for 48V effektivitet, har dagens 12V serverkort eksistert i 20+ år. Tolv volts infrastruktur er en vare - den finnes i stort volum i verden i dag - og dagens 12V forsyningskjede er optimalisert. Så konverteringen til høyere spenning vil ikke være allestedsnærværende over hele infrastrukturen. For eksempel vil harddisker fortsatt være på 12 V, slik at de kan dra nytte av det brede utvalget av velprøvde alternativer i dagens lagringsmarked, slik at vanlige serverdesign vil fortsette å inkludere 12 V-strøm i overskuelig fremtid. Men med den umettelige tørsten etter prosessorkraft, kan man forvente flere adopsjoner av patroner og hovedkort med høyere spenning, som vi allerede ser i AI- og Machine Learning-områdene.
For å være helt tydelig, 48V spenningsregulatorløsninger egnet for vanlige hovedkort- eller prosessorpakkeapplikasjoner (det vil si med høy tetthet, effektivitet og kostnadsoptimalisert) er fortsatt begrenset. Men ledende leverandører av halvledere for strømstyring, sammen med kraftkonverteringsindustrien, jobber intensivt med det, og det forventes at flere levedyktige løsninger blir tilgjengelige i de kommende årene. Fremskritt innen prosessor- og emballasjeteknologi kan innlede en epoke der den siste trinnkonverteringen med høyspenningskonverteringsforhold kan skje i prosessorsilisiumet og/eller på pakkesubstratet, og høyere spenning kan mates direkte på dem.
Konklusjon
En av de største utfordringene for datasentre er forbedringen i energieffektivitet. I mange tilfeller koker jakten på større effektivitet ned til å spare energi og tilhørende driftskostnader, og dermed spare de totale eierkostnadene (TCO). Så behovet for enda større strømforbruk gjør det så mye viktigere å presse ut de høyeste effektivitetsnivåene som er mulig.
Dell EMC samarbeider med et bredt spekter av kunder for å bidra til å løse noen av de mest komplekse og interessante problemene med maskinlæring. Extreme Scale Infrastructure (ESI)-gruppen er forpliktet til å holde seg oppdatert på de nyeste kraftteknologiene og bruke dem der de gir mening, slik at vi kan hjelpe kundene våre med å effektivt møte deres uforminskede etterspørsel etter prosesseringsevne.
Hvis du vil ha mer informasjon om hva Dell EMC Extreme Scale Infrastructure gjør med strømteknologier, kan du kontakte ESI@dell.com.
Cause
Ikke relevant
Resolution
Ikke relevant