• Generativ AI

    Generativ AI är här:
    Är du redo?

    Intel® Innovation inbyggd
      • Utgångspunkt

        En ny era av generativ AI

        Generativ AI (GenAI) utnyttjas i enorm skala av både organisationer och individer, vilket har en betydande inverkan på samhället överlag. AI i konsumentklass, till exempel ChatGPT och DALL-E, har skapat ett oerhört intresse tack vare sin förmåga att generera innehåll. Men det är GenAI:s inverkan på organisationer som är den verkliga värdeskaparen, vilket inkluderar ökad produktivitet, lägre kostnader och en omvandling av vårt arbetssätt.

      • 76%

        76 % av IT-cheferna tror att GenAI kommer att vara betydande, eller rentav omvälvande, för deras organisation.

        GenAI kommer att omvandla organisationer

        GenAI medför inte bara fördelar utan även nya utmaningar och risker. I takt med att organisationer startar sina GenAI-resor måste de se till att de inte förlorar kundernas förtroende eller det höga värdet av sina egna data enbart för att vara först med att implementera nya lösningar.

        76%

        76 % av IT-cheferna tror att GenAI kommer att vara betydande, eller rentav omvälvande, för deras organisation.
      • Uppnå framgång med generativ AI

        Att hitta rätt användningsområden är avgörande. Affärs- och IT-chefer bör prioritera användningsområden utifrån följande kriterier:


      • Medarbetare och team

        Förbered din organisation för att ta tillvara möjligheten med GenAI, med IT som fokuserar på genomförbarhet och företagsledare som tittar på optimering och tillväxt.

      • Processer och policyer

        Definiera och kommunicera hur organisationen kommer att utnyttja AI och göra det till en kritisk aspekt av dina dagliga affärsprocesser.

      • Technology

        Leverera säker åtkomst till GenAI i hela organisationen genom att undvika instanser av skugg-AI och säkerställa dataintegriteten och efterlevnaden.

      • Strategi

        Beskriv det befintliga skicket av din miljö för att fastställa den strategiska visionen och de vägledande principerna för framtida GenAI-projekt.

      • Den avgörande rollen för dina data i generativ AI

        Data och risker går hand i hand. Data kommer att driva GenAI-projekten framåt, vilket betyder att du måste bedöma de potentiella riskerna med att vara värd för GenAI-modeller i offentliga moln, inklusive risken för förlust av immateriell egendom, dataläckage, sekretessproblem, efterlevnadsöverträdelser, förlust av trovärdighet och integritet, bristande objektivitet och IP-intrång.

        • Hantera risker och öka värdet

          När du startar din resa är det viktigt att investeringarna i teknik och träning anpassas till målet för att öka den operativa mognaden, minska riskerna, förstärka kontrollen och maximera värdet för organisationen. Med startklar GenAI för företag kan du ta kontroll över vem som har åtkomst till dina data.

      • Företagsklar GenAI Omogen GenAI Operativ mognad Risk
        Diagram som visar att risken (y-axeln) minskar med tiden när du når operativ mognad (x-axeln) med din datahantering. Början av lutningen i grafen indikerar omogen GenAI med hög risk och låg operativ mognad. Den nedåtgående trenden i diagrammet indikerar att företagsklar AI minskar risken och representerar hög operativ mognad.
      • ANVÄND AI MED DINA DATA

        Placera generativa AI-modeller nära dina data

        • Det är viktigt att förstå riskerna och fördelarna med olika driftsättningsalternativ för att fastställa organisationens optimala arbetsbelastningsplacering för GenAI. Driftsättningen av privata instanser av stora GenAI-språkmodeller (LLM:er), t.ex. Llama 2 eller Falcon, ger fördelar när det gäller hastighet och driftsättning vid införlivandet av AI i dina data, men det kan även leda till högre kostnader och andra nackdelar. I vilket fall kommer intern GenAI sannolikt att ge mest värde under det inledande stadiet.

          När det gäller arbetsbelastningens placering skiljer sig GenAI inte från någon annan typ av arbetsbelastning. För att få bästa möjliga resultat ska du placera GenAI i den miljö som är mest passande baserat på verksamhetskraven och de tekniska behoven.

          Diagrammet nedan förmedlar koncept och ramverk som är relevanta vid fastställandet av GenAI-arbetsbelastningens placering.

      • Var data finns Kostnad Kortare tid till värde Noggrannhet och anpassning Allmänna användningsfall Säker åtkomst Offentligt moln Privata moln
        Ett diagram som representerar sex faktorer att tänka på när du väljer mellan privat moln eller offentligt moln för placering av GenAI-arbetsbelastningar. ”Var data finns” och ”Säker åtkomst” lutar i hög grad åt privat moln. ”Kostnad” lutar något åt privat moln och ”Noggrannhet och anpassning” lutar något åt privat moln. ”Snabbare tid till värde" lutar något åt offentligt moln. Och ”Allmänna användningsfall” lutar mycket åt offentligt moln.
        • Datahantering för generativ AI

          De flesta organisationer har en tvådelad inställning till sin GenAI-strategi. De experimenterar med taktiska driftsättningar för att lära sig mer och undvika att hamna på efterkälken samtidigt som de utvecklar en långsiktig strategi för att tillgodose de många användningsfall som kommer att uppstå med tiden. Denna metod kräver att datahanteringsstrategin är uppdelad i två nivåer.

        DATAFÖRBEREDELSE
        DATAKONSTRUKTION
        • Dataförberedelse

        • Dataidentifiering

          Identifiera datauppsättningar och definiera datakrav

        • Datautforskning och databerikning

          Utforma och implementera datapipelines för att märka, rensa och anonymisera data


        • Kortsiktigt: dataförberedelse

          Dataförberedelse inkluderar identifiering av datauppsättningar och definiering av datakrav, vilket följs av rensning, märkning och anonymisering av data samt efterföljande normalisering av dem i alla datakällor. För att kunna integrera data i modeller krävs det dessutom att man bygger datapipelines.

        • Datakonstruktion

        • Datainmatning

          Integrera företagsdata i stora språkmodeller

        • Överskådlighet och prestanda

          Kontrollera att omvandlade data uppfyller målen


        • Långsiktigt: datakonstruktion

          Organisationer behöver ett välstrukturerat datalager, t.ex. en datasjö eller ett datasjöhus, för att kunna integrera sina data med GenAI-modeller. Överväg att bygga datasjön iterativt för att gradvist utöka kapaciteten hos GenAI-datalagret medan teamet förbättrar sina datahanterings- och GenAI-färdigheter.


        • ”Detta samarbete [med Dell Technologies] kommer att göra det möjligt för företag att bygga egna AI-system och utnyttja den otroliga innovationen i communityn för öppen källkod samtidigt som de drar nytta av Dell-systemens säkerhet, efterlevnad och prestanda.”

          Jeff Boudier, Produkt- och tillväxtchef på Hugging Face
      • AI I RÄTT STORLEK

        Definiera infrastruktur och AI i rätt storlek

      • 75%

        Dells AI-lösningar för inferens med stora språkmodeller på plats kan vara upp till 75 % mer kostnadseffektiva än offentliga moln.1

        Med dina unika data kan du använda domän- och företagsspecifika användningsfall och skapa branschvärde genom uppgifter eller funktioner för vilka du har exklusiv äganderätt till data. Olika typer av GenAI har olika startpunkter och nödvändiga investeringar för att kunna garantera framgång. LLM:er tränade på stora textmängder är som uppslagsböcker – användbara för allmän användning, men kanske inte lämpliga för att svara på specifika frågor om organisationens data.

        75%

        Dells AI-lösningar för inferens med stora språkmodeller på plats kan vara upp till 75 % mer kostnadseffektiva än offentliga moln.1
      •  


         
      • Dina data förbättrar GenAI:s effektivitet och värde avsevärt

      • Begränsad funktionalitet Minst/mest kostnadseffektivt Domänkompetens Mest exakt Mindre storlek Mer exakt Fler hallucinationer Dyrt och energikrävande Bredd av användningsfall Allmänt bruk Företagsspecifik Domänspecifik Stora språkmodeller Värde
        Bild som visar relativa mängder data som krävs för tre typer av AI-modeller samt deras affärsvärde. Stora språkmodeller, eller LLM:er, är avsedda för allmänna användningsfall och är de som använder mest data. De kan vara dyra och energikrävande, och de är mer benägna att hallucinera. Domänspecifik AI använder mindre mängder data, men datan är mer specifik. Den har begränsad funktionalitet, men är mer relevant för ditt företag och har mer värde. Företagsspecifik AI använder ännu mindre data, men är den mest specifika och exakta och erbjuder det största värdet för ditt företag.
      • Driftsättningsmönster för AI

        Vilken AI-modell du väljer beror på organisationens nivå av datavetenskaplig beredskap, driftsättningsmönster och konsekvenserna av varje.

      • Förhandstränad modell

        Detta tillvägagångssätt kallas för ”prompt engineering” och innebär att en fråga ställs till en förhandstränad modell och att ett svar mottas.
        Exempel: ChatGPT

        Modellförstärkning

        Förstärk din GenAI-modell genom att lägga till dina data för att ge ytterligare kontext för svaren, t.ex. inferens, som inkluderar användningsfall som Retrieval-Augmented Generation (RAG).

        Finjustering av modeller

        Detta omfattar justering av modellviktning och ett införlivande av dina data. Även om detta leder till bättre resultat, så kräver det även mer ansträngning under konfigurationen.

        Modellträning

        Detta omfattar att bygga en specifik modell och träna den med en datauppsättning. Denna typ kräver vanligtvis mest arbete och resurser och är ofta reserverad för att lösa komplicerade problem.

        Ansträngning Liten ansträngning Medelstor ansträngning Stor ansträngning Betydande ansträngning
        Kostnad Låg kostnad Medelhög kostnad Hög kostnad Betydande kostnad
        Värde och
        differentiering
        Minimalt värde och minimal differentiering Medelhögt värde och medelhög differentiering Högt värde och hög differentiering Betydande värde och differentiering
        Dataintegrering Ingen dataintegrering Hög dataintegrering Hög dataintegrering Betydande dataintegrering
        Infrastruktur Klient – server Klient – server GPU-optimerad Distribution av stor GPU
        Kunskaper IT-Ops Utvecklare Dataforskare Dataforskare
        Referens för förenklad driftsättning Validerad utformning Referensdesign Validerad utformning Referensdesign
      • Välj rätt infrastruktur för din modell

        Infrastrukturen som stöder din GenAI-driftsättning beror till stor del på beräkningskraven, vilka påverkas av modelltypen, modellstorleken och antalet användare. Ytterligare överväganden omfattar nödvändig lagringskapacitet för data som används under driftsättning, träning och förfining av modellen.

      • ALLMÄN BERÄKNING (CPU-orienterad) AI-OPTIMERAD (GPU-intensiv) Dells bärbara datorer Dell Precision-arbetsstationer PowerEdge rackservrar PowerEdge XE-servrar ObjectScale-lagring Lagring i PowerScale PowerFlex-lagring Switchar i PowerSwitch Z-serien Modellträning Finjustering av modell Modellförstärkning Förhandstränad modell Miljontals parametrar Miljarder parametrar Biljontals parametrar Lågt antal användare Högt antal användare
        Diagram som representerar tre GenAI-krav och mappar dem till lämpliga Dell-hårdvarulösningar. Hårdvarulösningarna varierar i kraft från allmänna beräkningsalternativ, som är CPU-orienterade, till AI-optimerade alternativ, som är GPU-intensiva. De specifika alternativen börjar med bärbara Dell-datorer för allmän beräkning, fortsätter genom Precision-workstations och PowerEdge-servrar och slutar med PowerEdge XE-servrar inom AI-optimerade lösningar. Observera att Dells hårdvara för lagring och nätverk kan användas för alla alternativ. Tre GenAI-infrastrukturattribut mappas till dessa lösningar i en utveckling som kräver allt mer processkraft. Modellens komplexitet kan sträcka sig från att använda förhandstränade modeller och förstärkningsmodeller eller finjustering av modeller till att träna nya modeller. Antalet parametrar kan variera från miljoner till miljarder, hela vägen upp till biljoner.
      • Accelerera din AI-resa

        Börja med en omedelbar fördel

        RAG (Retrieval-Augmented Generation) är en idealisk utgångspunkt för många organisationer eftersom den komplettera GenAI-modeller med dina egna data utan att behöva träna om den. Utforska konfigurationen av RAG-användningsfall som kan tillämpas för att förbättra ditt företag och förstärka dina data.

      • Användningsfall för RAG

        Tillämpa RAG på en anpassad PDF-datauppsättning

      • DELL-VALIDERAD UTFORMNING FÖR RAG

        Installera en digital assistent på Dell APEX Cloud Platform for Red Hat OpenShift

    • 1 Baserat på forskning av Enterprise Strategy Group på uppdrag av Dell, ”Maximizing AI ROI: Inferencing On-premises With Dell Technologies Can Be 75% More Cost-effective Than Public Cloud”, där lokal Dell-infrastruktur jämförs med inbyggd infrastruktur för offentligt moln som en tjänst och token-baserade API:er, april 2024. Förväntade kostnader modellerades med hjälp av RAG för små (5 000 användare), medelstora (10 000 användare) och stora tillämpningar (50 000 användare) och två stora språkmodeller (7md och 70md parametrar) under tre år. De faktiska resultaten kan variera. Ekonomisk sammanfattning