Przewodnik lidera IT w zakresie dostarczania wysokiej jakości danych do AI

Wysokiej jakości dane są kluczem do wysokiej jakości wyników sztucznej inteligencji, chociaż nie zawsze jest jasne, jak je uzyskać. Ten podręcznik może pomóc.

Liderzy IT wiedzą, że jakość danych ich organizacji wpływa na wydajność rozwiązań AI. Tak twierdzą ich inżynierowie danych.   

Jednak ci sami inżynierowie danych często ubolewają nad brakiem solidnych danych w swoich organizacjach i martwią się pracą niezbędną do ich kultywowania. Obciążenie to dzielą z szefami swoich firm.  

Prawie dwie trzecie dyrektorów generalnych wymienia niską jakość lub odłączenie danych ze względu na odizolowaną infrastrukturę i fragmentaryczne stosy technologii jako główne bariery uniemożliwiające skalowanie rozwiązań AI, co pokazały wyniki badania The Futurum Group i Kearney.  

Zanim zaczniemy zastanawiać się, jak pozyskać wysokiej jakości dane do rozwiązań AI, warto zrozumieć, jakie mogą być konsekwencje złej jakości danych.  

Rzeczywistość typu „śmiecie na wejściu, śmiecie na wyjściu” 

Śmiecie na wejściu, śmiecie na wyjściu. To powiedzenie stało się popularne wraz z rozwojem generatywnej sztucznej inteligencji. Gdy dane zawarte w modelu AI są niedokładne lub stronnicze (śmieci na wejściu), modele nie generalizują wyników, co prowadzi do błędów w prognozach lub decyzjach (śmieci na wyjściu).   

Ale jak to wygląda w praktyce? Kiedy wprowadzasz dane niskiej jakości do systemu AI, zasadniczo prosisz go o podjęcie decyzji wartych miliony dolarów w oparciu o nieprawidłowe informacje.   

Rozważmy sieć detaliczną, która wdraża system sztucznej inteligencji w celu optymalizacji zapasów w 500 sklepach. Załóżmy teraz, że dane dotyczące sprzedaży tej sieci nieprawidłowo oznaczają zwroty towarów, przez co pojawiają się one jako dodatkowa sprzedaż.   

W rezultacie system AI błędnie zakłada, że niektóre produkty „sprzedają się” o 30% więcej. Efekt? Masowe nadmierne zamawianie produktów o niskiej rotacji, miliony nadwyżek magazynowych i braki zapasów.  

Albo weźmy pod uwagę przypadek dużego banku, którego chatbot AI został przeszkolony na podstawie transkrypcji obsługi klienta zawierających źle przechowywane, niedokładne dane, a agenci skracali dane dotyczące rachunków bieżących, używając terminów „chk”, „checking”, a nawet numerycznych kodów rachunków.   

Niestety chatbot nie może wiarygodnie zrozumieć żądań klientów dotyczących podstawowych usług bankowych, co obniża ocenę zadowolenia klientów. Często bank musi zatrudnić więcej ludzkich agentów, aby przetworzyć dodatkowe wnioski.  

Wyobraźmy sobie podobne sytuacje w innych branżach regulowanych, które balansują na krawędzi między zgodnością z przepisami a ryzykiem. Czasami wynik przynosi poważne szkody dla reputacji i finansów; to prawdziwe „śmiecie na wyjściu”.  

Przetwarzanie danych wysokiej jakości 

Firmy Dell Technologies i NVIDIA przygotowały ten e-book, wyjaśniając, w jaki sposób organizacje mogą opracować swoją strategię danych, aby zapewnić skuteczne wdrożenia sztucznej inteligencji. Jednym z kluczowych aspektów ułatwiania skutecznej strategii danych jest przygotowywanie danych.   

Wysoka jakość danych decyduje o tym, jak dobrze model AI może postrzegać, przewidywać i działać — wszystkie te czynniki są kluczowymi kryteriami wydajności. Bez rzetelnych danych fundamenty AI ulegną zawaleniu. Omówimy tutaj kroki niezbędne do uporządkowania zasobów danych. W tym miejscu omówimy kroki niezbędne do uporządkowania danych.  

  1. Audyt danych. Zanim dane osiągną pożądany stan, należy ocenić ich aktualny stan. Czy stos zarządzania danymi jest przejrzysty, uporządkowany i dobrze utrzymany? Podjęcie tych kroków może pomóc w wykryciu i usunięciu błędów, duplikatów lub niespójności. 
  2. Połączenie silosów danych. Dane organizacyjne są rozproszone w różnych liniach biznesowych, w aplikacjach i platformach. Konsolidacja źródeł danych zapewnia dokładniejszy wgląd w dane, zmniejsza duplikację i prowadzi do bardziej użytecznych informacji. 
  3. Przygotowanie danych. Z biegiem czasu dane stają się nieaktualne, obszerne, a ich czyszczenie, oznaczanie i standaryzacja poprawia wydajność modeli AI, jednocześnie skracając czas wdrażania. Ustanowienie standardów organizacyjnych dotyczących struktury danych, spójności i kompletności pomaga zapewnić, że modele, na których opiera się Twoja firma, uczą się na podstawie właściwych sygnałów. 
  4. Wdrożenie zarządzania i zgodności z przepisami. Bezpieczeństwo i odporność danych są najważniejsze. Ustanowienie wyraźnej linii danych, kontroli bezpieczeństwa i struktur zgodności buduje zaufanie do systemów AI. Utrzymanie solidnej struktury zarządzania danymi i ścieżki audytu zapewnia odpowiedzialne wykorzystanie wrażliwych danych przy jednoczesnym przestrzeganiu zgodności z przepisami. 
  5. Modernizacja infrastruktury danych. Rozwiązania AI wymagają nowoczesnych technologii obliczeniowych, pamięci masowej i sieciowych, a także wiedzy eksperckiej w zakresie ich konfiguracji i obsługi. Przejście na platformy obsługujące dostęp w czasie rzeczywistym, skalowalność i integrację umożliwia organizacji sprostanie rosnącym wymaganiom w zakresie sztucznej inteligencji. 

Droga do modernizacji infrastruktury danych 

Uproszczenie sposobu, w jaki dane się przemieszczają, jak są przetwarzane i jak są zarządzane, zapewnia skalowalność Twoich obciążeń AI. Ujednolicone, elastyczne podejście skraca czas wprowadzania produktów na rynek i zapewnia długoterminową konkurencyjność Twojej organizacji.  

Osiągnięcie takiego podejścia jest trudne. Firmy Dell Technologies i NVIDIA stworzyły rozwiązanie Dell AI Factory with NVIDIA, które obejmuje technologie i usługi przyspieszające wdrażanie przypadków użycia, integrację danych i przepływów pracy oraz pomoc w zaprojektowaniu własnej transformacji w kierunku sztucznej inteligencji.  

Pamiętaj: śmiecie na wejściu, śmiecie na wyjściu. Dobre dane zapewniają przewagę konkurencyjną, podczas gdy złe dane powodują kosztowne problemy na dużą skalę. Pytanie nie brzmi, czy możesz sobie pozwolić na inwestowanie w jakość danych, ale czy możesz sobie pozwolić na to, żeby tego nie robić.  

Czy możesz sobie pozwolić na to, aby tego nie robić?  

Dowiedz się więcej na temat rozwiązania Dell AI Factory with NVIDIA.  

About the Author: Dell Technologies