Leitfaden für IT-Führungskräfte zur Versorgung von KI mit hochwertigen Daten

Hochwertige Daten sind der Schlüssel zu hochwertigen KI-Ergebnissen, doch ist nicht immer klar, wie diese Daten gewonnen werden können. Dieses Playbook kann Ihnen dabei helfen.

IT-Führungskräfte wissen, dass die Qualität der Daten ihres Unternehmens die Performance ihrer KI-Lösungen beeinflusst. Das sagen ihnen ihre Data Engineers.   

Doch dieselben Data Engineers beklagen oft den Mangel an soliden Daten in ihren Unternehmen und sorgen sich um die Arbeit, die erforderlich ist, um diese zu beschaffen. Diese Gruppen teilen die Last mit der Geschäftsleitung.  

Fast zwei Drittel der CEOs nennen laut einer Studie von The Futurum Group und Kearney minderwertige oder unzusammenhängende Daten aufgrund von isolierten Infrastrukturen und fragmentierten Technologie-Stacks als Haupthindernisse für die Skalierung von KI-Lösungen.  

Bevor wir uns damit befassen, wie hochwertige Daten für KI-Lösungen gewonnen werden können, ist es wichtig, die potenziellen Folgen schlechter Daten zu verstehen.  

Die Realität von „Garbage in, Garbage out“ 

Garbage in, Garbage out („Müll rein, Müll raus“). Dieser Ausdruck hat mit dem Aufkommen der generativen KI einen festen Platz in der Alltagssprache gefunden. Wenn die in einem KI-Modell enthaltenen Daten ungenau oder verzerrt sind („Müll rein“), können die Modelle keine Verallgemeinerungen vornehmen, was zu Fehlern bei Vorhersagen oder Entscheidungen führt („Müll raus“).   

Aber wie sieht das in der Praxis aus? Wenn Sie einem KI-System Daten von schlechter Qualität zuführen, verlangen Sie im Grunde genommen, dass es auf der Grundlage fehlerhafter Information Entscheidungen in Millionenhöhe trifft.   

Stellen Sie sich z. B. eine Einzelhandelskette vor, die ein KI-System einsetzt, um den Lagerbestand in 500 Filialen zu optimieren. Nehmen wir nun an, dass die Verkaufsdaten der Kette Artikelrücksendungen falsch gekennzeichnet wurden, sodass diese als zusätzliche Verkäufe aufgeführt werden.   

Infolgedessen geht das KI-System fälschlicherweise davon aus, dass bestimmte Produkte 30 % mehr „verkauft“ werden. Das Ergebnis? Massive Überbestellungen von sich langsam verkaufenden Artikeln, Millionen an Überbeständen und Lieferengpässe.  

Oder nehmen wir den Fall einer großen Bank, deren KI-Chatbot mit Kundenservice-Transkripten trainiert wurde. Die Transkripte waren jedoch mit schlecht gepflegten, ungenauen Daten gespickt, wobei die MitarbeiterInnen Kontodaten mit Abkürzungen wie „chk“, „checking“ oder sogar numerischen Kontocodes abgekürzt haben.   

Dadurch kann der Chatbot Kundenanfragen zu grundlegenden Bankdienstleistungen nicht zuverlässig verstehen, was zu einer Verschlechterung der Kundenzufriedenheit führt. In diesem Fall muss die Bank mehr MitarbeiterInnen einstellen, um die zusätzlichen Anfragen zu bearbeiten.  

Stellen Sie sich ähnliche Szenarien in anderen regulierten Branchen vor, die auf einem schmalen Grat zwischen Compliance und Risiko balancieren. Mitunter drohen Reputations- und finanzielle Schäden – das ist ernstzunehmender „Müll raus“.  

Beschaffung hochwertiger Daten 

Dell Technologies und NVIDIA haben dieses E-Book erstellt, in dem erläutert wird, wie Unternehmen ihre Datenstrategie gestalten können, um erfolgreiche KI-Bereitstellungen sicherzustellen. Ein entscheidender Aspekt für eine wirkungsvolle Datenstrategie ist die Vorbereitung der Daten.   

Hochwertige Daten bestimmen, wie gut ein KI-Modell wahrnehmen, vorhersagen und handeln kann – alles kritische Performancekriterien. Ohne solide Daten bricht Ihre KI-Grundlage zusammen. Hier beschreiben wir die Schritte, die erforderlich sind, um Ihren Datenbestand in Ordnung zu bringen.  

  1. Überprüfen Sie Ihre Daten. Bevor Sie Daten in den gewünschten Zustand bringen können, müssen Sie ihren Ist-Zustand bewerten. Ist Ihr Datenmanagement-Stack sauber, organisiert und gut gepflegt? Diese Schritte können Ihnen helfen, Fehler, Duplikate oder Inkonsistenzen zu erkennen und zu beheben.  
  2. Verbinden Sie die Datensilos. Unternehmensdaten sind über verschiedene Geschäftsbereiche, Anwendungen und Plattformen verstreut. Die Konsolidierung von Datenquellen verschafft Ihnen einen genaueren Überblick über Ihre Daten, reduziert Duplikate und führt zu besser verwertbaren Erkenntnissen. 
  3. Bereiten Sie Ihre Daten vor. Im Laufe der Zeit werden Daten veraltet und voluminös. Das Bereinigen, Beschriften und Standardisieren von Daten verbessert die Leistung von KI-Modellen und reduziert gleichzeitig die Bereitstellungszeit. Durch die Festlegung von Unternehmensstandards für Datenstruktur, Konsistenz und Vollständigkeit stellen Sie sicher, dass die Modelle, auf die sich Ihr Unternehmen stützt, aus den richtigen Signalen lernen.  
  4. Implementieren Sie Governance und Compliance. Datensicherheit und –resilienz sind von größter Bedeutung. Mit einer klaren Datenherkunft, Sicherheitskontrollen und Compliance-Frameworks schaffen Sie Vertrauen in KI-Systeme. Eine starke Daten-Governance-Struktur und ein Audit-Trail gewährleisten, dass sensible Daten verantwortungsbewusst und unter Einhaltung der Compliance verwendet werden.  
  5. Modernisieren Sie Ihre Dateninfrastruktur. KI-Lösungen erfordern moderne Rechen-, Storage- und Netzwerktechnologien sowie das entsprechende Fachwissen, um sie zu konfigurieren und zu unterstützen. Durch ein Upgrade auf Plattformen, die Echtzeitzugriff, Skalierbarkeit und Integration unterstützen, kann Ihr Unternehmen den steigenden Anforderungen der KI gerecht werden. 

Der Weg zur Modernisierung Ihrer Dateninfrastruktur 

Durch die Vereinfachung der Datenübertragung, -verarbeitung und -verwaltung stellen Sie sicher, dass Ihre KI-Workloads skalierbar sind. Ein einheitlicher, flexibler Ansatz beschleunigt die Markteinführung und macht Ihr Unternehmen zukunftssicher.  

Die Umsetzung eines solchen Ansatzes ist schwierig. Dell Technologies und NVIDIA haben die Dell AI Factory with NVIDIA entwickelt, die Technologien und Services umfasst, mit denen Sie Ihre Anwendungsfälle beschleunigen, Ihre Daten und Workflows integrieren und Ihren eigenen KI-Weg gestalten können.  

Denken Sie daran: Schlechter Input führt zu schlechtem Output (Garbage in, Garbage out). Gute Daten verschaffen Wettbewerbsvorteile, während schlechte Daten in großem Umfang kostspielige Probleme verursachen. Die Frage ist nicht, ob Sie sich Investitionen in Datenqualität leisten können, sondern ob Sie es sich leisten können, darauf zu verzichten.  

Können Sie es sich leisten, darauf zu verzichten?  

Erfahren Sie mehr über die Dell AI Factory with NVIDIA. 

About the Author: Dell Technologies