Guida per i leader IT su come alimentare l’AI con dati di alta qualità

I dati di alta qualità sono essenziali per ottenere risultati di qualità con l’AI, anche se non è sempre chiaro come generarli. Questo playbook può essere utile.

I leader IT sanno che la qualità dei dati della loro organizzazione determina il livello di prestazioni delle soluzioni AI. Lo dicono i data engineer.   

Tuttavia, gli stessi data engineer spesso lamentano la mancanza di dati affidabili nelle loro organizzazioni e si preoccupano del lavoro necessario per generarli. Questi gruppi condividono l’onere con i loro responsabili aziendali.  

Secondo la ricerca di The Futurum Group and Kearney quasi due terzi dei CEO indicano dati di bassa qualità o disconnessi a causa di infrastrutture in silos e stack tecnologici frammentati come i principali ostacoli che impediscono il dimensionamento delle soluzioni AI.  

Prima di esaminare le modalità per generare dati di alta qualità al servizio delle soluzioni AI, è importante comprendere le potenziali conseguenze di dati scadenti.  

Se l’input è di bassa qualità, lo sarà anche l’output 

Garbage in, garbage out. Questa espressione è ormai diventata comune con l’ascesa dell’AI generativa. Quando i dati inseriti in un modello di AI sono imprecisi o viziati da pregiudizi (garbage in), il modello non riesce ad applicare le capacità di generalizzazione, con conseguenti errori nelle previsioni o nelle decisioni (garbage out).   

Ma che cosa significa in pratica? Quando si inseriscono dati di scarsa qualità in un sistema AI, si chiede essenzialmente di prendere decisioni da milioni di dollari in base a informazioni alterate.   

Prendiamo in considerazione una catena di vendita al dettaglio che implementa un sistema AI per ottimizzare l’inventario in 500 punti vendita. Supponiamo ora che nei dati di vendita della catena i resi degli articoli siano contrassegnati in modo errato, facendoli apparire come vendite aggiuntive.   

Di conseguenza, il sistema AI presuppone erroneamente che alcuni prodotti “vendano” il 30% in più. Il risultato? Ordini eccessivi di articoli a bassa rotazione, milioni di eccedenze di magazzino e carenze di scorte.  

Oppure consideriamo il caso di un’importante banca il cui chatbot AI è stato addestrato sulle trascrizioni del servizio clienti caricate con dati non correttamente conservati e imprecisi, con agenti che abbreviano i dati dei conti correnti con i termini “chk”, “checking” o persino codici di conto numerici.   

Purtroppo, il chatbot non è in grado di comprendere in modo affidabile le richieste dei clienti sui servizi bancari di base e la conseguenza è la riduzione dei punteggi di soddisfazione dei clienti. Spesso la banca deve assumere più agenti umani per elaborare le richieste aggiuntive.  

Immagina scenari simili che si verificano in altri settori regolamentati in sottile equilibrio tra conformità e rischio. A volte, il risultato produce danni finanziari e alla reputazione: si tratta di conseguenze gravi.  

Selezione dei dati di alta qualità 

Dell Technologies e NVIDIA hanno creato questo eBook che spiega in che modo le organizzazioni possono definire la propria strategia per i dati per garantire un deployment efficace dell’AI. Un aspetto essenziale del supporto di una corretta strategia per i dati è la loro preparazione.   

I dati di alta qualità determinano il livello di percezione, previsione e azione di un modello di AI, tutti criteri fondamentali per le prestazioni. Senza dati affidabili, la base AI non reggerà. Qui vengono illustrati i passaggi necessari per mettere in ordine il tuo sistema di dati.  

  1. Controlla i dati. Prima di poter portare i dati allo stato desiderato, è necessario valutarne lo stato corrente. Lo stack di gestione dei dati è pulito, organizzato e correttamente gestito? L’adozione di questi passaggi potrebbe contribuire a rilevare e correggere errori, duplicati o incoerenze.  
  2. Unisci i silos di dati. I dati delle organizzazioni si trovano sparsi tra le LOB, nelle applicazioni e nelle piattaforme. Il consolidamento delle origini dati offre una visione più precisa, riduce la deduplica e determina informazioni più fruibili. 
  3. Prepara i dati. Nel corso del tempo, i dati diventano obsoleti e voluminosi; la loro pulizia, etichettatura e standardizzazione migliorano le prestazioni dei modelli di AI, riducendo al contempo i tempi di deployment. La definizione di standard organizzativi per la struttura, la coerenza e la completezza dei dati contribuisce a garantire che i modelli su cui si basa il business apprendano dalle fonti giuste.  
  4. Implementa governance e conformità. La sicurezza e la resilienza dei dati sono fondamentali. Con derivazione dei dati, controlli di sicurezza e framework di conformità trasparenti si crea fiducia nei sistemi AI. La presenza di una solida struttura di governance dei dati e di un audit trail garantisce che i dati sensibili vengano utilizzati in modo responsabile, rispettando al contempo la conformità.  
  5. Modernizza l’infrastruttura dei dati. Le soluzioni AI richiedono tecnologie di elaborazione, storage e rete moderne, nonché le competenze necessarie per configurarle e supportarle. L’upgrade a piattaforme che supportano l’accesso in tempo reale, la scalabilità e l’integrazione permette alla tua organizzazione di soddisfare le crescenti esigenze in termini di AI. 

Il percorso verso la modernizzazione dell’infrastruttura dei dati

La semplificazione del modo in cui i dati vengono trasferiti, elaborati e gestiti garantisce il dimensionamento dei carichi di lavoro AI. Un approccio unificato e flessibile accelera il time to market e predispone l’organizzazione per il futuro.  

Adottare un approccio simile è complesso. Dell Technologies e NVIDIA hanno creato Dell AI Factory with NVIDIA, che comprende tecnologie e servizi per accelerare i casi d’uso, integrare dati e flussi di lavoro e aiutarti a progettare il tuo percorso verso l’AI.  

Ricorda: se l’input è di bassa qualità, lo sarà anche l’output. I dati di qualità creano vantaggi competitivi, mentre quelli scadenti causano costosi problemi su vasta scala. La domanda non è se puoi permetterti di investire nella qualità dei dati, ma se puoi permetterti di non farlo.  

Puoi permetterti di non farlo?  

Ulteriori informazioni su Dell AI Factory with NVIDIA.