Le guide du responsable IT pour alimenter l’IA avec des données de haute qualité

Des données de haute qualité sont essentielles pour obtenir des résultats d’IA de qualité, mais il n’est pas toujours facile de déterminer comment cultiver ces données. Ce guide peut vous y aider.

Les responsables IT savent que les performances de leurs solutions d’IA dépendent de la qualité des données de leur entreprise. Et leurs ingénieurs de données le confirment.   

Pourtant, les mêmes ingénieurs déplorent souvent le manque de données solides au sein de leur entreprise et sont effrayés par l’ampleur du travail nécessaire pour les cultiver. Ces équipes partagent la responsabilité avec leurs dirigeants.  

Selon une étude menée par le Futurum Group et Kearney, près des deux tiers des PDG estiment que les données de mauvaise qualité ou déconnectées liées à des infrastructures cloisonnées et à des piles technologiques fragmentées constituent les principaux obstacles à l’évolution des solutions d’IA.  

Avant de découvrir comment cultiver des données de haute qualité au serviceF des solutions d’IA, il est important de comprendre les conséquences potentielles de données de mauvaise qualité.  

La réalité du « Garbage in Garbage Out » 

Garbage in, garbage out. Cette expression, qui signifie que des données erronées ne peuvent que produire des résultats erronés, a réellement pris tout son sens avec l’essor de l’IA générative. Lorsque les données incluses dans un modèle d’IA sont inexactes ou biaisées (« garbage in »), les modèles ne parviennent pas à généraliser, ce qui entraîne des erreurs au niveau des prédictions ou des décisions (« garbage out »).   

Qu’est-ce que cela signifie en pratique ? Quand vous introduisez des données de mauvaise qualité dans un système d’IA, vous lui demandez essentiellement de prendre des décisions stratégiques sur le plan économique en se basant sur des informations corrompues.   

Par exemple, une chaîne de vente au détail qui déploie un système d’IA pour optimiser les stocks dans 500 magasins. Supposons que les données de vente de la chaîne n’aient pas correctement étiqueté les retours d’articles, à tel point que ces retours soient comptabilisés comme des ventes supplémentaires.   

Le système d’IA va alors supposer à tort que certains produits « se vendent » 30 % plus. Résultat : des commandes massives d’articles à faible rotation, des millions de stocks excédentaires et des ruptures de stock.  

Prenons également l’exemple d’une grande banque dont le chatbot IA a été entraîné sur des transcriptions de service client chargées de données mal conservées et inexactes, avec des agents abrégeant les données de compte courants avec les termes « cpt », « CC » ou même des codes de compte numériques.   

Malheureusement, le chatbot ne peut pas comprendre de manière fiable les demandes des clients concernant les services bancaires essentiels, ce qui réduit les scores de satisfaction des clients. Souvent, la banque doit embaucher davantage d’agents humains pour traiter les demandes supplémentaires.  

Imaginez que des scénarios similaires se présentent dans d’autres secteurs réglementés qui doivent parvenir à un juste équilibre entre conformité et risques. Ils peuvent avoir des conséquences aussi désastreuses qu’une atteinte à la réputation ou des pertes financières.  

Conservation de données de haute qualité 

Dell Technologies et NVIDIA ont rédigé cet eBook afin d’expliquer aux entreprises comment élaborer leur stratégie de données pour garantir la réussite de leurs déploiements d’IA. La préparation des données est un aspect essentiel de la mise en œuvre d’une stratégie de données efficace.   

Des données de haute qualité déterminent la capacité d’un modèle d’IA à percevoir, prédire et agir, autant de critères essentiels de performance. Sans données fiables, votre base d’IA s’effondrera. Nous abordons ici les étapes à suivre pour vous assurer que votre centre de données est opérationnel.  

  1. Vérifier vos données. Avant de pouvoir obtenir les données escomptées, vous devez les évaluer dans leur état actuel. Votre pile de gestion des données est-elle propre, organisée et bien entretenue ? Suivre ces étapes peut vous aider à détecter et corriger les erreurs, la déduplication ou les incohérences.  
  2. Décloisonner les données. Les données organisationnelles sont dispersées entre les lignes de produits, dans les applications et les plateformes. La consolidation des sources de données vous offre une vue plus précise de vos données, réduit la déduplication et permet d’obtenir des informations plus exploitables. 
  3. Préparer les données. Au fil du temps, les données deviennent obsolètes et volumineuses. Le nettoyage, l’étiquetage et la normalisation des données améliorent les performances du modèle d’IA tout en réduisant le temps de déploiement. En instaurant des normes organisationnelles qui régissent la structure, la cohérence et l’exhaustivité des données, vous aurez la garantie que les modèles que vous utilisez apprennent en s’appuyant sur les bons signaux.  
  4. Mettre en œuvre la gouvernance et la conformité. La sécurité et la résilience des données sont primordiales. Établir une traçabilité claire des données, des contrôles de sécurité et des cadres de conformité renforce la confiance dans les systèmes d’IA. C’est en maintenant une solide structure de gouvernance des données et une piste d’audit robuste que vous pourrez veiller à ce que vos données sensibles soient utilisées de manière responsable et dans le respect des règles de conformité.  
  5. Moderniser l’infrastructure de données. Les solutions d’IA nécessitent des technologies modernes de calcul, de stockage et de réseau, ainsi qu’une expertise pour les exploiter pleinement. La mise à niveau vers des plateformes prenant en charge l’accès en temps réel, l’évolutivité et l’intégration permet à votre entreprise de répondre aux demandes croissantes en matière d’IA. 

La voie de la modernisation de votre infrastructure de données 

La simplification du déplacement des données, de leur traitement et de leur gestion garantit l’évolutivité de vos charges applicatives d’IA. Une approche unifiée et flexible accélère les délais de commercialisation et garantit l’avenir de votre entreprise.  

Adopter une telle approche est difficile. Dell Technologies et NVIDIA ont créé Dell AI Factory with NVIDIA, qui comprend des technologies et des services pour accélérer vos cas d’utilisation, intégrer vos données et vos workflows, et vous aider à concevoir votre propre parcours d’adoption de l’IA.  

Car rappelez-vous : de mauvaises données donnent de mauvais résultats. De bonnes données créent des avantages concurrentiels, tandis que de mauvaises données créent des problèmes coûteux à grande échelle. La question n’est pas de savoir si vous pouvez vous permettre d’investir dans la qualité des données, mais plutôt si vous pouvez vous permettre de ne pas le faire.  

Pouvez-vous vous permettre de ne pas le faire ?  

En savoir plus sur Dell AI Factory with NVIDIA. 

About the Author: Dell Technologies