-
IA générative
L’IA générative est là :
êtes-vous prêt ?Innovation Intel® intégrée
-
-
-
Par où commencer ?
La nouvelle ère de l’IA générative
L’IA générative (GenAI) est exploitée à grande échelle par les organisations et les individus, d’où un impact significatif sur la société. L’IA destinée au grand public, comme ChatGPT et DALL-E, a suscité l’engouement du monde entier avec sa capacité à générer du contenu. Pourtant, l’impact de l’IA générative sur les organisations laisse envisager de nombreux avantages supplémentaires, y compris une productivité accrue, une réduction des coûts et une transformation de nos modes de travail.
-
76 % des responsables IT estiment que l’IA générative sera importante, voire transformatrice, pour leur organisation.
76%
L’IA générative transforme les organisations
L’IA générative présente des atouts, mais s’accompagne également de nouveaux défis et risques. Les organisations adoptent de plus en plus l’IA générative, mais franchir la ligne d’arrivée en premier n’est pas une raison suffisante pour mettre en péril la confiance des clients et la forte valeur ajoutée de leurs données.
76 % des responsables IT estiment que l’IA générative sera importante, voire transformatrice, pour leur organisation.76%
-
-
-
Réussir avec l’IA générative
Il est essentiel d’identifier les cas d’utilisation pertinents. Les responsables métier et IT doivent hiérarchiser les cas d’utilisation en fonction des critères suivants :
-
-
-
Le rôle essentiel de vos données à l’ère de l’IA générative
Les données et les risques vont de pair. Les données contribuent à la progression de vos projets d’IA générative, mais vous devez également évaluer les risques potentiels liés à l’hébergement des modèles d’IA générative dans les Clouds publics, y compris la perte de propriété intellectuelle, les fuites de données, les problèmes de confidentialité, les violations des règles de conformité, la perte de crédibilité et d’intégrité, les préjugés et la violation de propriété intellectuelle.
-
-
Gestion des risques et valeur accrue
Au début de votre transition, il est crucial de coordonner vos investissements en technologie et en formation pour accroître la maturité opérationnelle, réduire les risques, améliorer le contrôle et optimiser la valeur pour votre organisation. Avec une IA générative clé en main, vous avez le contrôle des accès à vos données.
-
-
IA générative adaptée à l’entreprise IA générative immature Maturité opérationnelle Risque Graphique montrant que le risque (axe des ordonnées) diminue au fil du temps à mesure que vous atteignez la maturité opérationnelle (axe des abscisses) dans le traitement de vos données. Le début de la pente du graphique indique une IA générative immature présentant un risque élevé et une faible maturité opérationnelle. La tendance à la baisse sur le graphique indique que l’IA adaptée à l’entreprise réduit les risques et représente une maturité opérationnelle élevée.
-
-
-
-
-
EXPLOITEZ L’IA AVEC VOS DONNÉES
Conservez vos modèles d’IA générative au plus proche de vos données
-
-
Il est essentiel de comprendre les risques et les avantages des différentes options de déploiement pour déterminer le placement optimal des charges applicatives de votre organisation pour l’IA générative. Lorsqu’il s’agit d’appliquer l’IA à vos données, le déploiement d’instances privées de modèles linguistiques volumineux d’IA générative, tels que Llama 2 ou Falcon, offre des avantages en matière de vitesse et de déploiement, il peut également impliquer des coûts plus élevés et d’autres inconvénients. Quoi qu’il en soit, l’IA générative interne vous permettra probablement de tirer le meilleur parti de vos premiers efforts.
En ce qui concerne l’affectation des charges applicatives, l’IA générative ne diffère en rien. Pour obtenir les meilleurs résultats, placez-la dans l’environnement le plus pertinent en fonction de vos besoins métier et techniques.
Le schéma ci-dessous illustre les concepts et les cadres qui entrent en jeu lors du choix de l’affectation des charges applicatives d’IA générative.
-
-
-
5 raisons de placer l’IA au cœur de vos données
-
-
-
-
L’emplacement des données Coût Accélération du délai de rentabilisation Précision et personnalisation Cas d’utilisation généraux Accès sécurisé Cloud public Cloud privé Un graphique représentant six facteurs à prendre en compte lors du choix entre le Cloud privé et le Cloud public pour le placement des charges applicatives d’IA générative. « L’emplacement des données » et « l’accès sécurisé » privilégient le Cloud privé. Le « coût » favorise modérément le Cloud privé, tandis que « la précision et la personnalisation » privilégient légèrement le Cloud privé. Un « délai de rentabilisation plus rapide » tend légèrement vers le Cloud public. Et les « cas d’utilisation généraux » favorisent grandement le Cloud public.
-
-
Gestion des données pour l’IA générative
La plupart des organisations adoptent une approche double concernant leur stratégie d’IA générative. Elles testent des déploiements tactiques pour acquérir de l’expérience et éviter de prendre du retard, tout en élaborant une stratégie à long terme pour s’adapter aux nombreux scénarios d’utilisation qui apparaîtront progressivement. Cette approche nécessite une stratégie de gestion des données à deux niveaux.
PRÉPARATION DES DONNÉESINGÉNIERIE DE DONNÉES -
-
-
Préparation des données
-
Court terme : préparation des données
La préparation des données implique l’identification des jeux de données et la définition des exigences en matière de données, ainsi que le nettoyage, l’étiquetage et l’anonymisation des données, puis leur normalisation sur toutes les sources de données. Il convient également de créer des pipelines de données pour intégrer les données dans un modèle.
-
-
-
Ingénierie de données
-
Long terme : ingénierie de données
Les organisations ont besoin d’un référentiel de données bien structuré, tel qu’un Data Lake ou un Data Lakehouse, pour intégrer leurs données aux modèles d’IA générative. Envisagez de créer le Data Lake de manière itérative pour étendre progressivement les fonctionnalités du référentiel de données d’IA générative, tandis que l’équipe améliore ses compétences en matière de gestion des données et d’IA générative.
-
-
-
-
-
-
« Cette collaboration [avec Dell Technologies] permettra aux sociétés de créer leurs propres systèmes d’IA en tirant parti de l’innovation incroyable de la communauté Open Source tout en bénéficiant de la sécurité, de la conformité et des performances des systèmes Dell. »
-
-
-
-
-
-
UNE IA PARFAITEMENT DIMENSIONNÉE
Définir l’infrastructure et dimensionner l’IA
-
Les solutions d’IA Dell pour l’inférence des grands modèles de langage (LLM) sur site peuvent être jusqu’à 75 % plus rentables que le Cloud public.1
75%
Vos données uniques vous permettent de vous appuyer sur des exemples d’utilisation propres au domaine et à l’entreprise, ce qui crée de la valeur spécialisée par le biais de tâches ou de fonctions pour lesquelles vous seul disposez des données. Les différents types d’IA générative ont des points d’entrée et des investissements correspondants qui sont nécessaires pour garantir la réussite. Les modèles linguistiques volumineux entraînés à partir de grandes quantités de texte ressemblent à des encyclopédies et sont utiles pour une utilisation générale, mais ne sauront sans doute pas répondre à des questions spécifiques concernant vos données organisationnelles.
Les solutions d’IA Dell pour l’inférence des grands modèles de langage (LLM) sur site peuvent être jusqu’à 75 % plus rentables que le Cloud public.175%
-
-
-
Vos données améliorent considérablement l’efficacité et la valeur de l’IA générative
-
Fonctionnalités limitées Le plus petit/le plus rentable Expertise du domaine Grande précision Petite taille Plus de précision Plus d’hallucinations Coûteux et énergivore Diversité des cas d’utilisation Usage général Propre à l’entreprise Spécifique au domaine Grands modèles de langage Valeur Graphique montrant les quantités relatives de données requises pour trois types de modèles d’IA, ainsi que leur valeur commerciale. Les grands modèles de langage, ou LLM, sont destinés à des cas d’utilisation à usage général et utilisent le plus de données. Ils peuvent être coûteux et énergivores et génèrent plus souvent des hallucinations. L’IA spécifique à un domaine utilise moins de données, mais des données plus spécialisées. Ses fonctionnalités sont limitées, mais elles sont plus pertinentes pour votre entreprise et ont plus de valeur. L’IA propre à l’entreprise utilise encore moins de données, mais elle est la plus spécifique et la plus précise, et offre la plus grande valeur ajoutée à votre entreprise.
-
-
-
Modèles de déploiement de l’IA
Le modèle d’IA que vous choisirez dépendra du niveau de préparation de votre organisation en matière de science des données, des modèles de déploiement et des implications de chacun.
-
Modèle pré-entraîné
Nommée « ingénierie d’invites », cette approche consiste à interroger un modèle pré-entraîné et à recevoir un résultat.
Exemple : ChatGPTAugmentation du modèle
Améliorez votre modèle d’IA générative en ajoutant vos données pour fournir un contexte supplémentaire pour ses réponses, telles que l’inférence, qui englobe des exemples d’utilisation tels que la génération augmentée de récupération (RAG).
Optimisation des modèles
Cette étape consiste à ajuster la pondération du modèle et à intégrer vos données. Bien qu’elle génère de meilleurs résultats, elle nécessite également plus d’efforts lors de la configuration.
Entraînement du modèle
Cette étape englobe la création d’un modèle spécifique, puis son entraînement à l’aide d’un jeu de données. Elle implique généralement le plus de travail et de ressources et est souvent réservée à la résolution de problèmes complexes.
Effort Coût Valeur et
différenciationIntégration des données Infrastructure Client – serveur Client – serveur Optimisé pour le processeur graphique Déploiement de processeurs graphiques volumineux Compétences IT Ops Développeur Experts en science des données Experts en science des données Référence de déploiement simplifié Validated Design Conception de référence Validated Design Conception de référence
-
Choisissez l’infrastructure adaptée à votre modèle
L’infrastructure prenant en charge votre déploiement d’IA générative dépend en grande partie des exigences de calcul, influencées par le type et la taille de modèle, et le nombre d’utilisateurs. On peut également citer d’autres considérations, comme la capacité de stockage nécessaire pour les données utilisées lors du déploiement, de l’entraînement et du perfectionnement du modèle.
-
CALCUL GÉNÉRAL (ORIENTÉ PROCESSEUR) OPTIMISÉ PAR L’IA (gourmand en processeurs graphiques) Ordinateurs portables Dell Stations de travail Precision Serveurs au format rack PowerEdge Serveurs PowerEdge XE Stockage ObjectScale Stockage PowerScale Stockage PowerFlex Commutateurs PowerSwitch série Z Entraînement du modèle Optimisation du modèle Augmentation du modèle Modèle pré-entraîné Des millions de paramètres Des milliards de paramètres Des billions de paramètres Faible nombre d’utilisateurs Nombre élevé d’utilisateurs Diagramme représentant trois critères en matière d’IA générative et les associant aux solutions matérielles Dell appropriées. Les solutions matérielles varient en puissance, allant des options de calcul général, qui sont axées sur le processeur, aux options optimisées par l’IA, qui sont gourmandes en ressources de processeur graphique. Les options spécifiques commencent avec les ordinateurs portables Dell pour le calcul général et viennent ensuite les stations de travail Precision et les serveurs PowerEdge, et enfin les serveurs PowerEdge XE du côté des solutions optimisées par l’IA. Notez que le matériel de stockage et de gestion de réseau Dell peut être utilisé sur l’ensemble de la gamme. Trois attributs d’infrastructure d’IA générative sont associés à ces solutions, suivant une progression qui demande de plus en plus de puissance de traitement. La complexité peut aller de l’utilisation de modèles pré-entraînés et de l’augmentation ou l’optimisation à l’entraînement de nouveaux modèles. Le nombre de paramètres peut aller de millions à des milliards, voire des billions.
-
-
-
-
-
Accélération de votre transition vers l’IA
Commencez par un premier succès
La génération augmentée de récupération (RAG) est le point de départ idéal pour de nombreuses organisations, car elle améliore les modèles d’IA générative avec vos propres données sans devoir les réentraîner. Explorez la configuration des cas d’utilisation RAG qui peuvent être appliqués pour améliorer votre entreprise et vos données.
-
Cas d’utilisation RAG
Appliquer le mode RAG à un jeu de données PDF personnalisé
-
DELL VALIDATED DESIGN FOR RAG
Déployer un assistant numérique sur Dell APEX Cloud Platform for Red Hat OpenShift
-
-