-
IA generativa
A IA generativa já chegou:
Você está com tudo pronto?Inovação Integrada Intel®
-
-
-
Ponto de partida
Uma nova era com a IA generativa
A IA generativa (GenAI) está sendo aproveitada em grande escala tanto por organizações como indivíduos, gerando uma grande mudança social. A IA para consumidores, como o ChatGPT e DALL-E, conquistou a imaginação de todos pela capacidade de gerar conteúdo. No entanto, a repercussão da IA generativa sobre as organizações promete agregar ainda mais valor, como na maior produtividade, na redução de custos e na transformação da maneira que trabalhamos.
-
76% dos líderes de TI acreditam que a IA generativa será significativa, se não transformadora, para suas organizações.
76%
A IA generativa transformará as organizações
Embora ela traga recompensas, também apresenta novos desafios e riscos. À medida que as organizações embarcam na jornada da IA generativa, elas não podem, na ânsia de cruzar a linha de chegada e ficar em primeiro lugar, colocar a confiança dos clientes e os próprios dados valiosos em risco.
76% dos líderes de TI acreditam que a IA generativa será significativa, se não transformadora, para suas organizações.76%
-
-
-
Tenha sucesso ao usar a IA generativa
Detectar os casos de uso certos é crucial. Os líderes de TI e de negócios devem priorizar os casos de uso com base nestes critérios:
-
-
-
A função vital dos seus dados na IA generativa
Dados e os riscos caminham lado a lado. Os dados aceleram os projetos com IA generativa, mas você também precisa avaliar os possíveis riscos de hospedar os modelos dela em nuvens públicas, incluindo: a perda de propriedade intelectual, vazamento de dados, problemas de privacidade, violações de conformidade, perda de credibilidade e integridade, desvios, além de violação de IP.
-
-
Como gerenciar riscos e agregar valor
Ao iniciar sua jornada, é essencial sintonizar os investimentos em tecnologia e treinamento para acelerar a maturidade operacional, reduzir os riscos, aumentar o controle e maximizar valor para sua organização. Com a IA generativa pronta para empresas, você terá o controle sobre quem conseguirá acessar seus dados.
-
-
IA generativa pronta para uso empresarial IA generativa pouco desenvolvida Maturidade operacional Risco Gráfico que mostra como o risco (eixo y) diminui com o tempo à medida que você atinge a maturidade operacional (eixo x) com o processamento de dados. O início da inclinação do gráfico indica IA generativa pouco desenvolvida com alto risco e baixa maturidade operacional. A tendência de queda no gráfico indica que a IA pronta para uso empresarial diminui o risco e representa alta maturidade operacional.
-
-
-
-
-
USE A IA COM SEUS DADOS
Mantenha os modelos de IA generativa próximos dos dados
-
-
Compreender os riscos e benefícios das diferentes opções de implementação é essencial para determinar o posicionamento ideal das cargas de trabalho de sua organização para a IA generativa. Quando o assunto é aplicar IA em dados, implementar instâncias privadas de modelos grandes de linguagem (LLMs) de IA generativa, como Llama 2 ou Falcon, oferece vantagens em termos de velocidade e implementação, mas isso também pode incluir custos mais altos e outras desvantagens. De qualquer forma, uma IA generativa interna deverá agregar o máximo de valor para suas iniciativas iniciais.
Em termos de posicionamento, a IA generativa não é diferente de qualquer outra carga de trabalho. Para ter os melhores resultados, é preciso colocá-la no ambiente que faça mais sentido com base tanto nas necessidades de negócios como nas técnicas.
O diagrama abaixo apresenta conceitos e estruturas que entram em cena ao determinar o posicionamento das cargas de trabalho com IA generativa.
-
-
-
Cinco motivos para usar seus dados com IA
-
-
-
-
Onde residem os dados Custo Menor time-to-value Precisão e personalização Casos de uso gerais Acesso seguro Nuvem pública Nuvem privada Um gráfico que representa seis fatores a serem considerados ao escolher entre a nuvem privada ou pública para alocação de carga de trabalho de IA generativa. "Onde residem os dados" e "Acesso seguro" tendem muito para a nuvem privada. "Custo" direciona moderadamente para a nuvem privada, e "Precisão e personalização" tendem um pouco para a nuvem privada. "Menor time-to-value" tende um pouco para a nuvem pública. E "Casos de uso gerais" tendem muito para a nuvem pública.
-
-
Gerenciamento de dados para IA generativa
A maioria das organizações está implementando uma abordagem dupla na estratégia de IA generativa. Elas estão experimentando implementações táticas para aprender e tentar não ficar para trás, desenvolvendo também uma estratégia em longo prazo para acomodar os muitos casos de uso que surgirão com o passar do tempo. Essa abordagem requer uma estratégia de gerenciamento de dados de duas camadas.
PREPARAÇÃO DE DADOSENGENHARIA DE DADOS -
-
-
Preparação de dados
-
Curto prazo: preparação dos dados
A preparação inclui a identificação de conjuntos e a definição dos requisitos de dados, seguidas da limpeza, rotulagem e ocultação, e, por fim, a normalização deles em diferentes fontes. Também é necessário criar pipelines de dados para integrá-los a um modelo.
-
-
-
Engenharia de dados
-
Longo prazo: engenharia de dados
As organizações precisam de um repositório de dados bem estruturado, como um data lake ou data lakehouse, para integrá-los aos modelos de IA generativa. É possível considerar a criação iterativa de um data lake para expandir progressivamente os recursos do repositório de dados de IA generativa à medida que a equipe aprimorar o gerenciamento de dados e as habilidades da IA generativa.
-
-
-
-
-
-
"Esta colaboração [com a Dell Technologies] capacitará as empresas a criar os próprios sistemas de IA aproveitando as inovações incríveis da comunidade de código aberto e se beneficiando da segurança, da conformidade e do desempenho dos sistemas Dell."
-
-
-
-
-
-
A IA NO TAMANHO CERTO
Defina a infraestrutura e a IA no tamanho certo
-
As soluções de IA da Dell para inferir LLMs no local podem ser 75% mais econômicas do que a nuvem pública.1
75%
Seus dados exclusivos permitem que você utilize casos de uso específicos do domínio e da empresa, agregando valor ao setor por meio de tarefas ou funções pelas quais você tem propriedade exclusiva dos dados. Diferentes tipos de IA generativa têm pontos de entrada e investimentos correspondentes que são necessários para garantir o sucesso. LLMs treinados com grandes quantidades de texto são como enciclopédias, úteis para uso geral, mas talvez não adequados para responder a perguntas específicas sobre seus dados organizacionais.
As soluções de IA da Dell para inferir LLMs no local podem ser 75% mais econômicas do que a nuvem pública.175%
-
-
-
Seus dados melhoram muito a eficiência e o valor da IA generativa
-
Funcionalidade limitada A menor/mais econômica Conhecimento especializado no domínio A mais precisa Menor tamanho Mais precisa Mais alucinações Cara com intensidade energética Amplitude de casos de uso Finalidade geral Específica da empresa Específica do domínio Grandes modelos de linguagem Valor Gráfico que mostra as quantidades relativas de dados necessários para três tipos de modelos de IA, bem como o respectivo retorno comercial. Grandes modelos de linguagem, ou LLMs, são para casos de uso gerais e consomem a maioria dos dados. Podem ser caros e ter intensidade energética, sendo mais propensos a alucinações. A IA específica do domínio usa menos, mas mais dados específicos. Tem funcionalidade limitada, mas é mais relevante para sua empresa e agrega mais valor. A IA específica da empresa usa ainda menos dados, mas é a mais específica e precisa, além de agregar o maior valor para sua empresa.
-
-
-
Padrões de implementação de IA
O modelo de IA que você escolher dependerá do nível de preparo em ciência de dados de sua organização, dos padrões de implementação e das implicações de cada um deles.
-
Modelo pré-treinado
Conhecida por "engenharia de prompt", essa estratégia consiste em fazer uma pergunta a um modelo pré-treinado e o recebimento de uma resposta.
Exemplo: ChatGPTAumento de modelos
Aprimore seu modelo de IA generativa incluindo dados que dão um contexto adicional para as respostas; por exemplo, a inferência, que inclui casos de uso como a geração aumentada de recuperação (RAG).
Modelos de ajuste
Envolvem o ajuste da ponderação do modelo e a integração dos seus dados. Embora isso resulte em resultados melhores, também exigirá mais esforço durante a configuração.
Treinamento de modelos
Inclui a criação de um modelo específico e o treinamento dele com um conjunto de dados. Geralmente, é preciso dedicar a maior parte do trabalho e de recursos para essa abordagem, que, com frequência, é reservada para resolver problemas complexos.
Esforço Custo Valor e
diferenciaçãoIntegração de dados Infraestrutura Entre client e servidor Entre client e servidor Otimizado para GPU Grandes implementações de GPU Habilidades Operações de TI Desenvolvedor Cientista(s) de dados Cientista(s) de dados Referência de implementação simplificada Projeto validado Design de referência Projeto validado Design de referência
-
Escolha a infraestrutura certa para o seu modelo
A infraestrutura compatível com a implementação da sua IA generativa depende muito dos requisitos computacionais, influenciados pelo tipo, tamanho e o número de usuários do modelo. Outras considerações incluem a capacidade de armazenamento necessária para os dados usados durante a implementação, o treinamento e o aperfeiçoamento do modelo.
-
COMPUTAÇÃO GERAL (orientada a CPUs) OTIMIZADA PARA IA (com uso intensivo de GPUs) Notebooks Dell Workstations Precision Servidores em rack PowerEdge Servidores PowerEdge XE Armazenamento ObjectScale Armazenamento PowerScale Armazenamento PowerFlex Switches Dell PowerSwitch Série Z Treinamento de modelos Modelo de ajustes Aumento de modelos Modelo pré-treinado Milhões de parâmetros Bilhões de parâmetros Trilhões de parâmetros Número baixo de usuários Número alto de usuários Gráfico que representa três requisitos de IA generativa e os mapeia para as soluções de hardware adequadas da Dell. As soluções de hardware variam em potência, desde opções de computação geral, que são orientadas para CPUs, até opções otimizadas para IA, que fazem uso intensivo de GPUs. As opções específicas começam com os notebooks Dell no final de computação geral e avançam até workstations Precision e servidores PowerEdge, terminando com servidores PowerEdge XE no final das soluções otimizadas para IA. Os hardwares de armazenamento e de rede da Dell podem ser usados em toda a extensão. Três atributos de infraestrutura da IA generativa são mapeados para essas soluções em uma progressão que exige cada vez mais capacidade de processamento. Complexidade do modelo pode variar desde o uso de modelos pré-treinados e Modelos de aumento ou de ajustes até o treinamento de novos modelos. Número de parâmetros pode variar de milhões a bilhões, até trilhões.
-
-
-
-
-
Acelere sua jornada com a IA
Saia ganhando
A geração aumentada por recuperação (RAG) é um ponto de partida ideal para muitas organizações, pois ela amplia um modelo de IA generativa com seus próprios dados, sem precisar passar por retreinamento. Explore a configuração de casos de uso de RAG que podem ser aplicados para melhorar sua empresa e dados.
-
Caso de uso de RAG
Aplique a RAG a um conjunto de dados em PDF personalizado
-
DELL VALIDATED DESIGN PARA RAG
Implemente um assistente digital no Dell APEX Cloud Platform for Red Hat OpenShift
-
-