• IA generativa

    A IA generativa já chegou:
    Você está com tudo pronto?

    Inovação Integrada Intel®
      • Ponto de partida

        Uma nova era com a IA generativa

        A IA generativa (GenAI) está sendo aproveitada em grande escala tanto por organizações como indivíduos, gerando uma grande mudança social. A IA para consumidores, como o ChatGPT e DALL-E, conquistou a imaginação de todos pela capacidade de gerar conteúdo. No entanto, a repercussão da IA generativa sobre as organizações promete agregar ainda mais valor, como na maior produtividade, na redução de custos e na transformação da maneira que trabalhamos.

      • 76%

        76% dos líderes de TI acreditam que a IA generativa será significativa, se não transformadora, para suas organizações.

        A IA generativa transformará as organizações

        Embora ela traga recompensas, também apresenta novos desafios e riscos. À medida que as organizações embarcam na jornada da IA generativa, elas não podem, na ânsia de cruzar a linha de chegada e ficar em primeiro lugar, colocar a confiança dos clientes e os próprios dados valiosos em risco.

        76%

        76% dos líderes de TI acreditam que a IA generativa será significativa, se não transformadora, para suas organizações.
      • Tenha sucesso ao usar a IA generativa

        Detectar os casos de uso certos é crucial. Os líderes de TI e de negócios devem priorizar os casos de uso com base nestes critérios:


      • Pessoas e equipes

        Prepare sua organização para aproveitar a oportunidade de IA generativa, com a TI se concentrando na viabilidade e os líderes de negócios buscando otimizar e impulsionar o crescimento.

      • Processos e políticas

        Defina e comunique como sua organização utilizará a IA e a tornará um aspecto essencial dos processos de negócios cotidianos.

      • Tecnologia

        Ofereça um acesso seguro à IA generativa em toda a sua organização, evitando instâncias de IA invisíveis para garantir a integridade e a conformidade dos dados.

      • Estratégia

        Observe o estado atual do seu ambiente para estabelecer a visão estratégica e os princípios básicos para futuros projetos de IA generativa.

      • A função vital dos seus dados na IA generativa

        Dados e os riscos caminham lado a lado. Os dados aceleram os projetos com IA generativa, mas você também precisa avaliar os possíveis riscos de hospedar os modelos dela em nuvens públicas, incluindo: a perda de propriedade intelectual, vazamento de dados, problemas de privacidade, violações de conformidade, perda de credibilidade e integridade, desvios, além de violação de IP.

        • Como gerenciar riscos e agregar valor

          Ao iniciar sua jornada, é essencial sintonizar os investimentos em tecnologia e treinamento para acelerar a maturidade operacional, reduzir os riscos, aumentar o controle e maximizar valor para sua organização. Com a IA generativa pronta para empresas, você terá o controle sobre quem conseguirá acessar seus dados.

      • IA generativa pronta para uso empresarial IA generativa pouco desenvolvida Maturidade operacional Risco
        Gráfico que mostra como o risco (eixo y) diminui com o tempo à medida que você atinge a maturidade operacional (eixo x) com o processamento de dados. O início da inclinação do gráfico indica IA generativa pouco desenvolvida com alto risco e baixa maturidade operacional. A tendência de queda no gráfico indica que a IA pronta para uso empresarial diminui o risco e representa alta maturidade operacional.
      • USE A IA COM SEUS DADOS

        Mantenha os modelos de IA generativa próximos dos dados

        • Compreender os riscos e benefícios das diferentes opções de implementação é essencial para determinar o posicionamento ideal das cargas de trabalho de sua organização para a IA generativa. Quando o assunto é aplicar IA em dados, implementar instâncias privadas de modelos grandes de linguagem (LLMs) de IA generativa, como Llama 2 ou Falcon, oferece vantagens em termos de velocidade e implementação, mas isso também pode incluir custos mais altos e outras desvantagens. De qualquer forma, uma IA generativa interna deverá agregar o máximo de valor para suas iniciativas iniciais.

          Em termos de posicionamento, a IA generativa não é diferente de qualquer outra carga de trabalho. Para ter os melhores resultados, é preciso colocá-la no ambiente que faça mais sentido com base tanto nas necessidades de negócios como nas técnicas.

          O diagrama abaixo apresenta conceitos e estruturas que entram em cena ao determinar o posicionamento das cargas de trabalho com IA generativa.

      • Onde residem os dados Custo Menor time-to-value Precisão e personalização Casos de uso gerais Acesso seguro Nuvem pública Nuvem privada
        Um gráfico que representa seis fatores a serem considerados ao escolher entre a nuvem privada ou pública para alocação de carga de trabalho de IA generativa. "Onde residem os dados" e "Acesso seguro" tendem muito para a nuvem privada. "Custo" direciona moderadamente para a nuvem privada, e "Precisão e personalização" tendem um pouco para a nuvem privada. "Menor time-to-value" tende um pouco para a nuvem pública. E "Casos de uso gerais" tendem muito para a nuvem pública.
        • Gerenciamento de dados para IA generativa

          A maioria das organizações está implementando uma abordagem dupla na estratégia de IA generativa. Elas estão experimentando implementações táticas para aprender e tentar não ficar para trás, desenvolvendo também uma estratégia em longo prazo para acomodar os muitos casos de uso que surgirão com o passar do tempo. Essa abordagem requer uma estratégia de gerenciamento de dados de duas camadas.

        PREPARAÇÃO DE DADOS
        ENGENHARIA DE DADOS
        • Preparação de dados

        • Detecção de dados

          Identifique conjuntos de dados e defina os requisitos para dados

        • Exploração e aprimoramento de dados

          Desenvolva e implemente o pipeline de dados para marcar, limpar, rotular e ocultar essas informações


        • Curto prazo: preparação dos dados

          A preparação inclui a identificação de conjuntos e a definição dos requisitos de dados, seguidas da limpeza, rotulagem e ocultação, e, por fim, a normalização deles em diferentes fontes. Também é necessário criar pipelines de dados para integrá-los a um modelo.

        • Engenharia de dados

        • Ingestão de dados

          Integre dados empresariais a modelos de linguagem grandes

        • Observabilidade e desempenho

          Verifique se os dados transformados atendem aos objetivos


        • Longo prazo: engenharia de dados

          As organizações precisam de um repositório de dados bem estruturado, como um data lake ou data lakehouse, para integrá-los aos modelos de IA generativa. É possível considerar a criação iterativa de um data lake para expandir progressivamente os recursos do repositório de dados de IA generativa à medida que a equipe aprimorar o gerenciamento de dados e as habilidades da IA generativa.


        • "Esta colaboração [com a Dell Technologies] capacitará as empresas a criar os próprios sistemas de IA aproveitando as inovações incríveis da comunidade de código aberto e se beneficiando da segurança, da conformidade e do desempenho dos sistemas Dell."

          Jeff Boudier, Diretor de produtos e crescimento, Hugging Face
      • A IA NO TAMANHO CERTO

        Defina a infraestrutura e a IA no tamanho certo

      • 75%

        As soluções de IA da Dell para inferir LLMs no local podem ser 75% mais econômicas do que a nuvem pública.1

        Seus dados exclusivos permitem que você utilize casos de uso específicos do domínio e da empresa, agregando valor ao setor por meio de tarefas ou funções pelas quais você tem propriedade exclusiva dos dados. Diferentes tipos de IA generativa têm pontos de entrada e investimentos correspondentes que são necessários para garantir o sucesso. LLMs treinados com grandes quantidades de texto são como enciclopédias, úteis para uso geral, mas talvez não adequados para responder a perguntas específicas sobre seus dados organizacionais.

        75%

        As soluções de IA da Dell para inferir LLMs no local podem ser 75% mais econômicas do que a nuvem pública.1
      •  


         
      • Seus dados melhoram muito a eficiência e o valor da IA generativa

      • Funcionalidade limitada A menor/mais econômica Conhecimento especializado no domínio A mais precisa Menor tamanho Mais precisa Mais alucinações Cara com intensidade energética Amplitude de casos de uso Finalidade geral Específica da empresa Específica do domínio Grandes modelos de linguagem Valor
        Gráfico que mostra as quantidades relativas de dados necessários para três tipos de modelos de IA, bem como o respectivo retorno comercial. Grandes modelos de linguagem, ou LLMs, são para casos de uso gerais e consomem a maioria dos dados. Podem ser caros e ter intensidade energética, sendo mais propensos a alucinações. A IA específica do domínio usa menos, mas mais dados específicos. Tem funcionalidade limitada, mas é mais relevante para sua empresa e agrega mais valor. A IA específica da empresa usa ainda menos dados, mas é a mais específica e precisa, além de agregar o maior valor para sua empresa.
      • Padrões de implementação de IA

        O modelo de IA que você escolher dependerá do nível de preparo em ciência de dados de sua organização, dos padrões de implementação e das implicações de cada um deles.

      • Modelo pré-treinado

        Conhecida por "engenharia de prompt", essa estratégia consiste em fazer uma pergunta a um modelo pré-treinado e o recebimento de uma resposta.
        Exemplo: ChatGPT

        Aumento de modelos

        Aprimore seu modelo de IA generativa incluindo dados que dão um contexto adicional para as respostas; por exemplo, a inferência, que inclui casos de uso como a geração aumentada de recuperação (RAG).

        Modelos de ajuste

        Envolvem o ajuste da ponderação do modelo e a integração dos seus dados. Embora isso resulte em resultados melhores, também exigirá mais esforço durante a configuração.

        Treinamento de modelos

        Inclui a criação de um modelo específico e o treinamento dele com um conjunto de dados. Geralmente, é preciso dedicar a maior parte do trabalho e de recursos para essa abordagem, que, com frequência, é reservada para resolver problemas complexos.

        Esforço Pouco Médio Alto Enorme
        Custo Baixo Médio Alto Enorme
        Valor e
        diferenciação
        Mínimos Médios Altos Enormes
        Integração de dados Nenhuma Alta Alta Enorme
        Infraestrutura Entre client e servidor Entre client e servidor Otimizado para GPU Grandes implementações de GPU
        Habilidades Operações de TI Desenvolvedor Cientista(s) de dados Cientista(s) de dados
        Referência de implementação simplificada Projeto validado Design de referência Projeto validado Design de referência
      • Escolha a infraestrutura certa para o seu modelo

        A infraestrutura compatível com a implementação da sua IA generativa depende muito dos requisitos computacionais, influenciados pelo tipo, tamanho e o número de usuários do modelo. Outras considerações incluem a capacidade de armazenamento necessária para os dados usados durante a implementação, o treinamento e o aperfeiçoamento do modelo.

      • COMPUTAÇÃO GERAL (orientada a CPUs) OTIMIZADA PARA IA (com uso intensivo de GPUs) Notebooks Dell Workstations Precision Servidores em rack PowerEdge Servidores PowerEdge XE Armazenamento ObjectScale Armazenamento PowerScale Armazenamento PowerFlex Switches Dell PowerSwitch Série Z Treinamento de modelos Modelo de ajustes Aumento de modelos Modelo pré-treinado Milhões de parâmetros Bilhões de parâmetros Trilhões de parâmetros Número baixo de usuários Número alto de usuários
        Gráfico que representa três requisitos de IA generativa e os mapeia para as soluções de hardware adequadas da Dell. As soluções de hardware variam em potência, desde opções de computação geral, que são orientadas para CPUs, até opções otimizadas para IA, que fazem uso intensivo de GPUs. As opções específicas começam com os notebooks Dell no final de computação geral e avançam até workstations Precision e servidores PowerEdge, terminando com servidores PowerEdge XE no final das soluções otimizadas para IA. Os hardwares de armazenamento e de rede da Dell podem ser usados em toda a extensão. Três atributos de infraestrutura da IA generativa são mapeados para essas soluções em uma progressão que exige cada vez mais capacidade de processamento. Complexidade do modelo pode variar desde o uso de modelos pré-treinados e Modelos de aumento ou de ajustes até o treinamento de novos modelos. Número de parâmetros pode variar de milhões a bilhões, até trilhões.
      • Acelere sua jornada com a IA

        Saia ganhando

        A geração aumentada por recuperação (RAG) é um ponto de partida ideal para muitas organizações, pois ela amplia um modelo de IA generativa com seus próprios dados, sem precisar passar por retreinamento. Explore a configuração de casos de uso de RAG que podem ser aplicados para melhorar sua empresa e dados.

    • 1 Com base na pesquisa do Enterprise Strategy Group encomendada pela Dell, "Maximizing AI ROI: Inferencing On-premises With Dell Technologies Can Be 75% More Cost-effective Than Public Cloud", que compara a infraestrutura Dell no local com a Infraestrutura as a Service nativa na nuvem pública e APIs baseadas em token, abril de 2024. Os custos esperados foram modelados utilizando RAG para pequenos (5 mil usuários), médios (10 mil usuários), grandes (50 mil usuários) e dois LLMs (7 bilhões e 70 bilhões de parâmetros) durante três anos. Os resultados reais podem variar. Resumo econômico