AI 고품질 데이터 공급을 위한 IT 리더용 가이드

고품질 데이터는 양질의 AI 성과를 달성하는 데 핵심적인 요소이지만, 이를 육성하는 방법이 항상 명확하지는 않습니다. 이 플레이북이 도움이 될 수 있습니다.

IT 리더는 조직의 데이터 품질이 AI 솔루션의 성능을 좌우한다는 사실을 알고 있습니다데이터 엔지니어는 이렇게 말합니다.   

하지만 동일한 데이터 엔지니어는 조직의 신뢰할  있는 데이터 부족과 이를 성장시키는  필요한 작업에 대해 걱정합니다이러한 코호트 집단은 기업 책임자와 부담을 공유합니다.  

The Futurum Group and Kearney 연구에 따르면 CEO  2/3 사일로화된 인프라스트럭처와 단편화된 기술 스택으로 인해 품질이 떨어지거나 연결이 끊어진 데이터를 AI 솔루션 확장의 주된 장벽으로 꼽았습니다.  

AI 솔루션을 제공하기 위해 고품질 데이터를 육성하는 방법을 모색하기 전에 데이터가 열악할 경우 발생할  있는 결과를 이해하는 것이 중요합니다.  

불완전한 데이터를 입력하면 불완전한 결과가 출력되는 현실 

불완전한 데이터를 입력하면 불완전한 결과가 출력된다.  문구는 Generative AI 등장과 함께 주류가 되었습니다. AI 모델에 포함된 데이터가 부정확하거나 편향된 경우(불완전한 데이터 입력모델이 일반화에 실패하고예측 또는 의사 결정에 오류가 발생합니다(불완전한 결과 출력).   

실제로는 어떤 모습일까요품질이 좋지 않은 데이터를 AI 시스템에 입력하면 손상된 정보를 기반으로 수백만 달러 가치의 의사 결정을 내리라고 요청하는 것과 같습니다.   

500 매장에 걸쳐 인벤토리를 최적화하기 위해 AI 시스템을 구축하는 소매 체인을 고려해 보십시오이제 체인의 판매 데이터에서 태그가 잘못 지정된 항목이 반환되어 추가 판매로 표시된다고 가정해 보겠습니다.   

결과적으로 AI 시스템은 특정 제품이 30%  많이 팔리고 있다고 잘못 판단했습니다결과는 어땠을까요재고가 빠르게 줄어들지 않는 상품이 과도하게 주문되어 다른 상품의 재고 부족이 발생합니다.  

또는 주요 은행에서 잘못 보관되어 부정확한 데이터가 로드된 고객 서비스 기록을 학습한 AI 챗봇의 에이전트가 예금 계좌 데이터를 “chk”, “checking” 또는 숫자로  계좌 코드로 축약하는 경우를 생각해 보십시오.   

안타깝게도 챗봇은 기본 뱅킹 서비스에 대한 고객의 요청을 안정적으로 이해할  없어 고객 만족도 점수가 낮아집니다은행은 추가 요청을 처리하기 위해  많은 인적 에이전트를 고용해야 하는 경우가 많습니다.  

규정 준수와 위험 사이에서 균형을 이루는 다른 규제산업 전반에서 유사한 시나리오를 상상해 보십시오경우에 따라 평판과 재무 상태에 피해가 발생할  있으며이는 심각한 결과입니다.  

선별된 고품질 데이터 

Dell Technologies NVIDIA 조직이 성공적인 AI 배포를 위해 데이터 전략을 수립하는 방법을 설명하는 eBook 작성했습니다영향력 있는 데이터 전략을 촉진하는  중요한  가지 측면에는 데이터 준비가 포함됩니다.   

고품질 데이터는 AI 모델이 모든 중요한 성능 기준을 얼마나  인식하고 예측하고 행동할  있는지를 결정합니다올바른 데이터가 없으면 AI 기반이 무너질 것입니다여기서는 데이터를 정리하는  필요한 단계를 다룹니다.  

  1. 데이터 감사.  원하는 목표 상태로 데이터를 가져오려면 먼저 현재 상태를 평가해야 합니다데이터 관리 스택이 깨끗하고 체계적이며  관리되고 있습니까이러한 단계를 수행하면 오류중복 또는 불일치를 탐지하고 해결하는  도움이   있습니다.   
  2. 데이터 사일로를 결합합니다. 조직 데이터는 여러 LOB 걸쳐 애플리케이션과 플랫폼에 흩어져 있습니다데이터 소스를 통합하면 데이터를 보다 정확하게   있고중복을 줄이며 유용한 통찰력을 얻을  있습니다. 
  3. 데이터를 준비합니다. 시간이 지남에 따라 데이터가 노후화되고 방대해지는 가운데데이터를 정리레이블 지정  표준화하면 배포 시간을 단축하는 동시에 AI 모델 성능이 향상됩니다데이터 구조일관성  완전성과 관련된 조직 표준을 수립하면 비즈니스에서 활용하는 모델이 올바른 신호에서 학습할  있습니다.   
  4. 거버넌스  규정 준수를 구현합니다. 데이터 보안과 회복탄력성이 무엇보다 중요합니다명확한 데이터 계열보안 제어  규정 준수 프레임워크를 확립하면 AI 시스템에 대한 신뢰가 구축됩니다강력한 데이터 거버넌스 구조와 감사 추적을 유지하면 민감한 데이터가 책임감 있게 사용되고 규정을 준수할  있습니다.   
  5. 데이터 인프라스트럭처를 현대화합니다. AI 솔루션에는 최신 컴퓨팅스토리지  네트워킹 기술 이를 구성하고 지원하는 전문 지식이 필요합니다실시간 액세스확장성  통합을 지원하는 플랫폼으로 업그레이드하면 조직이 증가하는 AI 요구 사항을 충족할  있습니다. 

데이터 인프라스트럭처 현대화를 위한 경로 

데이터 이동 방식처리 방식  관리 방식을 간소화하여 AI 워크로드를 확장할  있습니다유연한 통합 접근 방식을 통해 출시 소요 시간을 단축하고 조직의 미래에 대비할  있습니다.  

그런 접근 방식을 취하는 것은 어렵습니다. Dell Technologies NVIDIA Dell AI Factory with NVIDIA 만들었습니다활용 사례를 가속화하고데이터와 워크플로를 통합하며자체 AI 여정 설계에 도움이 되는 기술과 서비스로 구성되어 있습니다.  

명심하십시오불완전한 데이터를 입력하면 불완전한 결과가 출력됩니다좋은 데이터는 경쟁 우위를 창출하지만 나쁜 데이터는  규모와 무관하게 많은 비용을 소모시키는 문제를 야기합니다데이터 품질에 투자할 여유가 있는지 여부가 문제가 아니라 그렇게  여유가 없는지가 문제입니다.  

그럴 여유가 없습니까?  

Dell AI Factory with NVIDIA 대해 자세히 알아보십시오.