

AI 솔루션
AI 고품질 데이터 공급을 위한 IT 리더용 가이드
IT 리더는 조직의 데이터 품질이 AI 솔루션의 성능을 좌우한다는 사실을 알고 있습니다. 데이터 엔지니어는 이렇게 말합니다.
하지만 동일한 데이터 엔지니어는 조직의 신뢰할 수 있는 데이터 부족과 이를 성장시키는 데 필요한 작업에 대해 걱정합니다. 이러한 코호트 집단은 기업 책임자와 부담을 공유합니다.
The Futurum Group and Kearney 연구에 따르면 CEO의 약 2/3가 사일로화된 인프라스트럭처와 단편화된 기술 스택으로 인해 품질이 떨어지거나 연결이 끊어진 데이터를 AI 솔루션 확장의 주된 장벽으로 꼽았습니다.
AI 솔루션을 제공하기 위해 고품질 데이터를 육성하는 방법을 모색하기 전에 데이터가 열악할 경우 발생할 수 있는 결과를 이해하는 것이 중요합니다.
불완전한 데이터를 입력하면 불완전한 결과가 출력되는 현실
불완전한 데이터를 입력하면 불완전한 결과가 출력된다. 이 문구는 Generative AI의 등장과 함께 주류가 되었습니다. AI 모델에 포함된 데이터가 부정확하거나 편향된 경우(불완전한 데이터 입력) 모델이 일반화에 실패하고, 예측 또는 의사 결정에 오류가 발생합니다(불완전한 결과 출력).
실제로는 어떤 모습일까요? 품질이 좋지 않은 데이터를 AI 시스템에 입력하면 손상된 정보를 기반으로 수백만 달러 가치의 의사 결정을 내리라고 요청하는 것과 같습니다.
500개 매장에 걸쳐 인벤토리를 최적화하기 위해 AI 시스템을 구축하는 소매 체인을 고려해 보십시오. 이제 체인의 판매 데이터에서 태그가 잘못 지정된 항목이 반환되어 추가 판매로 표시된다고 가정해 보겠습니다.
결과적으로 AI 시스템은 특정 제품이 30% 더 많이 팔리고 있다고 잘못 판단했습니다. 결과는 어땠을까요? 재고가 빠르게 줄어들지 않는 상품이 과도하게 주문되어 다른 상품의 재고 부족이 발생합니다.
또는 주요 은행에서 잘못 보관되어 부정확한 데이터가 로드된 고객 서비스 기록을 학습한 AI 챗봇의 에이전트가 예금 계좌 데이터를 “chk”, “checking” 또는 숫자로 된 계좌 코드로 축약하는 경우를 생각해 보십시오.
안타깝게도 챗봇은 기본 뱅킹 서비스에 대한 고객의 요청을 안정적으로 이해할 수 없어 고객 만족도 점수가 낮아집니다. 은행은 추가 요청을 처리하기 위해 더 많은 인적 에이전트를 고용해야 하는 경우가 많습니다.
규정 준수와 위험 사이에서 균형을 이루는 다른 규제산업 전반에서 유사한 시나리오를 상상해 보십시오. 경우에 따라 평판과 재무 상태에 피해가 발생할 수 있으며, 이는 심각한 결과입니다.
선별된 고품질 데이터
Dell Technologies와 NVIDIA는 조직이 성공적인 AI 배포를 위해 데이터 전략을 수립하는 방법을 설명하는 eBook을 작성했습니다. 영향력 있는 데이터 전략을 촉진하는 데 중요한 한 가지 측면에는 데이터 준비가 포함됩니다.
고품질 데이터는 AI 모델이 모든 중요한 성능 기준을 얼마나 잘 인식하고 예측하고 행동할 수 있는지를 결정합니다. 올바른 데이터가 없으면 AI 기반이 무너질 것입니다. 여기서는 데이터를 정리하는 데 필요한 단계를 다룹니다.
- 데이터 감사. 원하는 목표 상태로 데이터를 가져오려면 먼저 현재 상태를 평가해야 합니다. 데이터 관리 스택이 깨끗하고 체계적이며 잘 관리되고 있습니까? 이러한 단계를 수행하면 오류, 중복 또는 불일치를 탐지하고 해결하는 데 도움이 될 수 있습니다. 。
- 데이터 사일로를 결합합니다. 조직 데이터는 여러 LOB에 걸쳐 애플리케이션과 플랫폼에 흩어져 있습니다. 데이터 소스를 통합하면 데이터를 보다 정확하게 볼 수 있고, 중복을 줄이며, 더 유용한 통찰력을 얻을 수 있습니다.
- 데이터를 준비합니다. 시간이 지남에 따라 데이터가 노후화되고 방대해지는 가운데, 데이터를 정리, 레이블 지정 및 표준화하면 배포 시간을 단축하는 동시에 AI 모델 성능이 향상됩니다. 데이터 구조, 일관성 및 완전성과 관련된 조직 표준을 수립하면 비즈니스에서 활용하는 모델이 올바른 신호에서 학습할 수 있습니다.
- 거버넌스 및 규정 준수를 구현합니다. 데이터 보안과 회복탄력성이 무엇보다 중요합니다. 명확한 데이터 계열, 보안 제어 및 규정 준수 프레임워크를 확립하면 AI 시스템에 대한 신뢰가 구축됩니다. 강력한 데이터 거버넌스 구조와 감사 추적을 유지하면 민감한 데이터가 책임감 있게 사용되고 규정을 준수할 수 있습니다.
- 데이터 인프라스트럭처를 현대화합니다. AI 솔루션에는 최신 컴퓨팅, 스토리지 및 네트워킹 기술과 이를 구성하고 지원하는 전문 지식이 필요합니다. 실시간 액세스, 확장성 및 통합을 지원하는 플랫폼으로 업그레이드하면 조직이 증가하는 AI 요구 사항을 충족할 수 있습니다.
데이터 인프라스트럭처 현대화를 위한 경로
데이터 이동 방식, 처리 방식 및 관리 방식을 간소화하여 AI 워크로드를 확장할 수 있습니다. 유연한 통합 접근 방식을 통해 출시 소요 시간을 단축하고 조직의 미래에 대비할 수 있습니다.
그런 접근 방식을 취하는 것은 어렵습니다. Dell Technologies와 NVIDIA는 Dell AI Factory with NVIDIA를 만들었습니다. 활용 사례를 가속화하고, 데이터와 워크플로를 통합하며, 자체 AI 여정 설계에 도움이 되는 기술과 서비스로 구성되어 있습니다.
명심하십시오. 불완전한 데이터를 입력하면 불완전한 결과가 출력됩니다. 좋은 데이터는 경쟁 우위를 창출하지만 나쁜 데이터는 그 규모와 무관하게 많은 비용을 소모시키는 문제를 야기합니다. 데이터 품질에 투자할 여유가 있는지 여부가 문제가 아니라 그렇게 할 여유가 없는지가 문제입니다.
그럴 여유가 없습니까?
Dell AI Factory with NVIDIA에 대해 자세히 알아보십시오.