

AIソリューション
AIの高品質データを提供するためのITリーダー向けガイド
ITリーダーは、組織のデータの品質が、AIソリューションのパフォーマンスを方向付けることを理解しています。データ エンジニアから、そうした話を聞いているのです。
しかし、その同じデータ エンジニアの口から、自分の組織内にしっかりとしたデータがないという嘆きと、データの育成に必要な作業についての不安が聞かれることもよくあります。これらのグループは、企業の責任者と負担を共有しています。
The Futurum Group and Kearneyの調査によると、CEOの3分の2近くが、AIソリューションの規模拡大を妨げる主な障壁は、インフラストラクチャのサイロ化とテクノロジー スタックの断片化に起因する、低品質または分断したデータであることに言及しています。
AIソリューションを提供するために高品質のデータを育成する方法を検討する前に、データの質が低い場合の潜在的な結果を理解することが重要です。
ゴミを入れてもゴミしか出ないという現実
ガベージ イン、ガベージ アウト。このフレーズは、生成AIの台頭とともに多くの人が知るところとなりました。AIモデルに取り込まれるデータが不正確であるか偏りがある場合(ガベージ イン)、モデルの一般化ができないため、予測や意思決定の誤りにつながります(ガベージ アウト)。
これは実際問題として、どのようなことになるのでしょうか?AIシステムに与えるデータの質が低い場合は、実質的に、数百万ドルにも値する意思決定をでたらめな情報に基づいて行うことを依頼するようなものです。
500店舗の在庫を最適化するためにAIシステムを導入する小売チェーンについて、考えてみましょう。このチェーンの売上データに返品のタグが正しく付けられていなかったため、売上が増えたように見えているとします。
その結果、AIシステムは、特定の製品の売上が30%増加していると誤って認識しています。その結果、あまり売れない商品の過剰発注、大量の過剰在庫と在庫不足が発生します。
別の例として、ある大手銀行のAIチャットボットのトレーニングに使用された顧客サービスの会話の文字起こしの中に、管理が十分でない不正確なデータが含まれているとします。たとえば、エージェントが当座預金口座(checking account)を「chk」や「checking」などの短縮形で表現していたり、数字の口座コードを使用したりしている場合です。
残念ながら、チャットボットは基本的な銀行サービスに関する顧客の要求を確実に理解できず、顧客満足度スコアが低下します。多くの場合、増えたリクエストを処理するために、銀行が人間のエージェントをさらに雇用する必要が生じます。
同様のシナリオが、他の規制産業、つまりコンプライアンスとリスクの最適なバランスが求められる業界ではどうなるかを想像してみてください。時には、その結果として評判の低下や金銭的損害が生じることもありますが、これは深刻なガベージ アウトです。
高品質データのキュレーション
デル・テクノロジーズとNVIDIAは、AI導入を成功させるために組織がデータ戦略を策定する方法を説明するe-bookを作成しました。インパクトのあるデータ戦略を促進するための重要な側面の1つに、データの準備があります。
高品質データは、AIモデルがどの程度適切に認識、予測、行動できるかを決定付けます。これらはすべて、重要なパフォーマンス基準です。健全なデータがなければ、AI基盤は崩壊します。ここでは、データハウスを整頓するために必要な手順について説明します。
- データを監査する。データを望ましい状態にするには、その前に現状を評価する必要があります。データ管理スタックはクリーンで、整理され、適切に維持されていますか?これらの手順を踏むことで、エラー、重複、不整合を検出して修復しやすくなります。
- データ サイロをまとめる。組織データは、事業部門、アプリケーション、プラットフォームに分散しています。データソースを統合することで、データをより正確に表示し、重複を減らして、より実用的なインサイトを得ることができます。
- データを整える。時間の経過とともに、データは旧式化し大量に増加します。データのクリーニング、ラベル付け、標準化は、導入時間を短縮しつつ、AIモデルのパフォーマンスを向上させます。データ構造、整合性、完全性に関する組織の基準を確立することで、ビジネスが依存するモデルが適切なシグナルで学習していることを確認できます。
- ガバナンスとコンプライアンスを実装する。データセキュリティとレジリエンスは最優先事項です。明確なデータ リネージ、セキュリティ制御、コンプライアンスのフレームワークを確立することで、AIシステムの信頼性が高まります。強力なデータ ガバナンス構造と監査証跡を維持することで、コンプライアンスを尊重しながら、機密データを責任を持って使用できるようになります。
- データ インフラストラクチャをモダナイズする。AIソリューションには、最新のコンピューティング、ストレージ、ネットワーキング テクノロジーと、それらを構成してサポートするための専門技術が必要です。リアルタイムのアクセス、拡張性、統合をサポートするプラットフォームにアップグレードすることで、増大するAIニーズに対応できます。
データ インフラストラクチャをモダナイズするための道筋
データの移動方法、処理方法、管理方法をシンプルにすることで、AIワークロードを拡張できます。統合された柔軟なアプローチにより、市場投入までの時間を短縮し、組織の将来への対応性を確実にすることができます。
このようなアプローチを取り入れることは、簡単ではありません。デル・テクノロジーズとNVIDIAが開発したDell AI Factory with NVIDIAは、テクノロジーとサービスで構成されており、ユースケースを加速させ、データとワークフローを統合して、独自のAI導入の設計を支援します。
「ガベージ イン、ガベージ アウト」を忘れないでください。優れたデータは競争上の優位性を生み出し、不良データは大規模なコストの問題を生み出します。問われているのは、データ品質に投資する余裕があるかどうかではなく、投資せずにいられる余裕があるかどうか、ということです。
実行せずにいられる余裕はありますか?
こちらでDell AI Factory with NVIDIAの詳細をご覧ください。