AIをデータに適用し、インサイトを最大限に引き出す

デル・テクノロジーズの非構造化データ ソリューションで、インフラストラクチャーをモダナイズ(最新鋭化)しながらデータを保護・活用することで、AIのイノベーションを促進

ブログ原稿 https://www.dell.com/en-us/blog/insights-unlocked-introduce-ai-to-your-data/
筆者 Elizabeth Carbone | 2023年7月31日

生成AIなどのユースケースにとってデータは燃料

私は、人工知能(AI)が2023年の最も旬な話題であると考えています。ChatGPTとGoogle Bardがリリースされたことで、未知なる可能性への期待が大きく高まっています。AIは、世界中の企業の成長を促進し、私たちが働く環境を変え、誰もが考えたことすらなかったような新しいユース ケースを生み出すでしょう。ただし、すべてのモデルのトレーニング、クエリー、推論の基盤になっているのは、「データ」です。データは、より質の高い情報をベースとした意思決定、新しいコンテンツの創出、業務効率の改善、そして最終的にさまざまなビジネス モデルにおける予測可能性の向上につながる「AIロケット」に燃料を供給しています。まさに興味深い可能性だと言えるのではないでしょうか。

AIのもたらす可能性が大きく喧伝されている中、データ サイエンティストやIT部門のスタッフは、すべてを理解・把握しようと努力していますが、データからインサイトを引き出すことは難しいのが現実です。Enterprise Strategy Group(ESG)社の調査では、組織が保有している全データのうち平均47%は「ダークデータ」(保有してはいるものの分析に活用されていないデータ)で(*1)、これらのデータの大部分は、非構造化データです。全世界のデータ領域の90%以上は、整然とした列として分析に使うことができない非構造化データです(*2)。このような状況で、データ サイエンティストとIT部門は、画像や動画、センサー データなどに隠されているインサイトを引き出すために、どのように協力できるでしょうか?

デル・テクノロジーズの非構造化データ ソリューション:AIのイノベーションを実現

デル・テクノロジーズは、「Dell PowerScale」「Dell ECSエンタープライズ向けオブジェクト ストレージ」「Dell ObjectScale」といった高性能かつ高セキュリティーのファイル/オブジェクト ストレージ プラットフォームで構成された非構造化データ ソリューション ポートフォリオを提供しています。当社は、お客様が価値あるデータのすべてを活用して、高い要件が求められるワークロードを促進できるようにすることを目標にしています。このブログでは、最適なIT環境の構築に向けたプロセスを説明します。お客様は、「PowerScale OneFS」と「ECS」または「ObjectScale」で次世代ストレージの基盤をモダナイズ(最新鋭化)および構築し、「Dell Cyber Protection for Unstructured Data」でデータを保護して、データ管理ツールのフルスイートとパートナー エコシステムで、データをベースとしたアクションを実行することができます。

インフラストラクチャーをモダナイズし、AIワークロードのための次世代ストレージの基盤を構築

多くの人がすぐに「推論」段階に進みたいと思う反面、AIユースケース向けのトレーニングとモデリングを効果的に行うには、堅牢なストレージ基盤が不可欠です。現在は、AIにどのような質問をすればよいか分からないかもしれませんが、ストレージに格納するデータこそが、将来の予測や質の高いインサイトの実現要素になります。さらに、データセットは増加の一途をたどるため、データ収集とモデルのトレーニング サイクルに、より高いパフォーマンスが必要になります。デル・テクノロジーズは、生成AIのような高レベルの集中的なワークロード向けに「PowerScale OneFS」「ECS」「ObjectScale」を設計・構築しました。お客様は、幅広いモデルを活用することで、固有のニーズに合わせて柔軟に環境の規模を最適化することができます。また、デル・テクノロジーズが提供するファイル/オブジェクト ストレージ プラットフォーム ポートフォリオによって、必要に応じて迅速にデータセットを拡張することができます。例えば、「PowerScale」の単一クラスターで最大186PB(ペタバイト)の物理容量を利用して(*3)、高解像度データセット向けにAIモデルの精度を高めることができます。容量の増加は無停止で行えるため、データ サイエンティストと各業務部門は、ペースを崩すことなく学習とイノベーションを継続していくことができます。

PowerScaleのおかげで、エッジからコアやクラウドへの送信時に発生するレイテンシー遅延を心配することなく、データとアナリティクスへリアルタイムにアクセスできるようになりました」。
– Keith Bradley氏、Nature Fresh Farms社情報、テクノロジーおよびセキュリティー担当VP

さらに、生成AIのようなユース ケース向けのデータ処理には、モデルのトレーニング、ファインチューニング、入力データに基づく予測の生成が必要になります。実際は、これら3つのステップが異なる場所で行われる場合もあります。レイテンシーの要件、展開の期間、セキュリティー、その他のさまざまな考慮事項によっては、AIの目的を真に達成するためにオンプレミス、エッジ、クラウドの展開環境の組み合わせが必要になることも考えられます。お客様は、デル・テクノロジーズの非構造化データ ソリューションによって、任意の場所で生成AIのようなワークロードを実行できます。デル・テクノロジーズのポートフォリオがマルチクラウド対応である理由は、任意の場所でワークロードを実行可能にするためで、コアからエッジ、クラウドまでを網羅した単一のデータ アクセス ポイントを提供します。例えば、「Dell APEX File Storage for AWS」では、ストレージ アーキテクチャーのリファクタリングを必要とせず、高度なネイティブ レプリケーション機能を使って、オンプレミスからクラウドへ簡単にデータを移動させることができます。クラウドに移行した後は、エンタープライズ グレードの「PowerScale OneFS」のすべての機能を使用できます。これらを使い慣れた環境で実行できるため、ITチームを再度トレーニングすることは不要です。このことは、運用効率を高める上で重要な意味を持ちます。

インテリジェントなリアルタイムの検出ツールと高速リカバリーでデータの安全を確保

残念なことに、セキュリティーへの脅威が衰える兆しは、一切見られません。サイバー犯罪に伴うコストは、2025年までに10兆5,000億ドルに達することが見込まれ(*4)、ランサムウェアによる攻撃未遂を経験した企業は76%に上ります(*5)。攻撃者は、その価値(売却可能な機密データ)と量の多さから、特に非構造化データをターゲットにしています。このため、AIのトレーニングとモデリングのための環境を構築する際には、多層型のセキュリティーが必須です。「Cyber Protection for Unstructured Data」は、多層型のアプローチによってサイバー攻撃者による攻撃を阻止します。

デル・テクノロジーズのセキュリティーに対する取り組みは、セキュリティー専門家が、ゼロトラストの視点から、お客様のサイバーセキュリティーの状態を包括的に評価することから始まります。次に、エアギャップ(ネットワーク分離)したサイバー ボールトを確立します。このサイバー ボールトは、ミッション クリティカルなデータと一般的なストレージの間に、侵入不可能なバリアを築きます。さらに、AIと機械学習ソフトウェアをシームレスに統合して、お客様があらゆる不審なアクティビティーをリアルタイムに検知して分析できる環境を確立します。何らかの脅威を検知すると、プロアクティブな対策が開始されます。このプロセスでは、アクセスまたは改変されたすべてのファイルを追跡して特定するとともに、アカウントを迅速にロックアウトし、データ複製のパイプラインをシャットダウンすることでリスクを軽減します。サイバー攻撃が発生した場合でも、高速な復旧時間によって、ペタバイト規模のデータも数週間ではなく数時間レベルで復旧し、業務を確実に復旧させることができます。デル・テクノロジーズのエンド ツー エンドのサイバーセキュリティー ソリューションは、AI環境をリアルタイムに保護するための最適なレベルの可視性と、セキュリティーが確立されているという安心感をお客様に提供します。

保存場所を問わず、データの活用と分析が可能

これでデータのためのモダンでセキュアな基盤が確立されますが、これだけではありません。デル・テクノロジーズ社内のAI専門家チームが、モデルのトレーニングからファインチューニング、推論まで、AIを実装する全過程を通じて、お客様のサポートに専心の態勢で取り組みます。そのため、お客様は、インサイトをベースとして、より迅速にアクションを起こすことができます。デル・テクノロジーズのデータ サイエンティストは、お客様とのミーティングでビジネスにおける最も重要な課題を特定し、生成AIのような最適なワークロードの実行方法を提案します。さらに、Starburst社、Snowflake社、Databricks社をはじめとする、データ管理パートナーの緊密に統合された幅広いエコシステムが、データの発見を簡素化し、価値あるインサイトを引き出すことを支援します。お客様は、モダン データ レイクハウスを確立してデータ アクセスを合理化しながら、市場で最も堅牢なデータ クエリー/エンジニアリング ツールをAIプロジェクトで活用することができます。

PowerScaleオールフラッシュをエッジに展開したことで、トレーニングと推論の両方を含め、より迅速に分析を実行して、インサイトを提供できるようになりました」。
– Arnaud Langer氏、Atos社グローバル エッジ& IoTシニア プロダクト ディレクター

信頼できるプロバイダーを選び、AIを実装する過程を強力に推進

デル・テクノロジーズは、お客様がデータを活用してAIによるイノベーションを成功に導くパートナーです。お客様は、市場で実証済みのテクノロジー、また全世界で16,000を超えるお客様への導入実績を誇るデル・テクノロジーズをパートナーにすることで、安心感を得ることができます。さらに、デル・テクノロジーズは、市場で最も柔軟(*6)かつ効率的(*7)で安全(*8)なストレージを提供しています。Gartner® Magic Quadrant™ for Distributed File Systems and Object Storageにおいては、7年連続でリーダーの1社に位置付けられています(*9)。

デル・テクノロジーズのAI専門家とデータ サイエンティストは、お客様のビジネスのための包括的なAI戦略を立案・策定する準備を整えています。「PowerScale」と「Dell PowerEdge」サーバー、そしてNVIDIAを基盤にした「Dell AI Starter Kit」をご活用ください。その他の詳細は「Dell Unstructured Data Solutions for AI」のページをご覧ください。

*1. Enterprise Strategy Group(ESG)社『2022 State of Data Governance and Empowerment Report.
*2. IDC社ホワイトペーパー『High Data Growth and Modern Applications』、2022年7月
*3. デル・テクノロジーズ仕様書に基づく。 最大エクサバイト レベル(ECS)または252ノード クラスターで186PB(PowerScale)の物理容量
*4. CyberSecurity Ventures 2022: eSentire | 2022 Official Cybercrime Report.
*5. ProofPoint社『2023 State of the Phish Report
*6. 公開されている情報源のデル・テクノロジーズ社内分析に基づく(2023年2月)。
*7. デル・テクノロジーズ社内分析に基づく - 効率性に関連する機能を比較: データ削減、ストレージ容量、データ保護、ハードウェア、スペース、ライフサイクル管理の効率、ENERGY STAR認定構成(2023年6月)
*8. デル・テクノロジーズ社内分析に基づく - 「PowerScale」と競合製品のサイバーセキュリティー ソフトウェア機能を比較。2022年9月。
*9. Gartner, Inc. “Magic Quadrant™ for Distributed File Systems and Object Storage” Julia Palmer, Jerry Rozeman, Chandra Mukhyala, Jeff Vogel, October 19, 2022.
Gartnerは、Gartnerリサーチの発行物に掲載された特定のベンダー、製品またはサービスを推奨するものではありません。また、最高のレーティング又はその他の評価を得たベンダーのみを選択するようにテクノロジーユーザーに助言するものではありません。Gartner・リサーチの発行物は、Gartner・リサーチの見解を表したものであり、事実を表現したものではありません。Gartnerは、明示または黙示を問わず、本リサーチの商品性や特定目的への適合性を含め、一切の責任を負うものではありません。
GARTNER/ Magic Quadrantは、Gartner Inc.または関連会社の米国およびその他の国における登録商標およびサービスマークであり、同社の許可に基づいて使用しています。All rights reserved.