-
生成AI
生成AIの時代が到来。
準備は整っていますか?インテル® のイノベーション内蔵
-
-
-
まず考慮すること
生成AIの新時代
生成AIは、組織や個人によって大規模に活用されており、社会に大きな影響を与えています。ChatGPTやDALL-Eなど、コンシューマーグレードのAIは、そのコンテンツ生成能力によって、人々の興味をかき立てています。しかし、生成AIが組織にもたらす影響から、生産性の向上、コスト削減、働き方の変革など、さらなる価値が得られることが期待されています。
-
76%のITリーダーが、生成AIは組織にとって変革的とまではいかなくても、重要だと考えています。
76%
生成AIが組織に変革をもたらす
生成AIはメリットをもたらしますが、新たな課題とリスクも伴います。組織が生成AIの導入に乗り出す際、ほかに先んじて成果を得るために、お客様の信頼や貴重なデータを危険にさらすことはできません。
76%のITリーダーが、生成AIは組織にとって変革的とまではいかなくても、重要だと考えています。76%
-
-
-
生成AIの成功を実現
適切なユース ケースを見極めることが重要です。ビジネス リーダーとITリーダーは、次の基準に基づいてユースケースの優先順位を決定する必要があります。
-
-
-
生成AIにおけるデータの重要な役割
データとリスクは表裏一体の関係にあります。データは生成AIプロジェクトを牽引しますが、パブリッククラウド内で生成AIモデルをホストすることの潜在的なリスクを評価する必要もあります。例えば、知的財産の損失、データ漏洩、プライバシーの問題、コンプライアンス違反、信頼性と整合性の損失、バイアス、IP侵害などです。
-
-
リスクの管理と価値の向上
導入に向けた取り組みを開始する際は、運用成熟度を高め、リスクを軽減し、制御を強化し、組織にとっての価値を最大限に高めるため、テクノロジーとトレーニングへの投資を調整することが不可欠です。エンタープライズ対応の生成AIを採用すれば、データにアクセスできるユーザーを制御できます。
-
-
エンタープライズ対応の生成AI 未成熟な生成AI 運用の成熟度 リスク データ処理に関して、運用の成熟度(x軸)が高まると、経時的にリスク(y軸)が低減することを示すグラフ。グラフの傾きの始まりは、リスクが高く運用の成熟度が低い、未成熟な生成AIを示す。グラフの下降傾向は、エンタープライズ対応AIではリスクが低減し、運用の成熟度が高まることを示す。
-
-
-
-
-
データでAIを活用
生成AIモデルをデータのすぐそばに配置
-
-
生成AIワークロードの最適な配置を決定する際は、さまざまな導入オプションのリスクとメリットを理解することが重要です。データへのAI導入に関しては、Llama 2やFalconなどの生成AI大規模言語モデル(LLM)のプライベート インスタンスを導入すると、スピードと導入におけるメリットが得られますが、コストの増加やその他のデメリットも伴う可能性があります。いずれにせよ、社内での生成AI導入は、早期の取り組みに特に大きな価値をもたらす可能性があります。
ワークロードの配置に関しては、生成AIもほかのワークロードと同様です。最適な成果を得るには、ビジネス要件と技術的なニーズに基づいて理にかなった環境に配置します。
以下の図は、生成AIワークロードの配置を決定する際に影響を及ぼす概念と枠組みを示しています。
-
-
-
データにAIを導入すべき5つの理由
-
-
-
-
データの配置場所 コスト タイム トゥ バリューの短縮 正確性とカスタマイズ 汎用ユース ケース 安全なアクセス パブリック クラウド プライベート クラウド 生成AIワークロードの配置について、プライベートクラウドとパブリッククラウドのどちらかを選択する際に考慮すべき6つの要素を表すチャート。「データの配置場所」と「安全なアクセス」はプライベートクラウドに大きく傾いている。「コスト」はプライベートクラウドにやや傾いており、「正確性とカスタマイズ」はプライベートクラウドにわずかに傾いている。「タイムトゥバリューの短縮」はパブリッククラウドにわずかに傾いている。「汎用ユース ケース」はパブリッククラウドに大きく傾いている。
-
-
生成AIのためのデータ管理
大多数の組織が、生成AI戦略に対して二面的なアプローチを採用しています。AIについて学び、後れを取らないよう、戦術的な導入で試しつつ、時間の経過とともに明らかになる多くのユース ケースに対応できるよう、長期的な戦略も策定しています。このようなアプローチには、2階層のデータ管理戦略が必要です。
データ準備データ エンジニアリング -
-
-
データ準備
-
短期:データ準備
データ準備の段階では、データ セットの特定とデータ要件の定義を行います。その後、データのクレンジング、ラベル付け、匿名化、さらには複数のデータ ソースにわたる正規化を行います。また、データをモデルに統合するためのデータ パイプラインの構築も必要です。
-
-
-
データ エンジニアリング
-
長期:データ エンジニアリング
データを生成AIモデルに統合するために、データレイクやデータ レイクハウスなどの適切に構造化されたデータ リポジトリーが必要です。チームのデータ管理と生成AIに関するスキルを強化しつつ、データレイクの構築を反復して行い、生成AIのデータ リポジトリー機能を段階的に拡張することを検討しましょう。
-
-
-
-
-
-
「(デル・テクノロジーズとの)コラボレーションにより、企業はDell製システムがもたらすセキュリティ、コンプライアンス、パフォーマンスのメリットを享受しながら、オープンソース コミュニティーの優れたイノベーションを活用して独自のAIシステムを構築できます」
-
-
-
-
-
-
AIのサイズを適正化
インフラストラクチャを定義し、AIのサイズを適正化
-
オンプレミスでLLMを推論するDell AIソリューションは、パブリッククラウドと比較して、コスト効率が最大75%向上します1。1
75%
独自のデータを使用することで、特定分野や企業に特化したユース ケースを活用できるとともに、自社だけがデータを有しているタスクや機能を通じて業界価値を生み出すことができます。生成AIにはさまざまな種類があり、確実に成功を収めるために必要な出発点と投資もそれぞれ異なります。膨大な量のテキストでトレーニングされたLLMは百科事典のようなもので、一般的な用途には役立ちますが、組織データに関する具体的な質問に対する回答を得るのには適していない場合があります。
オンプレミスでLLMを推論するDell AIソリューションは、パブリッククラウドと比較して、コスト効率が最大75%向上します1。175%
-
-
-
自社のデータで生成AIの効率と価値を大幅に向上
-
機能が限定的 最小/最もコスト効率が高い 特定分野の専門知識 最も正確 より小規模 より正確 ハルシネーションが多い コストとエネルギー強度が高い 幅広いユース ケース 汎用 企業固有 ドメイン固有 大規模言語モデル 価値 3種類のAIモデルに必要な相対的なデータ量と、それぞれのビジネス バリューを示す図。大規模言語モデル(LLM)は汎用ユース ケース向けであり、最も多くのデータを使用する。コストとエネルギー強度が高くなる可能性があり、ハルシネーションを起こしやすくなる。ドメイン固有のAIの場合、使用するデータは少ないが、より具体的になる。機能は限定的だが、ビジネスとの関連性が高く、もたらす価値も高くなる。企業固有のAIの場合、使用するデータはさらに少ないものの、最も具体的かつ正確であり、ビジネスに最大の価値をもたらす。
-
-
-
AI導入パターン
選択するAIモデルは、データサイエンスに対する組織の準備レベル、導入パターン、各組織への影響に応じて異なります。
-
事前トレーニング済みモデル
「プロンプト エンジニアリング」と呼ばれるこのアプローチでは、事前トレーニング済みモデルに質問を提示し、結果を受け取ります。
例:ChatGPTモデルの強化
データを追加して、推論といった回答のためのコンテキストをさらに足すことで、生成AIモデルを強化します。検索拡張生成(RAG)などのユースケースが含まれます。
微調整モデル
モデルの重み付けを調整し、データを取り入れます。これにより結果が向上しますが、セットアップに多くの労力を要します。
モデル トレーニング
データ セットを使用した独自モデルの構築やモデルのトレーニングが含まれます。通常、最も多くの作業とリソースを要し、多くの場合、複雑な問題を解決するために行われます。
労力 コスト 価値と
差別化データ統合 インフラストラクチャ クライアント – サーバー クライアント – サーバー GPU最適化 大規模なGPUの導入 スキル IT運用 開発者 データ サイエンティスト データ サイエンティスト シンプルな導入リファレンス Validated Design Reference Design Validated Design Reference Design
-
使用するモデルに適したインフラストラクチャを選択する
生成AIの導入を支えるインフラストラクチャは、コンピューティング要件に大きく依存します。コンピューティング要件は、モデルの種類やサイズ、ユーザー数による影響を受けます。このほかに、導入、トレーニング、モデルの改良の際に使用されるデータに必要なストレージ容量などを考慮しましょう。
-
一般的なコンピューティング(CPU指向) AI最適化(GPU集約型) Dellのノートパソコン Dell Precisionワークステーション PowerEdgeラックサーバー PowerEdge XEサーバー ObjectScaleストレージ PowerScaleストレージ PowerFlexストレージ PowerSwitch Zシリーズ スイッチ モデル トレーニング モデルの微調整 モデルの強化 事前トレーニング済みモデル 数百万個のパラメーター 数十億個のパラメーター 数兆個のパラメーター ユーザー数が少ない ユーザー数が多い 3つの生成AI要件と、それらを適切なDellハードウェア ソリューションにマッピングして表現したチャート。ハードウェア ソリューションのパワーは、CPU指向の一般的なコンピューティング オプションから、GPU集約型のAI最適化オプションまで多岐にわたる。具体的なオプションとしては、一般的なコンピューティング側のDell製ノートパソコンから始まり、Dell Precisionワークステーション、PowerEdgeサーバーを経て、AI最適化ソリューション側のPowerEdge XEサーバーで終わる。Dellのストレージおよびネットワーキング ハードウェアは、全製品で使用できる。生成AIインフラストラクチャの3つの属性がこれらのソリューションに対して、必要な処理能力の高さ順にマッピングされている。モデルの複雑さは、事前トレーニング済みモデルから、モデルの強化や微調整、新しいモデルのトレーニングまで多岐にわたる。パラメーターの数は、数百万個から数十億個、最大で数兆個にまで及ぶ。
-
-