生成AIの世界に向けたデータセンターの準備

生成AIの世界に向けたデータセンターの準備

「ここはもうカンザスではないみたい」 – 『オズの魔法使い』の主人公ドロシー

生成AIの世界に足を踏み入れることは、他にはない困難と機会に満ちあふれた新しい国に入っていくことに似ています。ドロシーがオズの国を旅するための道案内を必要としたように、組織にもAIインフラストラクチャのニーズに対応できるデータセンターの準備が必要になります。

エメラルド シティのコンピューティング要件

AIインフラストラクチャの導入には、コンピューティング要件をはじめとした大きな課題が伴います。その中でも最も負荷の高いのがモデル トレーニングです。たとえ組織がモデルをゼロからトレーニングするのではないにしても、大規模言語モデル推論や、検索拡張生成(RAG)のベクトル埋め込み、微調整などのコンピューティング要件は、今日のアプリケーションの要件をはるかに上回ります。

これらの要件を満たすため、GPU搭載の生成AIサーバーは、物理的なサイズ、重量、ケーブル接続、ネットワーキング、電源、冷却特性において、標準サーバーでの同様の仕様の数倍になります。組織がこのAIインフラストラクチャをデータセンターに導入して稼働させるには、慎重な計画が必要です。

組織のニーズとAIの導入の規模に応じて、このブログで説明する推奨事項の適用対象を、データセンター全体にするか、データセンターのAI専用セクションにするかを選ぶとよいでしょう。

かかしの脳みそ:データセンターの収容能力

このよく知られた物語に登場するかかしは、脳みそが欲しい、その計画としてドロシーの魔法使い探しの旅についていくのだと言います。AIインフラストラクチャの世界では、サーバーとラックの設置、エアフローの最適化、メンテナンスを適切に行うため、データセンターの規模とスペース割り当てに関する計画が非常に重要になります。

 

Dell Servicesの導入スペシャリストは、お客様のチームと協力して、大量のAIインフラストラクチャ ラックを効率的に管理するためのスペースを設計し、将来の拡張に備えて追加の収容能力を提供できるようにします。

ラックを配置して、サーバーとインフラストラクチャのメンテナンスを楽に行えるようにすることは、優れたデータセンター設計の鍵ですが、これはAIインフラストラクチャも言えることです。チームは必要に応じて、エアー フィルター、ファン、冷却ユニットなどの定期点検と交換といった、守るべき定期的なメンテナンス スケジュールを確立する必要があります。

ライオンの勇気:効果的なエアフロー管理

エアフローは、サーバーやインフラストラクチャ システムからの発熱を管理するうえで重要な役割を担います。AIインフラストラクチャは従来のサーバーよりもはるかに多くの電力を消費し、より多くの熱を発するため、エアフローと冷却が一層重要になります。

組織は、構造化されたエアフロー管理戦略を使用する必要があります。ホット アイル コンテインメントとコールド アイル コンテインメント、冷気をサーバーの吸気口に直接送り込む、高温の排気を機器から遠ざけるなどにより、冷却効率を向上させ、エネルギー コストを削減します。

ブリキ男の心臓:高度な電力と冷却

高密度GPUサーバーをサポートするには、電力と冷却のニーズを判断することが重要です。計画には、現在および将来の総電力要件の評価を含める必要があり、十分なリソースとバックアップ システムを整えて、中断のない運用をサポートできるようにします。より高い、AIインフラストラクチャのニーズに対応する設計になっていないデータセンターは、GPU密度の高いサーバーを扱える設備ではない可能性があります。

より高い効率定格を提供する、最新の電源および変圧器技術への投資を検討しましょう。そうした技術により、エネルギー消費量を削減するだけでなく、データセンターの運用が環境に与える影響も最小限に抑えられます。非常用電源用の無停電電源装置(UPS)とエネルギー効率に優れた配電ユニット(PDU)を使用することで、データセンター内の電力を効果的に管理、分配することができます。

Dellチームは、高密度のAIワークロードから生じる熱を管理するための冷却要件の評価を支援します。AIワークロードの増大に伴い、従来の空冷では不十分な場合があります。水冷ソリューションを実装すると、熱フットプリントを大幅に削減できるため、より効率的な熱除去が可能になり、高密度構成での安定性と寿命の伸長も実現します。

 

トトの行路:ケーブルの複雑さ、レイアウト、整理

トトを忘れてはいけません。複雑なオズの国の道案内の役割をトトが担ったように、当社のAI導入アプローチには、天井ルーティングと熱管理をサポートする綿密なケーブル管理ソリューションが含まれています。搬送システムは、電源ケーブルとデータ ケーブルを分離し、干渉を最小限に抑えて、安全性とシステムの信頼性の両方を高めるように設計する必要があります。

ラック内を整理して、空気の流れを妨げることもなく、技術者が適切なケーブルを簡単に見つけられるようにすることが重要です。ケーブルの配線が適切でないと、熱が蓄積され、スイッチング インフラストラクチャに問題が生じる可能性があります。

また、生成AIの「ポッド」を構成すると、多くの場合、1つのネットワーキング ラックが複数のGPUサーバー ラックに対応することになるため、ラック間のケーブルは数が増え、長くなります。この大量のケーブルと接続を体系的に整理するためのベスト プラクティスとして、構造化されたケーブル配線とラベリングの体系を設計し実装することなどが考えられます。

将来の成長に対応するために、モジュラー パネルや調整可能なラックなど、調整可能なケーブル管理システムを導入します。AIプロフェッショナル サービスのDell AIスイートには、ケーブルのレイアウトと管理を支援するインフラストラクチャ導入サービスが含まれています。

オンサイトでの導入をさらにシンプルにするため、AIインフラストラクチャの構築、構成、ケーブル配線、テストを、Dellが工場で行い、お客様のデータセンターで行う作業の量を大幅に削減できます。

 

ドロシーの知恵:パッケージの廃棄に関する考慮事項

 

Dellは、梱包材の廃棄に伴う環境および物流への影響を意識しています。ケーブルの梱包には、リサイクル可能素材または生分解性素材を選択し、サステナビリティを優先する廃棄手順を実施することで、規制要件を満たし、データセンターの環境プロファイルを改善します。

また、組織はデータセンターを評価して、既存のインフラストラクチャの電力消費(およびそれに伴う冷却要件)を削減できる領域を見つける必要があります。これにより、AIインフラストラクチャに必要な電力消費を補い、二酸化炭素排出量の影響を軽減できます。

Dellのソリューションは、廃棄物を最小限に抑えて、廃棄コストを効率的に管理することを目指しています。AIインフラストラクチャの導入が技術的に先進的であると同時に、環境に優しいものとなるようにしています。

黄色いレンガ道をたどってAI対応データセンターを実現する

『オズの魔法使い』の主要な登場人物たちが、友人の助けを借りながら困難を乗り越えたように、デル・テクノロジーズは、エキスパートによる計画とサポートを通じて、お客様の生成AI対応データセンターへの移行の成功を支援します。

新しいAIの世界に向けてデータセンターを準備する方法の詳細については、ジェネレーティブAIの専門サービスをご覧になるか、Dellの担当者にお問い合わせください。

About the Author: Dell Technologies