Amazon SageMaker HyperPodのタスクガバナンスが一般提供開始

ID	194
GUID	20a7eae1fc8c7e6ea7a55f23d9f2bdfb7edb751f
発表日(JST)	2024/12/5
要約生成日時(JST)	2024-12-05 02:21:11 +0900
タイトル	Amazon SageMaker HyperPodのタスクガバナンスが一般提供開始
詳細リンク	https://aws.amazon.com/about-aws/whats-new/2024/12/task-governance-amazon-sagemaker-hyperpod/
カテゴリ	amazon-machine-learning amazon-sagemaker artificial-intelligence
要点	Amazon SageMaker HyperPodが生成AI開発タスク全体の一元的なガバナンスを提供コンピューティングリソースの割り当てを最適化し、モデル開発コストを最大40%削減可能管理者がタスクの優先順位とリソース制限を設定可能ビジュアルダッシュボードでタスクの監視と監査が可能優先度に基づいたリソースの動的な再割り当てを実現 Amazon SageMaker Studioとの統合により、開発環境が向上複数のAWSリージョンで利用可能
アップデート内容要約	Amazon SageMaker HyperPodが、生成AIの開発タスク全体に対する一元的なガバナンスを提供するようになりました。これにより、コンピューティングリソースの割り当てを最適化し、モデル開発コストを最大40%削減できます。
アップデート内容全文	Amazon SageMaker HyperPodは、トレーニングや推論などの生成AI開発タスク全体に対して一元的なガバナンスを提供するようになりました。コンピューティングリソースの割り当てを完全に可視化し制御できるため、最も重要なタスクを優先し、コンピューティングリソースの利用を最大化することで、モデル開発コストを最大40%削減できます。 HyperPodのタスクガバナンスにより、管理者は異なるタスクの優先順位を定義し、各チームが使用できるコンピューティングリソースの制限を設定することが容易になりました。また、管理者はビジュアルダッシュボードを通じて、実行中または計算リソースを待機中のタスクをいつでも監視および監査できます。データサイエンティストがタスクを作成すると、HyperPodは定義されたコンピューティングリソースの制限と優先順位に従って自動的にタスクを実行します。例えば、高優先度のモデルのトレーニングをできるだけ早く完了する必要があるが、すべてのコンピューティングリソースが使用中の場合、HyperPodは低優先度のタスクからリソースを解放してトレーニングをサポートします。 HyperPodは低優先度のタスクを一時停止し、チェックポイントを保存して、解放されたコンピューティングリソースを再割り当てします。中断された低優先度のタスクは、リソースが再び利用可能になると最後に保存されたチェックポイントから再開されます。また、チームが管理者が設定したリソース制限を完全に使用していない場合、HyperPodはそれらのアイドル状態のリソースを使用して別のチームのタスクを加速します。さらに、HyperPodがAmazon SageMaker Studioと統合され、タスクガバナンスやその他のHyperPod機能がStudio環境に組み込まれました。データサイエンティストはStudioから直接HyperPodクラスターとシームレスに対話でき、強力なアクセラレーターを備えたクラスター上で機械学習（ML）ジョブの開発、送信、監視を行うことができます。 HyperPodのタスクガバナンスは、HyperPodが利用可能なすべてのAWSリージョンで利用できます：米国東部（バージニア北部）、米国西部（カリフォルニア北部）、米国西部（オレゴン）、アジアパシフィック（ムンバイ）、アジアパシフィック（シンガポール）、アジアパシフィック（シドニー）、アジアパシフィック（東京）、ヨーロッパ（フランクフルト）、ヨーロッパ（アイルランド）、ヨーロッパ（ロンドン）、ヨーロッパ（ストックホルム）、南米（サンパウロ）。詳細については、SageMaker HyperPodのウェブページ、AWSニュースブログ、およびSageMaker AIのドキュメントをご覧ください。
関連サービス	Amazon SageMaker Amazon SageMaker HyperPod Amazon SageMaker Studio
関連サービスの説明	Amazon SageMaker HyperPodは、大規模な機械学習モデルのトレーニングと推論を効率的に行うためのAWSのマネージドサービスです。複数のGPUやその他のアクセラレーターを持つクラスターを簡単に設定し、管理することができます。タスクガバナンス機能により、リソースの使用を最適化し、優先度の高いタスクを効率的に処理できます。 Amazon SageMaker Studioは、機械学習モデルの構築、トレーニング、デプロイ、管理のための統合開発環境（IDE）です。データサイエンティストやML開発者が、コードの作成からモデルのデプロイまで、すべての機械学習ワークフローを1つのインターフェースで行うことができます。 Amazon SageMakerは、機械学習モデルの構築、トレーニング、デプロイを簡素化するAWSの包括的なマネージドサービスです。データの準備から本番環境へのモデルデプロイまで、機械学習のライフサイクル全体をカバーし、開発者やデータサイエンティストの生産性を向上させます。
関連URL	https://aws.amazon.com/sagemaker/studio/ https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/ https://aws.amazon.com/sagemaker-ai/hyperpod/ https://aws.amazon.com/blogs/aws/maximize-accelerator-utilization-for-model-development-with-new-amazon-sagemaker-hyperpod-task-governance https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-eks-operate-console-ui-governance.html