Googleが低価格のプリエンプティブGPUを提供へ – InfoQ Japan



Googleは先頃、同社のクラウドプラットフォーム内でプリエンプティブ仮想マシン(VM)に接続するGPU(Graphical Processing Unit)のベータ版を発表した。Google Cloud Platform (GCP)のユーザは、NVIDIA K80とNVIDIA P100 GPUをプリエンプティブ仮想マシンに、それぞれGPU1時間あたり0.22ドルと0.73ドルでアタッチすることができる。この価格は、オンデマンドインスタンスに接続されたGPUよりも50パーセント安くなっている。今回のGoogleのリリースは、高スループットバッチ処理やマシンラーニング、科学技術的なワークロードに対して、計算リソースの選択肢をより詳細なレベルでユーザに提供するという意味での新たなステップとなる。

プリエンプティブVMは、標準のオンデマンドインスタンスに比べて、非常に安価なコストで生成と実行が可能なインスタンスである。ただしGoogle Compute Engineは、警告を行った30秒後に、これらのインスタンスを停止(プリエンプト)する場合がある。実質的には、これらのインスタンスは最大24時間使用することが可能だ。フォールトトレラントなワークロードを持ち、専用のインスタンスを必要としないGCPユーザにとって、このようなプリエンプティブインスタンスはコスト面で適している。さらに、プリエンプティブVMにアタッチされているGPUはデフォルトでプリエンプティブであるため、費用が少なくて済む。

CIO Dive Webサイトの編集者であるAlex Hickey氏は、同サイトの最新のブリーフで、GoogleのプリエンプティブGPUの活用に関して、いくつかの洞察を提供している。

平均的な企業にとって、AIシステムの構築や実行は安価なものではありません。専門家の給与が6桁あるいはそれ以上であるため、AIにまで予算が回らないのです。計算処理用のハードウェアは、コスト節約のためにアウトソースされるのが通常です。GPUは、初期投資と維持コストのかさむ専用ハードウェアよりも、スピードと処理時間の点で勝っています。処理ハードウェアを含むツールが入手可能であることは、AIとMLが本格的に普及する上で重要な条件です。AIを試験的あるいは実験的に導入している企業は40パーセントと見積られていますが、大規模に、あるいはビジネスの中核機能を対象としてAIを導入しているのは、20パーセント程度に過ぎません。しかしながら、より価格の手頃なGPUを使用すれば、POC(概念実証)やテストケースを実施する予算的余地や、戦略を持った企業が増える可能性があります。

プリエンプティブVMは通常、gcloudコマンドラインインターフェースのインスタンス生成コマンドに“–preemptible”パラメータを追加するか、あるいはREST APIを使用している場合には、scheduling.preemptibleプロパティをtrueに設定して作成する。あるいは、Google Cloud Platform Consoleで“Preemptibility”を“On”にして、通常と同じようにGPUをアタッチする方法もある。


イメージ引用: https://cloudplatform.googleblog.com/2018/01/introducing-preemptible-gpus-50-off.html

さらにスケーラビリティが必要ならば、プリエンプティブインスタンスのマネージドインスタンスグループを作って、GPUパワーを動的にプールすることもできる。この場合、グループを作成する前に、インスタンステンプレートでpreemptibleオプションを指定する必要がある点に注意が必要だ。ここでのメリットは、プリエンプティブインスタンスが停止した時、利用可能な容量が十分にあれば、自動的に再生成が可能なことだ。プリエンプティブGPU機能は現在、US-central1リージョンでのみ使用することができる。プリエンプティブVMに関する完全なドキュメントには、Compute Engineのドキュメント経由でアクセスすることができる。

Google、Amazon、Microsoftはいずれも、プリエンプティブVMやスポットインスタンス、あるいはリザーブドVMインスタンスの名目で、低価格の計算リソースを提供している。違っているのはインスタンス利用の柔軟性だ。Amazon EC2のスポットインスタンスはプリエンプティブVMに相当するが、GPUをアタッチすることはできない。AWSとAzureのリザーブドインスタンスは低コストで利用可能だが、1年間ないし3年間という期間制限がある。ユーザは、プリエンプティブVMあるいはAWSスポットインスタンスを短期間か、AzureあるいはAWSのリザーブドインスタンスを長期間かを、ユースケースや必要な可用性に応じて選択することができる。どちらも、それぞれのクラウドプラットフォームのオンデマンドインスタンスより低コストで提供されている。

 



Related Post