type
status
date
slug
summary
tags
category
icon
password
理論
AWSによる画像データのアーカイブとコスト効率の最適化
- AWS DataSync
- オンプレミスからAWSへのデータ転送を効率的に管理できるサービス。
- 大量のデータを高スループットで移行でき、転送のスケジュールや帯域幅制限の設定も可能。
- S3 Glacier Deep Archive
- 最もコスト効率の良い長期アーカイブ用ストレージ。
- 頻繁にアクセスされないデータ(例えば、バックアップやアーカイブ用データ)の保存に適しており、アクセスが必要な場合でも低コストで保存できます。
- Storage Gateway
- オンプレミスのストレージとAWSクラウドのストレージを接続し、クラウドバックアップやアーカイブを行うためのサービス。
- Tape Gatewayはテープバックアップシステムを仮想化するため、主にバックアップ用途に適していますが、今回のシンプルなデータアーカイブには過剰な選択肢。
結論
- 大量の画像データを効率的かつコスト効果高くアーカイブするには、AWS DataSyncを使い、S3 Glacier Deep Archiveにデータを直接転送する方法が最も適しています。
- ストレージと転送コストを最適化するためには、S3 Glacier Deep Archiveが最適な選択肢です。
実践
略
一問道場
質問 #457
ある企業が、オンプレミスで画像データを解析し保存するアプリケーションを運用しています。このアプリケーションは毎日数百万件の新しい画像ファイルを受信します。
ファイルのサイズは平均1MBです。ファイルは1GBのバッチで解析され、バッチの解析が完了すると、画像は1つのファイルに圧縮され、長期保存のためにオンプレミスのNFSサーバーにアーカイブされます。
企業はオンプレミスにMicrosoft Hyper-V環境を持ち、コンピューティングリソースは利用可能です。ただし、ストレージ容量が不足しており、画像をAWSにアーカイブしたいと考えています。企業は、リクエストから1週間以内にアーカイブされたデータを取得できる必要があります。
企業は、オンプレミスのデータセンターとAWS間に10GbpsのAWS Direct Connect接続を持っています。企業は帯域幅制限を設定し、非営業時間中にアーカイブ画像をAWSにコピーするスケジュールを設定する必要があります。
どのソリューションが最もコスト効率よくこれらの要件を満たすでしょうか?
A. 新しいGPUベースのAmazon EC2インスタンスにAWS DataSyncエージェントをデプロイし、DataSyncエージェントを構成してNFSオンプレミスサーバーからAmazon S3 Glacier Instant Retrievalにファイルのバッチをコピーします。コピーが完了したら、オンプレミスのストレージからデータを削除します。
B. オンプレミスのHyper-V VMにAWS DataSyncエージェントをデプロイし、DataSyncエージェントを構成してNFSオンプレミスサーバーからAmazon S3 Glacier Deep Archiveにファイルのバッチをコピーします。コピーが完了したら、オンプレミスのストレージからデータを削除します。
C. 新しい一般的なAmazon EC2インスタンスにAWS DataSyncエージェントをデプロイし、DataSyncエージェントを構成してNFSオンプレミスサーバーからAmazon S3 Standardにファイルのバッチをコピーします。コピーが完了したら、オンプレミスのストレージからデータを削除します。その後、S3ライフサイクルルールを作成し、オブジェクトを1日後にS3 Glacier Deep Archiveに移行します。
D. AWS Storage Gateway Tape GatewayをオンプレミスのHyper-V環境にデプロイし、Tape GatewayをAWSに接続します。自動テープ作成を使用し、Amazon S3 Glacier Deep Archiveプールを指定します。バッチ画像がコピーされた後にテープを排出します。
解説
この問題では、企業がAWSに画像データをアーカイブし、非業務時間に帯域幅制限を設定してコピーを行う最もコスト効率の良い方法を求めています。各選択肢について詳しく見ていきましょう。
A. GPUベースのEC2インスタンスを使用
- GPUベースのEC2インスタンスは、画像解析などの高負荷処理には向いていますが、今回はデータのコピーという比較的シンプルな操作です。GPUは不要であり、この選択肢はオーバースペックです。
- Amazon S3 Glacier Instant Retrievalは、低レイテンシでデータにアクセスできるストレージですが、コストが高いため、長期保存には適していません。今回の要件には過剰なストレージクラスです。
B. Hyper-V VMにDataSyncエージェントをデプロイ
- AWS DataSyncエージェントを使用して、データをS3 Glacier Deep Archiveにコピーするのは適切です。S3 Glacier Deep Archiveは最もコスト効率が良いアーカイブ用ストレージです。アーカイブデータの長期保存に適しており、頻繁にアクセスしないデータに最適です。
- この方法は、データの移行におけるコストを最小化し、帯域幅制限を設定するのにも柔軟です。
C. EC2インスタンスでDataSyncエージェントを使用
- S3 Standardを使うと、データの長期保存にはコストが高くなるため、これは長期アーカイブには適していません。
- S3 Glacier Deep Archiveに移行するためのライフサイクルルールを作成することは可能ですが、最初にS3 Standardに保存するのは非効率的でコストがかさむ可能性があります。
D. AWS Storage Gateway Tape Gatewayを使用
- Tape Gatewayはテープバックアップの仮想化サービスで、主にバックアップやアーカイブの用途に使用されますが、現在の要件には過剰であり、シンプルなデータコピーのシナリオでは不必要です。テープ作成や管理が追加され、管理が複雑になります。
結論
最もコスト効率が良い選択肢は、B. AWS DataSyncエージェントをHyper-V VMにデプロイして、S3 Glacier Deep Archiveにコピーする方法です。この選択肢は、低コストのアーカイブストレージであるS3 Glacier Deep Archiveを使用し、オンプレミスのストレージを削除することでコスト削減が可能です。
- 作者:みなみ
- 链接:https://tangly1024.com/資格勉強/17bd7ae8-88e2-80dc-80a4-ef811abd43ae
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。
相关文章