応用情報技術者 2019年春期午前2 問29

問題文

ビッグデータのデータ貯蔵場所であるデータレイクの特徴として、適切なものはどれか。

ア：あらゆるデータをそのままの形式や構造で格納しておく。（正解）

イ：データ量を抑えるために、データの記述情報であるメタデータは格納しない。

ウ：データを格納する前にデータ利用方法を設計し、それに沿ってスキーマをあらかじめ定義しておく。

エ：テキストファイルやバイナリデータなど、格納するデータの形式に応じてリポジトリを使い分ける。

ア: あらゆるデータをそのままの形式や構造で格納しておく。
データレイクは構造化データ・非構造化データを問わず、元の形式のまま大量に保存できる特徴があります。これにより、後から必要に応じて柔軟に分析や処理が可能です。

データレイクはスキーマを事前に設計する必要があると誤解されがちですが、実際はスキーマオンリード方式で後からスキーマを適用します。

データレイクは大量の多様なデータを蓄積し、ビッグデータ解析や機械学習の基盤として活用されます。スキーマオンリードの柔軟性が特徴で、データウェアハウスとは異なり、事前のデータ整形が不要です。

Q: データレイクとデータウェアハウスの違いは何ですか？
A: データレイクは生データをそのまま保存し、スキーマは後から適用します。一方、データウェアハウスは事前にスキーマを設計し、整形済みデータを保存します。

Q: メタデータはデータレイクに必要ですか？
A: はい。メタデータはデータの検索や管理に重要で、データレイクでも適切に管理されます。

関連キーワード: データレイク、スキーマオンリード、ビッグデータ、メタデータ、データウェアハウス

\ せっかくなら /

応用情報技術者を
クイズ形式で学習しませんか？

すぐに利用可能！