応用情報技術者 2021年 春期 午前2 問31
問題文
データレイクの特徴はどれか。
選択肢
ア:大量のデータを分析し、単なる検索だけでは分からない隠れた規則や相関関係を見つけ出す。
イ:データウェアハウスに格納されたデータから特定の用途に必要なデータだけを取り出し、構築する。
ウ:データウェアハウスやデータマートからデータを取り出し、多次元分析を行う。
エ:必要に応じて加工するために、データを発生したままの形で格納する。(正解)
データレイクの特徴はどれか。【午前2 解説】
要点まとめ
- 結論:データレイクはデータを発生したままの形で格納し、必要に応じて加工する方式です。
- 根拠:構造化・非構造化問わず大量の生データをそのまま保存し、後から柔軟に分析可能にする点が特徴です。
- 差がつくポイント:データウェアハウスとの違いを理解し、加工済みデータと生データの格納方法を区別できることが重要です。
正解の理由
選択肢エは「必要に応じて加工するために、データを発生したままの形で格納する」とあり、これはデータレイクの本質を正確に表しています。データレイクはあらゆる形式のデータをそのまま保存し、分析や加工は後から行うため、柔軟性が高いのが特徴です。
よくある誤解
データレイクは単に大量のデータを分析する場所ではなく、加工前の生データを保存する場所である点を混同しやすいです。加工済みデータを保存するのはデータウェアハウスです。
解法ステップ
- データレイクの定義を確認する(生データをそのまま保存する場所)。
- 選択肢の内容を「生データの保存」か「加工済みデータの保存」かで分類する。
- データウェアハウスや多次元分析の説明はデータレイクの特徴と異なることを理解する。
- 「必要に応じて加工するために生データを格納する」選択肢を正解と判断する。
選択肢別の誤答解説
- ア:大量データの分析や隠れた規則の発見はデータマイニングの説明であり、データレイクの特徴ではありません。
- イ:特定用途に必要なデータだけを取り出すのはデータウェアハウスの役割で、生データをそのまま保存するデータレイクとは異なります。
- ウ:多次元分析はデータウェアハウスやデータマートの機能であり、データレイクの特徴ではありません。
- エ:生データをそのまま格納し、必要に応じて加工する点がデータレイクの本質です。
補足コラム
データレイクは構造化データだけでなく、ログファイルや画像、音声など非構造化データも格納可能です。これにより、ビッグデータ分析や機械学習の基盤として活用されます。一方、データウェアハウスは整形・加工済みのデータを高速に分析するためのシステムです。
FAQ
Q: データレイクとデータウェアハウスの違いは何ですか?
A: データレイクは生データをそのまま保存し、後から加工・分析するのに対し、データウェアハウスは加工済みのデータを保存し即時分析に適しています。
A: データレイクは生データをそのまま保存し、後から加工・分析するのに対し、データウェアハウスは加工済みのデータを保存し即時分析に適しています。
Q: データレイクはどのようなデータを扱いますか?
A: 構造化データ、非構造化データ、半構造化データなどあらゆる形式のデータをそのまま格納します。
A: 構造化データ、非構造化データ、半構造化データなどあらゆる形式のデータをそのまま格納します。
関連キーワード: データレイク、データウェアハウス、生データ保存、ビッグデータ、非構造化データ、データ分析

\ せっかくなら /
応用情報技術者を
クイズ形式で学習しませんか?
クイズ画面へ遷移する→
すぐに利用可能!

