データベーススペシャリスト試験 2012年 午前220


業務系のデータベースから抽出したデータをデータウェアハウスに格納するために, 整合されたデータ属性やコード体系などに合うように変換及び修正を行う処理はどれか。
クラスタリング
スライシング
ダイシング
データクレンジング(正解)

解説

業務系データベースからデータウェアハウスへの変換処理とは【午前2 解説】

要点まとめ

  • 結論:データウェアハウスに格納する前のデータ変換や修正は「データクレンジング」で行います。
  • 根拠:データクレンジングは、データの整合性を保つために属性やコード体系を統一し、誤りや不整合を修正する処理です。
  • 差がつくポイント:クラスタリングやスライシング、ダイシングは分析や抽出手法であり、データの修正や整備を指しません。

正解の理由

「データクレンジング」は、業務系データベースから抽出したデータをデータウェアハウスに格納する際に、属性の整合性を保ち、コード体系を統一し、誤ったデータや不整合を修正する処理を指します。これにより、分析に適したクリーンなデータが準備されます。
一方、クラスタリングはデータのグループ化、スライシングやダイシングは多次元データの切り出し操作であり、データの修正や整備とは異なります。

よくある誤解

クラスタリングやスライシング、ダイシングはデータの分析や抽出に使う技術であり、データの修正や整備を行う処理ではありません。

解法ステップ

  1. 問題文の「整合されたデータ属性やコード体系に合うように変換及び修正を行う処理」に注目する。
  2. 選択肢の意味を確認し、データの修正や整備に該当するものを探す。
  3. 「データクレンジング」がデータの誤り修正や整合性確保を意味することを理解する。
  4. 他の選択肢は分析や抽出の手法であるため除外する。
  5. よって「エ: データクレンジング」が正解と判断する。

選択肢別の誤答解説

  • ア: クラスタリング
    データを似た特徴ごとにグループ化する分析手法であり、データの修正や整備ではありません。
  • イ: スライシング
    多次元データの特定の軸で切り出す操作で、データの変換や修正とは異なります。
  • ウ: ダイシング
    多次元データの特定の範囲を抽出する操作で、データの整備処理ではありません。
  • エ: データクレンジング
    データの誤りや不整合を修正し、属性やコード体系を統一する処理で正解です。

補足コラム

データクレンジングはETL(Extract, Transform, Load)プロセスの「Transform(変換)」に該当し、データウェアハウスの品質を保つために不可欠な工程です。正確な分析結果を得るためには、データの一貫性と正確性を確保することが重要です。

FAQ

Q: データクレンジングとデータマイニングの違いは何ですか?
A: データクレンジングはデータの誤り修正や整備を行う処理で、データマイニングはデータから有用なパターンや知識を抽出する分析手法です。
Q: スライシングとダイシングはどのように使い分けますか?
A: スライシングは多次元データの特定の軸で切り出す操作、ダイシングは複数軸の範囲を指定して抽出する操作です。

関連キーワード: データクレンジング, ETL, データウェアハウス, データ整備, 多次元データ分析
← 前の問題へ次の問題へ →

©︎2025 情報処理技術者試験対策アプリ