データベーススペシャリスト試験 2015年 午前219


業務系のデータベースから抽出したデータをデータウェアハウスに格納するために, 整合されたデータ属性やコード体系などに合うように変換及び修正を行う処理はどれか。
クラスタリング
スライシング
ダイシング
データクレンジング(正解)

解説

業務系データベースからデータウェアハウスへの変換処理とは【午前2 解説】

要点まとめ

  • 結論:業務系データベースのデータをデータウェアハウスに適合させるための変換・修正処理は「データクレンジング」である。
  • 根拠:データクレンジングは、データの整合性を保ち、属性やコード体系の統一を図るために欠かせない工程である。
  • 差がつくポイント:クラスタリングやスライシング、ダイシングは分析や抽出手法であり、データの修正・変換を指さない点を理解することが重要。

正解の理由

「データクレンジング」は、データの誤りや不整合を検出し、修正・変換して整合性を確保する処理です。業務系データベースから抽出したデータは、属性名の違いやコード体系の不一致などが存在しやすいため、データウェアハウスに格納する前にこれらを統一・修正する必要があります。これにより、後続の分析やレポーティングの精度が向上します。

よくある誤解

クラスタリングやスライシング、ダイシングはデータの分析や抽出方法であり、データの修正や整合性の確保を行う処理ではありません。

解法ステップ

  1. 問題文の「変換及び修正を行う処理」に注目する。
  2. 選択肢の意味を整理し、修正・変換に該当する用語を探す。
  3. 「データクレンジング」がデータの整合性を保つ処理であることを確認。
  4. 他の選択肢は分析手法であるため除外。
  5. 正解は「エ」と判断する。

選択肢別の誤答解説

  • ア: クラスタリング
    データを似た特徴ごとにグループ化する分析手法であり、データの修正や変換を意味しない。
  • イ: スライシング
    多次元データの特定の次元を切り出す操作で、データの整合性を保つ処理ではない。
  • ウ: ダイシング
    スライシングと似ており、多次元データの一部を抽出する分析手法である。
  • エ: データクレンジング
    データの誤りや不整合を検出し、修正・変換して整合性を確保する処理で正解。

補足コラム

データクレンジングはETL(Extract, Transform, Load)プロセスの「Transform」に該当し、データウェアハウス構築において非常に重要な工程です。正確なデータ分析や意思決定の基盤となるため、データの品質管理は欠かせません。

FAQ

Q: データクレンジングとデータマイニングの違いは何ですか?
A: データクレンジングはデータの修正・整合性確保を行う処理で、データマイニングはデータから有用なパターンや知見を抽出する分析手法です。
Q: クラスタリングはどのような場面で使われますか?
A: クラスタリングは顧客の分類や異常検知など、データをグループ化して特徴を把握する分析に用いられます。

関連キーワード: データクレンジング, ETL, データウェアハウス, データ整合性, データ変換
← 前の問題へ次の問題へ →

©︎2025 情報処理技術者試験対策アプリ