ホーム > データベーススペシャリスト試験 > 2015年
データベーススペシャリスト試験 2015年 午前2 問19
業務系のデータベースから抽出したデータをデータウェアハウスに格納するために, 整合されたデータ属性やコード体系などに合うように変換及び修正を行う処理はどれか。
ア:クラスタリング
イ:スライシング
ウ:ダイシング
エ:データクレンジング(正解)
解説
業務系データベースからデータウェアハウスへの変換処理とは【午前2 解説】
要点まとめ
- 結論:業務系データベースのデータをデータウェアハウスに適合させるための変換・修正処理は「データクレンジング」である。
- 根拠:データクレンジングは、データの整合性を保ち、属性やコード体系の統一を図るために欠かせない工程である。
- 差がつくポイント:クラスタリングやスライシング、ダイシングは分析や抽出手法であり、データの修正・変換を指さない点を理解することが重要。
正解の理由
「データクレンジング」は、データの誤りや不整合を検出し、修正・変換して整合性を確保する処理です。業務系データベースから抽出したデータは、属性名の違いやコード体系の不一致などが存在しやすいため、データウェアハウスに格納する前にこれらを統一・修正する必要があります。これにより、後続の分析やレポーティングの精度が向上します。
よくある誤解
クラスタリングやスライシング、ダイシングはデータの分析や抽出方法であり、データの修正や整合性の確保を行う処理ではありません。
解法ステップ
- 問題文の「変換及び修正を行う処理」に注目する。
- 選択肢の意味を整理し、修正・変換に該当する用語を探す。
- 「データクレンジング」がデータの整合性を保つ処理であることを確認。
- 他の選択肢は分析手法であるため除外。
- 正解は「エ」と判断する。
選択肢別の誤答解説
- ア: クラスタリング
データを似た特徴ごとにグループ化する分析手法であり、データの修正や変換を意味しない。 - イ: スライシング
多次元データの特定の次元を切り出す操作で、データの整合性を保つ処理ではない。 - ウ: ダイシング
スライシングと似ており、多次元データの一部を抽出する分析手法である。 - エ: データクレンジング
データの誤りや不整合を検出し、修正・変換して整合性を確保する処理で正解。
補足コラム
データクレンジングはETL(Extract, Transform, Load)プロセスの「Transform」に該当し、データウェアハウス構築において非常に重要な工程です。正確なデータ分析や意思決定の基盤となるため、データの品質管理は欠かせません。
FAQ
Q: データクレンジングとデータマイニングの違いは何ですか?
A: データクレンジングはデータの修正・整合性確保を行う処理で、データマイニングはデータから有用なパターンや知見を抽出する分析手法です。
A: データクレンジングはデータの修正・整合性確保を行う処理で、データマイニングはデータから有用なパターンや知見を抽出する分析手法です。
Q: クラスタリングはどのような場面で使われますか?
A: クラスタリングは顧客の分類や異常検知など、データをグループ化して特徴を把握する分析に用いられます。
A: クラスタリングは顧客の分類や異常検知など、データをグループ化して特徴を把握する分析に用いられます。
関連キーワード: データクレンジング, ETL, データウェアハウス, データ整合性, データ変換