ホーム > データベーススペシャリスト試験 > 2012年
データベーススペシャリスト試験 2012年 午前2 問20
業務系のデータベースから抽出したデータをデータウェアハウスに格納するために, 整合されたデータ属性やコード体系などに合うように変換及び修正を行う処理はどれか。
ア:クラスタリング
イ:スライシング
ウ:ダイシング
エ:データクレンジング(正解)
解説
業務系データベースからデータウェアハウスへの変換処理とは【午前2 解説】
要点まとめ
- 結論:データウェアハウスに格納する前のデータ変換や修正は「データクレンジング」で行います。
- 根拠:データクレンジングは、データの整合性を保つために属性やコード体系を統一し、誤りや不整合を修正する処理です。
- 差がつくポイント:クラスタリングやスライシング、ダイシングは分析や抽出手法であり、データの修正や整備を指しません。
正解の理由
「データクレンジング」は、業務系データベースから抽出したデータをデータウェアハウスに格納する際に、属性の整合性を保ち、コード体系を統一し、誤ったデータや不整合を修正する処理を指します。これにより、分析に適したクリーンなデータが準備されます。
一方、クラスタリングはデータのグループ化、スライシングやダイシングは多次元データの切り出し操作であり、データの修正や整備とは異なります。
一方、クラスタリングはデータのグループ化、スライシングやダイシングは多次元データの切り出し操作であり、データの修正や整備とは異なります。
よくある誤解
クラスタリングやスライシング、ダイシングはデータの分析や抽出に使う技術であり、データの修正や整備を行う処理ではありません。
解法ステップ
- 問題文の「整合されたデータ属性やコード体系に合うように変換及び修正を行う処理」に注目する。
- 選択肢の意味を確認し、データの修正や整備に該当するものを探す。
- 「データクレンジング」がデータの誤り修正や整合性確保を意味することを理解する。
- 他の選択肢は分析や抽出の手法であるため除外する。
- よって「エ: データクレンジング」が正解と判断する。
選択肢別の誤答解説
- ア: クラスタリング
データを似た特徴ごとにグループ化する分析手法であり、データの修正や整備ではありません。 - イ: スライシング
多次元データの特定の軸で切り出す操作で、データの変換や修正とは異なります。 - ウ: ダイシング
多次元データの特定の範囲を抽出する操作で、データの整備処理ではありません。 - エ: データクレンジング
データの誤りや不整合を修正し、属性やコード体系を統一する処理で正解です。
補足コラム
データクレンジングはETL(Extract, Transform, Load)プロセスの「Transform(変換)」に該当し、データウェアハウスの品質を保つために不可欠な工程です。正確な分析結果を得るためには、データの一貫性と正確性を確保することが重要です。
FAQ
Q: データクレンジングとデータマイニングの違いは何ですか?
A: データクレンジングはデータの誤り修正や整備を行う処理で、データマイニングはデータから有用なパターンや知識を抽出する分析手法です。
A: データクレンジングはデータの誤り修正や整備を行う処理で、データマイニングはデータから有用なパターンや知識を抽出する分析手法です。
Q: スライシングとダイシングはどのように使い分けますか?
A: スライシングは多次元データの特定の軸で切り出す操作、ダイシングは複数軸の範囲を指定して抽出する操作です。
A: スライシングは多次元データの特定の軸で切り出す操作、ダイシングは複数軸の範囲を指定して抽出する操作です。
関連キーワード: データクレンジング, ETL, データウェアハウス, データ整備, 多次元データ分析