ホーム > 情報処理安全確保支援士試験 > 2015年 秋期
情報処理安全確保支援士試験 2015年 秋期 午前2 問21
データウェアハウスを構築するために,業務システムごとに異なっているデータ属性やコード体系を統一する処理はどれか。
ア:ダイス
イ:データクレンジング(正解)
ウ:ドリルダウン
エ:ロールアップ
解説
データウェアハウス構築におけるデータ属性・コード体系の統一処理【午前2 解説】
要点まとめ
- 結論:業務システムごとに異なるデータ属性やコード体系を統一する処理は「データクレンジング」です。
- 根拠:データクレンジングはデータの誤りや不整合を修正し、統一された形式に整える作業を指します。
- 差がつくポイント:似た用語の意味を正確に理解し、データの品質向上に関わる処理を見極めることが重要です。
正解の理由
「データクレンジング」は、複数の業務システムから収集したデータの属性やコード体系の違いを調整し、整合性を持たせる処理です。これにより、データウェアハウス内で一貫した分析が可能になります。
他の選択肢はデータの集計や分析操作を指し、属性やコードの統一とは異なります。
他の選択肢はデータの集計や分析操作を指し、属性やコードの統一とは異なります。
よくある誤解
「ダイス」や「ロールアップ」はデータの集計や分析の操作であり、データの属性やコードの統一作業ではありません。
「ドリルダウン」は詳細分析の手法で、データの整備とは目的が異なります。
「ドリルダウン」は詳細分析の手法で、データの整備とは目的が異なります。
解法ステップ
- 問題文から「業務システムごとに異なるデータ属性やコード体系を統一する処理」を探す。
- 各選択肢の意味を確認し、データの整備や品質向上に関わる用語を特定。
- 「データクレンジング」がデータの誤り修正や統一を行う処理であることを理解。
- 他の選択肢が分析操作であることを踏まえ、正解を選択。
選択肢別の誤答解説
- ア: ダイス
データの多次元分析で特定の条件に絞り込む操作であり、属性やコードの統一とは無関係です。 - イ: データクレンジング
正解。データの誤り修正や属性・コード体系の統一を行う処理です。 - ウ: ドリルダウン
データの詳細分析を行う操作で、データの整備や統一処理ではありません。 - エ: ロールアップ
データの集計や要約を行う操作で、属性やコードの統一とは異なります。
補足コラム
データクレンジングはデータウェアハウス構築における重要な前処理で、データの重複排除や欠損値の補完、フォーマットの統一なども含まれます。これにより分析結果の信頼性が向上します。
また、ETL(Extract, Transform, Load)プロセスの中で「Transform」に該当し、データの品質管理に欠かせない工程です。
また、ETL(Extract, Transform, Load)プロセスの中で「Transform」に該当し、データの品質管理に欠かせない工程です。
FAQ
Q: データクレンジングとデータマイニングの違いは何ですか?
A: データクレンジングはデータの誤り修正や統一を行う前処理で、データマイニングはその後の分析手法です。
A: データクレンジングはデータの誤り修正や統一を行う前処理で、データマイニングはその後の分析手法です。
Q: ダイスとロールアップはどのように使い分けますか?
A: ダイスは多次元データの特定条件での絞り込み、ロールアップはデータの集約や要約に使います。
A: ダイスは多次元データの特定条件での絞り込み、ロールアップはデータの集約や要約に使います。
関連キーワード: データクレンジング, データウェアハウス, ETL, データ統合, データ品質管理