情報処理安全確保支援士試験 2015年 秋期 午前221


データウェアハウスを構築するために,業務システムごとに異なっているデータ属性やコード体系を統一する処理はどれか。
ダイス
データクレンジング(正解)
ドリルダウン
ロールアップ

解説

データウェアハウス構築におけるデータ属性・コード体系の統一処理【午前2 解説】

要点まとめ

  • 結論:業務システムごとに異なるデータ属性やコード体系を統一する処理は「データクレンジング」です。
  • 根拠:データクレンジングはデータの誤りや不整合を修正し、統一された形式に整える作業を指します。
  • 差がつくポイント:似た用語の意味を正確に理解し、データの品質向上に関わる処理を見極めることが重要です。

正解の理由

「データクレンジング」は、複数の業務システムから収集したデータの属性やコード体系の違いを調整し、整合性を持たせる処理です。これにより、データウェアハウス内で一貫した分析が可能になります。
他の選択肢はデータの集計や分析操作を指し、属性やコードの統一とは異なります。

よくある誤解

「ダイス」や「ロールアップ」はデータの集計や分析の操作であり、データの属性やコードの統一作業ではありません。
「ドリルダウン」は詳細分析の手法で、データの整備とは目的が異なります。

解法ステップ

  1. 問題文から「業務システムごとに異なるデータ属性やコード体系を統一する処理」を探す。
  2. 各選択肢の意味を確認し、データの整備や品質向上に関わる用語を特定。
  3. 「データクレンジング」がデータの誤り修正や統一を行う処理であることを理解。
  4. 他の選択肢が分析操作であることを踏まえ、正解を選択。

選択肢別の誤答解説

  • ア: ダイス
    データの多次元分析で特定の条件に絞り込む操作であり、属性やコードの統一とは無関係です。
  • イ: データクレンジング
    正解。データの誤り修正や属性・コード体系の統一を行う処理です。
  • ウ: ドリルダウン
    データの詳細分析を行う操作で、データの整備や統一処理ではありません。
  • エ: ロールアップ
    データの集計や要約を行う操作で、属性やコードの統一とは異なります。

補足コラム

データクレンジングはデータウェアハウス構築における重要な前処理で、データの重複排除や欠損値の補完、フォーマットの統一なども含まれます。これにより分析結果の信頼性が向上します。
また、ETL(Extract, Transform, Load)プロセスの中で「Transform」に該当し、データの品質管理に欠かせない工程です。

FAQ

Q: データクレンジングとデータマイニングの違いは何ですか?
A: データクレンジングはデータの誤り修正や統一を行う前処理で、データマイニングはその後の分析手法です。
Q: ダイスとロールアップはどのように使い分けますか?
A: ダイスは多次元データの特定条件での絞り込み、ロールアップはデータの集約や要約に使います。

関連キーワード: データクレンジング, データウェアハウス, ETL, データ統合, データ品質管理
← 前の問題へ次の問題へ →

©︎2025 情報処理技術者試験対策アプリ