基本情報技術者 2015年 秋期 午前(科目A) 問64
問題文
企業が保有する顧客や市場などの膨大なデータから、有用な情報や関係を見つけ出す手法はどれか。
選択肢
ア:データウェアハウス
イ:データディクショナリ
ウ:データフローダイアグラム
エ:データマイニング(正解)
顧客や市場などの膨大なデータから、有用な情報や関係を見つけ出す手法はどれか。【午前2 解説】
要点まとめ
- 結論:膨大なデータからパターンや関係を抽出する手法はエデータマイニングであり、探索的解析と機械学習を用いる技術です。
- 根拠:データウェアハウスは格納・統合、データディクショナリは定義管理、データフローダイアグラムは業務流れの可視化であり、抽出そのものはデータマイニングが担います。
- 差がつくポイント:選択肢を消去する際は「情報や関係を見つけ出す=分析・発見」がキーワードである点を重視して正解に導きます。
正解の理由
正解は エ データマイニング です。問題文で求められる「膨大なデータから有用な情報や関係を見つけ出す」行為は、データのパターン抽出、相関関係発見、分類やクラスタリングなど探索的・予測的分析を行うデータマイニングの定義に一致します。データマイニングは統計解析や機械学習、データマイニング特有の手法(アソシエーション分析、決定木、クラスタリング等)を用いて大規模データから知見を抽出します。
よくある誤解
- データウェアハウス=データマイニングと混同する:データウェアハウスは分析用にデータを集約・格納する層で、分析手法そのものではありません。
- 図や設計図(DFD)でデータの関係が「見える」と思い込む:DFDは業務フローやデータの流れを表すもので、データ中の潜在的なパターン発見とは目的が異なります。
- データディクショナリで「分析が完了する」と考える:ディクショナリは項目定義やメタデータ管理が目的で、分析アルゴリズムではありません。
解法ステップ
- 問題文のキーワードを抽出:「膨大なデータ」「有用な情報や関係を見つけ出す」→「発見・抽出」が目的。
- 各選択肢の役割を想起:格納(データウェアハウス)、定義管理(データディクショナリ)、図式化(DFD)、分析・発見(データマイニング)。
- 「発見・抽出」に該当する選択肢を選ぶ。消去法で速やかに エ を確定する。
選択肢別の誤答解説
- ア: データウェアハウス
説明:複数システムのデータを統合・保持し、分析に適した形で格納するための仕組み。データを蓄える役割であり、直接「有用な情報を見つける」手法ではありません。 - イ: データディクショナリ
説明:データの定義や属性、制約などのメタデータを管理するツール/リポジトリ。データの意味や構造管理に有用ですが、探索的分析を行うものではありません。 - ウ: データフローダイアグラム
説明:業務やシステムにおけるデータの流れや処理を図示する手法で、解析手法ではなく設計・可視化のための図解です。 - エ: データマイニング
説明:大量データからパターン発見や関係抽出を行う手法群(クラスタリング、分類、アソシエーション分析など)。問題文の要件に合致するため正解です。
補足コラム
データマイニングは単にアルゴリズムを適用するだけでなく、前処理(欠損値処理、正規化、特徴量選択)や結果の解釈、モデル評価(精度、再現率、適合率)、そしてビジネスへの落とし込みが重要です。実務ではデータウェアハウスでデータを用意し、メタデータ管理はデータディクショナリで行い、分析手法としてデータマイニングを適用する流れが一般的です。
FAQ
Q1: データマイニングと機械学習は同じですか?
A1: 完全に同義ではありませんが重なります。機械学習はモデル構築の理論・手法群で、データマイニングは探索的発見や知識抽出という実践的目的に機械学習や統計手法を適用する分野です。
A1: 完全に同義ではありませんが重なります。機械学習はモデル構築の理論・手法群で、データマイニングは探索的発見や知識抽出という実践的目的に機械学習や統計手法を適用する分野です。
Q2: データウェアハウスがあればデータマイニングは不要ですか?
A2: 不要ではありません。ウェアハウスは分析のためのデータ基盤であり、実際に知見を得るにはデータマイニング等の分析手法が必要です。
A2: 不要ではありません。ウェアハウスは分析のためのデータ基盤であり、実際に知見を得るにはデータマイニング等の分析手法が必要です。
Q3: 小規模データでもデータマイニングは使えますか?
A3: 使えますが、手法選択はデータ量や目的に依存します。小規模なら統計的手法や単純モデルで十分なこともあります。
A3: 使えますが、手法選択はデータ量や目的に依存します。小規模なら統計的手法や単純モデルで十分なこともあります。
関連キーワード: データマイニング、クラスタリング、アソシエーション分析、データウェアハウス、メタデータ、データ前処理、分類モデル

\ せっかくなら /
基本情報技術者を
クイズ形式で学習しませんか?
クイズ画面へ遷移する→
すぐに利用可能!

