応用情報技術者 2017年 秋期 午前2 問30
問題文
データマイニングの説明として、最も適切なものはどれか。
選択肢
ア:基幹業務のデータベースとは別に作成され、 更新処理をしない集計データの分析を主目的とする。
イ:個人別データ、 部門別データ、 サマリデータなど、 分析の目的別に切り出され、カスタマイズされたデータを分析する。
ウ:スライシング、 ダイシング、 ドリルダウンなどのインタラクティブな操作によって多次元分析を行い、 意思決定を支援する。
エ:ニューラルネットワークや統計解析などの手法を使って、 大量に蓄積されているデータから、特徴あるパターンを探し出す。(正解)
データマイニングの説明 +【午前2 解説】
要点まとめ
- 結論:データマイニングは大量データから特徴的なパターンを抽出する技術である。
- 根拠:ニューラルネットワークや統計解析などの手法を用いて、隠れた知見を発見する点が特徴。
- 差がつくポイント:データマイニングと多次元分析やデータウェアハウスの違いを理解し、目的や手法の違いを押さえること。
正解の理由
選択肢エは、データマイニングの本質である「大量データから特徴的なパターンを探し出す」点を正確に表現しています。ニューラルネットワークや統計解析などの高度な分析手法を用いることもデータマイニングの特徴です。これに対し、他の選択肢はデータの管理や多次元分析の説明であり、データマイニングの定義とは異なります。
よくある誤解
データマイニングを単なる集計や多次元分析と混同しがちですが、データマイニングはパターン発見や予測モデル構築に重点を置きます。
解法ステップ
- 問題文の「データマイニング」の定義を正確に把握する。
- 各選択肢の説明がデータマイニングの特徴に合致しているかを検証する。
- 「大量データからパターンを探す」というキーワードに注目する。
- 多次元分析やデータウェアハウスの説明と混同しないように注意する。
- 最も適切な選択肢を選ぶ。
選択肢別の誤答解説
- ア:基幹業務データベースとは別の集計データの分析はデータウェアハウスの説明に近く、データマイニングの定義ではない。
- イ:分析目的別にデータを切り出すのはデータマートの説明であり、データマイニングの手法ではない。
- ウ:スライシングやダイシングは多次元分析(OLAP)の操作であり、データマイニングの特徴的な手法ではない。
- エ:ニューラルネットワークや統計解析を用いて大量データからパターンを抽出する点がデータマイニングの本質である。
補足コラム
データマイニングはビッグデータ解析の基盤技術として注目されており、マーケティングや不正検知、顧客分析など幅広い分野で活用されています。多次元分析(OLAP)やデータウェアハウスはデータの整理や集計に重点を置くのに対し、データマイニングは未知のパターン発見に焦点を当てています。
FAQ
Q: データマイニングと多次元分析の違いは何ですか?
A: 多次元分析は既存データの集計や切り口の変更による分析で、データマイニングは未知のパターンや関係性を発見する技術です。
A: 多次元分析は既存データの集計や切り口の変更による分析で、データマイニングは未知のパターンや関係性を発見する技術です。
Q: ニューラルネットワークはなぜデータマイニングで使われるのですか?
A: 複雑なパターンや非線形関係をモデル化できるため、大量データから有用な知見を抽出するのに適しています。
A: 複雑なパターンや非線形関係をモデル化できるため、大量データから有用な知見を抽出するのに適しています。
関連キーワード: データマイニング、ニューラルネットワーク、統計解析、多次元分析、データウェアハウス、OLAP, パターン発見

\ せっかくなら /
応用情報技術者を
クイズ形式で学習しませんか?
クイズ画面へ遷移する→
すぐに利用可能!

