ホーム > 情報処理安全確保支援士試験 > 2010年 春期
情報処理安全確保支援士試験 2010年 春期 午前2 問21
データマイニングツールに関する記述として,最も適切なものはどれか。
ア:企業内で発生する情報を主題ごとに時系列で蓄積することによって,既存の情報システムだけでは得られない情報を提供する。
イ:集計データを迅速かつ容易に表示するなど,利用者に対して様々な情報分析機能を提供する。
ウ:大量に蓄積されたデータに対して統計処理などを行い,法則性の発見を支援する。(正解)
エ:利用者が情報を利用するための目的別データベースであり,あらかじめ集計処理などを施しておくことによって検索時間を短縮する。
解説
データマイニングツールに関する問題ですが、まず各選択肢の意味を整理し、データマイニングの本質と照らし合わせて考えましょう。
各選択肢の説明
-
ア: 「企業内で発生する情報を主題ごとに時系列で蓄積する」
これはデータの蓄積方法の説明であり、たとえばデータウェアハウス(DWH)に近い内容です。データマイニングツールの説明としては中身が違います。 -
イ: 「集計データを迅速かつ容易に表示するなど、利用者に対して情報分析機能を提供する」
これはBIツールのダッシュボードや、OLAP(オンライン分析処理)の特徴に近く、可視化やデータ集計支援の話です。データの掘り下げやパターン分析をするデータマイニングとは少し異なります。 -
ウ: 「大量に蓄積されたデータに統計処理などを行い、法則性の発見を支援する」
これはデータマイニングの本質を的確に表現しています。データから新たな知見やパターンを抽出することが目的です。統計的手法や機械学習アルゴリズムを用いて処理を行います。 -
エ: 「利用者が情報を利用するための目的別データベースであり、あらかじめ集計処理などを施して検索時間を短縮する」
これはデータマートやOLAPを指す説明で、データの事前集計と検索効率化に関する内容です。データマイニングと直接対応しません。
データマイニングとは
データマイニング(Data Mining)は、大量のデータから有用なパターンやルールを見つけ出す技術・プロセスのことです。
- データ分析の段階としては「単なる集計」よりも高度で
- 統計学的手法や機械学習アルゴリズム(決定木、クラスタリング、アソシエーションルールなど)を使い
- 新たな知識や隠れた関連性(法則性)を抽出することが目的です。
このため「大量のデータに対して統計処理を行い、法則性を発見する支援」をするという選択肢ウが正解となります。
まとめ
- 正解ウの特徴: 大量データ → 統計処理・分析 → 法則性の発見を支援
- これがまさに「データマイニング」の定義に合致します。
他の選択肢は関連技術やシステムの特徴を述べていますが、「データマイニングツール」として最も適切なのはウです。
付記:関連用語の整理
このように用語やツールの役割を正しく理解することが、情報処理技術者試験において正しい選択肢を選ぶ力につながります。