応用情報技術者 2023年 秋期 午前2 問02
問題文
複数の変数をもつデータに対する分析手法の記述のうち、主成分分析はどれか。
選択肢
ア:変数に共通して影響を与える新たな変数を計算して、 データの背後にある構造を取得する方法
イ:変数の値からほかの変数の値を予測して、 データがもつ変数間の関連性を確認する方法
ウ:変数の値が互いに類似するものを集めることによって、 データを分類する方法
エ:変数を統合した新たな変数を使用して、 データがもつ変数の数を減らす方法(正解)
主成分分析とは何か【午前2 解説】
要点まとめ
- 結論:主成分分析は複数の変数を統合し、新たな変数(主成分)を作って次元削減を行う手法です。
- 根拠:元の変数の情報をできるだけ保持しつつ、変数の数を減らすことで解析や可視化を容易にします。
- 差がつくポイント:主成分分析は「変数の数を減らす」ことに特化し、因子分析や回帰分析とは目的や手法が異なる点を理解することが重要です。
正解の理由
選択肢エは「変数を統合した新たな変数を使用して、データがもつ変数の数を減らす方法」とあり、主成分分析の本質を正確に表しています。主成分分析は複数の相関のある変数を線形結合し、情報の損失を最小限に抑えながら次元を削減する技術です。これにより、解析の効率化やノイズの除去が可能になります。
よくある誤解
主成分分析は「変数間の関連性を予測する」や「データを分類する」手法ではありません。これらは回帰分析やクラスタリングの役割であり、主成分分析とは目的が異なります。
解法ステップ
- 問題文の「複数の変数をもつデータに対する分析手法」に注目する。
- 主成分分析の目的は「変数の数を減らすこと」であることを思い出す。
- 選択肢の説明文から「変数の数を減らす」「新たな変数を作る」表現を探す。
- 選択肢エが「変数を統合し新たな変数を使う」と明示しているため正解と判断する。
選択肢別の誤答解説
- ア:因子分析に近い説明で、主成分分析とは異なり「背後にある構造の取得」が主目的。
- イ:回帰分析や予測モデルの説明で、主成分分析の目的とは異なる。
- ウ:クラスタリングの説明で、データの分類を目的とする手法。
- エ:主成分分析の定義に合致し、正解。
補足コラム
主成分分析は多変量解析の基本手法であり、データの可視化やノイズ除去、特徴抽出に広く利用されます。計算には固有値分解や特異値分解が用いられ、最も情報を持つ軸(主成分)から順に抽出します。因子分析との違いは、因子分析が潜在変数の推定に重点を置くのに対し、主成分分析はデータの分散を最大化する軸を求める点です。
FAQ
Q: 主成分分析はどんな場面で使われますか?
A: 多数の変数を持つデータの次元削減や、データの可視化、ノイズ除去に使われます。
A: 多数の変数を持つデータの次元削減や、データの可視化、ノイズ除去に使われます。
Q: 主成分分析と因子分析はどう違いますか?
A: 主成分分析はデータの分散を最大化する軸を求めるのに対し、因子分析は潜在的な因子を推定し背後の構造を探ります。
A: 主成分分析はデータの分散を最大化する軸を求めるのに対し、因子分析は潜在的な因子を推定し背後の構造を探ります。
関連キーワード: 主成分分析、次元削減、多変量解析、固有値分解、特異値分解、因子分析、クラスタリング、回帰分析

\ せっかくなら /
応用情報技術者を
クイズ形式で学習しませんか?
クイズ画面へ遷移する→
すぐに利用可能!

