データベーススペシャリスト 2016年 午前2 問19
問題文
文献検索システム、データ検索システムなどの情報検索システムを評価する尺度として用いられる再現率(recall ratio)と精度(precision ratio)の組合せとして、適切なものはどれか。ここで、a, b, cは次の件数を示す。
a:蓄積された全てのデータのうち、質問に適合する件数
b:検索結果のデータのうち、質問に適合する件数
c:検索結果のデータの件数

選択肢
ア:
イ:(正解)
ウ:
エ:
情報検索システムの再現率と精度の定義【午前2 解説】
要点まとめ
- 結論:再現率は「質問に適合する件数のうち検索で見つかった割合」、精度は「検索結果のうち適合する割合」で表される。
- 根拠:再現率は、精度はで計算され、は全適合件数、は検索結果中の適合件数、は検索結果件数。
- 差がつくポイント:再現率と精度の分母・分子の意味を正確に理解し、混同しないことが重要。
正解の理由
再現率(Recall)は「実際に適合する全データのうち、検索で見つかった適合データの割合」であるため、で表されます。
精度(Precision)は「検索結果のうち、適合するデータの割合」であるため、で表されます。
したがって、再現率が、精度がの組み合わせである「イ」が正解です。
精度(Precision)は「検索結果のうち、適合するデータの割合」であるため、で表されます。
したがって、再現率が、精度がの組み合わせである「イ」が正解です。
よくある誤解
再現率と精度の分母を逆に覚えてしまい、再現率をやと誤認することが多いです。
また、精度をとする誤りも見られ、両者の意味を混同しやすい点に注意が必要です。
また、精度をとする誤りも見られ、両者の意味を混同しやすい点に注意が必要です。
解法ステップ
- 問題文のの定義を正確に把握する。
- 再現率の定義「実際に適合する全データのうち検索で見つかった割合」を確認。
- 精度の定義「検索結果のうち適合する割合」を確認。
- それぞれの定義に基づき、分子・分母を当てはめる。
- 選択肢の分数と照合し、正しい組み合わせを選ぶ。
選択肢別の誤答解説
- ア:再現率を、精度をとしているが、再現率の分母が誤り。
- イ:再現率、精度で正しい定義に合致。
- ウ:再現率は正しいが、精度をとしており、精度の分母が誤り。
- エ:再現率、精度は両方とも定義と逆で誤り。
補足コラム
再現率と精度は情報検索だけでなく、機械学習の分類問題評価でも重要な指標です。
再現率が高いと見逃しが少なく、精度が高いと誤検出が少ないことを意味します。
両者はトレードオフの関係にあり、F値(F1スコア)でバランスを評価することもあります。
再現率が高いと見逃しが少なく、精度が高いと誤検出が少ないことを意味します。
両者はトレードオフの関係にあり、F値(F1スコア)でバランスを評価することもあります。
FAQ
Q: 再現率と精度はどちらが重要ですか?
A: 目的によります。見逃しを減らしたい場合は再現率、誤検出を減らしたい場合は精度が重要です。
A: 目的によります。見逃しを減らしたい場合は再現率、誤検出を減らしたい場合は精度が重要です。
Q: 再現率と精度の値は常に高い方が良いですか?
A: 理想的には両方高い方が良いですが、実際はトレードオフの関係でバランスを取る必要があります。
A: 理想的には両方高い方が良いですが、実際はトレードオフの関係でバランスを取る必要があります。
関連キーワード: 再現率、精度、情報検索、検索評価指標、recall, precision

\ せっかくなら /
データベーススペシャリストを
クイズ形式で学習しませんか?
クイズ画面へ遷移する→
すぐに利用可能!

