ホーム > データベーススペシャリスト試験 > 2011年
データベーススペシャリスト試験 2011年 午前2 問19
文献検索システム, データ検索システムなどの情報検索システムを評価する尺度として用いられる再現率 (recall ratio) と精度 (precision ratio) の組合せとして, 適切なものはどれか。ここで, a, b, cは次の件数を示す。
a:蓄積されたすべてのデータのうち、質問に適合する件数
b: 検索されたデータのうち、質問に適合する件数
c: 検索されたデータの件数

ア:
イ:(正解)
ウ:
エ:
解説
文献検索システムにおける再現率と精度の定義【午前2 解説】
要点まとめ
- 結論:再現率は「検索された適合データ数 ÷ 全適合データ数」、精度は「検索された適合データ数 ÷ 検索されたデータ数」で表されます。
- 根拠:再現率は全体の中でどれだけ適合データを見つけたかを示し、精度は検索結果の中で適合データの割合を示す指標です。
- 差がつくポイント:a, b, cの意味を正確に理解し、分母と分子の関係を混同しないことが重要です。
正解の理由
再現率は「質問に適合する全データのうち、検索で見つかった件数」の割合であり、式は です。
精度は「検索されたデータのうち、質問に適合する件数」の割合であり、式は です。
したがって、選択肢イの「再現率 、精度 」が正しい組み合わせです。
精度は「検索されたデータのうち、質問に適合する件数」の割合であり、式は です。
したがって、選択肢イの「再現率 、精度 」が正しい組み合わせです。
よくある誤解
再現率と精度の分母を逆に考えたり、適合データ数と検索データ数を混同してしまうことが多いです。
特に「再現率=a/b」や「精度=c/b」と誤認しやすいので注意が必要です。
特に「再現率=a/b」や「精度=c/b」と誤認しやすいので注意が必要です。
解法ステップ
- 問題文のa, b, cの定義を正確に把握する。
- 再現率は「検索で見つかった適合データ数 ÷ 全適合データ数」であることを確認。
- 精度は「検索結果の中の適合データ数 ÷ 検索結果の総数」であることを確認。
- 各選択肢の式とa, b, cの関係を照らし合わせる。
- 正しい式の組み合わせを選択する。
選択肢別の誤答解説
- ア:再現率が となっているが、分母bは「検索された適合データ数」であり、全適合データ数aが分母でなければならないため誤り。
- イ:再現率 、精度 は定義通りで正解。
- ウ:精度が となっているが、分母cは「検索されたデータの件数」であり、分子bは適合データ数なので逆になっている。
- エ:再現率 、精度 はどちらも定義と合わず、分母分子の意味が混乱している。
補足コラム
再現率と精度は情報検索だけでなく、機械学習の分類問題評価にも用いられます。
再現率は「漏れなく拾う能力」、精度は「誤検出を減らす能力」を示し、両者のバランスが重要です。
F値(F1スコア)は再現率と精度の調和平均で、総合的な性能評価に使われます。
再現率は「漏れなく拾う能力」、精度は「誤検出を減らす能力」を示し、両者のバランスが重要です。
F値(F1スコア)は再現率と精度の調和平均で、総合的な性能評価に使われます。
FAQ
Q: 再現率が高いのに精度が低い場合はどういう状態ですか?
A: 多くの適合データを拾えているが、検索結果に誤ったデータも多く含まれている状態です。
A: 多くの適合データを拾えているが、検索結果に誤ったデータも多く含まれている状態です。
Q: 精度が高いのに再現率が低い場合は?
A: 検索結果は正確だが、適合データの多くを見逃している状態です。
A: 検索結果は正確だが、適合データの多くを見逃している状態です。
関連キーワード: 再現率, 精度, 情報検索, 検索評価指標, F値