転置インデックスに関する記述の正解はどれか【午前2 解説】
要点まとめ
- 結論:転置インデックスは単語ごとに、その単語を含む文書へのポインタを保持するインデックス方式です。
- 根拠:全文検索エンジンで効率的に単語検索を行うために用いられ、単語から文書を逆引きする構造が特徴です。
- 差がつくポイント:B木やヒープ領域の説明と混同せず、転置インデックスの「単語→文書」対応関係を正確に理解することが重要です。
正解の理由
選択肢ウは「テキストに含まれる単語に対して、その単語を含むテキストへのポインタをインデックスとして使用する」とあり、これは転置インデックスの本質を正しく表しています。転置インデックスは単語をキーにして、その単語が出現する文書IDや位置情報を保持し、全文検索の高速化に寄与します。
よくある誤解
転置インデックスはB木やヒープ領域の物理的な並べ替えとは異なり、単語と文書の逆引きリストを作る仕組みです。SQL関数の評価結果をインデックスにすることもありません。
解法ステップ
- 「転置インデックス」の定義を確認する。
- 単語と文書の関係を逆引きするインデックスであることを理解する。
- 選択肢の説明が単語→文書の対応を示しているかを判断する。
- B木やヒープ領域の説明は転置インデックスの特徴と異なるため除外する。
- 最も正確に転置インデックスを説明している選択肢を選ぶ。
選択肢別の誤答解説
- ア: SQL関数の評価結果をインデックスに使うのは一般的なインデックスの説明ではなく、転置インデックスの特徴ではありません。
- イ: 最上位ノードからリーフノードへのポインタを使うのはB木(B-tree)インデックスの説明であり、転置インデックスとは異なります。
- ウ: 正解。単語をキーにして、その単語を含む文書へのポインタを保持する転置インデックスの本質を正しく表しています。
- エ: ヒープ領域を使わずに物理的に並べ替えるのはクラスタ化インデックスの特徴であり、転置インデックスとは無関係です。
補足コラム
転置インデックスは全文検索システムや情報検索で広く使われています。単語ごとに文書IDリストを持つため、検索時に単語の出現文書を高速に特定可能です。Googleの検索エンジンもこの技術を応用しています。B木インデックスは主に範囲検索やキー検索に適しており、用途が異なります。
FAQ
Q: 転置インデックスはどのような場面で使われますか?
A: 大量のテキストデータから特定の単語を含む文書を高速に検索する全文検索システムで使われます。
Q: B木インデックスと転置インデックスの違いは何ですか?
A: B木はキーの順序を保ち範囲検索に強い構造で、転置インデックスは単語から文書を逆引きする全文検索向けの構造です。
関連キーワード: 転置インデックス、全文検索、インデックス構造、B木、クラスタ化インデックス、情報検索、ポインタ、文書検索