戦国IT - 情報処理技術者試験の過去問対策サイト
ブログお知らせお問い合わせ料金プラン

基本情報技術者 2018年 秋期 午前(科目A)24


問題文

列車の予約システムにおいて、人間とコンピュータが音声だけで次のようなやり取りを行う。この場合に用いられるインタフェースの種類はどれか。   〔凡例〕  P:人間  C:コンピュータ   P “5月28日の名古屋駅から東京駅までをお願いします。” C “ご乗車人数をどうぞ。” P “大人2名でお願いします。” C “ご希望の発車時刻をどうぞ。” P “午前9時頃を希望します。” C “午前9時3分発、午前10時43分着の列車ではいかがでしょうか。” P “それでお願いします。” C “確認します。大人2名で,5月28日の名古屋駅午前9時3分発、東京駅午前10時43分着の列車でよろしいでしょうか。” P “はい。”

選択肢

感性インタフェース
自然言語インタフェース(正解)
ノンバーバルインタフェース
マルチモーダルインタフェース

列車予約の音声対話に用いられるインタフェースの種類【午前2 解説】

要点まとめ

  • 結論→このやり取りは音声による言語的な問い答えを行う自然言語インタフェース(音声対話システム)です。
  • 根拠→発話の理解と応答が中心で、音声認識→意味解析→応答生成の流れで言語情報を処理している点が一致します。
  • 差がつくポイント→音声のみで完結しているか、感情やジェスチャなど非言語情報や画面操作など複数モードが混在しているかで判断します。

正解の理由

正解は (自然言語インタフェース)です。問題文の対話は人間とコンピュータが音声で発話を行い、発話の意味を理解して適切に返答する一連の言語的処理が主役になっています。具体的には音声認識(ASR)で発話をテキスト化し、自然言語理解(NLU)で意図を解析し、対話管理が応答を決定、自然言語生成(NLG)と音声合成(TTS)で返答を音声化する典型的な自然言語(音声)インタフェースの構成に該当します。

よくある誤解

  • 「話している=マルチモーダル」と考える誤解:発話と応答だけであれば単一モーダル(音声)であり、視覚や触覚など別のモードがある場合にマルチモーダルとなります。
  • 「感性インタフェース」と混同する誤解:感性(アフェクティブ)インタフェースは利用者の感情や表情を検出・反映するもので、今回のやり取りの主目的は感情ではなく語義理解です。
  • 「ノンバーバル=会話に含まれる黙示的情報」と誤認する点:ノンバーバルは言語以外のジェスチャや表情、視線などを意味し、今回の例には該当しません。

解法ステップ

  1. 対話の手段(音声・文字・画面・ジェスチャなど)を洗い出す。
  2. 対話内容が「言語の意味理解と応答」であるかを確認する(自然言語処理が必要か)。
  3. 複数モードが混在していないか(例:音声+画面操作、音声+ジェスチャ)を判断する。
  4. 感情や表情の認識が主目的であれば「感性インタフェース」、非言語情報が主体なら「ノンバーバル」と選ぶ。
  5. 上記に基づき最も該当するインタフェースを選択する(本問は音声のみかつ意味理解が主目的→自然言語インタフェース)。

選択肢別の誤答解説

  • ア: 感性インタフェース
    感性インタフェースは利用者の感情や表情、心理状態をセンシングしてシステム動作を制御するものです。本問は座席予約という機能的要求に対する言語的な問答であり、感情センシングが登場しないため不適切です。
  • イ: 自然言語インタフェース(正解)
    自然言語(音声)での入力理解と応答生成が行われており、典型的な音声対話システムの例に当たります。
  • ウ: ノンバーバルインタフェース
    ノンバーバルはジェスチャ、表情、視線など非言語的手がかりを用いるインタフェースであり、対話例はすべて言語(発話)によるため該当しません。
  • エ: マルチモーダルインタフェース
    マルチモーダルは複数の感覚モード(音声+視覚+触覚等)を組み合わせる場合を指します。本例は音声のやり取りのみで完結しているため単一モードであり、マルチモーダルとは言えません。

補足コラム

音声対話システムの内部は一般に「ASR → NLU → 対話管理 → NLG → TTS」のパイプラインで構成されます。午前試験では細かい技術実装よりも「どのインタフェース分類に該当するか」を問われることが多いので、設問文から「入力手段(音声/視覚/入力装置)」と「主目的(意味理解/感情検出)」を素早く切り分ける練習が有効です。

FAQ

Q1: 音声でやり取りしているから必ずマルチモーダルでしょうか?
A1: いいえ。音声入出力だけなら単一モード(音声)です。マルチモーダルは音声+画面操作やジェスチャなど複数の異なるモードが同時に使われる場合を指します。
Q2: 会話中に相手の「感情」を推測して対応していれば感性インタフェースになりますか?
A2: はい。主に感情や表情を検出・反映して振る舞う設計であれば感性インタフェースの要素が含まれます。本問は感情より予約情報のやり取りが中心です。
Q3: テキストチャットでも自然言語インタフェースに入りますか?
A3: はい。入力手段が音声かテキストかにかかわらず、自然言語の理解と生成が行われる対話は自然言語インタフェースです。

関連キーワード: 音声認識、自然言語処理、対話システム、ASR、TTS、ユーザインタフェース、ヒューマンコンピュータインタラクション
← 前の問題へ次の問題へ →
戦国ITクイズ機能

\ せっかくなら /

基本情報技術者
クイズ形式で学習しませんか?

クイズ画面へ遷移する

すぐに利用可能!

©︎2026 情報処理技術者試験対策アプリ

このサイトについてブログプライバシーポリシー利用規約特商法表記開発者について