ホーム > システムアーキテクト試験 > 2019年
システムアーキテクト試験 2019年 午前2 問12
ある通信販売事業者は、人工知能技術を利用して人間のように受け答えする、Webのチャットをインタフェースとしたユーザサポートシステムを開発している。テスト工程では、次の方法でテストする手法を採用した。このような、人工知能に関するテスト手法を何というか。
〔テストの方法〕
・判定者は、このシステムと人間の二者を相手に自然言語によるチャットを行う。このとき、判定者はどちらがこのシステムで、どちらが人間なのかは知らされていない。
・判定者が一連のチャットを行った後に、チャットの相手のどちらがこのシステムで、どちらが人間かを判別できるかどうかを確認する。
ア:実験計画法
イ:チューリングテスト(正解)
ウ:ファジング
エ:ロードテスト
解説
人工知能のテスト手法に関する問題【午前2 解説】
要点まとめ
- 結論:このテスト手法は「チューリングテスト」と呼ばれ、人工知能の人間らしさを評価する方法です。
- 根拠:判定者がシステムと人間の区別がつかないかを確認する点が特徴で、アラン・チューリングが提唱した概念に基づいています。
- 差がつくポイント:単なる性能評価ではなく、自然言語での対話を通じて「知能の人間らしさ」を判定する点を理解することが重要です。
正解の理由
選択肢イの「チューリングテスト」は、人工知能が人間と区別がつかないかどうかを判定者が判断するテストです。問題文の「判定者がシステムと人間のどちらかを知らされずにチャットを行い、区別できるかを確認する」という手法は、まさにチューリングテストの定義に合致します。
他の選択肢はテスト手法として異なる目的や方法を持つため、正解はイです。
他の選択肢はテスト手法として異なる目的や方法を持つため、正解はイです。
よくある誤解
チューリングテストは単なる性能テストや負荷テストではなく、人工知能の「人間らしさ」を評価するための対話形式のテストである点を誤解しやすいです。
解法ステップ
- 問題文のテスト方法を読み、判定者がシステムと人間の区別をつけるかどうかを確認していることを把握する。
- それが人工知能の「人間らしさ」を評価するテストであることを理解する。
- 選択肢の中から「チューリングテスト」の定義と照らし合わせて該当するものを選ぶ。
- 他の選択肢の意味を確認し、問題文の内容と合わないことを確認する。
- イを正解と判断する。
選択肢別の誤答解説
- ア: 実験計画法
実験計画法は品質管理や効率的なテスト設計に使う統計的手法であり、人工知能の人間らしさを判定するテストではありません。 - イ: チューリングテスト
人工知能が人間と区別できないかを判定するテストで、問題文の内容に完全に一致します。 - ウ: ファジング
ファジングはソフトウェアの脆弱性を発見するために大量の異常入力を与えるテスト手法であり、人工知能の対話能力評価とは異なります。 - エ: ロードテスト
ロードテストはシステムの負荷耐性を評価する性能テストであり、人工知能の知能評価とは無関係です。
補足コラム
チューリングテストは1950年にアラン・チューリングが提唱したもので、人工知能の「知能」を測る哲学的かつ実践的な基準として広く知られています。近年では、チャットボットや対話型AIの評価に応用されることが多く、AIの自然言語処理能力の向上を示す指標の一つとなっています。
FAQ
Q: チューリングテストは人工知能の性能を完全に評価できるのですか?
A: いいえ。チューリングテストは「人間らしさ」を評価する一つの基準であり、性能や正確性を総合的に評価するものではありません。
A: いいえ。チューリングテストは「人間らしさ」を評価する一つの基準であり、性能や正確性を総合的に評価するものではありません。
Q: ファジングとチューリングテストはどのように違いますか?
A: ファジングはソフトウェアの脆弱性検出を目的とした異常入力テストで、チューリングテストは人工知能の人間らしさを判定する対話テストです。
A: ファジングはソフトウェアの脆弱性検出を目的とした異常入力テストで、チューリングテストは人工知能の人間らしさを判定する対話テストです。
関連キーワード: チューリングテスト, 人工知能テスト, 自然言語処理, AI評価, 対話型AI