応用情報技術者 2024年 秋期 午後 問11
チャットボット導入における開発計画の監査に関する次の記述を読んで、設問に答えよ。
W社は、中堅の家電メーカーである。顧客サービス部では、製品の特徴や使用方法に関する顧客からの問合せなどに回答するコールセンターを運用しており、Web上で顧客からの問合せに対し、定型文で自動的に回答するチャットボット(以下、現行CBという)で作業効率を向上させてきた。
問合せ内容をより的確に解釈するなど、回答の品質向上のために、顧客サービス部長がシステムオーナーとなり、現行CBのベンダーが提供する、ディープラーニングを利用していない機械学習方式のチャットボット(以下、新CBという)を導入するプロジェクトを立ち上げることになった。
企画プロセスの完了を受けて、W社監査部のシステム監査チームは、新CBの開発計画の適切性について監査を実施することになった。そのために実施した予備調査の結果、次のことを把握した。
〔予備調査の結果〕
(1) 現行CBの概要と課題
① W社では、季節性のある製品を多く取りそろえているので、顧客から寄せられる問合せ数は、季節性のある製品では季節によって偏りがある。
② 現行CBでは、顧客が入力した曖味な言葉に対応できず、FAQに回答が存在するにもかかわらず、問合せを解釈できずに回答が表示されないことや、誤った回答を表示することがある。顧客が現行CBの回答では不十分と感じた場合には、顧客からの要望で、コールセンターのオペレーターが代わって問合せ対応を実施している。
③ 導入効果をモニタリングするために、顧客の入力テキスト、現行CBが表示した回答、現行CBの回答に対して“役立った”かどうかの結果などを、CB回答履歴として保存している。これらの情報を分析し、顧客から“役立った”という評価を得た割合(以下、回答満足率という)を効果測定の指標の一つにしている。
④ 新製品については、発売に合わせて新規にFAQを知識ベースに登録している。今回のプロジェクト期間中にも、発売が予定されている新製品が複数ある。
⑤ 現行 CB を導入した際には、受入テストを顧客サービス部員が参加せずに開発担当者だけが実施したことから、新製品に関する問合せに対して適切に回答できないなど、本番移行後に混乱を招く問題点があった。
(2) プロジェクトの概要
これまで、企画プロセスにおいて新 CB 導入の目的の明確化、システム化計画の立案、及び PoC(Proof of Concept:概念実証)を実施しており、PoC の結果は品質向上の効果を見込めるものであった。現在、開発計画書案を顧客サービス部とシステム部が共同で作成したところである。関係する役員、及び財務部、顧客サービス部、システム部の各部長で構成するプロジェクト運営委員会で開発計画書案を承認する予定である。
今後の開発プロセスにおいて要件定義、追加の機械学習を含む設計、実装、テスト、受入テスト、及び本番移行を予定している。新 CB の機能構成を図1に示す。

(3) 新CBの機能概要と機械学習
① 回答機能には、現行CBよりも改良した知識ベースを備えており、新CBにおいても新製品の発売に合わせてFAQを知識ベースに登録する。新CBでは、類似する言葉を整理して、言葉の関連度合いを格納している用語データベース(以下、類義語DBという)が備わっている。回答機能では、顧客の入力テキストを自然言語処理し、類義語DBと突き合わせることで、顧客の曖昧な言葉遣いに対してある程度問合せ対応可能であり、回答満足率の向上が期待できる。
② 新CBの類義語DBは、ベンダーからの納入時には一般的な語句だけに対応している。W社製品に関する語句などを類義語DBに反映するには、二つの方法がある。一つ目は、手作業入力データを基に学習機能に備わる手作業入力機能によって、類義語DBを整備する方法である。二つ目は、現行CBのCB回答履歴から抽出した文章を自然言語処理によって品詞別に分解し、AIモデルによって機械学習することで類義語DBを整備する方法である。
PoCでは、機械学習によって類義語DBを整備する際のサーバ処理に想定以上の時間を要していた。
③ PoCにおける機械学習による類義語DBの整備では、現行CBのCB回答履歴から6か月分を学習用データ及びテスト用データとして、ランダムに抽出した。また、回答満足率を指標にして、効果の目標レベルを定め、新CBの有効性を判断している。
④ 新CBでは、設計において、追加の機械学習によって類義語DBの精度を高め、回答満足率を上げる想定である。設計後においても、本番運用向けの類義語DBの学習では、再学習を実施する。
〔監査手続案の作成〕
予備調査の結果を踏まえて、システム監査チームが作成した監査手続案(抜粋)を表1に示す。

〔監査部長の指示〕
監査部長は、監査手続案をレビューして、次のとおりシステム監査チームに指示した。
(1) 表1項番1について、設計における追加の機械学習では、類義語DBの整備がスケジュールどおり完了しないおそれがある。機械学習を実行するサーバに対する非機能要件の一つであるeが、PoCを実施した際の実績データから導いた要件になっているか確かめること。
(2) 表1項番2について、新製品だけでなく、現行のfに関する問合せへの回答について、学習用データが不十分で、適切に回答できないおそれがある。設計における追加の機械学習では、製品を網羅する観点から学習用データを準備する計画になっているか確かめること。
(3) 表1項番3について、新CBの有効性を確保するために、gに先立って、プロジェクト運営委員会が、当初予定の導入効果が得られる見込みを評価する計画になっているか確かめること。
(4) 追加する監査手続として、現行CB導入時における問題点を踏まえて、今後の開発プロセスにおいて顧客サービス部によるhが適切に実施される計画になっているか確かめること。
設問1:表1の監査手続案について答えよ。
(1)表中のa、bに入れる適切な字句を、それぞれ5字以内で答えよ。
模範解答
a:学習
b:手作業入力
解説
解答の論理構成
-
a について
- 監査手続案(表1 項番1)は「追加の機械学習におけるa用データとテスト用データを別に準備」と記述しています。
- 【問題文】〔予備調査の結果〕(3)③ では「現行CBのCB回答履歴から6か月分を学習用データ及びテスト用データとして、ランダムに抽出した。」と明示されており、機械学習で一般に分割するのは「学習用データ」と「テスト用データ」です。
- よって a に入る語は「学習」と判断できます(「学習用データ」という熟語を完成)。
-
b について
- 監査手続案(表1 項番2)は「発売前の新製品に関して適切に回答するために、b機能による類義語DBの整備」と記述しています。
- 【問題文】〔予備調査の結果〕(3)② で、類義語DBを整備する二つの方法の一つとして「手作業入力データを基に学習機能に備わる手作業入力機能によって、類義語DBを整備する方法」が説明されています。
- 発売前の新製品はまだ回答履歴が不足しているため、自動学習より「手作業入力機能」による整備が必須です。
- したがって b に入る語は「手作業入力」となります。
誤りやすいポイント
- a を「訓練」や「トレーニング」と英語・カタカナで書いてしまう。問題文は「学習用データ」で統一されているため要注意です。
- b を「手作業」だけで止める、あるいは「人手入力」と書くミス。機能名としては「手作業入力機能」であり、該当箇所は複合語である点に気付きにくいです。
- 「PoCでは機械学習で時間超過」という記述に引きずられ、b に「機械学習」を入れてしまうケース。新製品 FAQ の不足はむしろ手作業で補うという流れを読み取る必要があります。
FAQ
Q: 「学習用データ」と「訓練データ」は同じ意味ですか?
A: はい、ほぼ同義ですが、本設問は問題文で「学習用データ」と表現しているため、そのまま使用することが求められます。
A: はい、ほぼ同義ですが、本設問は問題文で「学習用データ」と表現しているため、そのまま使用することが求められます。
Q: 類義語DBの整備で「手作業入力」を選ぶ判断根拠は?
A: 新製品は回答履歴が少なく、自動学習に十分なデータがないためです。【問題文】(3)② では手作業入力機能がそのギャップを埋める方法として説明されています。
A: 新製品は回答履歴が少なく、自動学習に十分なデータがないためです。【問題文】(3)② では手作業入力機能がそのギャップを埋める方法として説明されています。
Q: なぜ学習用とテスト用を分ける必要があるのですか?
A: 同じデータで学習と評価を行うと過学習が発生し、PoC では良くても本番で性能が落ちるリスクが高まるからです。
A: 同じデータで学習と評価を行うと過学習が発生し、PoC では良くても本番で性能が落ちるリスクが高まるからです。
関連キーワード: 機械学習、学習用データ、テスト用データ、類義語DB, 受入テスト
設問1:表1の監査手続案について答えよ。
(2)表1中のcに入れる適切な字句を、本文中の字句を用いて5字以内で答えよ。
模範解答
c:目標レベル
解説
解答の論理構成
- 表1項番3では、受入テスト結果が想定を下回った場合に備え、「本番移行の可否判断で使用する適切な評価項目とその項目に設定した具体的な効果のc」を確認すると記載されています。
- 何を設定すべきかは、企画・PoCフェーズで用いた評価指標と揃えるのが自然です。
- 本文中の〔予備調査の結果〕(3)③には、次の記述があります。
――「回答満足率を指標にして、効果の目標レベルを定め、新CBの有効性を判断している。」 - ここで「効果の目標レベル」が、評価項目(回答満足率など)に対して設定する具体的な基準値を意味しており、表1の文脈と一致します。
- したがって、cに入る語句は「目標レベル」と判断できます。
誤りやすいポイント
- 「KPI」や「基準値」など一般的な管理用語を当てはめてしまう。本文では明確に「目標レベル」という表現を用いている点を見落としやすいです。
- 指標そのもの(例:「回答満足率」)を入れてしまうケース。問われているのは“指標に設定する具体的な効果”であり、数値水準を示す語句が必要です。
- 表1項番3の文だけを読んで判断し、PoCの記述と照合しないミス。過去フェーズの記載は必ず参照する癖を付けましょう。
FAQ
Q: 「目標レベル」は具体的に数値で示す必要がありますか?
A: 開発計画書上では数値(例えば「回答満足率90%」など)で示すのが望ましいですが、本設問は語句を問うため「目標レベル」と記入します。
A: 開発計画書上では数値(例えば「回答満足率90%」など)で示すのが望ましいですが、本設問は語句を問うため「目標レベル」と記入します。
Q: KPIと目標レベルの違いは?
A: KPIは評価“項目”そのもの(回答満足率など)であり、目標レベルはそのKPIが達成すべき具体的“水準”を指します。
A: KPIは評価“項目”そのもの(回答満足率など)であり、目標レベルはそのKPIが達成すべき具体的“水準”を指します。
Q: 受入テスト時に目標レベルを満たさなかったらどうなりますか?
A: 設問の趣旨どおり、本番移行を保留し再学習や追加改善を実施するのが適切です。
A: 設問の趣旨どおり、本番移行を保留し再学習や追加改善を実施するのが適切です。
関連キーワード: KPI, 類義語DB, 機械学習、評価指標、受入テスト
設問1:表1の監査手続案について答えよ。
(3)表1中のdに入れる適切な字句を、5字以内で答えよ。
模範解答
d:レビュー
解説
解答の論理構成
- 【問題文】表1 項番4 の監査手続は
“テスト結果と不具合の対応状況を文書化して保管するとともに、プロジェクト関係者によるdを適切に実施する。”
と記載されています。 - テスト結果・不具合対応を「文書化して保管」した後に行う典型的な活動は、関係者が集まり内容を点検・評価する「レビュー」です。
– ソフトウェア開発の品質保証では、設計書・テスト結果などの成果物をレビューし、欠陥の早期発見と是正を図ることが定石です。
– “プロジェクト関係者による” という条件も、複数人で行うレビューを示唆しています。 - 以上より、d に入る適切な字句は「レビュー」と判断できます。
誤りやすいポイント
- 「承認」「確認」と誤記する
承認は最終決裁、確認は個人作業のニュアンスが強く、複数人で行う品質活動を示す語としては不十分です。 - 「ミーティング」と置く
打ち合わせ全般を指す言葉であり、成果物を体系的に点検するレビューとは異なります。 - レビューは設計フェーズだけと勘違いする
テスト結果や不具合対応もレビュー対象であることを忘れがちです。
FAQ
Q: レビューはどのタイミングで実施すべきですか?
A: テスト工程中はもちろん、テスト終了後の総括時にも実施します。成果物が作成されるたびに早期レビューを繰り返すことで、後工程での手戻りを防げます。
A: テスト工程中はもちろん、テスト終了後の総括時にも実施します。成果物が作成されるたびに早期レビューを繰り返すことで、後工程での手戻りを防げます。
Q: レビューとウォークスルーの違いは?
A: ウォークスルーは作成者が主導して説明する形式的でない点検手法です。一方、レビューはチェックリストや手順書に基づく公式な点検であり、承認・改善アクションが明確になります。
A: ウォークスルーは作成者が主導して説明する形式的でない点検手法です。一方、レビューはチェックリストや手順書に基づく公式な点検であり、承認・改善アクションが明確になります。
Q: レビュー結果はどのように管理すべきですか?
A: 指摘事項、対応方針、是正完了日を一覧化し、版管理されたドキュメントとして保管します。監査証跡としても重要です。
A: 指摘事項、対応方針、是正完了日を一覧化し、版管理されたドキュメントとして保管します。監査証跡としても重要です。
関連キーワード: テスト計画、品質保証、レビュー、不具合管理、文書化
設問2:監査部長の指示について答えよ。
(1)本文中のeに入れる最も適切な字句を解答群の中から選び、記号で答えよ。
解答群
ア:外部インタフェース要件
イ:性能要件
ウ:セキュリティ要件
エ:保守性要件
模範解答
e:イ
解説
解答の論理構成
- 【問題文】には
“機械学習を実行するサーバに対する非機能要件の一つであるeが、PoCを実施した際の実績データから導いた要件になっているか確かめること。”
とあります。 - 非機能要件は安全性・保守性・性能など、機能以外の品質を指します。
- 同じ段落の冒頭で
“追加の機械学習では、類義語DBの整備がスケジュールどおり完了しないおそれ”
と述べられ、遅延の原因は“PoCでは、機械学習によって類義語DBを整備する際のサーバ処理に想定以上の時間を要していた。”(【問題文】)と記載されています。 - “処理に想定以上の時間を要した”という課題に直接対応する非機能項目は、サーバの処理速度・スループット・応答時間などを定義する「性能要件」です。
- 選択肢のうち、時間的性能に関するものは “イ:性能要件” だけです。よって
e:イ
が最適となります。
誤りやすいポイント
- 「非機能要件」という言葉から “ウ:セキュリティ要件” を連想しがちですが、今回のリスクは速度・スケジュール遅延であり安全性ではありません。
- PoCの結果を基にする、という記述を「外部システムとのつながり」と解釈して “ア:外部インタフェース要件” を選ぶミス。
- “保守性要件” は将来的な改修のしやすさを指すため、開発期間中の処理速度問題とはズレます。
FAQ
Q: 非機能要件は複数あるのに、なぜ性能要件だけを取り上げているのですか?
A: 【問題文】で挙げられたリスクが「サーバ処理に想定以上の時間を要した」ことであり、時間的制約を定義するのは性能要件だからです。
A: 【問題文】で挙げられたリスクが「サーバ処理に想定以上の時間を要した」ことであり、時間的制約を定義するのは性能要件だからです。
Q: 性能要件にはどのような項目を盛り込むのが一般的ですか?
A: スループット、レスポンスタイム、同時接続数、バッチ処理時間など、サービスレベルに直結する数値を具体的に設定します。
A: スループット、レスポンスタイム、同時接続数、バッチ処理時間など、サービスレベルに直結する数値を具体的に設定します。
Q: PoCで得た実測値をどう反映させれば良いですか?
A: 実測値+安全率を加味し、ピーク負荷を想定した最大処理時間やCPU使用率などを定量的に記述します。
A: 実測値+安全率を加味し、ピーク負荷を想定した最大処理時間やCPU使用率などを定量的に記述します。
関連キーワード: 非機能要件、性能要件、機械学習、サーバ処理時間、PoC
設問2:監査部長の指示について答えよ。
(2)本文中のf〜hに入れる適切な字句を、それぞれ10字以内で答えよ。
模範解答
f:季節性のある製品
g:本番移行
h:受入テスト
解説
解答の論理構成
-
f を導く
- 監査部長の指示(2)に「新製品だけでなく、現行のfに関する問合せへの回答について、学習用データが不十分で…」とあります。
- 予備調査(1)①には「W社では、季節性のある製品を多く取りそろえている」と明記されています。
- よって、現行の問合せ対象は「季節性のある製品」であり、f = 「季節性のある製品」と判断できます。
-
g を導く
- 監査部長の指示(3)は「gに先立って、プロジェクト運営委員会が、当初予定の導入効果が得られる見込みを評価する計画…」と記述。
- 表1項番3の想定リスクは「…本番運用に移行する」です。
- つまり評価は「本番運用に移行」する直前、すなわち「本番移行」の前に行われます。
- したがって g = 「本番移行」となります。
-
h を導く
- 監査部長の指示(4)は「現行CB導入時における問題点を踏まえて…顧客サービス部によるhが適切に実施される計画…」とあります。
- 予備調査(1)⑤では「受入テストを顧客サービス部員が参加せず…本番移行後に混乱を招く問題点があった」と具体的に指摘されています。
- ここから、顧客サービス部が関与すべき工程は「受入テスト」であり、h = 「受入テスト」と結論づけられます。
誤りやすいポイント
- 「季節性のある製品」を「新製品」と読み違え、f を誤答するケース。
- 「本番移行」と「本番運用」の用語を混同し、g を「本番運用」と書いてしまうミス。
- 予備調査(1)⑤の問題点が“受入テストへの部門不参加”に起因することを見落とし、h を「システムテスト」などとする誤認。
FAQ
Q: 「本番移行」と「本番運用」は何が違いますか?
A: 「本番移行」はデータ・機能を本番環境へ切り替える行為や工程を指し、「本番運用」は移行後の通常運用フェーズを指します。
A: 「本番移行」はデータ・機能を本番環境へ切り替える行為や工程を指し、「本番運用」は移行後の通常運用フェーズを指します。
Q: 監査手続で「受入テスト」を重視する理由は?
A: 利用部門が実際の業務シナリオでシステムを検証し、運用開始後の混乱を未然に防ぐためです。特に顧客対応システムでは影響が大きいため、監査で確認ポイントになります。
A: 利用部門が実際の業務シナリオでシステムを検証し、運用開始後の混乱を未然に防ぐためです。特に顧客対応システムでは影響が大きいため、監査で確認ポイントになります。
Q: 季節性製品の問合せデータはなぜ学習用に重要ですか?
A: 季節ごとに問い合わせ内容が変動するため、機械学習の訓練データが偏ると回答精度が低下します。網羅的なデータを確保することでモデルの汎化性能を維持できます。
A: 季節ごとに問い合わせ内容が変動するため、機械学習の訓練データが偏ると回答精度が低下します。網羅的なデータを確保することでモデルの汎化性能を維持できます。
関連キーワード: 機械学習、類義語DB、本番移行、受入テスト、データ偏り


