基本情報技術者 2017年 秋期 午前(科目A) 問63
問題文
ビッグデータを企業が活用している事例はどれか。
選択肢
ア:カスタマセンタへの問合せに対し、登録済みの顧客情報から連絡先を抽出する。
イ:最重要な取引先が公表している財務諸表から、売上利益率を計算する。
ウ:社内研修の対象者リスト作成で、人事情報から入社10年目の社員を抽出する。
エ:多種多様なソーシャルメディアの大量な書込みを分析し、商品の改善を行う。(正解)
ビッグデータを企業が活用している事例はどれか。【午前2 解説】
要点まとめ
- 結論:多種多様なソーシャルメディアの大量な書込みを分析して商品の改善に活かす事例は、量・多様性・速度の観点でビッグデータ活用に該当します。
- 根拠:ビッグデータは「Volume(量)」「Variety(多様性)」「Velocity(速度)」などの特性を持ち、構造化されていない大量のテキストやログを分析対象にする点が特徴です。
- 差がつくポイント:設問では「大量」「多種多様」「分析して改善」というキーワードを探し、個別の顧客情報や少量の構造化データと区別する思考が重要です。
正解の理由
正解: エ
エの記述は、ソーシャルメディアという多様で非構造化なデータ(投稿テキスト、画像、メタデータ等)を大量に扱い、これを分析して製品改善に結びつける点でビッグデータの典型的な活用例です。ビッグデータは単なるデータ量の多さだけでなく、多様な形式と高速に生成される点が特徴であり、自然言語処理や感情分析、クラスタリングなどの技術で価値を抽出します。したがってエが正解です。
エの記述は、ソーシャルメディアという多様で非構造化なデータ(投稿テキスト、画像、メタデータ等)を大量に扱い、これを分析して製品改善に結びつける点でビッグデータの典型的な活用例です。ビッグデータは単なるデータ量の多さだけでなく、多様な形式と高速に生成される点が特徴であり、自然言語処理や感情分析、クラスタリングなどの技術で価値を抽出します。したがってエが正解です。
よくある誤解
- 「大量=ビッグデータ」とだけ考える誤解:量が多くても構造化された少量のクエリ処理ではビッグデータ特有の技術が不要な場合があります。
- 「社内データ=ビッグデータ」と考える誤り:社内の人事や顧客の登録情報は構造化されており、分析対象としては『小〜中データ』で済むことが多いです。
- 「公開データの分析=必ずビッグデータ活用」との混同:公開情報のうち少量の財務数値を計算する行為(例:財務諸表の売上利益率算出)はビッグデータの範疇ではありません。
解法ステップ
- 設問のキーワードを抽出:「ビッグデータ」「活用」「事例」などに注目します。
- 各選択肢が扱うデータの性質を確認:構造化か非構造化か、データ量は多いか、多様性があるかを見ます。
- 3V(Volume, Variety, Velocity)に照らし合わせる:該当する要素が複数ある選択肢を正解候補とします。
- 残りの選択肢を除外:単純な抽出や少量の計算などビッグデータ技術を必要としないものは誤答として排除します。
選択肢別の誤答解説
- ア: カスタマーセンタへの問合せで登録済み顧客情報から連絡先を抽出する行為は、構造化データの検索・抽出でありビッグデータ特有の処理ではありません。
- イ: 最重要取引先の公表財務諸表から売上利益率を計算するのは定型的な数値計算で、データ量や多様性は小さいためビッグデータ活用の例ではありません。
- ウ: 社内研修対象の抽出(入社10年目の社員抽出)は人事DBの単純なフィルタ処理で、構造化データに対する通常のクエリです。
- エ: 多種多様なソーシャルメディアの大量な書込みを分析し、商品の改善に活用する行為は非構造化データの大量処理や自然言語解析を伴い、ビッグデータ活用の典型例です。
補足コラム
ビッグデータ活用の典型的な領域として、ソーシャルリスニング(SNS分析)、IoTセンサーデータのリアルタイム解析、ウェブアクセスログの行動解析などが挙げられます。技術的にはHadoop、Spark、NoSQLデータベース、自然言語処理や機械学習モデルが用いられ、データの前処理(ETL)、特徴量抽出、モデル評価と運用(MLOps)まで含めて「活用」の流れになります。試験対策では「データの性質(構造化 vs 非構造化)」「量・多様性・生成速度」に着目する訓練が有効です。
FAQ
Q: 「どれくらいの量からビッグデータと言えるか?」
A: 明確な閾値はありません。一般的には従来の単一サーバやRDBで扱えない量・多様性・速度がある場合にビッグデータと呼びます。試験では設問の文言(大量、多種、多様、リアルタイム性)を手掛かりに判断します。
A: 明確な閾値はありません。一般的には従来の単一サーバやRDBで扱えない量・多様性・速度がある場合にビッグデータと呼びます。試験では設問の文言(大量、多種、多様、リアルタイム性)を手掛かりに判断します。
Q: 「構造化データはビッグデータに含まれないのか?」
A: 含まれることもありますが、構造化データだけで単純処理可能な場合はビッグデータ特有の分析技術は不要です。鍵は“従来の手段で処理困難かどうか”です。
A: 含まれることもありますが、構造化データだけで単純処理可能な場合はビッグデータ特有の分析技術は不要です。鍵は“従来の手段で処理困難かどうか”です。
Q: 「テキスト分析は必ずビッグデータなのか?」
A: テキスト量が少なければビッグデータとは言えませんが、SNSやログなど大量の非構造化テキストを扱う場合はビッグデータ技術が必要になります。
A: テキスト量が少なければビッグデータとは言えませんが、SNSやログなど大量の非構造化テキストを扱う場合はビッグデータ技術が必要になります。
関連キーワード: ビッグデータ、3V、ソーシャルリスニング、テキストマイニング、感情分析、非構造化データ、Hadoop、Spark

\ せっかくなら /
基本情報技術者を
クイズ形式で学習しませんか?
クイズ画面へ遷移する→
すぐに利用可能!

