データベーススペシャリスト試験 2019年 午前2 問19
ビッグデータの処理に使用されるCEP(複合イベント処理)に関する記述として, 適切なものはどれか。
ア:ストリームデータをメモリ上に展開し, あらかじめ設定した条件に合致した場合に対応するアクションを実行する。(正解)
イ:ビジネスの結果を表す数値データをファクトテーブル, そのデータの解析に必要なデータを次元テーブルに格納して処理する。
ウ:分散データベースにおいて, 関係する全てのプロセスでコミットが可能かを判定する相と, 各プロセスで実際のコミットを行う相の二つを経てコミット処理を実行する。
エ:並列分散環境にある多数のサーバによって, 分散ファイルシステムに蓄積された大量データをバッチ処理する。
解説
ビッグデータの処理に使用されるCEP(複合イベント処理)に関する記述【午前2 解説】
要点まとめ
- 結論:CEPはストリームデータをリアルタイムにメモリ上で処理し、条件に合致した場合に即座にアクションを実行します。
- 根拠:CEPは大量の連続するイベントを高速に分析し、複雑なパターン検出や即時対応を可能にする技術です。
- 差がつくポイント:CEPとバッチ処理やデータウェアハウスの概念を混同せず、リアルタイム処理に特化している点を理解することが重要です。
正解の理由
選択肢アは、CEPの本質である「ストリームデータをメモリ上で展開し、設定した条件に合致した場合に即座にアクションを実行する」という特徴を正確に表しています。CEPは大量のイベントをリアルタイムで処理し、複雑なイベントパターンを検出して即時に対応するため、メモリ上での高速処理が不可欠です。
よくある誤解
CEPはバッチ処理やデータウェアハウスのように大量データを後からまとめて処理する技術ではありません。リアルタイムのストリーム処理に特化している点を誤解しやすいです。
解法ステップ
- 問題文の「CEP(複合イベント処理)」の意味を確認する。
- CEPがリアルタイムでストリームデータを処理する技術であることを理解する。
- 選択肢の内容をリアルタイム処理かバッチ処理かで分類する。
- ストリームデータをメモリ上で処理し、条件に合致したらアクションを実行する選択肢を選ぶ。
- 他の選択肢がデータウェアハウスや分散トランザクション、バッチ処理に関する記述であることを確認し除外する。
選択肢別の誤答解説ステップ
- ア: 正解。CEPの特徴を正しく表現している。
- イ: ファクトテーブルや次元テーブルはデータウェアハウスの概念であり、CEPとは異なる。
- ウ: 二相コミットは分散トランザクションの制御手法であり、CEPの説明ではない。
- エ: 分散ファイルシステムでのバッチ処理はHadoopなどのバッチ処理技術であり、CEPのリアルタイム処理とは異なる。
補足コラム
CEP(Complex Event Processing)は金融取引の監視、不正検知、IoTデバイスの異常検知など、リアルタイム性が求められる分野で活用されています。Apache FlinkやApache Stormなどのストリーム処理フレームワークがCEPの実装例として知られています。
FAQ
Q: CEPとバッチ処理の違いは何ですか?
A: CEPはリアルタイムに連続するイベントを処理し即時対応する技術で、バッチ処理は大量データをまとめて後から処理します。
A: CEPはリアルタイムに連続するイベントを処理し即時対応する技術で、バッチ処理は大量データをまとめて後から処理します。
Q: CEPはどのような場面で使われますか?
A: 金融の不正検知、IoTの異常検知、ネットワーク監視など、リアルタイムでイベントを分析し対応が必要な場面で使われます。
A: 金融の不正検知、IoTの異常検知、ネットワーク監視など、リアルタイムでイベントを分析し対応が必要な場面で使われます。
関連キーワード: 複合イベント処理, ストリーム処理, リアルタイム分析, CEP, 二相コミット, データウェアハウス, バッチ処理