応用情報技術者 2017年 秋期 午前2 問19
問題文
Hadoopの説明はどれか。
選択肢
ア:Java EE 仕様に準拠したアプリケーションサーバ
イ:LinuxやWindows などの様々なプラットフォーム上で動作する Webサーバ
ウ:機能の豊富さが特徴の RDBMS
エ:大規模なデータを分散処理するためのソフトウェアライブラリ(正解)
Hadoopの説明はどれか。【午前2 解説】
要点まとめ
- 結論:Hadoopは大規模データの分散処理を行うためのソフトウェアライブラリです。
- 根拠:Hadoopは複数のコンピュータにデータを分散し、並列処理で高速に処理するフレームワークとして設計されています。
- 差がつくポイント:Hadoopは単なるサーバやRDBMSではなく、ビッグデータ処理に特化した分散処理基盤である点を理解しましょう。
正解の理由
選択肢エは「大規模なデータを分散処理するためのソフトウェアライブラリ」とあり、Hadoopの本質を正確に表しています。HadoopはHDFS(分散ファイルシステム)とMapReduce(分散処理モデル)を中心に構成され、大量のデータを複数ノードで効率的に処理するためのフレームワークです。
よくある誤解
Hadoopを単なるWebサーバやRDBMSと混同しやすいですが、これらは異なる役割のソフトウェアです。Hadoopは分散処理に特化しています。
解法ステップ
- Hadoopのキーワード「分散処理」「大規模データ」を確認する。
- 選択肢の説明とHadoopの特徴を照合する。
- WebサーバやRDBMSの説明とHadoopの違いを理解する。
- 「分散処理のためのソフトウェアライブラリ」という表現が最も適切な選択肢を選ぶ。
選択肢別の誤答解説
- ア: Java EE仕様のアプリケーションサーバはHadoopではなく、例えばGlassFishやWildFlyなどが該当します。
- イ: LinuxやWindowsで動作するWebサーバはApache HTTP ServerやIISであり、Hadoopとは異なります。
- ウ: 機能豊富なRDBMSはOracleやMySQLなどで、HadoopはRDBMSではありません。
- エ: 大規模なデータを分散処理するためのソフトウェアライブラリであり、Hadoopの正しい説明です。
補足コラム
Hadoopはオープンソースのビッグデータ処理基盤として広く利用されており、HDFSによる耐障害性の高い分散ストレージとMapReduceによる並列処理が特徴です。近年はSparkなどの新しい分散処理エンジンも注目されていますが、Hadoopはその基盤技術として重要です。
FAQ
Q: Hadoopはどのような用途で使われますか?
A: 大量のログ解析や機械学習の前処理など、大規模データの高速処理に使われます。
A: 大量のログ解析や機械学習の前処理など、大規模データの高速処理に使われます。
Q: HadoopはどのOSで動作しますか?
A: 主にLinux環境で使われますが、Windowsでも動作可能です。
A: 主にLinux環境で使われますが、Windowsでも動作可能です。
関連キーワード: Hadoop, 分散処理、ビッグデータ、HDFS, MapReduce, ソフトウェアライブラリ

\ せっかくなら /
応用情報技術者を
クイズ形式で学習しませんか?
クイズ画面へ遷移する→
すぐに利用可能!

