応用情報技術者 2021年 春期 午前2 問20
問題文
Hadoopの説明はどれか。
選択肢
ア:Java EE 仕様に準拠したアプリケーションサーバ
イ:Linux や Windows などの様々なプラットフォーム上で動作する Webサーバ
ウ:機能の豊富さが特徴の RDBMS
エ:大規模なデータセットを分散処理するためのソフトウェアライブラリ(正解)
Hadoopの説明はどれか【午前2 解説】
要点まとめ
- 結論:Hadoopは大規模データを分散処理するためのソフトウェアライブラリである。
- 根拠:Hadoopは複数のコンピュータにデータを分散し、効率的に処理するためのフレームワークとして設計されている。
- 差がつくポイント:Hadoopは単なるサーバやRDBMSではなく、ビッグデータ処理に特化した分散処理基盤である点を理解すること。
正解の理由
選択肢エは「大規模なデータセットを分散処理するためのソフトウェアライブラリ」とあり、Hadoopの本質を正確に表しています。HadoopはHDFS(分散ファイルシステム)とMapReduce(分散処理モデル)を中心に、大量のデータを複数ノードで効率的に処理するためのオープンソースフレームワークです。
よくある誤解
Hadoopを単なるWebサーバやRDBMSと混同しやすいですが、Hadoopはデータの保存と処理を分散環境で行うためのシステムであり、アプリケーションサーバやWebサーバとは役割が異なります。
解法ステップ
- Hadoopのキーワード「分散処理」「大規模データ」を確認する。
- 各選択肢の説明とHadoopの特徴を照合する。
- アはJava EEアプリケーションサーバ、イはWebサーバ、ウはRDBMSでありHadoopの説明と異なる。
- エがHadoopの定義に合致するため正解と判断する。
選択肢別の誤答解説
- ア: Java EE仕様のアプリケーションサーバはHadoopとは無関係で、Java EEのWebアプリケーション実行環境。
- イ: WebサーバはHTTPリクエストを処理するサーバであり、Hadoopの分散処理機能とは異なる。
- ウ: RDBMSは関係データベース管理システムで、Hadoopの分散ファイルシステムやMapReduceとは別物。
- エ: 正解。Hadoopの特徴を正しく表している。
補足コラム
HadoopはGoogleのMapReduce論文を基に開発され、HDFSでデータを分散保存し、MapReduceで並列処理を行います。近年はSparkなどの高速処理エンジンと組み合わせて利用されることも多いです。
FAQ
Q: Hadoopはどのような用途で使われますか?
A: 大量のログ解析や機械学習の前処理など、大規模データの分散処理に利用されます。
A: 大量のログ解析や機械学習の前処理など、大規模データの分散処理に利用されます。
Q: HadoopはどのOSで動作しますか?
A: 主にLinux環境で動作しますが、Windowsでも動作可能です。
A: 主にLinux環境で動作しますが、Windowsでも動作可能です。
関連キーワード: Hadoop, 分散処理、ビッグデータ、HDFS, MapReduce, オープンソース

\ せっかくなら /
応用情報技術者を
クイズ形式で学習しませんか?
クイズ画面へ遷移する→
すぐに利用可能!

