データベーススペシャリスト試験 2022年 午前217


機械学習を用いたビッグデータ分析において使用されるJupyter Labの説明はどれか。
定期的に実行するタスクを制御するための, ワークフローを管理するツールである。
データ分析を行う際に使用する, 対話型の開発環境である。(正解)
並列分散処理を行うバッチシステムである。
マスターノードをもたない分散データベースシステムである。

解説

機械学習を用いたビッグデータ分析において使用されるJupyter Labの説明はどれか。【午前2 解説】

要点まとめ

  • 結論:Jupyter Labはデータ分析に適した対話型の開発環境であり、コードの実行や可視化が容易です。
  • 根拠:Pythonなどの言語を用いてリアルタイムにコードを記述・実行し、結果を即座に確認できるため分析効率が高まります。
  • 差がつくポイント:Jupyter Labはワークフロー管理や分散処理のツールではなく、あくまで対話型ノートブック環境である点を押さえましょう。

正解の理由

選択肢イは「データ分析を行う際に使用する、対話型の開発環境である」と述べています。Jupyter Labはブラウザベースのノートブック環境で、コードの記述・実行・可視化を一体化して行えます。機械学習やビッグデータ分析の現場で広く使われており、データ探索やモデル開発に最適です。これが正解の理由です。

よくある誤解

Jupyter Labはワークフロー管理や分散処理のためのツールではありません。単なるコード実行環境ではなく、対話的に分析を進めるための統合開発環境です。

解法ステップ

  1. 問題文の「Jupyter Lab」の役割に注目する。
  2. 選択肢の内容を「ツールの機能」と「用途」で比較する。
  3. Jupyter Labが「対話型の開発環境」であることを知識として確認する。
  4. ワークフロー管理や分散処理は別のツールであることを理解し、該当しない選択肢を除外する。
  5. 「データ分析に使う対話型環境」という選択肢イを正解と判断する。

選択肢別の誤答解説

  • ア: 定期実行タスクのワークフロー管理はApache Airflowなどの役割であり、Jupyter Labとは異なります。
  • イ: 対話型の開発環境として正しい説明です。
  • ウ: 並列分散処理のバッチシステムはHadoopやSparkなどが該当し、Jupyter Labではありません。
  • エ: マスターノードを持たない分散データベースはCassandraなどの特徴であり、Jupyter Labの説明ではありません。

補足コラム

Jupyter LabはJupyter Notebookの次世代版で、複数のノートブックやターミナル、テキストエディタをタブで管理できます。PythonだけでなくRやJuliaなど多言語に対応し、機械学習の実験やデータ可視化に欠かせないツールです。

FAQ

Q: Jupyter LabとJupyter Notebookの違いは何ですか?
A: Jupyter Labは複数ファイルの同時編集やターミナル操作が可能な統合環境で、Notebookは単一ノートブックの編集に特化しています。
Q: Jupyter Labはどのような言語に対応していますか?
A: Pythonをはじめ、R、Julia、Scalaなど多くの言語カーネルを追加して利用可能です。

関連キーワード: Jupyter Lab, 対話型開発環境, 機械学習, ビッグデータ分析, ノートブック, Python, データ可視化
← 前の問題へ次の問題へ →

©︎2025 情報処理技術者試験対策アプリ