#amazon(B00ESXY9SE)
概要 †
- Apache Software Foundation のトップ レベル プロジェクト
MapReduce †
- Job Tracker
- 通常 HDFS の Name Node を兼ねる
- ジョブを Task Tracker にディスパッチする
- なるべく対象データをローカルに持つノードにディスパッチする
- Task Tracker
HDFS [Hadoop Distributed File System] †
- Hadoop 向けの分散ファイル システム
- データはブロック単位 (デフォルト 64MB) で複数ノードに分散配置される
- これを同時に読み込むことで I/O 性能を向上させる
- 各ブロックを複数ノードに重複して (デフォルトは三重) データ消失を防ぐ
- HDFS は Java で実装されており、MapReduce から独自 API でアクセスされる
Last-modified: 2020-07-08 (水) 18:10:14