hadoop三大元件:1、HDFS,一個高可靠、高吞吐量的分散式檔案系統;2、MapReduce,一個分散式離線的平行運算框架;3、Yarn,分散式資源管理框架。
本文操作環境:Windows7系統,Dell G3電腦。
hadoop三大元件:
1、HDFS
一個高可靠、高吞吐量的分散式檔案系統
儲存海量資料
分散式
安全性
#副本資料
#資料是以block的方式儲存的,128M
例如:200M—128M 72M
2、MapReduce
一個分散式的離線並行計算框架
#對海量數據的處理
分散式
想法:
分而治之
大資料集分成小的資料集
每個資料集進行邏輯業務處理(map)
合併統計資料結果(reduce)
#3、Yarn
分散式資源管理架構
管理整個叢集的資源(記憶體、CPU核數)
分配調度叢集的資源
相關影片推薦:PHP程式設計從入門到精通
以上是hadoop三大元件是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!