首頁 >常見問題 >hadoop三大元件是什麼

hadoop三大元件是什麼

coldplay.xixi
coldplay.xixi原創
2021-03-24 11:04:5342979瀏覽

hadoop三大元件:1、HDFS,一個高可靠、高吞吐量的分散式檔案系統;2、MapReduce,一個分散式離線的平行運算框架;3、Yarn,分散式資源管理框架。

hadoop三大元件是什麼

本文操作環境:Windows7系統,Dell G3電腦。

hadoop三大元件:

1、HDFS

一個高可靠、高吞吐量的分散式檔案系統

儲存海量資料

分散式

安全性

#副本資料

#資料是以block的方式儲存的,128M

例如:200M—128M 72M

2、MapReduce

一個分散式的離線並行計算框架

#對海量數據的處理

分散式

想法:

分而治之

大資料集分成小的資料集

每個資料集進行邏輯業務處理(map)

合併統計資料結果(reduce)

#3、Yarn

分散式資源管理架構

管理整個叢集的資源(記憶體、CPU核數)

分配調度叢集的資源

相關影片推薦:PHP程式設計從入門到精通

以上是hadoop三大元件是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn