Hadoop之Hadoop基础知识
Hadoop之Hadoop基礎(chǔ)知識(shí)復(fù)習(xí)
目錄
1. Hadoop是什么
1)Hadoop是一個(gè)由Apache基金會(huì)所開(kāi)發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。
2)主要解決的是海量數(shù)據(jù)的存儲(chǔ)和海量數(shù)據(jù)的分析計(jì)算問(wèn)題。
3)廣義上來(lái)說(shuō),HADOOP通常是指一個(gè)更廣泛的概念——HADOOP生態(tài)圈。
2. Hadoop的優(yōu)勢(shì)
1)高可靠性:Hadoop底層維護(hù)多個(gè)數(shù)據(jù)副本,所以即使Hadoop某個(gè)計(jì)算元素或存儲(chǔ)出現(xiàn)故障,也不會(huì)導(dǎo)致數(shù)據(jù)的丟失。
2)高擴(kuò)展性:在集群間分配任務(wù)數(shù)據(jù),可方便的擴(kuò)展數(shù)以千計(jì)的節(jié)點(diǎn)。
3)高效性:在MapReduce的思想下,Hadoop是并行工作的,以加快任務(wù)處理速度。
4)高容錯(cuò)性:能夠自動(dòng)將失敗的任務(wù)重新分配。
3. Hadoop組成
在Hadoop1.x時(shí)代,Hadoop中的MapReduce同時(shí)處理業(yè)務(wù)邏輯運(yùn)算和資源的調(diào)度,耦合性較大,在Hadoop2.x時(shí)代,增加了Yarn。Yarn只負(fù)責(zé)資源的調(diào)度,MapReduce只負(fù)責(zé)運(yùn)算,如下圖所示:
HDFS架構(gòu)概述
YARN架構(gòu)概述
MapReduce架構(gòu)概述
MapReduce將計(jì)算過(guò)程分為兩個(gè)階段:Map和Reduce,如下圖所示
1)Map階段并行處理輸入數(shù)據(jù)
2)Reduce階段對(duì)Map結(jié)果進(jìn)行匯總
4. 大數(shù)據(jù)技術(shù)生態(tài)體系
總結(jié)
以上是生活随笔為你收集整理的Hadoop之Hadoop基础知识的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 操作系统之常考面试题
- 下一篇: Hadoop之Hadoop基础知识面试复