日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

Spark - 大数据Big Data处理框架

發(fā)布時(shí)間:2025/6/15 编程问答 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Spark - 大数据Big Data处理框架 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

 Spark是一個(gè)針對(duì)超大數(shù)據(jù)集合的低延遲的集群分布式計(jì)算系統(tǒng),比MapReducer快40倍左右。

  Spark是hadoop的升級(jí)版本,Hadoop作為第一代產(chǎn)品使用HDFS,第二代加入了Cache來(lái)保存中間計(jì)算結(jié)果,并能適時(shí)主動(dòng)推Map/Reduce任務(wù),第三代就是Spark倡導(dǎo)的流Streaming。

  Spark兼容Hadoop的APi,能夠讀寫(xiě)Hadoop的HDFS HBASE 順序文件等。

  傳統(tǒng)Hadoop如下圖 性能慢原因有:磁盤(pán)IO 復(fù)制和序列化等等,涉及圖中的HDFS

而在Spark中,使用內(nèi)存替代了使用HDFS存儲(chǔ)中間結(jié)果:

Spark架構(gòu)圖

Spark的編程模型

彈性的分布數(shù)據(jù)集(RDD) :分布式對(duì)象集合能夠跨集群在內(nèi)存中保存。多個(gè)并行操作,失敗自動(dòng)恢復(fù)。

使用內(nèi)存集群計(jì)算, 內(nèi)存訪問(wèn)要比磁盤(pán)快得多。有Scala Java Python API,能夠從Scala和Python訪問(wèn)。

下面是一個(gè)簡(jiǎn)單的對(duì)日志log計(jì)數(shù)的代碼:


/*** SimpleJob.scala ***/

import spark.SparkContext
import SparkContext._

object SimpleJob {
def main(args: Array[String]) {

val logFile = "/var/log/syslog" // Should be some file on your system
val sc = new SparkContext("local", "Simple Job", "$YOUR_SPARK_HOME",
List("target/scala-2.9.3/simple-project_2.9.3-1.0.jar"))
val logData = sc.textFile(logFile, 2).cache()
val numAs = logData.filter(line => line.contains("a")).count()
val numBs = logData.filter(line => line.contains("b")).count()
println("Lines with a: %s, Lines with b: %s".format(numAs, numBs))
}
}

運(yùn)行原理圖:

當(dāng)進(jìn)行filter操作是,是一種transformed RDD,RDD跟蹤這種轉(zhuǎn)換,當(dāng)有數(shù)據(jù)丟失失敗時(shí),重新計(jì)算 得到這個(gè)數(shù)據(jù)。

Spark支持物流logistic表達(dá)式,如下圖:

物流表達(dá)式相比Hadoop的遍歷性能:

支持以下數(shù)據(jù)分析操作:

Spark流處理

以推流方式處理數(shù)據(jù):

Shark

Shark是基于Spark上的“Hive”,看看基于hadoop的Hive:

而Shark的結(jié)構(gòu)圖:

Hive是記錄每行記錄一個(gè)對(duì)象,而shark是每列記錄:

執(zhí)行SQL時(shí)間對(duì)比:

總結(jié)

以上是生活随笔為你收集整理的Spark - 大数据Big Data处理框架的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。