日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Spark2.x 与 Spark1.x 关系

發布時間:2025/3/21 编程问答 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Spark2.x 与 Spark1.x 关系 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Spark2.x 引入了很多優秀特性,性能上有較大提升,API 更易用。在“編程統一”方面非常驚艷,實現了離線計算和流計算 API 的統一,實現了 Spark sql 和 Hive Sql 操作 API 的統一。Spark 2.x 基本上是基于 Spark 1.x 進行了更多的功能和模塊的擴展,及性能的提升。

Spark2.x 新特性

1). Spark Core/SQL

在內存和CPU使用方面進一步優化Spark引擎性能(鎢絲計劃)。支持SQL 2003標準 ,支持子查詢,對常用的SQL操作和DataFrame,性能有2-10倍的提升。

2). sparksession

Spark2.0 中引入了 SparkSession 的概念,它為用戶提供了一個統一的切入點來使用 Spark 的各項功能,統一了舊的SQLContext與HiveContext。用戶不但可以使用 DataFrame 和Dataset 的各種 API,學習 Spark2 的難度也會大大降低。

3). 統一 DataFrames 和 Datasets 的 API。

它們都是提供給用戶使用,包括各類操作接口的 API,1.3 版本引入 DataFrame,1.6版本引入Dataset,在 spark 2.0 中,把 dataframes 當作是一種特殊的 datasets,dataframes = datasets[row],把兩者統一為datasets。

4). Structured Streaming

Spark Streaming基于Spark SQL(DataFrame / Dataset )構建了high-level API,使得Spark Streaming充分受益Spark SQL的易用性和性能提升。

5). 其它特性

mllib 里的計算用 DataFrame-based API 代替以前的 RDD 計算邏輯,提供更多的 R 語言算法,默認使用 Scala 2.11 編譯與運行。

?

參考資料:

https://www.shiyanlou.com/courses/809/labs/2835/document

轉載于:https://www.cnblogs.com/libin2015/p/7250046.html

總結

以上是生活随笔為你收集整理的Spark2.x 与 Spark1.x 关系的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。