日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

databricks使用教程

發布時間:2023/12/14 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 databricks使用教程 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Databricks

databricks是使用Apache Spark?的原始創建者提供的Databricks統一分析平臺
它集成了Spark環境支持Scala、python、R語言進行開發。

databricks分商業版本社區版本,學生以及個人可以使用社區版本。社區版本只需要注冊一下賬號,則就會擁有一臺配置為6G內存Spark集群環境
Spark初學者則不再為配置開發環境而煩惱·~~~~

接下來就展示一下注冊&使用教程

然后就是郵件驗證 以及手機號驗證。這里就不截圖了。

如何使用



設置集群名稱RoneDemo,Scala版本為2.10Spark版本為2.2.1,其它參數無傷大雅默認就好,最后就是直接點擊上方的CreateCluster創建集群

稍等片刻集群便會搭建起來

接下來我們導入文件數據并進行一些數據操作

導入準備好的數據文件
表的默認指定的字段類型為String,我們可以更改其類型

最后就是編寫Spark代碼了
這里的Notebook和JPuterNoteBook、以及Zeppelin大同小異

val productsDF = spark.sql("select * from products_datasetss") productsDF.show()

執行sparkSQL進行查詢,(Ctrl + Enter 進行快速執行)其它的快捷鍵上面都有。
這種編輯器支持聯想關鍵詞,Tab鍵可以給你提示信息。

import org.apache.spark.sql.functions._ productsDF.groupBy("product_category_name").count().orderBy(desc("count")).show()

如果想進行其它語句直接編寫執行就完事了,比如說統計共多少條數據etc

That’s All of This 謝謝觀看

總結

以上是生活随笔為你收集整理的databricks使用教程的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。