spark-sql 方差和标准差
生活随笔
收集整理的這篇文章主要介紹了
spark-sql 方差和标准差
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
運(yùn)行環(huán)境spark-shell
val p=spark.read.json("file:///root/spark-2.1.1-bin-hadoop2.7/examples/src/main/resources/people.json")p.show方差和標(biāo)準(zhǔn)差
1. 求age平均值
2.udf的函數(shù)
def subtraction2(variable:String):Double={ (variable.toDouble-avgvule)*(variable.toDouble-avgvule)}3.注冊(cè)u(píng)fd函數(shù)
spark.udf.register("square",subtraction2 _)4.方差運(yùn)行
sql("select sum(square(age))/count(square(age)) as variance from people").createTempView("variance")5.標(biāo)準(zhǔn)差
sql("select sqrt(*) from variance").show最近發(fā)現(xiàn) spark sql 自帶了方差和標(biāo)準(zhǔn)差的內(nèi)置函數(shù),自己重新卻重寫了一次。
總結(jié)
以上是生活随笔為你收集整理的spark-sql 方差和标准差的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据存储之SwiftJSON
- 下一篇: 手把手教你设计数字钟(基于protues