當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

探索Julia(part14)--学生得分描述性统计案例

發布時間：2023/12/19 编程问答 26 豆豆

生活随笔收集整理的這篇文章主要介紹了探索Julia(part14)--学生得分描述性统计案例小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

學習筆記，僅供參考，有錯必糾

參考自：Julia數據科學應用–Zacharias Voulgaris；官方文檔；Julia數據處理常用包_DataFrames包測試

使用Julia-1.1.1

學生得分描述性統計案例

導入包，并導入數據：

using DataFrames using CSV mydata = CSV.read("./data/score.csv"); println(mydata)

輸出：

10××4 DataFrame ││ Row ││ Column1 ││ age ││ money ││ score ││ ││ ││ String ││ Int64 ││ Int64 ││ Int64 ││ ├├──────────┼┼──────────────────┼┼──────────────┼ ┤┤ ││ 1 ││ A ││ 19 ││ 1000 ││ 99 ││ ││ 2 ││ B ││ 20 ││ 2000 ││ 100 ││ ││ 3 ││ C ││ 19 ││ 9999 ││ 50 ││ ││ 4 ││ D ││ 21 ││ 3456 ││ 69 ││ ││ 5 ││ E ││ 22 ││ 8999 ││ 95 ││ ││ 6 ││ F ││ 25 ││ 887 ││ 76 ││ ││ 7 ││ G ││ 28 ││ 2600 ││ 85 ││ ││ 8 ││ H ││ 20 ││ 8000 ││ 90 ││ ││ 9 ││ I ││ 21 ││ 2460 ││ 77 ││ ││ 10 ││ J ││ 19 ││ 1000 ││ 84 ││

顯示數據框前6行：

head(mydata)

輸出：

6××4 DataFrame ││ Row ││ Column1 ││ age ││ money ││ score ││ ││ ││ String ││ Int64 ││ Int64 ││ Int64 ││ ├├──────────┼┼──────────────────┼┼──────────────┼┼ ┤┤ ││ 1 ││ A ││ 19 ││ 1000 ││ 99 ││ ││ 2 ││ B ││ 20 ││ 2000 ││ 100 ││ ││ 3 ││ C ││ 19 ││ 9999 ││ 50 ││ ││ 4 ││ D ││ 21 ││ 3456 ││ 69 ││ ││ 5 ││ E ││ 22 ││ 8999 ││ 95 ││ ││ 6 ││ F ││ 25 ││ 887 ││ 76 ││

顯示數據后6行：

tail(mydata)

輸出：

6××4 DataFrame ││ Row ││ Column1 ││ age ││ money ││ score ││ ││ ││ String ││ Int64 ││ Int64 ││ Int64 ││ ├├──────────┼┼──────────────────┼┼──────────────┼┼ ┤┤ ││ 1 ││ E ││ 22 ││ 8999 ││ 95 ││ ││ 2 ││ F ││ 25 ││ 887 ││ 76 ││ ││ 3 ││ G ││ 28 ││ 2600 ││ 85 ││ ││ 4 ││ H ││ 20 ││ 8000 ││ 90 ││ ││ 5 ││ I ││ 21 ││ 2460 ││ 77 ││ ││ 6 ││ J ││ 19 ││ 1000 ││ 84 ││

返回數據的描述性統計信息：

describe(mydata)

輸出：

variablemeanminmedianmaxnuniquenmissingeltype

	Symbol	Union…	Any	Union…	Any	Union…	Nothing	DataType
1	Column1		A		J	10		String
2	age	21.4	19	20.5	28			Int64
3	money	4040.1	887	2530.0	9999			Int64
4	score	82.5	50	84.5	100			Int64

返回age大于22的記錄：

mydata[mydata[:age] .> 22, :]

輸出：

Column1agemoneyscore

	String	Int64	Int64	Int64
1	F	25	887	76
2	G	28	2600	85

求age和money的平均值：

colwise(mean, mydata[[:age, :score]])

輸出：

2-element Array{Float64,1}:21.482.5

給mydata數據框增加一列等級(grade)列：

mydata[:grade] = ["A", "B", "C", "D", "A", "A", "B", "B", "C", "D"]

刪除mydata最后兩行：

deleterows!(mydata, 9:10);

按照grade給mydata數據框分組：

by(mydata, :grade, nrow)

輸出：

││ Row ││ grade ││ nrow ││ ││ ││ String ││ Int64 ││ ├├──────────┼┼──────────────── ││ 1 ││ A ││ 3 ││ ││ 2 ││ B ││ 3 ││ ││ 3 ││ C ││ 1 ││ ││ 4 ││ D ││ 1 ││

計算age與score之間的皮爾遜相關系數：

cor(mydata[:age], mydata[:score]) #返回值 0.019667052513438126

總結

以上是生活随笔為你收集整理的探索Julia(part14)--学生得分描述性统计案例的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：腾达 W304R 无线路由器固定IP上网
下一篇：机器学习(part1)--机器学习第一课