探索Julia(part14)--学生得分描述性统计案例
生活随笔
收集整理的這篇文章主要介紹了
探索Julia(part14)--学生得分描述性统计案例
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
學習筆記,僅供參考,有錯必糾
參考自:Julia數據科學應用–Zacharias Voulgaris;官方文檔;Julia數據處理常用包_DataFrames包測試
使用Julia-1.1.1
學生得分描述性統計案例
導入包,并導入數據:
using DataFrames using CSV mydata = CSV.read("./data/score.csv"); println(mydata)輸出:
10××4 DataFrame ││ Row ││ Column1 ││ age ││ money ││ score ││ ││ ││ String ││ Int64 ││ Int64 ││ Int64 ││ ├├──────────┼┼──────────────────┼┼──────────────┼ ┤┤ ││ 1 ││ A ││ 19 ││ 1000 ││ 99 ││ ││ 2 ││ B ││ 20 ││ 2000 ││ 100 ││ ││ 3 ││ C ││ 19 ││ 9999 ││ 50 ││ ││ 4 ││ D ││ 21 ││ 3456 ││ 69 ││ ││ 5 ││ E ││ 22 ││ 8999 ││ 95 ││ ││ 6 ││ F ││ 25 ││ 887 ││ 76 ││ ││ 7 ││ G ││ 28 ││ 2600 ││ 85 ││ ││ 8 ││ H ││ 20 ││ 8000 ││ 90 ││ ││ 9 ││ I ││ 21 ││ 2460 ││ 77 ││ ││ 10 ││ J ││ 19 ││ 1000 ││ 84 ││顯示數據框前6行:
head(mydata)輸出:
6××4 DataFrame ││ Row ││ Column1 ││ age ││ money ││ score ││ ││ ││ String ││ Int64 ││ Int64 ││ Int64 ││ ├├──────────┼┼──────────────────┼┼──────────────┼┼ ┤┤ ││ 1 ││ A ││ 19 ││ 1000 ││ 99 ││ ││ 2 ││ B ││ 20 ││ 2000 ││ 100 ││ ││ 3 ││ C ││ 19 ││ 9999 ││ 50 ││ ││ 4 ││ D ││ 21 ││ 3456 ││ 69 ││ ││ 5 ││ E ││ 22 ││ 8999 ││ 95 ││ ││ 6 ││ F ││ 25 ││ 887 ││ 76 ││顯示數據后6行:
tail(mydata)輸出:
6××4 DataFrame ││ Row ││ Column1 ││ age ││ money ││ score ││ ││ ││ String ││ Int64 ││ Int64 ││ Int64 ││ ├├──────────┼┼──────────────────┼┼──────────────┼┼ ┤┤ ││ 1 ││ E ││ 22 ││ 8999 ││ 95 ││ ││ 2 ││ F ││ 25 ││ 887 ││ 76 ││ ││ 3 ││ G ││ 28 ││ 2600 ││ 85 ││ ││ 4 ││ H ││ 20 ││ 8000 ││ 90 ││ ││ 5 ││ I ││ 21 ││ 2460 ││ 77 ││ ││ 6 ││ J ││ 19 ││ 1000 ││ 84 ││返回數據的描述性統計信息:
describe(mydata)輸出:
| Symbol | Union… | Any | Union… | Any | Union… | Nothing | DataType | |
| 1 | Column1 | A | J | 10 | String | |||
| 2 | age | 21.4 | 19 | 20.5 | 28 | Int64 | ||
| 3 | money | 4040.1 | 887 | 2530.0 | 9999 | Int64 | ||
| 4 | score | 82.5 | 50 | 84.5 | 100 | Int64 |
返回age大于22的記錄:
mydata[mydata[:age] .> 22, :]輸出:
| String | Int64 | Int64 | Int64 | |
| 1 | F | 25 | 887 | 76 |
| 2 | G | 28 | 2600 | 85 |
求age和money的平均值:
colwise(mean, mydata[[:age, :score]])輸出:
2-element Array{Float64,1}:21.482.5給mydata數據框增加一列等級(grade)列:
mydata[:grade] = ["A", "B", "C", "D", "A", "A", "B", "B", "C", "D"]刪除mydata最后兩行:
deleterows!(mydata, 9:10);按照grade給mydata數據框分組:
by(mydata, :grade, nrow)輸出:
││ Row ││ grade ││ nrow ││ ││ ││ String ││ Int64 ││ ├├──────────┼┼──────────────── ││ 1 ││ A ││ 3 ││ ││ 2 ││ B ││ 3 ││ ││ 3 ││ C ││ 1 ││ ││ 4 ││ D ││ 1 ││計算age與score之間的皮爾遜相關系數:
cor(mydata[:age], mydata[:score]) #返回值 0.019667052513438126總結
以上是生活随笔為你收集整理的探索Julia(part14)--学生得分描述性统计案例的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 腾达 W304R 无线路由器固定IP上网
- 下一篇: 机器学习(part1)--机器学习第一课