日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

多选取值_R语言缺失值的处理——回归预测法

發布時間:2025/3/21 46 豆豆
生活随笔 收集整理的這篇文章主要介紹了 多选取值_R语言缺失值的处理——回归预测法 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
在進行數據分析的過程中,有時候拿到的數據并不完整,有很多確實數據。這就需要我們對這些缺失值進行處理。一般的處理辦法包括刪除缺失值較多的樣本和變量、使用其他樣本均值替代缺失值等方法。而利用回歸模型進行缺失值插補的方法也是十分普遍的,本文將利用一個例子進行介紹。? ?

1?讀取數據。

library(foreign) #加載程序包

stu_data_na=read.spss(file="stu_data_na.sav",to.data.frame=TRUE)?

head(stu_data_na) #查看數據前幾行

2??查看數據集缺失情況。

dim(stu_data_na) #查看數據維度

sum(complete.cases(stu_data_na)) #查看完整數據條數

library(mice) #加載mice包

md.pattern(stu_data_na) #利用函數md.pattern查看數據缺失情況

結果中的1表示無缺失,0表示有缺失。可以看到stu_data_na數據集共有26條完整數據,x1、x2兩個變量中,x1是無缺失數據的,x2有8個缺失值。

3??下面利用回歸預測方法插補變量x2的缺失值。首先,將x2完整和有缺失的數據分開。

stu_1=which(is.na(stu_data_na[,4])==TRUE) #返回stu_data_na中第4列為缺失的行,也就是x2為空的行

stu_data_com1=stu_data_na[-stu_1,] #選取x2不為空的行

head(stu_data_com1)

stu_data_fill1=stu_data_na[stu_1,]? #選取x2為空的行

head(stu_data_fill1)

4??建立x2、x1的回歸模型。

lm=lm(x2~x1,data=stu_data_com1) #其中x1為自變量,x2為因變量

summary(lm)

從結果中可以看出,回歸模型是顯著的。x1和x2具有一定的線性關系。因此利用回歸模型來填補缺失值是可行的。

5??stu_data_fill1[,4]=round(predict(lm,stu_data_fill1))? #將x2的缺失值用非缺失值的回歸模型預測結果來替代

stu_data_fill1 #查看已經補全的數據

6??stu_data_new=rbind(stu_data_com1,stu_data_fill1)#將填補了缺失值的數據與完整數據合并得到最終的數據集。

head(stu_data_new) #查看新的數據集

dim(stu_data_new?)

缺失值插補完成。

總結

以上是生活随笔為你收集整理的多选取值_R语言缺失值的处理——回归预测法的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。