c++ pdflib输出表格_DescrTab2包,输出SCI级别的描述统计表
今天瀏覽R包,發現一個不錯的包——DescrTab2包。
看R包介紹,這個包可以繪制出版物質量級別的描述統計表。
看起來很不錯。
下面來學習下。
1. R包安裝和加載
install.packages("DescrTab2")?#?安裝包library(DescrTab2)?#?加載包
2. 加載演示數據集
library(magrittr)?#?加載R包dat?"Species",?"Sepal.Length")]
#?選擇iris數據集的"Species",?"Sepal.Length"變量另建一個dat數據集
dat?%<>%?mutate(animal=?c("Mammal",?"Fish")?%>%?rep(75)?%>%?factor())
#?在dat數據集中新建一個分組變量animal,水平為"Mammal", "Fish"。
dat?%<>%?mutate(food=?c("fries",?"wedges")?%>%?sample(150,?TRUE)?%>%?factor())
#?在dat數據集中新建一個分組變量food,水平為"fries", "wedges"。
dat
在數據集中,有150行數據,4個變量,其中Species、animal、food這三個變量為分組變量,Sepal.Length變量為連續變量。
3. 創建描述統計表
在DescrTab2包,使用descr()函數來創建統計描述表。
直接將數據集放在函數中即可創建簡單的統計描述表。
descr(dat)如上圖所示,就簡單的創建了一個描述統計表。
上面結果總共輸出了4列數據。
第一列為變量,包括連續變量和分類變量。連續變量的結果有例數、均數、標準差、中位數、四分位間距、極差等;分類變量則顯示每個分類水平。
第二列變量顯示第一列各數據的數值;
第三列顯示P值;
第四列顯示P值的計算方法,分類變量為卡方擬合優度檢驗,連續變量為單樣本t檢驗。
4. 訪問表格元素
如果我們需要獲取表格中的某些統計數值,可以將descr(dat)傳遞給一個參數,這個參數是一個list列表,然后再讀取其中的數值。
# my_table是一個list列表。my_table?#?可以使用$符號訪問my_table中的結果
my_table$variables$Sepal.Length$results$Total$mean
#?[1]?5.843333
5. 指定分組變量
上面我們是沒有添加分組變量的,現在我們在描述統計表中添加一個分組變量看看。
比如說在描述統計標準中添加Species分組變量。
descr(dat,?"Species")如上圖所示,多組連續變量執行F檢驗,單因素方差分析。多組分類變量,也就是列聯表資料,執行皮爾遜卡方檢驗。
6. 添加組標簽
可以給上圖中的行變量和分組變量分別添加標簽,換句話說就是修改這些變量的名稱。
descr(dat,?"Species",???????group_labels=list(setosa?=?"setosa自定義",?
????????????????????????versicolor?=?"versicolor自定義",
????????????????????????virginica?=?"virginica自定義"),?
??????var_labels?=?list(Sepal.Length?=?"Sepal.Length標簽",
????????????????????????animal?=?"animal變量",?
????????????????????????food?=?"food標簽"))
7. 計算兩組比較的置信區間
如果分組變量是二分類變量,函數會自動計算并輸出置信區間的數值,三分類變量及以上就不會輸出了。
descr(dat,?"animal")8. 指定統計檢驗方法
上面執行的統計檢驗方法都是默認的,也可以執行我們指定的統計檢驗方法。
更多的統計檢驗方法選擇:https://imbi-heidelberg.github.io/DescrTab2/articles/test_choice_tree_pdf.pdf
#?去掉數據集中的"Species"變量,余下的變量執行精確檢驗和非參數檢驗descr(dat?%>%?select(-"Species"),?"animal",?
??????test_options?=?list(exact=TRUE,?nonparametric=TRUE))
分組變量為animal,Sepal.Length變量執行Mann-Whitney U test,food變量執行Boschloos test。
descr(dat?%>%?select(c("Species",?"Sepal.Length")),?"Species",??????test_options?=?list(nonparametric=TRUE))
同上。
9. 配對設計t檢驗
在配對設計中,分組變量通常跟時間有關,比如說某一處理前后的比較。
在這種情況下,你需要設置索引變量來指定哪些不同時間點的觀察值需要進行配對。
descr(dat?%>%?mutate(animal?=?fct_recode(animal,?Before="Fish",?After="Mammal"))???????%>%?select(-"Species"),?"animal",
??????test_options?=?list(paired=TRUE,?indices=rep(1:75,?each=2)))
10. 設置有效數字
DescrTab2包中的每部分摘要統計信息都可以通過相應的參數進行設置。
比如說設置均數和標準差的有效數字。
descr(dat,?"Species",???????format_summary_stats?=?list(
????????mean=function(x)formatC(x,?digits?=?4),
????????sd?=?function(x)formatC(x,?digits?=?5))
??????)
11. 合并均值和標準差
使用format_options = list(combine_mean_sd=TRUE)即可。
descr(dat,?"Species",?format_options?=?c(combine_mean_sd=TRUE))有興趣的可以點擊閱讀原文進行更深入的學習。
參考資料
既往專輯
總結
以上是生活随笔為你收集整理的c++ pdflib输出表格_DescrTab2包,输出SCI级别的描述统计表的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ubuntu mysql 防火墙_mys
- 下一篇: C++模板类嵌套类内部类局部类的区别