當前位置：首頁 > 编程语言 > c/c++ >内容正文

c/c++

c++ pdflib输出表格_DescrTab2包，输出SCI级别的描述统计表

發布時間：2023/12/10 c/c++ 36 豆豆

生活随笔收集整理的這篇文章主要介紹了 c++ pdflib输出表格_DescrTab2包，输出SCI级别的描述统计表小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

今天瀏覽R包，發現一個不錯的包——DescrTab2包。

看R包介紹，這個包可以繪制出版物質量級別的描述統計表。

看起來很不錯。

下面來學習下。

1. R包安裝和加載

install.packages("DescrTab2")?#?安裝包
library(DescrTab2)?#?加載包

2. 加載演示數據集

library(magrittr)?#?加載R包
dat?"Species",?"Sepal.Length")]
#?選擇iris數據集的"Species",?"Sepal.Length"變量另建一個dat數據集
dat?%<>%?mutate(animal=?c("Mammal",?"Fish")?%>%?rep(75)?%>%?factor())
#?在dat數據集中新建一個分組變量animal，水平為"Mammal", "Fish"。
dat?%<>%?mutate(food=?c("fries",?"wedges")?%>%?sample(150,?TRUE)?%>%?factor())
#?在dat數據集中新建一個分組變量food，水平為"fries", "wedges"。

dat

在數據集中，有150行數據，4個變量，其中Species、animal、food這三個變量為分組變量，Sepal.Length變量為連續變量。

3. 創建描述統計表

在DescrTab2包，使用descr()函數來創建統計描述表。

直接將數據集放在函數中即可創建簡單的統計描述表。

descr(dat)

如上圖所示，就簡單的創建了一個描述統計表。

上面結果總共輸出了4列數據。

第一列為變量，包括連續變量和分類變量。連續變量的結果有例數、均數、標準差、中位數、四分位間距、極差等；分類變量則顯示每個分類水平。

第二列變量顯示第一列各數據的數值；

第三列顯示P值；

第四列顯示P值的計算方法，分類變量為卡方擬合優度檢驗，連續變量為單樣本t檢驗。

4. 訪問表格元素

如果我們需要獲取表格中的某些統計數值，可以將descr(dat)傳遞給一個參數，這個參數是一個list列表，然后再讀取其中的數值。

# my_table是一個list列表。
my_table?#?可以使用$符號訪問my_table中的結果
my_table$variables$Sepal.Length$results$Total$mean
#?[1]?5.843333

5. 指定分組變量

上面我們是沒有添加分組變量的，現在我們在描述統計表中添加一個分組變量看看。

比如說在描述統計標準中添加Species分組變量。

descr(dat,?"Species")

如上圖所示，多組連續變量執行F檢驗，單因素方差分析。多組分類變量，也就是列聯表資料，執行皮爾遜卡方檢驗。

6. 添加組標簽

可以給上圖中的行變量和分組變量分別添加標簽，換句話說就是修改這些變量的名稱。

descr(dat,?"Species",?
??????group_labels=list(setosa?=?"setosa自定義",?
????????????????????????versicolor?=?"versicolor自定義",
????????????????????????virginica?=?"virginica自定義"),?
??????var_labels?=?list(Sepal.Length?=?"Sepal.Length標簽",
????????????????????????animal?=?"animal變量",?
????????????????????????food?=?"food標簽"))

7. 計算兩組比較的置信區間

如果分組變量是二分類變量，函數會自動計算并輸出置信區間的數值，三分類變量及以上就不會輸出了。

descr(dat,?"animal")

8. 指定統計檢驗方法

上面執行的統計檢驗方法都是默認的，也可以執行我們指定的統計檢驗方法。

更多的統計檢驗方法選擇：https://imbi-heidelberg.github.io/DescrTab2/articles/test_choice_tree_pdf.pdf

#?去掉數據集中的"Species"變量，余下的變量執行精確檢驗和非參數檢驗
descr(dat?%>%?select(-"Species"),?"animal",?
??????test_options?=?list(exact=TRUE,?nonparametric=TRUE))

分組變量為animal，Sepal.Length變量執行Mann-Whitney U test，food變量執行Boschloos test。

descr(dat?%>%?select(c("Species",?"Sepal.Length")),?"Species",
??????test_options?=?list(nonparametric=TRUE))

同上。

9. 配對設計t檢驗

在配對設計中，分組變量通常跟時間有關，比如說某一處理前后的比較。

在這種情況下，你需要設置索引變量來指定哪些不同時間點的觀察值需要進行配對。

descr(dat?%>%?mutate(animal?=?fct_recode(animal,?Before="Fish",?After="Mammal"))?
??????%>%?select(-"Species"),?"animal",
??????test_options?=?list(paired=TRUE,?indices=rep(1:75,?each=2)))

10. 設置有效數字

DescrTab2包中的每部分摘要統計信息都可以通過相應的參數進行設置。

比如說設置均數和標準差的有效數字。

descr(dat,?"Species",?
??????format_summary_stats?=?list(
????????mean=function(x)formatC(x,?digits?=?4),
????????sd?=?function(x)formatC(x,?digits?=?5))
??????)

11. 合并均值和標準差

使用format_options = list(combine_mean_sd=TRUE)即可。

descr(dat,?"Species",?format_options?=?c(combine_mean_sd=TRUE))

有興趣的可以點擊閱讀原文進行更深入的學習。

參考資料

DescrTab2包幫助文件

既往專輯

總結

以上是生活随笔為你收集整理的c++ pdflib输出表格_DescrTab2包，输出SCI级别的描述统计表的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： ubuntu mysql 防火墙_mys
下一篇： C++模板类嵌套类内部类局部类的区别