精选| 2020年12月R新包推荐(第49期)
翻譯:黃小偉,資深大數據分析從業者。目前就職杭州有贊數據分析團隊!
知乎專欄:中國R語言社區 |11000+關注
知乎圈子:數據分析圈|10000+加入
2020年12月,123個R新包收錄于CRAN(2020年11月份收錄292個),累計收錄18,010個R包!此次選摘了40個R包(九個類別),分布結構如下:
以下是本期(總第49期)R新包的核心功能介紹:
一.?計算方法
1.?FKF.SP: 提供了一種快速靈活的Kalman濾波實現方法,利用序列處理,然后通過最大似然估計進行有效的參數估計.
2. rminizinc:?提供與MiniZinc的接口,它是一種免費的開源約束建模語言,當可以根據任意約束對問題進行建模時,該語言用于從大量候選對象中識別可行的解決方案.
3.?nosiySBM: 實現了變分期望最大化算法,將一個噪聲隨機塊模型擬合到一個觀察到的稠密圖上,并進行節點聚類.
4.?qsimulatR: 實現最多具有24個量子位的量子計算機模擬器,該模擬器提供許多通用門,并允許用戶定義通用單個量子位門和通用受控單個量子位門。該軟件包支持繪制電路并將電路導出到Qiskit,這是一個Python軟件包,可用于在IBM的Quantum硬件上運行.
二. 數據
1.?eyedata: 提供來自倫敦Moorfields眼科醫院治療患者的匿名真實生活開源數據集.
2. rgugik: 自動化開放數據采集,包括來自波蘭大地測量和制圖總部的光柵和矢量數據.
3.?readrba: 提供工具從澳大利亞儲備銀行的數據中下載當前和歷史統計表和預測,這些數據包括廣泛的澳大利亞宏觀經濟和金融時間序列.
4.?threesixtygiving: 支持對360Giving(英國慈善捐贈數據庫)公開數據的訪問.
5.?USgas: 支持與美國能源信息管理局的鏈接,提供縣級天然氣需求和概述.
三.基因組學
1.?polyqtlR: 提供多倍體雙親F1群體數量性狀基因座(QTL)分析的功能.
2. RPPASPACE: 提供用于分析反相蛋白質陣列(RPPA)的工具,該陣列也稱為組織裂解物陣列或簡單裂解物陣列.
3. RVA: 在RNAseq分析中,支持下游可視化和路徑分析的自動化實現.
四. 機器學習
1. comparator: 實現用于比較字符串、序列和數字向量的函數,用于集群和記錄鏈接應用程序。它包括用于比較序列/字符串的廣義編輯距離、用于標記集模糊比較的Monge-Elkan相似性和用于比較數值向量的L-p距離.
2. DoubleML: 針對部分線性回歸模型、線性工具變量回歸模型、交互回歸模型和交互工具變量回歸模型,實施Chernozhukov等人(2018)的雙/基于Debiase的機器學習框架.
3.?functClust: 支持將組成交互式系統的組件聚類,以實現一個或多個集體的系統性能.
4.?mlpack: 實現與mlpack C ++機器學習庫的綁定.
5.?RFCCA: 使用典型相關分析實現隨機林,這是一種根據主題相關協變量估計兩組變量之間典型相關的方法.
五.?醫藥學
1. babsim.hospital: 實現了醫院資源規劃的離散事件仿真模型。受當前COVID-19大流行中衛生保健機構所面臨的挑戰的影響,衛生部門可以利用它來預測對重癥監護病床、呼吸機和人力資源的需求.
2.?healthyR:?提供一個醫院數據分析工作流工具,包括建模工具和用于查看常見行政醫院數據的工具,如平均住院時間、再入院率、按服務項目列出的平均凈付款額等.
3.?metaSurvival: 提供評估匯總生存曲線中的信息并測試層間異質性的功能.
六. 科學
1. cmcR: 實現了Song(2013)提出的用于彈殼識別的全等匹配單元方法,以及Tong等人提出的方法的擴展.
2. envi: 提供使用發生數據、協變量、基于核密度的估計和空間相對風險的環境插值工具。有關空間相對風險的詳細信息,請參見Davies et al.(2018),Bithell(1990)用于核密度估計,Bithell(1991)用于相對風險估計.
3.?PAMpal: 提供加載和處理被動聲學數據的工具,包括讀取Pamguard數據、處理和導出數據的功能.
七. 統計學
1. bpcs: 使用Stan實現成對比較數據分析模型,包括隨機效應、預測因子的廣義模型和Bradley-Terry模型的順序效應貝葉斯版本.
2. brolgar: 提供一個工具框架,用于總結、可視化和探索縱向數據,包括計算特征和匯總統計數據以及對單個序列進行采樣的方法.
3. MASSExtra: 為MASS包提供增強、擴展和添加(例如Gramm-Schmidt正交化和廣義特征值問題),并提供方便的默認設置和用戶界面.
4.?motifr: 提供用于多級網絡中的主題分析的工具,以可視化多級網絡,對多級網絡主題進行計數并將主題出現與基準模型進行比較.
5. OptCirClust: 基于優化框架聚類的核心算法,為循環、周期或框架數據提供快速(運行時=O(K N log^2 N)、最佳、可重復的聚類算法.
6.?pflamelet: 提供計算持久性Flamelet的函數,這是一種用于探索Padellini和Brutti(2017)中介紹的尺度空間族拓撲不變量的統計工具.
7.?PRDA: 執行Gelman&Carlin(2014)提出的設計分析,將功率分析評估與其他推斷風險相結合.
8.?puls: 通過提供一種使用曲線的子區域信息對功能數據進行聚類的方法來補充fda和fda.use包.
八. 應用工具
1. coro: 提供協同程序,這是一系列可以在以后掛起和恢復的函數。這包括異步函數(等待)和生成器(產生).
2. dataReporter: 提供用于自動生成可自定義數據報告的函數,該報告顯示數據集中的潛在錯誤.
3.?DescrTab2: 提供為連續變量和分類變量創建描述性統計表的函數.
4.?libr: 提供創建數據庫、生成數據字典和模擬數據步驟的功能.
5.?outsider: 允許用戶通過使用Docker和聯機存儲庫在R中安裝和運行外部命令行程序.
6.?srcr: 提供一個簡單的工具,用于從源代碼中提取連接詳細信息(包括機密憑據),并管理常用數據庫連接的配置.
九. 數據可視化
1.?ComplexUpset: 提供創建翻轉圖的函數,該函數提供了對集合重疊可視化的維恩圖的改進.
2. nmaplateplot: 提供網絡元分析(NMA)結果的圖形顯示,該結果適用于優勢比、風險比、風險差異和標準化平均差異等結果.
3.?PantaRhei: 提供產生Sankey圖的功能,這些圖用于可視化保守物質通過系統的流動.
說明:限于個人水平,錯誤之處難免,煩請批評指正,共同交流~
原文:https://rviews.rstudio.com/2021/01/29/dec-2020-top-40-new-cran-packages/
北京大學出版社《R語言數據分析與可視化從入門到精通》
學R語言、練語法、取數據、預處理、可視化、交互圖、重實戰……一書在手,精通R語言數據分析與可視化!
往期精品(點擊圖片直達文字對應教程)
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
?
(請備注姓名-學校/企業-職務等)
總結
以上是生活随笔為你收集整理的精选| 2020年12月R新包推荐(第49期)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 内存小还免费,Adobe Acrobat
- 下一篇: 你的DNA都会玩摇滚了,你却还是个音痴