Nhanes临床数据库挖掘教程1----数据库下载
美國(guó)國(guó)家健康與營(yíng)養(yǎng)調(diào)查( NHANES, National Health and Nutrition Examination Survey)是一項(xiàng)基于人群的橫斷面調(diào)查,旨在收集有關(guān)美國(guó)家庭人口健康和營(yíng)養(yǎng)的信息。
地址為:https://wwwn.cdc.gov/nchs/nhanes/Default.aspx
數(shù)據(jù)庫(kù)有5個(gè)信息欄:DEMO:人口統(tǒng)計(jì)學(xué)DIET: 飲食EXAM: 檢查 LAB: 實(shí)驗(yàn)室指標(biāo)Q: 問(wèn)卷調(diào)查
我以論文Zhang RH, Zhou JB, Cai YH, Shu LP, Simó R, Lecube A. Non-linear association between diabetes mellitus and pulmonary function: a population-based study. Respir Res. 2020 Nov 4;21(1):292.為參照(糖尿病與肺功能之間的非線性關(guān)聯(lián):一項(xiàng)基于人群的研究)為參照,
對(duì)數(shù)據(jù)進(jìn)行下載,作者取的是2007-2012年的數(shù)據(jù),我這里取的是2007-2008的數(shù)據(jù)。下載nhanes數(shù)據(jù)庫(kù)有兩種方法,1是直接從頁(yè)面下載,2是通過(guò)R包nhanesA下載。頁(yè)面下載為:
點(diǎn)擊:Questionnaires, Datasets, and Related Documentation,再點(diǎn)擊2007-2018
然后從右邊選擇需要的數(shù)據(jù)
根據(jù)文章Non-linear association between diabetes mellitus and pulmonary function: a population-based study. Respir Res. 2020 Nov 4;21(1):292.的基線資料表列出的數(shù)據(jù)
需要找到年齡、性別、種族、體重指數(shù)、血糖、FVC等相關(guān)指標(biāo),這是一個(gè)花時(shí)間的過(guò)程,需要慢慢找,先把人口統(tǒng)計(jì)數(shù)據(jù)下載下來(lái)看看,使用haven包的函數(shù)把數(shù)據(jù)打開(kāi)
使用R包下載也是一樣的,要記住數(shù)據(jù)的標(biāo)識(shí)
mydata1<- nhanes(‘DEMO_E’)
對(duì)照變量說(shuō)明提取需要的變量
我做演示,隨便抽取一些
還需要關(guān)鍵的血糖和肺功能的指標(biāo),血糖應(yīng)該在化驗(yàn)室指標(biāo)那里,這次我們使用nhanesA包來(lái)下載
先查看血糖文檔編號(hào):GLU_E
數(shù)據(jù)小的話還是很快的
對(duì)數(shù)據(jù)進(jìn)行提取,序列號(hào)都要提取,等下對(duì)數(shù)據(jù)進(jìn)行合并用的
同理依次取糖化血紅蛋白、肺功能數(shù)據(jù)
tanghuadb <- nhanes('GHB_E') tanghuadb1<- tanghuadb %>% select(SEQN, # 序列號(hào)LBXGH #糖化血紅蛋白 feihuoliang <- nhanes('SPXRAW_E ') feihuoliang1<- feihuoliang %>% select(SEQN, # 序列號(hào)SPXNFEV1, #FEV1:第一秒用力呼氣量SPXNFVC #FVC:用力肺活量,ml(估計(jì)肺容量))處理好數(shù)據(jù)以后把數(shù)據(jù)合并就好了
hdata<-join_all(list(dat1, xuetang1,tanghuadb1,feihuoliang1), by = 'SEQN', type = 'full')
我們把它保存起來(lái),今后的操作將在這個(gè)數(shù)據(jù)展開(kāi)
參考文獻(xiàn):
總結(jié)
以上是生活随笔為你收集整理的Nhanes临床数据库挖掘教程1----数据库下载的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 浅析json_encode
- 下一篇: linux cmake编译源码,linu