日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 运维知识 > 数据库 >内容正文

数据库

Nhanes临床数据库挖掘教程1----数据库下载

發(fā)布時(shí)間:2023/12/16 数据库 190 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Nhanes临床数据库挖掘教程1----数据库下载 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

美國(guó)國(guó)家健康與營(yíng)養(yǎng)調(diào)查( NHANES, National Health and Nutrition Examination Survey)是一項(xiàng)基于人群的橫斷面調(diào)查,旨在收集有關(guān)美國(guó)家庭人口健康和營(yíng)養(yǎng)的信息。
地址為:https://wwwn.cdc.gov/nchs/nhanes/Default.aspx

數(shù)據(jù)庫(kù)有5個(gè)信息欄:DEMO:人口統(tǒng)計(jì)學(xué)DIET: 飲食EXAM: 檢查 LAB: 實(shí)驗(yàn)室指標(biāo)Q: 問(wèn)卷調(diào)查

我以論文Zhang RH, Zhou JB, Cai YH, Shu LP, Simó R, Lecube A. Non-linear association between diabetes mellitus and pulmonary function: a population-based study. Respir Res. 2020 Nov 4;21(1):292.為參照(糖尿病與肺功能之間的非線性關(guān)聯(lián):一項(xiàng)基于人群的研究)為參照,

對(duì)數(shù)據(jù)進(jìn)行下載,作者取的是2007-2012年的數(shù)據(jù),我這里取的是2007-2008的數(shù)據(jù)。下載nhanes數(shù)據(jù)庫(kù)有兩種方法,1是直接從頁(yè)面下載,2是通過(guò)R包nhanesA下載。頁(yè)面下載為:
點(diǎn)擊:Questionnaires, Datasets, and Related Documentation,再點(diǎn)擊2007-2018

然后從右邊選擇需要的數(shù)據(jù)

根據(jù)文章Non-linear association between diabetes mellitus and pulmonary function: a population-based study. Respir Res. 2020 Nov 4;21(1):292.的基線資料表列出的數(shù)據(jù)

需要找到年齡、性別、種族、體重指數(shù)、血糖、FVC等相關(guān)指標(biāo),這是一個(gè)花時(shí)間的過(guò)程,需要慢慢找,先把人口統(tǒng)計(jì)數(shù)據(jù)下載下來(lái)看看,使用haven包的函數(shù)把數(shù)據(jù)打開(kāi)

library(haven) library(nhanesA) library(tidyverse) mydata <- read_xpt("e:/nhanes/DEMO_E.XPT")


使用R包下載也是一樣的,要記住數(shù)據(jù)的標(biāo)識(shí)

mydata1<- nhanes(‘DEMO_E’)


對(duì)照變量說(shuō)明提取需要的變量

我做演示,隨便抽取一些

dat1 <- mydata %>% select(SEQN, # 序列號(hào)RIAGENDR, # 性別RIDAGEYR, # 年齡RIDRETH3, # 種族DMDMARTL, # 婚姻狀況WTINT2YR,WTMEC2YR, # 權(quán)重SDMVPSU, # psuSDMVSTRA) # strata


還需要關(guān)鍵的血糖和肺功能的指標(biāo),血糖應(yīng)該在化驗(yàn)室指標(biāo)那里,這次我們使用nhanesA包來(lái)下載
先查看血糖文檔編號(hào):GLU_E

xuetang <- nhanes('GLU_E')

數(shù)據(jù)小的話還是很快的

對(duì)數(shù)據(jù)進(jìn)行提取,序列號(hào)都要提取,等下對(duì)數(shù)據(jù)進(jìn)行合并用的

xuetang1 <- xuetang %>% select(SEQN, # 序列號(hào)LBDGLUSI, #血糖mmol表示LBDINSI, #胰島素( pmmol/L)PHAFSTHR #餐后血糖)

同理依次取糖化血紅蛋白、肺功能數(shù)據(jù)

tanghuadb <- nhanes('GHB_E') tanghuadb1<- tanghuadb %>% select(SEQN, # 序列號(hào)LBXGH #糖化血紅蛋白 feihuoliang <- nhanes('SPXRAW_E ') feihuoliang1<- feihuoliang %>% select(SEQN, # 序列號(hào)SPXNFEV1, #FEV1:第一秒用力呼氣量SPXNFVC #FVC:用力肺活量,ml(估計(jì)肺容量))

處理好數(shù)據(jù)以后把數(shù)據(jù)合并就好了

hdata<-join_all(list(dat1, xuetang1,tanghuadb1,feihuoliang1), by = 'SEQN', type = 'full')


我們把它保存起來(lái),今后的操作將在這個(gè)數(shù)據(jù)展開(kāi)

write.csv(hdata,file = "1.csv",row.names = F)


參考文獻(xiàn):

  • nhanes數(shù)據(jù)庫(kù)使用手冊(cè)
  • https://blog.csdn.net/weixin_40563866/article/details/120113073?spm=1001.2101.3001.6650.5&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7ERate-5-120113073-blog-121296965.pc_relevant_3mothn_strategy_and_data_recovery&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7ERate-5-120113073-blog-121296965.pc_relevant_3mothn_strategy_and_data_recovery&utm_relevant_index=7
  • 總結(jié)

    以上是生活随笔為你收集整理的Nhanes临床数据库挖掘教程1----数据库下载的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

    如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。