日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

gwas snp 和_GWAS分析中:为何有些SNP效应值大却不显著?

發布時間:2024/10/14 编程问答 40 豆豆
生活随笔 收集整理的這篇文章主要介紹了 gwas snp 和_GWAS分析中:为何有些SNP效应值大却不显著? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

之前的GWAS分析中,我查看結果時有過這個疑問,隨著不斷的學習理解,我已經知道了為什么,這里將我思考的結果分享一下。

1. 錯誤的理解

某一個SNP,效應值(Effect)越大,就越顯著???

「事實上:」 效應值和顯著性是兩碼事!

2. 用代碼說話

GWAS分析中,最簡單的就是一般線性模型(GLM),而GLM模型進行的GWAS分析中,用R語言實現的代碼如下:

mod_M7 = lm(phe.V3 ~ M7_1,data=dd) summary(mod_M7)

「結果:」

這個里面:

  • Estimate就是效應值:3.3265,這個就是SNP M9的效應值
  • Pr就是P值:0.0272,這個就是SNP M9的P值

可以看到,這兩個是兩個指標,他們之間沒有必然的聯系。

3. GWAS分析的思路

  • 1,將SNP的分型轉化為0, 1, 2的形式,主效純合(major)編碼為0,雜合編碼為1,次等位純合編碼為2
  • 2,x變量為0,1,2的數值,y變量為性狀表型值
  • 3,對x和y做回歸分析y ~ a*x + b,a為效應值,a是否顯著的P值,為SNP的P值

4. SNP效應值很大,卻不顯著

# SNP 分型 set.seed(666) x = rep(c(0,1,2),3) x# 模擬表型值 y = 12*x + rnorm(9)*10# 作回歸分析 mod = lm(y ~ x) summary(mod)# 作圖 dd = data.frame(x,y) dd ggplot(dd,aes(x=x,y=y)) + geom_point() + stat_smooth(method='lm',formula = y~x,colour='red')

看一下這個數據:

> ddx y 1 0 7.533110 2 1 32.143547 3 2 20.448655 4 0 20.281678 5 1 -10.168745 6 2 31.583962 7 0 -13.061853 8 1 3.974804 9 2 6.077592

計算每種分型對應的表型平均值:

> # 平均值 > aggregate(y~x,data = dd,mean)x y 1 0 4.917645 2 1 8.649869 3 2 19.370070

可以看出,分型0對應的是4.9,最小,分型1對應的是8.6,分型2對應的是19.3,趨勢是比較明顯的。

「看一下回歸分析的結果:」

> # 作回歸分析 > mod = lm(y ~ x) > summary(mod)Call: lm(formula = y ~ x)Residuals:Min 1Q Median 3Q Max -21.148 -12.128 2.243 13.379 21.164 Coefficients:Estimate Std. Error t value Pr(>|t|) (Intercept) 3.753 8.558 0.439 0.674 x 7.226 6.629 1.090 0.312Residual standard error: 16.24 on 7 degrees of freedom Multiple R-squared: 0.1451, Adjusted R-squared: 0.023 F-statistic: 1.188 on 1 and 7 DF, p-value: 0.3118

可以看出,效應值為7.226,但是P值卻是0.312,不顯著。

所以說,效應值大的SNP位點,不一定是顯著的。

「為何會出現這種情況呢?」 我們畫一個散點圖看一下分布情況:

library(ggplot2) ggplot(dd,aes(x=x,y=y)) + geom_point() + stat_smooth(method='lm',formula = y~x,colour='red')

可以看到,分型為1的表型值,有一個非常高,達到了31,相當于在進行T檢驗時,標準誤se比較高,導致P值較大,不顯著。

5. SNP效應值很小,卻極顯著

我們還模擬數據:

# SNP 分型 set.seed(666) x = rep(c(0,1,2),3) x# 模擬表型值 y = 0.1*x + rnorm(9)*0.01# 作回歸分析 mod = lm(y ~ x) summary(mod)# 作圖 dd = data.frame(x,y) dd library(ggplot2) ggplot(dd,aes(x=x,y=y)) + geom_point() + stat_smooth(method='lm',formula = y~x,colour='red')# 平均值 aggregate(y~x,data = dd,mean)

「模擬的數據如下:」

> ddx y 1 0 0.00753311 2 1 0.12014355 3 2 0.19644866 4 0 0.02028168 5 1 0.07783126 6 2 0.20758396 7 0 -0.01306185 8 1 0.09197480 9 2 0.18207759

計算每種分型對應的表型平均值:

> aggregate(y~x,data = dd,mean)x y 1 0 0.004917645 2 1 0.096649869 3 2 0.195370070

可以看到,三種基因型,階梯感也很強。

「回歸分析結果:」

> # 作回歸分析 > mod = lm(y ~ x) > summary(mod)Call: lm(formula = y ~ x)Residuals:Min 1Q Median 3Q Max -0.021148 -0.012128 0.002243 0.013379 0.021164 Coefficients:Estimate Std. Error t value Pr(>|t|) (Intercept) 0.003753 0.008558 0.439 0.674 x 0.095226 0.006629 14.365 1.89e-06 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Residual standard error: 0.01624 on 7 degrees of freedom Multiple R-squared: 0.9672, Adjusted R-squared: 0.9625 F-statistic: 206.4 on 1 and 7 DF, p-value: 1.886e-06

可以看出: SNP的效應值:0.095 SNP的P值:1.89e-6(達到極顯著水平)

「作圖看一下:」

雖然回歸系數(SNP效應值很小),但是每個分型對應的表型值相差不多,組內變異(同一種基因型的表型值)遠遠小于組間變異(不同SNP分型對應的表型值),導致進行T檢驗時,達到極顯著水平。

這也就出現了SNP的效應值很低,但是卻達到了極顯著水平。

6. 從生物學水平如何解釋?

可以這樣理解, 「SNP效應值小但顯著的位點:」 屬于對表型值是有直接影響的,但是影響的效應較小,但是比較穩定,所以才表現出極顯著,而效應小

「SNP效應大但不顯著的位點:」 有可能SNP是有大效應的,但是容易受到環境影響,或者由于群體的結構(某個群體內聚集),或者由于某些異常值導致這種情況。也有可能本身就是不顯著的。

「林子大了,什么鳥都有!」 畢竟SNP都是上萬,上十萬,上百萬的量。而表型值都是上百,上千,很少達到上萬的,這就存在很多種情況,導致有些SNP效應值很大,但是不顯著,有些SNP效應值很小,但是極顯著。這里需要區分對待一下。

如果有很多SNP出現這種情況,必然有妖,查看是否過濾了maf,是否對基因型進行了填充,是否表型數據有異常,如果都檢查過了,出現這種情況,我們也只能說:it happens,有時候會出現,這不是不可解釋的現象,否者我寫這篇文章的意義在哪里呢?除了灌水,還有炫技啊

7. GWAS系列相關

筆記 | GWAS 操作流程1:下載數據

筆記 GWAS 操作流程2-1:缺失質控

筆記 | GWAS 操作流程2-2:性別質控

筆記 GWAS 操作流程2-3:最小等位基因頻率

筆記 GWAS 操作流程2-4:哈溫平衡檢驗

筆記 GWAS 操作流程2-5:雜合率檢驗

筆記 GWAS 操作流程2-6:去掉親緣關系近的個體

筆記 GWAS 操作流程3:plink關聯分析

筆記 | GWAS 操作流程4-1:LM模型assoc

筆記 | GWAS 操作流程4-2:LM模型linear+數值協變量

筆記 | GWAS 操作流程4-3:LM模型+因子協變量

筆記 | GWAS 操作流程4-4:LM模型+數值+因子協變量

筆記 | GWAS 操作流程4-5:LM模型+數值+因子+PCA協變量

筆記 GWAS 操作流程5-1:根紅苗正的GWAS分析軟件:GEMMA

筆記 GWAS 操作流程5-2:利用GEMMA軟件進行LMM+PCA+協變量

總結

以上是生活随笔為你收集整理的gwas snp 和_GWAS分析中:为何有些SNP效应值大却不显著?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 天天宗合 | www.久久.com| 亚洲第八页 | 日韩123区| 亚洲咪咪 | 在线视频在线观看 | 男人天堂2014| 欧美伦理一区 | 欧美孕妇性xx | 日本三级理论片 | 黑人操欧美人 | 在线观看视频99 | 色播激情网| 毛利兰被扒开腿做同人漫画 | 91精品国产99久久久久久红楼 | 一级二级av | 午夜理伦三级理论 | 久久国产香蕉视频 | 欧洲黄色网| 一二三区在线视频 | 亚洲第一av在线 | 女同视频网站 | 欧美久久久精品 | 国产一级淫片a视频免费观看 | 法国伦理少妇愉情 | 国产鲁鲁视频在线观看特色 | 久久午夜鲁丝片 | 色七七在线 | 久久婷婷网站 | 国产高清免费在线播放 | 福利电影在线播放 | 三上悠亚影音先锋 | 人妻洗澡被强公日日澡 | 蜜桃成人无码区免费视频网站 | 亚洲天堂视频在线播放 | 成人在线观看a | 日韩毛片一区 | 影音先锋制服 | 男人天堂中文字幕 | 国产在线网址 | 欧美日本在线 | 国产高清视频在线免费观看 | 欧美精品在线一区二区三区 | www久久久久久 | 国产一级视频在线观看 | 中文字幕日韩欧美一区二区三区 | 熟妇人妻精品一区二区三区视频 | 老司机深夜福利在线观看 | 日韩视频国产 | 夜夜躁日日躁狠狠久久av | 久久人人爽人人爽 | 国产精品无码专区 | 影音先锋二区 | 日韩免费视频一区二区 | 免费观看黄色的网站 | 成人免费一区二区 | 日本三级视频在线 | 精品乱码一区二区三区四区 | 九九精品免费视频 | 日韩www| 一区二区三区四区免费视频 | 免费亚洲视频 | 国产一区二区三区精品愉拍 | 亚洲国产91 | 日本成人动漫在线观看 | 欧美极品喷水 | 久久久香蕉 | 91国视频| 性大毛片视频 | 啪啪啪一区二区 | 欧美二区在线观看 | 久久久久99精品成人片直播 | 亚洲免费av电影 | 艹少妇视频| 天天操天天插 | 亚洲福利专区 | 欧美性猛交xxxxx水多 | 一本一道久久a久久综合蜜桃 | a一级免费视频 | 欧美日韩人妻精品一区二区三区 | 久免费一级suv好看的国产 | 久一国产 | 欧类av怡春院 | 最近中文字幕在线mv视频在线 | 亚洲精品一区在线观看 | 精品人妻一区二区三区日产乱码卜 | 久久精品国产99精品国产亚洲性色 | 国产在线激情视频 | 亚洲在线免费观看 | 特种兵之深入敌后高清全集免费观看 | 亚洲一区二区自偷自拍 | 免费av网址在线观看 | 夜夜爽夜夜叫夜夜高潮漏水 | 自拍偷拍精品视频 | 爱情岛论坛自拍亚洲品质极速最新章 | 在线黄色免费网站 | 亚洲二区在线观看 | 国产免费自拍视频 | 成人深夜视频 |