INDEL的重新比对和碱基质量分数的重新校准
生活随笔
收集整理的這篇文章主要介紹了
INDEL的重新比对和碱基质量分数的重新校准
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1.為什么要做這兩步(why):
indel的重新比對:這是由于比對軟件的自身限制,其可能將包括indel的read解釋為snp的read,這就導致calling的錯誤和后面的堿基質量分數的重新校準。
堿基質量分數的重新校準:這是由于測序機器的系統性誤差導致的,假設機器能識別5億個堿基有99%的概率是對,那么也就說有5千萬可能是錯的,這些錯誤就可能被作為mutation calling出來,即假陽性。
2.怎么做的(how):
indel的重新比對:
1.先找到需要重新比對的區域:GATK之RealignerTargetCreator。基本思路是用千人基因組計劃里面收集的indel數據來作為模板來找出bam文件里面的indel。
2.重新比對:看哪種比對結果的分數高,就選那一個:GATK之IndelRealigner
堿基質量分數的重新校準:GATK之BaseRecalibrator
BaseRecalibrator是如何識別哪些位點應該矯正的:其只矯正非現有的snp的點,即現有已經公布的snp點認為是正確的,不需要矯正。
參考資料:
1.https://mp.weixin.qq.com/s/LMZgy_8aJ6cm6VGK9Mud2A
2.http://www.biotrainee.com/thread-1402-1-1.html
總結
以上是生活随笔為你收集整理的INDEL的重新比对和碱基质量分数的重新校准的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: iOS 13 省流量的四个小技巧
- 下一篇: TSQL 定义分割字符串的函数