日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

SAM文件格式

發布時間:2024/8/26 编程问答 56 豆豆
生活随笔 收集整理的這篇文章主要介紹了 SAM文件格式 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

幫朋友處理sam各式文件,又記不住sam各式每列代表的什么內容,干脆轉個帖子留著以后查詢。

在SAM輸出的結果中每一行都包括十二項通過Tab分隔,從左到右分別是:

1 序列的名字

2 概括出一個合適的標記,各個數字分別代表

  • 1? 序列是一對序列中的一個

  • 2? 比對結果是一個pair-end比對的末端

  • 4? 沒有找到位點

  • 8? 這個序列是pair中的一個但是沒有找到位點

  • 16? 在這個比對上的位點,序列與參考序列反向互補

  • 32? 這個序列在pair-end中的的mate序列與參考序列反響互補

  • 64 序列是 mate 1

  • 128 序列是 mate 2

假如說標記為以上列舉出的數目,就可以直接推斷出匹配的情況。假如說標記不是以上列舉出的數字,比如說83=(64+16+2+1),就是這幾種情況值和。

3? 參考序列的名字

4 在參考序列上的位置

5? mapping qulity?? 越高則位點越獨特

bowtie2有時并不能完全確定一個短的序列來自與參考序列的那個位置,特別是對于那些比較簡單的序列。但是bowtie2會給出一個值來顯示出 這個段序列來自某個位點的概率值,這個值就是mapping qulity。Mapping qulity的計算方法是:Q=-10log10p,Q是一個非負值,p是這個序列不來自這個位點的估計值。

假如說一條序列在某個參考序列上找到了兩個位點,但是其中一個位點的Q明顯大于另一個位點的Q值,這條序列來源于前一個位點的可能性就比較大。Q值的差距越大,這獨特性越高。

Q值的計算方法來自與SAM標準格式,請查看SAM總結。

6 代表比對結果的CIGAR字符串,如37M1D2M1I,這段字符的意思是37個匹配,1個參考序列上的刪除,2個匹配,1個參考序列上的插入。M代表的是alignment match(可以是錯配)

7? mate 序列所在參考序列的名稱

8 mate 序列在參考序列上的位置

9? 估計出的片段的長度,當mate 序列位于本序列上游時該值為負值。

10 read的序列

11 ASCII碼格式的序列質量

12 可選的區域

  • AS:i? 匹配的得分

  • XS:i? 第二好的匹配的得分

  • YS:i? mate 序列匹配的得分

  • XN:i? 在參考序列上模糊堿基的個數

  • XM:i? 錯配的個數

  • XO:i? gap open的個數

  • XG:i? gap 延伸的個數

  • NM:i? 經過編輯的序列

  • YF:i? 說明為什么這個序列被過濾的字符串

  • YT:Z

  • MD:Z? 代表序列和參考序列錯配的字符串

也可以查看這個,也比較詳細

https://blog.csdn.net/u014182497/article/details/51691743 ?

轉載于:https://www.cnblogs.com/zhanmaomao/p/9281646.html

總結

以上是生活随笔為你收集整理的SAM文件格式的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。