日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python 基因序列提取_科学网—简单的Python脚本提取对应位置基因序列(fasta文件) - 王彬忠的博文...

發布時間:2025/3/8 python 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python 基因序列提取_科学网—简单的Python脚本提取对应位置基因序列(fasta文件) - 王彬忠的博文... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

最近,用Python腳本提取,在基因號已知,位置已知條件下,相對應位置的基因序列時發現,這樣很簡單但是很實用的腳本,在網上卻比較難找。而且,能被找到的腳本,相對于具有初級編程能力的人而言,有點難。本人寫了相對于初學者同樣很簡單腳本分享給大家。

首先,我將fa文件處理為單行(嫌麻煩,沒有寫成scaffold_x一行,序列一行的樣子,如圖三),將下面的序列處理(圖一):

(補充)經過:

import re

fr=open(r'F:desktopcorrelxxx.fa','r')

fw=open(r'F:desktopcorrelxxx_use.fa','w')

line=fr.read()

r=line.replace('n','')

s=re.sub('>','n>',r)

fw.write(s)

fr.close()

fw.close()

得到(圖二):

當然你如果不嫌麻煩也可以處理成(圖三):

假設我含有位置信息源文件(圖四):

第一列為基因號,最后一列為基因在fa文件中的位置信息;

本人采用圖二的形式,具體腳本(腳本一);

#author:Wang Binzhong

# -*- coding:utf-8 -*-

fr=open(r'F:desktopCX.txt','r')#讀取含有位置信息的文件

fa=open(r'F:desktopxxxx.fa','r')#讀取處理好的基因序列文件

fw_1=open(r'F:desktopfa_3.txt','w')#寫入

line_cr=fr.readlines()

line_fa=fa.readlines()

for eachline in line_cr:

sp=eachline.strip().split('t')

title_1=eachline.find('scaffold')

start_1=eachline.find(':',title_1)+1

end_1=eachline.find('-',start_1)

d_1=eachline[title_1:start_1-1].strip()#scaffold名稱

d_2=eachline[start_1:end_1].strip()#首位的位置

d_3=eachline[end_1+1:].strip()#末尾的位置

for each_seq in line_fa:

if d_1 == each_seq[:int(len(d_1))+5].strip('ATGC'):#如果對應的名稱在行中,就可以用以下的規則寫入文本

fw_1.write(sp[0]+'t'+each_seq[len(d_1)+int(d_2):len(d_1)+int(d_3)].strip()+'n')#改為:fw_1.write('>'+sp[0]+'n'+each_seq[len(d_1)+int(d_2):len(d_1)+int(d_3)].strip()+'n')可以省略第二步(腳本二),一步完成

break

fr.close()

fa.close()

fw_1.close()

表頭沒有'>',同時也沒有換行處理,所以需要繼續處理(圖五):

沒有寫連續的腳本,重新寫了一個(腳本二):

import re

fr=open(r'F:desktopfa_3.txt','r')

fw=open(r'F:desktopfa_4.fa','w')

line_fr=fr.readlines()

s_1=''

for eachline in line_fr:

s_1=re.sub('t','n',eachline)

fw.write(re.sub('pp','>pp',s_1))

fr.close()

fw.close()

最終得到:

程序比較簡單,Python初學者都可以懂。當然,如果有錯誤的地方可以留言指出,

希望能為需要的同學提供幫助。這個程序只是針對于正鏈的

注:之前寫的出現了一個bug,經過修改后發布成功提取序列,希望對各位有幫助,有用的話可以引用。

鑒于某些人盜版,轉載請注明網址。

轉載本文請聯系原作者獲取授權,同時請注明本文來自王彬忠科學網博客。

鏈接地址:http://blog.sciencenet.cn/blog-783116-801490.html

總結

以上是生活随笔為你收集整理的python 基因序列提取_科学网—简单的Python脚本提取对应位置基因序列(fasta文件) - 王彬忠的博文...的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 在线观看 亚洲 | julia在线播放88mav | 一区二区激情 | 日日碰 | 国产精品视频一区二区三区 | 观看毛片| 免费看黄在线观看 | 日本在线天堂 | 岛国av中文字幕 | 人妻互换一区二区三区四区五区 | 爱av导航| 天天摸天天射 | 国产精品高清在线观看 | 极品毛片 | 看黄色一级片 | 深夜福利一区 | 男人天堂视频网 | 亚洲欧美另类一区 | 亚洲精品aaaaa | 息与子五十路翔田千里 | 日本视频免费观看 | 毛片基地视频 | 欧美大色 | www国产亚洲精品久久麻豆 | 中文精品久久久久人妻不卡 | 久久99视频精品 | 亚洲 成人 av | 欧美一性一乱一交一视频 | 涩涩国产 | 国产黄色成人 | 免费看国产曰批40分钟 | 男生裸体视频网站 | 大香蕉精品一区 | 国产黄色小说 | av在线三区 | 国产视频观看 | 91干干干| 黄网在线播放 | 国产亚洲无 | 国产一级伦理片 | 午夜激情久久久 | 中文字幕一区二区久久人妻网站 | 一区二区三区四区影院 | 亚洲女人被黑人巨大进入 | 九色一区 | 日本黄色片在线播放 | www.久久av| eeuss国产一区二区三区黑人 | 丁香婷婷一区二区三区 | 亚洲风情av | www.av88 | 国产视频你懂的 | 日本丰满熟妇hd | 五月情网| 黄色一级片在线播放 | 午夜手机福利 | 亚洲卡一 | 少妇在线 | 亚洲国产精品国自产拍久久 | 又黄又爽在线观看 | 国产www在线观看 | 黑人无套内谢中国美女 | av小说免费在线观看 | 国产精品久久久久影院 | 99爱免费视频 | 国产麻豆影视 | 亚洲人成电影一区二区在线 | 激情四射综合网 | 一道本在线播放 | 天天干,天天爽 | 国产影视av | 日本边添边摸边做边爱 | 欧美日韩黑人 | 五月天婷婷激情网 | 啪啪.com| 天天插天天干天天操 | 日本大奶少妇 | www.99re.| 在线观看一区视频 | www.久久精品视频 | 欧美性做爰猛烈叫床潮 | 综合视频| v片在线免费观看 | 日日麻批免费视频播放 | 中文在线字幕av | 国产一久久| 欧美天天搞 | 亚洲AV综合色区无码国产播放 | 色综合久久综合 | 久久婷综合 | 四虎一区二区 | 青草视屏 | 97国产成人无码精品久久久 | 欣赏asian国模裸体pics | 91成人在线观看喷潮蘑菇 | 国产午夜精品一区二区三区欧美 | 国产精品国产一区二区 | 在线观看 中文字幕 | 久草热在线视频 |