日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【高通量测序】.dna文件批量读取CAG重复序列长度

發布時間:2023/12/16 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【高通量测序】.dna文件批量读取CAG重复序列长度 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

191008 CAG讀取思路

#!/usr/bin/env python3 # -*- coding: utf-8 -*- import ref = open(r'C:\Users\kagami\Desktop\TEST\m54045_190927_083209 1.txt',encoding='gb18030', errors = "ignore") f.readline() f.readline()primertext = f.readline() secondtext = str(primertext)f.close() text = re.sub(r"[0123456789 ]","", secondtext) #輸出純凈DNA序列textsearch = re.search("GTCCTTCCAG(\S{0,1000})CCGCCGCCACCG",text)CAGnumber = len(textsearch.group(1)) PolyQnumber = int(CAGnumber/3)print(textsearch.group(1)) print(CAGnumber, PolyQnumber)

照著這個思路先把所有的.dna文件修改成了.txt文件,修改代碼如下:

#!/usr/bin/env python3 # -*- coding: utf-8 -*-import os import sys#獲取目錄下文件名清單 files = os.listdir(r"E:\TEST\Origin") #對文件名清單里的每一個文件名進行處理 for filename in files:portion = os.path.splitext(filename)#portion為名稱和后綴分離后的列表if portion[1] ==".dna":#如果為JPG則更改名字newname = portion[0]+".txt"#要改的新后綴#改好的新名字print(filename)#打印出要更改的文件名os.chdir(r"E:\TEST\Origin")#修改工作路徑os.rename(filename,newname)

(其實可以改動得更好,按照上面的方面會把所有的文件直接改名成.txt格式,源文件無法保留,而且還是在源文件夾下進行操作)

之后可以按照以上的思路,批量讀取文件夾內的每一個txt文件,輸出一張csv表,包含文件名、CAG數目、polyQ數目、CAG序列片段信息。

#!/usr/bin/env python3 # -*- coding: utf-8 -*- import os import re import linecache import csv import codecsListName = list() ListOldPolyQnumber = list() ListNewPolyQnumber = list() ListNewAgainPolyQnumber = list() ListSequencenumber = list()#抽取單個文本內CAG序列文本 def ReadPolyQnumber(text):Strtext = str(text)DNAsequence = re.sub(r"[0123456789 ]","", Strtext) #輸出測序完整DNA序列print(DNAsequence)CAGsearch = ""if re.search("GTCCTTCCAG", DNAsequence): #正向序列if re.search("CCGCCGCCACCG", DNAsequence):CAGsearch = re.search("GTCCTTCCAG(\S{0,10000})CCGCCGCCACCG", DNAsequence).group(1) # 輸出全部CAG序列else:if re.search("CCGCCACCGCCG", DNAsequence):CAGsearch = re.search("GTCCTTCCAG(\S{0,10000})CCGCCACCGCCG", DNAsequence).group(1)# 輸出全部CAG序列else:CAGsearch = ""print("正向匹配錯誤1")else:if re.search("CTGGAAGGAC", DNAsequence): # 反向序列if re.search("CGGTGGCGGCGG", DNAsequence):CAGsearch = re.search("CGGTGGCGGCGG(\S{0,10000})CTGGAAGGAC", DNAsequence).group(1) # 輸出全部CAG序列else:if re.search("CGGCGGTGGCGG", DNAsequence):CAGsearch = re.search("CGGCGGTGGCGG(\S{0,10000})CTGGAAGGAC", DNAsequence).group(1) # 輸出全部CAG序列else:CAGsearch = ""print("反向匹配錯誤1")else:CAGsearch = ""print("!!![匹配錯誤]!!!")CAGsequnece = CAGsearchreturn (CAGsequnece)#原始方法計算序列中PolyQ數量 def OldPolyQnumber(Str):CAGnumber = int(len(Str)/3)return CAGnumber#計算CAG序列文本中PolyQ數量-不計入錯配 def ChcekPolyQtext(Str):if re.search("CAGCAG", Str): #匹配正向序列print("Enter Forward Change")FirstChangetext = re.sub("CAG","Q",Str) #Chang CAG sequence to QSecondChangetext = re.sub("CAA","Q",FirstChangetext) #Chang CAA sequence to Qelse:if re.search("TGCTGC", Str): #匹配反向序列print("Enter Reverse Change")FirstChangetext = re.sub("TGC", "Q", Str)SecondChangetext = re.sub("TTC", "Q", FirstChangetext)else:print("Enter NO Change")SecondChangetext = "Q" * 9999print("CAG to Q:",SecondChangetext)return SecondChangetextdef CheckPolyQnumber(Str):PolyQnumber = int(Str.count("Q"))return PolyQnumberdef CheckagainPolyQnumber(Str):if re.search(r"QQ(\S{0,10000})QQ", Str):PolyQtext = re.search(r"QQ(\S{0,10000})QQ", Str).group(1)PolyQtoCAGtext = PolyQtext.replace("Q", "CAG")else:PolyQtoCAGtext = StrPolyQnumber = int((len(PolyQtoCAGtext)/3)+4)return PolyQnumberpath = r"C:\Users\kagami\Desktop\Origin" files = os.listdir(path)for file in files:print(file)Oldfilename = str(file)Newfilename = Oldfilename.replace(" ", "_")ListName.append(Newfilename)f = open(path+"/"+file,encoding='gb18030', errors = "ignore")f.readline()f.readline()Textinformation = f.readline()if len(Textinformation)<200:Textinformation = f.readline()f.close()fileCAGTEXT = ReadPolyQnumber(Textinformation)Sequencingnumber = int(len(fileCAGTEXT))ListSequencenumber.append(Sequencingnumber)print(fileCAGTEXT)OldCAGnumber = OldPolyQnumber(fileCAGTEXT)ListOldPolyQnumber.append(OldCAGnumber)PolyQTEXT = ChcekPolyQtext(fileCAGTEXT)print(PolyQTEXT)NewPolyQnumber = CheckPolyQnumber(PolyQTEXT)ListNewPolyQnumber.append(NewPolyQnumber)NewAgainPolyQnumber = CheckagainPolyQnumber(PolyQTEXT)ListNewAgainPolyQnumber.append(NewAgainPolyQnumber)def f(j,k,l,i,m):return j,k,l,i,mFinallist = list(map(f,[j for j in ListName], [k for k in ListOldPolyQnumber], [l for l in ListNewPolyQnumber],[i for i in ListNewAgainPolyQnumber], [m for m in ListSequencenumber]))print(len(Finallist))def data_write_csv(file_name, datas):#file_name為寫入CSV文件的路徑,datas為要寫入數據列表file_csv = codecs.open(file_name,'w+','utf-8')#追加writer = csv.writer(file_csv, delimiter=' ', quotechar=' ', quoting=csv.QUOTE_MINIMAL)for data in datas:writer.writerow(data)print("保存文件成功,處理結束")data_write_csv(r"C:\Users\kagami\Desktop\Result\result-3rd.csv", Finallist)

R劃線模擬GEL電泳

利用R中的lines()功能,劃線模擬PCR產物電泳情況,具體實現代碼如下:

PolyQnumber <- read.csv("C:/Users/Administrator/Desktop/Result/Result-Sort.csv",colClasses = c("NULL","NULL",NA), header = FALSE)PolyQ <- PolyQnumber$V3plot(c(0,500),c(0,600),type="n",xlab=" ",ylab="Length of Product")for (i in PolyQ)lines(c(100,300),c(i,i), col = rgb(255, 0, 0, 5, maxColorValue=255)) print(PolyQ)

R最終模擬的產物電泳圖如下:

總結

以上是生活随笔為你收集整理的【高通量测序】.dna文件批量读取CAG重复序列长度的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 奇米久久 | 亚洲av日韩av在线观看 | 岛国一区 | 日韩精品一区二区三区色欲av | 91视频免费 | 成人18网站 | h片在线观看视频 | 亚洲色图50p | 日韩毛片大全 | 欧美精品在线观看一区二区 | 色噜av| 日本人做受免费视频 | 国产伦精品一区二区三区视频免费 | 成人看片网站 | 日韩精品偷拍 | 亚洲精品乱码久久久久 | 亚洲美女网站 | 日韩一级欧美 | 日日摸夜夜爽 | 国产午夜性春猛交ⅹxxx | 熟女俱乐部一区二区视频在线 | 中文亚洲av片不卡在线观看 | 成年人91视频 | 一级毛片aa | 不卡av在线免费观看 | 欧美va视频 | 毛片日韩 | 国产伦精品一区二区. | 草草影院网址 | 中文字幕免费在线 | 国产精品入口日韩视频大尺度 | 与亲女洗澡时伦了毛片 | 青青青青青青草 | 破处视频在线观看 | 国产东北露脸精品视频 | 免费视频二区 | 亚洲人妻电影一区 | 成人在线观看一区二区三区 | 日韩欧美精品在线播放 | 中国女人毛片 | 欧美性猛交一区二区三区精品 | www在线| 99色99| 96视频在线 | 国产日日操| 97在线免费观看视频 | 又骚又黄的视频 | 久久草国产 | 久久精品网 | 激情天天| 国产chinese| 妹子干综合网 | 黄视频免费看在线 | 日本男女啪啪 | 国产午夜精品在线 | 国产一区a | 欧美亚洲激情 | 韩日一区二区 | 日韩久久一区二区 | 五月开心激情 | 蜜桃av在线免费观看 | 亚洲av永久无码精品三区在线 | 精品一区二区电影 | 日本少妇激三级做爰在线 | 国产区第一页 | 久久精品国产成人av | 亚洲一区日韩 | 香蕉视频免费在线播放 | 欧洲女女同性videoso | 日本成人在线视频网站 | 国产经典久久久 | 欧美人成在线视频 | 日本少妇吞精囗交 | 无码人妻精品一区二区三区99v | 三a大片 | 人人玩人人干 | 欧美大尺度做爰啪啪床戏明星 | 香蕉视频一区二区三区 | 日本黄色片在线播放 | 黑白配av| 日本成人中文字幕 | 91精品又粗又猛又爽 | 动漫美女隐私无遮挡 | 国产日韩欧美高清 | 美国美女黄色片 | 精品久久网 | 国产亚洲精久久久久久无码77777 | 色诱视频在线观看 | 国产 一二三四五六 | 日韩精品一区二区三区免费视频 | 欧美又粗又大xxxxbbbb疯狂 | 91好色先生tv | 自拍日韩亚洲一区在线 | 女人一级一片30分 | 操一操av | 亚洲精品人妻无码 | 亚洲欧美在线免费 | 成人欧美一区二区三区黑人 | 成人精品视频在线播放 |