python拆分pubchem SDF文件
生活随笔
收集整理的這篇文章主要介紹了
python拆分pubchem SDF文件
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
從pubchem下載的sdf文件是一個(gè)壓縮格式,一個(gè)sdf里面有多個(gè)化學(xué)物質(zhì),需要拆分開(kāi)單獨(dú)保存,
先將大的sdf拆分成一個(gè)個(gè)單獨(dú)的sdf小文件,然后再讀取每一行小文件的第一行獲取CID編號(hào)
# coding=utf-8
def splitSDF():
file_name = "48600001_48625000.sdf"
# 讀取的文件內(nèi)容保存在列表里
file_str_list = []
# 設(shè)置文件索引
index = 0
# import pdb
# pdb.set_trace()
with open(file_name, 'r+') as f:
for ln in f:
if ln != "$$$$
":
file_str_list.append(ln)
else:
# 將對(duì)應(yīng)的內(nèi)容按照索引寫(xiě)入文件
index = index + 1
with open('{0}.sdf'.format(index), 'w+') as wt:
for ds in file_str_list:
wt.write(ds)
file_str_list = []
if __name__ == '__main__':
splitSDF()
總結(jié)
以上是生活随笔為你收集整理的python拆分pubchem SDF文件的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: objdump 从 ELF 文件 反汇编
- 下一篇: js下载文件夹的解决方案