日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程语言 > python >内容正文

python

python医药数据_python爬虫:爬取医药数据库drugbank

發(fā)布時間:2023/12/29 python 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python医药数据_python爬虫:爬取医药数据库drugbank 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

import os

import time

import datetime

import codecs

from lxml import etree

from selenium import webdriver

import csv

'''遇到python不懂的問題,可以加Python學(xué)習(xí)交流群:1004391443一起學(xué)習(xí)交流,群文件還有零基礎(chǔ)入門的學(xué)習(xí)資料'''

#控制編碼,全英文網(wǎng)頁,用不著

# import sys

# reload(sys)

# sys.setdefaultencoding('utf-8')

# # date格式轉(zhuǎn)為string格式

today = datetime.date.today()

today_string = today.strftime('%Y-%m-%d')

#通過瀏覽器得到網(wǎng)頁頁面--反反爬蟲

def html_getter(site,file_name):

driver = webdriver.Firefox()

# chromedriver = r'C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe'

# os.environ['webdriver.chrome.driver'] = chromedriver

# driver = webdriver.Chrome(chromedriver)

driver.get(site)

driver.maximize_window() # 將瀏覽器最大化顯示

time.sleep(5) # 控制間隔時間,等待瀏覽器反映

# 保存頁面

source_code = driver.find_element_by_xpath("//*").get_attribute("outerHTML")

f = codecs.open(file_name, 'w+', 'utf8')

f.write(source_code)

f.close()

#打開保存在本地的html文件

def file_html(file_name):

f = open(file_name,'r')

html = f.read()

f.close()

return html

#寫入csv,也可以有其他寫入方式,這個地方就csv啦

def csv_writer(ll):

headers = ['drug','inter','snp_rs_id','Allele_name','Defining_change','Adverse_Reaction','ref','href','original_title']

with open('drugbank.csv','a') as f:

f_csv = csv.writer(f)

f_csv.writerow(headers)

f_csv.writerows(ll)

#用xpath解析網(wǎng)頁,得到表格數(shù)據(jù),我就是這么愛xpath,不喜歡正則表達式

def data_get(html):

selector = etree.HTML(html)

tbody=selector.xpath('/html/body/main/table/tbody/tr')

for each in tbody:

# #1.'drug'

drug_name=each.xpath('td[1]/strong/text()')[0]

drug_sn=each.xpath('td[1]/a/text()')[0]

drug=drug_name+' '+drug_sn

# #print(drug)

# #2.'Interacting Gene/Enzyme'

int=each.xpath('td[2]')[0]

inter=int.xpath('string(.)')

# print(inter)

# #3.'SNP RS ID'

snp=each.xpath('td[3]/a/text()')

if snp:

snp_rs_id=snp[0]

else:

snp_rs_id='Not Available '

#print snp_rs_id

#4.Allele name

Allele=each.xpath('td[4]/text()')

if Allele:

Allele_name=Allele[0]

else:

Allele_name='Not Available '

# #print Allele_name

# #5.'Defining change'

Defining=each.xpath('td[5]/text()')

if Defining:

Defining_change=Defining[0]

else:

Defining_change='Not Available '

# print Defining_change

# 6.'Adverse Reaction'

Adverse=each.xpath('td[6]/text()')

if Adverse:

Adverse_Reaction=Adverse[0]

else:

Adverse_Reaction='Not Available '

# print Adverse_Reaction

#7.'Reference(s)'

ref=each.xpath('td[7]/span/a/text()')[0]

href=each.xpath('td[7]/span/a/@href')[0]

original_title=each.xpath('td[7]/span/a/@data-original-title')[0]

# print ref

# print(href)

# print(original_title)

tt=(drug,inter,snp_rs_id,Allele_name,Defining_change,Adverse_Reaction,ref,href,original_title)

ll.append(tt)

#print ll

if __name__ == '__main__':

ll=[]

for i in range(1,5):

page_num=i

site='http://www.drugbank.ca/genobrowse/snp-adr?page='+str(page_num)

#get the html through webdriver

file_name=unicode(today_string)+u'drugbank_'+unicode(str(page_num))+u'.html'

html_getter(site,file_name)

html=file_html(file_name)

data_get(html)

csv_writer(ll)

總結(jié)

以上是生活随笔為你收集整理的python医药数据_python爬虫:爬取医药数据库drugbank的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 日韩精品久久 | 99riAv国产精品无码鲁大师 | 7799精品视频 | 91精品国产成人观看 | 一区三区视频在线观看 | 草比视频在线观看 | 少妇搡bbbb搡bbbb | 97超碰在线免费观看 | 小草av | 国产乱淫av麻豆国产 | 久久久久久网站 | 含羞草一区二区三区 | 国产精品久久久久久婷婷天堂 | 欧美激情国产在线 | √天堂资源地址在线官网 | 天天撸天天操 | 亚洲永久精品一区 | 一区二区在线播放视频 | 伊人久久大香线 | 色婷婷av一区二区三区之红樱桃 | 日本一区二区三区四区五区 | 最新国产视频 | 欧美老女人视频 | 日本国产精品一区 | 日韩欧美精品在线观看 | 国产成人在线观看免费 | 国产一区二区观看 | 鸥美一级片 | 免费观看在线播放 | 色欧美日韩 | 成人午夜激情视频 | 天堂色播| 综合色网站 | 欧美一区二区三 | 成a人片亚洲日本久久 | 激情图片网站 | 久久久久国产精品无码免费看 | 国产在线中文 | xxx视频网站| 亚洲成人一区二区在线观看 | 无遮挡黄色| 99欧美 | 视频精品一区二区 | 欧美又粗又深又猛又爽啪啪九色 | 男人手机天堂 | 亚洲宗人网 | 亚洲综合一区二区 | 日本55丰满熟妇厨房伦 | 国产东北真实交换多p免视频 | 亚洲欧洲综合 | 黄色成年网站 | 久久久久久久久久国产精品 | 日本免费一区二区三区最新 | 狠狠人妻久久久久久综合 | 快色视频在线观看 | 99久久婷婷国产综合精品电影 | 日本在线视频播放 | 国产精品三级 | 国产精品国产三级国产三级人妇 | 97精品自拍 | 中文字幕在线观看的网站 | 4虎最新网址 | 国产视频欧美视频 | 欧洲女性下面有没有毛发 | 另类男人与善交video | 国产精品日韩专区 | 日本69式三人交 | aaaaaav| 九九九在线视频 | 精品一区二区久久久久久按摩 | 国产精品视频第一页 | 久久久视频在线 | 欧洲亚洲综合 | 公交上高潮的丁芷晴 | 亚洲爱爱av| 男女涩涩 | 国产成人免费观看 | 在线观看视频一区二区 | 成人免费自拍视频 | 国产日韩欧美视频在线观看 | 欧美综合视频在线观看 | 国产黄大片在线观看画质优化 | 日韩高清在线观看一区 | 日本不卡免费在线 | 农村妇女毛片 | 乱熟女高潮一区二区在线 | 亚洲国产一区二区三区在线观看 | 欧美一级片免费看 | 婷婷在线网 | 青青草自拍偷拍 | 国产乱码精品一区二三区蜜臂 | 中文字幕一区二区三区人妻在线视频 | 精品视频久久 | 97在线精品 | 国产午夜啪啪 | 久久久久久久久久久久久国产 | 少妇厨房愉情理伦bd在线观看 | 天天插天天 | 国产精品aaa |