使用selenium爬取艺恩网年度票房(8.16)
生活随笔
收集整理的這篇文章主要介紹了
使用selenium爬取艺恩网年度票房(8.16)
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
網(wǎng)站展示:
?
爬取并保存至csv,代碼如下
from selenium.webdriver import Chrome from selenium.webdriver.support.select import Select import time import csvweb = Chrome() web.get("https://www.endata.com.cn/BoxOffice/BO/Year/index.html") #找到下拉菜單 sel_list = web.find_element_by_xpath('//*[@id="OptionDate"]') sel = Select(sel_list) #初始化信息列表 movie_name = [] movie_type = [] movie_sale_number = [] movie_average_sale = [] movie_average_people = [] movie_country = [] movie_online_time = [] #獲取列表信息 for s in range(len(sel.options)):#使用index索引逐個選擇下拉菜單sel.select_by_index(s)time.sleep(2)#獲取到每一個trtr_list = web.find_elements_by_xpath('//*[@id="TableList"]/table/tbody/tr')print(tr_list)for tr in range(len(tr_list)):#獲取每一個tr里的信息movie_name.append(tr_list[tr].find_element_by_xpath('./td[2]').text)movie_type.append(tr_list[tr].find_element_by_xpath('./td[3]').text)movie_sale_number.append(tr_list[tr].find_element_by_xpath('./td[4]').text)movie_average_sale.append(tr_list[tr].find_element_by_xpath('./td[5]').text)movie_average_people.append(tr_list[tr].find_element_by_xpath('./td[6]').text)movie_country.append(tr_list[tr].find_element_by_xpath('./td[7]').text)movie_online_time.append(tr_list[tr].find_element_by_xpath('./td[8]').text) print('運(yùn)行完畢') web.close() #保存至csv rows = zip(movie_name, movie_type, movie_sale_number, movie_average_sale, movie_average_people, movie_country, movie_online_time) with open('movie_info.csv', 'w', newline='', encoding='utf-8') as f:writer = csv.writer(f)#設(shè)置表頭writer.writerow(["影片名稱", "類型", "平均票價", "場均人次", "國家及地區(qū)", "上映日期"])#for循環(huán)每一行寫入for row in rows:writer.writerow(row)最后csv部分展示效果如下:
?
總結(jié)
以上是生活随笔為你收集整理的使用selenium爬取艺恩网年度票房(8.16)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: android admob sdk,an
- 下一篇: 汽车电子嵌入式相关知识