Python+IDM实现百度网盘批量下载
最近發現了一個Tampermonkey腳本,用來下載百度網盤能達到幾十MB/s,然而不能批量下載(比如幾十集的電視劇),于是借用爬蟲知識,利用Python+Selenium批量調用此腳本獲得直鏈,并在IDM里進行批量下載。
注意:文中的一些步驟需要一定的技術知識。
目錄
- 準備文件
- 相關代碼
- 啟動時加載Tampermonkey插件
- 自動安裝直鏈獲取腳本
- 百度網盤操作
- 完整代碼
- IDM下載
- 寫在最后
準備文件
相關代碼
其實這里完全可以不用Selenium,在瀏覽器控制臺中執行JavaScript腳本會更加方便,只是偶爾用用,懶得去研究了。
啟動時加載Tampermonkey插件
自動加載Tampermonkey插件,只需要在創建driver對象時為options指定插件路徑即可,這里將代碼和插件放在同一文件夾下
driver_path = './Chrome/Application/chromedriver.exe' driver_path = os.path.realpath(driver_path) chrome_path = './Chrome/Application/chrome.exe' chrome_path = os.path.realpath(chrome_path) options = Options() options.binary_location = chrome_path options.add_extension('tampermonkey v4.14.6147.crx') driver = Chrome(service=Service(driver_path), options=options)這里指定了Chrome和chromedriver的位置,如果使用電腦上安裝的Chrome并配置了環境變量,則可用如下代碼替換
options = Options() options.add_extension('tampermonkey v4.14.6147.crx') driver = Chrome(options=options)自動安裝直鏈獲取腳本
其實這一步可以用加載用戶配置文件來替代,而且速度更快,但是懶得研究了,直接去腳本網址安裝即可
driver.get('https://greasyfork.org/zh-CN/scripts/418182-%E7%99%BE%E5%BA%A6%E7%BD%91%E7%9B%98%E7%AE%80%E6%98%93%E4%B8%8B%E8%BD%BD%E5%8A%A9%E6%89%8B-%E7%9B%B4%E9%93%BE%E4%B8%8B%E8%BD%BD%E5%A4%8D%E6%B4%BB%E7%89%88') driver.find_element(By.XPATH, '//*[@id="install-area"]/a').click() WebDriverWait(driver, 30).until(EC.element_to_be_clickable((By.XPATH, '//*[@id="preinstall-modal"]/div/div/footer/button[2]'))).click() while len(driver.window_handles) == 1:pass driver.switch_to.window(driver.window_handles[-1]) WebDriverWait(driver, 30).until(EC.element_to_be_clickable((By.XPATH, '/html/body/div[2]/div[2]/div/table/tr[2]/td/div/div/div/div[2]/div/div/input[1]'))).click() driver.switch_to.window(driver.window_handles[0])百度網盤操作
這部分代碼會調用直鏈腳本,獲取當前網盤頁面文件夾下的所有文件的直鏈。
代碼執行到這里時會暫停,等待用戶登錄并打開需要獲取直鏈的界面,打開頁面后返回代碼運行窗口并點擊回車繼續運行(懶得寫自動化了)。
注意當前界面的文件中不能包含文件夾,否則代碼會報錯,因為沒有寫針對文件夾的處理,第一次使用時可能會要求輸入驗證碼,按彈出界面要求操作即可。
執行完畢后會在當前文件夾生成一個包含所有鏈接的txt文件。
driver.get('https://pan.baidu.com/disk/main?from=homeFlow#/index?category=all') while True:input('按回車鍵開始')name = driver.find_element(By.XPATH,'/html/body/div[1]/div[2]/div[2]/div/div[2]/div[1]/div/span[last()-0]/span[1]').textcheckboxs = driver.find_elements(By.XPATH,'/html/body/div[1]/div[2]/div[2]/div/div[3]/div/div[2]/table/tbody/tr/td[1]/label/span/span')links = []for i in range(len(checkboxs)):if i > 0:checkboxs[i - 1].click()checkboxs[i].click()time.sleep(0.1)driver.find_element(By.XPATH, '//*[@id="btnEasyHelper"]/button').click()time.sleep(0.2)driver.find_element(By.ID, 'dialogBtnGetUrl').click()while True:try:link = driver.find_element(By.ID, 'dialogBtnIdm').get_attribute('data-clipboard-text')if link != '':print(link)links.append(link)breakexcept:passtry:driver.find_element(By.XPATH,'/html/body/div[@class="swal-overlay swal-overlay--show-modal"]/div/div[2]/div/button').click()except:input('關閉界面出錯,請手動處理后按回車繼續')with open(name + '.txt', 'w', encoding='utf-8') as f:for link in links:f.write(link)f.write('\n\n')完整代碼
import time import os from selenium.webdriver import Chrome from selenium.webdriver.chrome.service import Service from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.support.wait import WebDriverWait from selenium.webdriver.chrome.options import Optionsdriver_path = './Chrome/Application/chromedriver.exe' driver_path = os.path.realpath(driver_path) chrome_path = './Chrome/Application/chrome.exe' chrome_path = os.path.realpath(chrome_path) options = Options() options.binary_location = chrome_path options.add_extension('tampermonkey v4.14.6147.crx') driver = Chrome(service=Service(driver_path), options=options) time.sleep(7) # 等待第二個窗口打開 if len(driver.window_handles) > 1:driver.switch_to.window(driver.window_handles[-1])driver.close()driver.switch_to.window(driver.window_handles[0]) # 安裝腳本 print('安裝腳本') driver.get('https://greasyfork.org/zh-CN/scripts/418182-%E7%99%BE%E5%BA%A6%E7%BD%91%E7%9B%98%E7%AE%80%E6%98%93%E4%B8%8B%E8%BD%BD%E5%8A%A9%E6%89%8B-%E7%9B%B4%E9%93%BE%E4%B8%8B%E8%BD%BD%E5%A4%8D%E6%B4%BB%E7%89%88') driver.find_element(By.XPATH, '//*[@id="install-area"]/a').click() WebDriverWait(driver, 30).until(EC.element_to_be_clickable((By.XPATH, '//*[@id="preinstall-modal"]/div/div/footer/button[2]'))).click() while len(driver.window_handles) == 1:pass driver.switch_to.window(driver.window_handles[-1]) WebDriverWait(driver, 30).until(EC.element_to_be_clickable((By.XPATH, '/html/body/div[2]/div[2]/div/table/tr[2]/td/div/div/div/div[2]/div/div/input[1]'))).click() driver.switch_to.window(driver.window_handles[0]) # 進入度盤 driver.get('https://pan.baidu.com/disk/main?from=homeFlow#/index?category=all') while True:input('按回車鍵開始')name = driver.find_element(By.XPATH,'/html/body/div[1]/div[2]/div[2]/div/div[2]/div[1]/div/span[last()-0]/span[1]').textcheckboxs = driver.find_elements(By.XPATH,'/html/body/div[1]/div[2]/div[2]/div/div[3]/div/div[2]/table/tbody/tr/td[1]/label/span/span')links = []for i in range(len(checkboxs)):if i > 0:checkboxs[i - 1].click()checkboxs[i].click()time.sleep(0.1)driver.find_element(By.XPATH, '//*[@id="btnEasyHelper"]/button').click()time.sleep(0.2)driver.find_element(By.ID, 'dialogBtnGetUrl').click()while True:try:link = driver.find_element(By.ID, 'dialogBtnIdm').get_attribute('data-clipboard-text')if link != '':print(link)links.append(link)breakexcept:passtry:driver.find_element(By.XPATH,'/html/body/div[@class="swal-overlay swal-overlay--show-modal"]/div/div[2]/div/button').click()except:input('關閉界面出錯,請手動處理后按回車繼續')print(f"輸出文件:{name + '.txt'}")with open(name + '.txt', 'w', encoding='utf-8') as f:for link in links:f.write(link)f.write('\n\n')IDM下載
這里使用IDM導入txt文件進行批量下載,具體操作如下
寫在最后
文中代碼僅供學習和交流,如果部分內容涉及到侵權,請聯系我刪除。
總結
以上是生活随笔為你收集整理的Python+IDM实现百度网盘批量下载的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【智能医疗】美国医疗领域人工智能应用行业
- 下一篇: Python常用语句