chromedriver 下载_centos7中配置python爬虫selenium+chromium+chromedriver环境
今天為了爬取某異步加載網(wǎng)站的數(shù)據(jù),開始自學(xué)了selenium,不得不說selenium還是很方便的工具,適合無腦爬取異步加載的網(wǎng)站。首先我在自己的windows電腦下配置了selenium和chromedriver的chrome瀏覽器內(nèi)核,正常調(diào)試好程序后準(zhǔn)備部署到centos7服務(wù)器上,但是遇到了很多問題,不停報錯,在踩了很多雷以后終于可以完美部署selenium+chromium+chromedriver環(huán)境順利爬蟲了!
接下來我就詳細(xì)介紹下正確的配置方式
2. 安裝chromium:由于谷歌chrome并不支持linux,也就更不支持centos了,所以需要安裝chromium,不過不用擔(dān)心,chromium也是谷歌的開源項目,與chrome并沒有太大的區(qū)別
yum install chromium這一步也沒什么問題,需要注意一下chromium安裝的版本,因為要與下一步需要安裝的chromedriver版本相適配,二者版本不同都會報錯,這里我也是踩雷了,chromium默認(rèn)安裝的最新版為“79.0.3945.130-1.el7”,但是chromedriver已經(jīng)更新到了81.0,第一次安裝的時候我選擇了最高版本的chromedriver,但是chromium還是79.0版本,執(zhí)行python腳本的時候就報錯版本不適配,所以我重新安裝了對應(yīng)版本的chromedriver。
如何查看安裝的chromium版本?yum就可以看到
yum list installed3. 安裝chromedriver:這里我們從taobao鏡像站點(diǎn)安裝:
# 下載對應(yīng)版本的chromedriver wget https://npm.taobao.org/mirrors/chromedriver/79.0.3945.16/chromedriver_linux64.zip # 解壓 unzip chromedriver_linux64.zip# 把chromedriver移動到系統(tǒng)目錄 mv chromedriver /usr/bin方法2:直接yum安裝,這樣其實(shí)更省事兒一點(diǎn)
yum chromedriver安裝完成后確認(rèn)一下版本與chromium保持一致:
到這一步已經(jīng)配置好selenium+chromium+chromedriver的環(huán)境了,接下來我們寫一個最簡單的python腳本試一下!
from selenium import webdriver from selenium.webdriver.chrome.options import Options # 導(dǎo)入瀏覽器內(nèi)核設(shè)置,主要是為了設(shè)置無頭(headless)模式 url = 'www.baidu.com' chrome_options = Options() chrome_options.add_argument('--headless') # 設(shè)置Chrome為無頭模式 driver = webdriver.Chrome(options=chrome_options) driver.get(url) driver.close() ```誒,報錯了:The process started from chrome location /usr/lib64/chromium-browser/chromium-browser is no longer running, so ChromeDriver is assuming that Chrome has crashed
按照網(wǎng)上的教程:https://cloud.tencent.com/developer/article/1404558在腳本上加上兩句話:
chrome_options.add_argument('no-sandbox') chrome_options.add_argument('disable-dev-shm-usage')完美解決了!
總結(jié)
以上是生活随笔為你收集整理的chromedriver 下载_centos7中配置python爬虫selenium+chromium+chromedriver环境的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何解决秒杀的性能问题和超卖的讨论
- 下一篇: python随机生成20个数字_pyth