Scrapy框架学习记录
隨著Python爬蟲學習的深入,開始接觸Scrapy框架
記錄下兩個參考教程:
- 官網(wǎng)教程:http://scrapy-chs.readthedocs.io/zh_CN/0.24/intro/tutorial.html
- 知乎:https://zhuanlan.zhihu.com/p/26342933
官網(wǎng)教程可以說是比較權威比較全的,但是有一部分細節(jié)存沒有交代清楚,例如第一個Scrapy框架項目的建立,這個時候我們可以參考第二個知乎的教程,主要還是以官網(wǎng)教程為主滴。
首先,按照官網(wǎng)的Scrapy安裝教程安裝Scrapy
安裝指南
安裝Scrapy
注解
請先閱讀?平臺安裝指南.
下列的安裝步驟假定您已經(jīng)安裝好下列程序:
- Python?3.6.5
- Python Package:?pip?and?setuptools. 現(xiàn)在?pip?依賴?setuptools?,如果未安裝,則會自動安裝?setuptools?。
- lxml. 大多數(shù)Linux發(fā)行版自帶了lxml。如果缺失,請查看http://lxml.de/installation.html
- OpenSSL. 除了Windows(請查看?平臺安裝指南)之外的系統(tǒng)都已經(jīng)提供。
您可以使用pip來安裝Scrapy(推薦使用pip來安裝Python package).
使用pip安裝:
pip install Scrapy在這過程中我遇到了這個錯誤(原因是pip版本太低):注意一下黃色字體的說明,大致意思就是你的pip版本太低需要更新。
更新用cmd進行,在cmd里面運行python,輸入以下語句即可完成更新:
python -m pip install --upgrade pip在更新完pip后我們就可以按照Scrapy了。
如果lxml還沒安裝的童鞋,可以通過pip完成安裝,安裝語句:
pip install lxmlScrapy項目的建立
安裝好以上環(huán)境、包之后,打開cmd,輸入scrapy startproject liaoxuefeng,出現(xiàn)以下提示后,就說明你已經(jīng)成功創(chuàng)建一個scrapy的新項目:
該命令將會創(chuàng)建包含下列內容的?tutorial?目錄:
tutorial/scrapy.cfgtutorial/__init__.pyitems.pypipelines.pysettings.pyspiders/__init__.py...這些文件分別是:
- scrapy.cfg: 項目的配置文件
- tutorial/: 該項目的python模塊。之后您將在此加入代碼。
- tutorial/items.py: 項目中的item文件.
- tutorial/pipelines.py: 項目中的pipelines文件.
- tutorial/settings.py: 項目的設置文件.
- tutorial/spiders/: 放置spider代碼的目錄.
CMD部分
輸入:“cd..”返回更目錄
輸入:“f:”進入f盤
輸入:“cd”并將test文件夾拖入cmd中,回車,進入test文件夾,然后就可以執(zhí)行我們的“scrapy startproject liaoxuefeng”語句了
備注:以管理員身份進入cmd是不允許將文件(夾)拖入cmd中的,這個時候就比較麻煩需要手動輸入文件地址了,一般我是不會以管理員身份進入cmd。
總結
以上是生活随笔為你收集整理的Scrapy框架学习记录的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: pandas教程(一)Series与Da
- 下一篇: Python--状态码的简介与获取方法