wget 网页爬虫,网页抓取工具
生活随笔
收集整理的這篇文章主要介紹了
wget 网页爬虫,网页抓取工具
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
前言
如何在linux上或者是mac上簡(jiǎn)單使用爬蟲(chóng)或者是網(wǎng)頁(yè)下載工具呢,常規(guī)的我們肯定是要去下載一個(gè)軟件下來(lái)使用啦,可憐的這兩個(gè)系統(tǒng)總是找不到相應(yīng)的工具,這時(shí)wget出來(lái)幫助你啦!!!wget本身是拿來(lái)下載東西的,但遠(yuǎn)不止那么強(qiáng)大,是一把強(qiáng)大利器。
使用指南
- 快速上手(整個(gè)bootstrap網(wǎng)頁(yè)全被你抓取下來(lái)了~_~)
參數(shù)說(shuō)明
-c:斷點(diǎn)續(xù)傳
-r:遞歸下載
-np:遞歸下載時(shí)不搜索上層目錄
-nd:遞歸下載時(shí)不創(chuàng)建一層一層的目錄,把所有文件下載當(dāng)前文件夾中
-p:下載網(wǎng)頁(yè)所需要的所有文件(圖片,樣式,js文件等)
-H:當(dāng)遞歸時(shí)是轉(zhuǎn)到外部主機(jī)下載圖片或鏈接
-k:將絕對(duì)鏈接轉(zhuǎn)換為相對(duì)鏈接,這樣就可以在本地脫機(jī)瀏覽網(wǎng)頁(yè)了
總結(jié)
以上是生活随笔為你收集整理的wget 网页爬虫,网页抓取工具的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: excel vba 调用webbrows
- 下一篇: 批量生成PDF417码