用wget下载网站,实现离线浏览
生活随笔
收集整理的這篇文章主要介紹了
用wget下载网站,实现离线浏览
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
資料來(lái)源:http://www.truevue.org/linux/wget-download-website
想下一些LSF的文檔,windows下的離線瀏覽有teleport等軟件可以選擇,Linux下面的類似的離線瀏覽的軟件就更多了。
本來(lái)想看看能不能用curl來(lái)實(shí)現(xiàn)整個(gè)網(wǎng)站下載,后來(lái)發(fā)現(xiàn)curl沒(méi)有網(wǎng)站下載這個(gè)功能。Linux下面除了curl外另一個(gè)強(qiáng)大的軟件就是wget。
發(fā)現(xiàn)wget果然強(qiáng)大,有網(wǎng)站下載這個(gè)功能,而且還可以控制網(wǎng)站下載的方式,下面就是wget進(jìn)行網(wǎng)站下載的命令:
$ wget \--recursive \--no-clobber \--page-requisites \--html-extension \--convert-links \--restrict-file-names=windows \--domains w3schools.com \--no-parent \http://www.w3schools.com/html/default.asp上面的命令會(huì)下載 http://www.w3schools.com/html/default.asp 下面所有的頁(yè)面。
上面用到的wget網(wǎng)站下載選擇解釋:
- --recursive: 下載整個(gè)網(wǎng)站
- --domains w3schools.com: 不要下載指定域名之外的網(wǎng)頁(yè)。
- --no-parent: 僅下載html/文件夾下的網(wǎng)頁(yè)。
- --page-requisites: 現(xiàn)在網(wǎng)頁(yè)包括的所有內(nèi)容(images, CSS and so on).
- --html-extension: 將網(wǎng)頁(yè)保存為html文件。
- --convert-links: 將連接轉(zhuǎn)換為本地連接
- --restrict-file-names=windows: 文件名保存為windows格式。
- --no-clobber: 不要覆蓋已有文件,在下載中斷后繼續(xù)下載。
總結(jié)
以上是生活随笔為你收集整理的用wget下载网站,实现离线浏览的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: java-net-php-python-
- 下一篇: GNOME3 美化