一、网络爬虫概述
1,瀏覽器與網(wǎng)絡爬蟲的區(qū)別
答:
對于瀏覽器而言:瀏覽器打開一個網(wǎng)站,會對網(wǎng)站服務器發(fā)送一個request請求,服務器收到該請求之后,會給瀏覽器一個respond響應,該響應攜帶很多數(shù)據(jù),之后瀏覽器收到這些數(shù)據(jù)進行渲染,最終形成可視化的頁面效果。
對于網(wǎng)絡爬蟲而言:和瀏覽器幾乎一樣,唯一不同的地方在于,網(wǎng)絡爬蟲只會獲取這些數(shù)據(jù),并不會進行像瀏覽器那樣進行渲染,不會形成一種可視化的效果而已。當讓,獲取這些數(shù)據(jù)已經(jīng)夠用了,然后通過一些正則表達式對這些數(shù)據(jù)進行有用的提取即可。
通俗而言:瀏覽器–展示數(shù)據(jù);網(wǎng)絡爬蟲–采集數(shù)據(jù)
2,網(wǎng)絡爬蟲的定義
答:網(wǎng)絡爬蟲就是模擬客戶端發(fā)送網(wǎng)絡請求,獲取響應數(shù)據(jù),一種按照一定的規(guī)則,·自動地抓取Internet(因特網(wǎng))信息的程序或腳本。
3,網(wǎng)絡爬蟲的作用
答:從Internet因特網(wǎng)上獲取需要的信息數(shù)據(jù)。
總結(jié)
- 上一篇: 《幽兰》第四句是什么
- 下一篇: 三、Beautiful Soup解析库