Python_爬虫
Python_爬蟲
爬蟲概念
數據獲取的方式:
- 企業生產的用戶數據:大型互聯網公司有海量用戶,所以他們積累數據有天然優勢。有數據意識的中小型企業,也開始積累的數據。
- 數據管理咨詢公司
- 政府/機構提供的公開數據
- 第三方數據平臺購買數據
- 爬蟲爬取數據
什么是爬蟲
抓去網頁數據的程序
如何抓去網頁數據
網頁三大特征:
- 每個網頁都有自己的URL
- 網頁都使用HTML標記語言來描述頁面信息
- 網頁都使用HTTP/HTTPS協議來傳輸HTML數據
爬蟲的設計思路
如果是需要的數據,就保存起來
如果頁面是其它URL,那就繼續爬取
原文地址https://segmentfault.com/a/1190000014981939?utm_source=index-hottest
總結
- 上一篇: 敲诈勒索罪无罪裁判要旨汇总
- 下一篇: Python3学习笔记(六):字符串