當(dāng)前位置：首頁 > 编程语言 > python >内容正文

python

python爬虫实验

發(fā)布時間：2024/4/14 python 41 豆豆

生活随笔收集整理的這篇文章主要介紹了 python爬虫实验小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

那天在新浪微博上看到北北出的題目，由于最近也在做類似的爬蟲研究，所以就有了這個實驗。

后來在QQ上和北北說了下，要求是啥都抓，就抓烏云的。。。

然后就開始了。。

第一個版本如下，后續(xù)不斷改進直到滿足需求：

import urllib2; from sgmllib import SGMLParser;class CatCh(SGMLParser):def reset(self):self.url=[]SGMLParser.reset(self)def start_a(self,attrs):href = [v for k, v in attrs if k == 'href']if href:self.url.extend(href)content = urllib2.urlopen("http://wooyun.org/").read() catch=CatCh() catch.feed(content) for item in catch.url:print item

轉(zhuǎn)載于:https://www.cnblogs.com/xiaoCon/p/3160657.html

總結(jié)

以上是生活随笔為你收集整理的python爬虫实验的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： [linux]makefile使用
下一篇：编写Tesseract的Python扩展