python爬虫搜特定内容的论文_python基于BeautifulSoup实现抓取网页指定内容的方法...
python基于BeautifulSoup實現抓取網頁指定內容的方法
更新時間:2015年07月09日 10:12:50 作者:光索與諾
這篇文章主要介紹了python基于BeautifulSoup實現抓取網頁指定內容的方法,涉及Python使用BeautifulSoup模塊解析html網頁的相關技巧,具有一定參考借鑒價值,需要的朋友可以參考下
本文實例講述了python基于BeautifulSoup實現抓取網頁指定內容的方法。分享給大家供大家參考。具體實現方法如下:
# _*_ coding:utf-8 _*_
#xiaohei.python.seo.call.me:)
#win+python2.7.x
import urllib2
from bs4 import BeautifulSoup
def jd(url):
page = urllib2.urlopen(url)
html_doc = page.read()
soup = BeautifulSoup(html_doc.decode('gb2312','ignore'))
for i in soup.find_all('div', id="sortlist"):
one = i.find_all('a')
two = i.find_all('li')
print ("%s %s" % (one,two))
jd("http://channel.jd.com/computer.html")
希望本文所述對大家的Python程序設計有所幫助。
相關文章
今天小編就為大家分享一篇python 實現dict轉json并保存文件,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-12-12
今天小編就為大家分享一篇python保存log日志,實現用log日志來畫圖,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-12-12
這篇文章主要介紹了Bottle框架中的裝飾器類和描述符應用詳解,具有一定參考價值,需要的朋友可以了解下。2017-10-10
這篇文章主要介紹了解決tensorflow 釋放圖,刪除變量問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-06-06
本文主要是針對Python的字典dict遍歷的4種方法進行了性能測試,以便分析得出效率最高的一種方法2014-06-06
這篇文章主要介紹了Python中的分支和循環結構,本文通過實例代碼給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下2020-02-02
這篇文章主要介紹了Python使用PyCrypto實現AES加密功能,結合具體實例形式分析了PyCrypto實現AES加密的操作步驟與相關實現技巧,需要的朋友可以參考下2017-05-05
這篇文章主要介紹了Python線程池模塊ThreadPoolExecutor用法,結合實例形式分析了Python線程池模塊ThreadPoolExecutor的導入與基本使用方法,需要的朋友可以參考下2018-12-12
這篇文章主要介紹了在Python的Flask框架下收發電子郵件的教程,主要用到了Flask中的Flask-mail工具,需要的朋友可以參考下2015-04-04
下面小編就為大家帶來一篇淺談編碼,解碼,亂碼的問題。小編覺得挺不錯的,現在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2016-12-12
最新評論
總結
以上是生活随笔為你收集整理的python爬虫搜特定内容的论文_python基于BeautifulSoup实现抓取网页指定内容的方法...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python爬虫源码附注解_Python
- 下一篇: python 对话框的创建及调用_单击按