xpath 解析离线网页解析本地网页解析本体html文件
生活随笔
收集整理的這篇文章主要介紹了
xpath 解析离线网页解析本地网页解析本体html文件
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
去年的工作,發第一篇試試
# coding= utf-8 import requests from lxml import etree # path = './web/new_index.html' fp = open('E:\\0爬蟲監控平臺\\錯誤碼視圖\\應用監控平臺.html','rb') html = fp.read().decode('utf-8') #.decode('gbk') print(html) selector = etree.HTML(html) #etree.HTML(源碼) 識別為可被xpath解析的對象 print(selector) infos = selector.xpath('//*[@id="tabs"]/ul/li[3]/a/text()') print(type(infos)) #運行結果 <class 'list'> print(len(infos)) #運行結果 11 print(infos)總結
以上是生活随笔為你收集整理的xpath 解析离线网页解析本地网页解析本体html文件的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: .Net 强名称签名程序集
- 下一篇: docker与jenkins学习