xpath helper
引語
在爬蟲各個(gè)應(yīng)用場景下,數(shù)據(jù)解析為其中重要的一環(huán)。而在數(shù)據(jù)解析中,BeautifulSoup、Xpath以及正則表達(dá)式等多種方法均為利器,在實(shí)際應(yīng)用中根據(jù)不同場景選擇不同的方法是最高效的,但是對各個(gè)方法的掌握程度要求很高。事實(shí)上,精通一種方法就已經(jīng)滿足需要了,再此基礎(chǔ)之上,用輔助工具幫助理解提高效率。
本文將提供給“爬蟲大師們”使用xpath方法的輔助工具XPath Helper插件。
XPath Helper簡介
XPath即為XML路徑語言,它是一種用來確定XML(標(biāo)準(zhǔn)通用標(biāo)記語言的子集)文檔中某部分位置的語言。XPath基于XML的樹狀結(jié)構(gòu),提供在數(shù)據(jù)結(jié)構(gòu)樹中找尋節(jié)點(diǎn)的能力。起初XPath的提出的初衷是將其作為一個(gè)通用的、介于XPointer與XSL間的語法模型。
XPath Helper是一款專用于chrome內(nèi)核瀏覽器的實(shí)用型爬蟲網(wǎng)頁解析工具。XPath Helper插件功能強(qiáng)勁,支持進(jìn)行XPath查詢功能。XPath Help插件可以幫助用戶在各類網(wǎng)站上通過按shift鍵選擇想要查看的頁面元素來提取查詢其代碼,同時(shí)還支持用戶對查詢出來的代碼進(jìn)行編輯,而編輯出的結(jié)果將立即顯示在旁邊的結(jié)果框中。
XPath Helper安裝方法
根據(jù)下面的鏈接將文件下載到本地。
鏈接:https://pan.baidu.com/s/18_Ws5qjHW9skhE1cb1jtYA
提取碼:x0no? ??
如果鏈接失效,請聯(lián)系Cgm1285373531
下載完成后,將文件的后綴名改為“.zip”,并進(jìn)行解壓。
解壓之后有兩個(gè)文件,將文件名為“2.0.2_0.crx”后綴名改為“.zip”,并對其進(jìn)行二次解壓。
至此,所有彈出的提示語句全部選擇 是
二次解壓完成,獲得如下圖所示的文件夾。如果紅色框內(nèi)文件夾如圖所示,將“_metadata”改為“metadata”。如果默認(rèn)就是“metadata”則不需要做任何操作。
進(jìn)入自己對應(yīng)的瀏覽器。在此,我以Google瀏覽器為基礎(chǔ)操作。
點(diǎn)擊谷歌右上角的三個(gè)點(diǎn)的按鈕
選擇更多工具——>選擇擴(kuò)展程序
進(jìn)入,打開開發(fā)者模式,加載已解壓的擴(kuò)展程序,選擇相應(yīng)的已解壓的文件,確認(rèn)!
重啟瀏覽器,確認(rèn)可以正常使用
如下圖表示創(chuàng)建成功。
??
使用方法,打開xpath,按住shfit鍵,鼠標(biāo)指哪就顯示哪個(gè)的值。
?
?
?
?
原文鏈接:https://blog.csdn.net/heartbeat196/article/details/113790232
?
總結(jié)
以上是生活随笔為你收集整理的xpath helper的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HttpClientHelper
- 下一篇: OpenCV图像处理(下) 边缘检测+模