當前位置：首頁 >

Python爬虫：Xpath语法笔记

發布時間：2025/7/25 56 豆豆

生活随笔收集整理的這篇文章主要介紹了 Python爬虫：Xpath语法笔记小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Python爬蟲：Xpath語法筆記

一、選取節點
常用的路勁表達式：

二、謂語

謂語被嵌在方括號內，用來查找某個特定的節點或包含某個制定的值的節點

實例：

表達式	結果
xpath(‘/body/div[1]’)	選取body下的第一個div節點
xpath(‘/body/div[last()]’)	選取body下最后一個div節點
xpath(‘/body/div[last()-1]’)	選取body下倒數第二個div節點
xpath(‘/body/div[positon()<3]’)	選取body下前兩個div節點
xpath(‘/body/div[@class]’)	選取body下帶有class屬性的div節點
xpath(‘/body/div[@class=”main”]’)	選取body下class屬性為main的div節點
xpath(‘/body/div[price>35.00]’)	選取body下price元素值大于35的div節點

?三、通配符

Xpath通過通配符來選取未知的XML元素

?四、取多個路徑

使用“|”運算符可以選取多個路徑

表達式	結果
xpath(‘//div\|//table’)	選取所有的div和table節點

五、Xpath軸

軸可以定義相對于當前節點的節點集

preceding-sibling	xpath(‘./preceding-sibling::*’)	選取當前節點之前的兄弟節點
self	xpath(‘./self::*’)	選取當前節點

六、功能函數???

使用功能函數能夠更好的進行模糊搜索

函數	用法	解釋
starts-with	xpath(‘//div[starts-with(@id,”ma”)]‘)	選取id值以ma開頭的div節點
contains	xpath(‘//div[contains(@id,”ma”)]‘)	選取id值包含ma的div節點
and	xpath(‘//div[contains(@id,”ma”) and contains(@id,”in”)]‘)	選取id值包含ma和in的div節點
text()	xpath(‘//div[contains(text(),”ma”)]‘)	選取節點文本包含ma的div節點
?	?	?

scrapy xpath文檔：http://doc.scrapy.org/en/0.14/topics/selectors.html

轉載于:https://www.cnblogs.com/PeterZhang1520389703/p/8193465.html

以上是生活随笔為你收集整理的Python爬虫：Xpath语法笔记的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。