日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

div超出不换行_一日一技:XPath不包含应该怎么写?

發布時間:2025/4/16 编程问答 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 div超出不换行_一日一技:XPath不包含应该怎么写? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

攝影:產品經理廚師:kingname

假設有這樣一段HTML代碼:

測試XPath移除功能

無關緊要的引用內容

你好啊

產品經理

很高興認識你

我想把其中的 你好啊產品經理,很高興認識你提取出來。

如果我們把XPath寫成:

//div[@]/text()

運行效果如下圖所示:

這是因為 /text()只會獲取當前標簽下面的文本,不會獲取子標簽的文本。

為了解決這個問題,我們在 /text()前面再添加一根斜線:

//div[@]//text()

這樣就可以抓取這個 div標簽及其子標簽下面的所有文本。運行效果如下圖所示:

現在問題來了, 無關緊要的引用內容是我不想要的,但是卻被無差別抓取進來了。

如果能夠實現,抓取 這個 div標簽下的文本和除了 以外的所有子節點的文本就好了。

如果沒有 你好啊這三個字,那么XPath可以這樣寫:

//div[@]//*[not(@)]/text()

這里的 //*[not(@)]的意思是說,這個 div標簽下面的所有 class不為"quote"的子標簽的文本。

運行效果如下圖所示:

但比較麻煩的是, 你好啊這一句,它就是 div標簽下的文本,它不屬于任何子標簽。所以上面的XPath無法獲取到。

為了單獨直接獲取 div下面的內容,我們需要使用 |再拼接一個 XPath:

//div[@]/text() | //div[@]//*[not(@)]/text()

運行效果如下圖所示:

不過結果是一個列表,并且有很多換行符,看起來不夠清晰,于是用Python再進行清洗。最終效果如下圖所示:

總結

以上是生活随笔為你收集整理的div超出不换行_一日一技:XPath不包含应该怎么写?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。