當前位置：首頁 >

BeautifulSoup 用法总结

發布時間：2025/3/17 34 豆豆

生活随笔收集整理的這篇文章主要介紹了 BeautifulSoup 用法总结小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

介紹

BeautifulSoup 是一個可以從HTML或XML文件中提取數據的Python庫

pip install beautifulsoup4

Beautiful Soup支持Python標準庫中的HTML解析器（’html.parser’）,還支持一些第三方的解析器，比如lxml，推薦用后者，純C實現的，速度更快：

pip install lxml

from bs4 import BeautifulSoupsoup=BeautifulSoup(html_doc,'lxml') soup=soup.prettify() #容錯處理===>自動補全代碼

一個html是一個對象，對象可以嵌套對象；每個soup對象下的每一個標簽，也都是對象。

find與find_all方法: 可根據標簽名,屬性,內容查找文檔，但是find只找第一個元素。

通過select方法來選擇，支持CSS選擇的器的所有方式，在此不詳述。

子節點、子孫節點：
- 子節點：soup_obj.contents 返回列表；soup_obj.children返回迭代器
- 子孫節點：soup_obj.descendants
父節點、祖先節點：soup_obj.parent父節soup_obj.parents祖先節點
兄弟節點：soup_obj.next_siblings；soup_obj.previous_siblings

以上是生活随笔為你收集整理的BeautifulSoup 用法总结的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。