當前位置：首頁 >

bs4爬取网页基础

發布時間：2025/3/20 29 豆豆

生活随笔收集整理的這篇文章主要介紹了 bs4爬取网页基础小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

import requests from bs4 import BeautifulSoupdef getSOUP(url):try:r = requests.get(url, timeout=30)r.raise_for_status()# print(r.text) # 代碼很亂soup = BeautifulSoup(r.text, "html.parser") # parser分析器、解析器# print(soup.prettify()) # 美化后的網頁代碼print(soup.a) # 獲取標簽內容print(soup.a.name) # 獲取標簽名字print(soup.a.parent.name)print(soup.a.parent.parent.name)tag = soup.aprint(type(tag)) # tag屬性print(tag.attrs) # 打印屬性,無論存在屬性都會返回一個字典類型print(type(tag.attrs)) # 打印屬性類型print(tag.attrs['class']) # 打印class屬性的屬性值print(type(tag.attrs['class']))print(tag.string) # 獲取字符串except expression as identifier:print("錯誤")if __name__ == "__main__":url = "https://python123.io/ws/demo.html"getSOUP(url)

總結

以上是生活随笔為你收集整理的bs4爬取网页基础的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

bs4爬取网页基础

總結