日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

信息提取的一般方法

發(fā)布時(shí)間:2025/3/20 编程问答 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 信息提取的一般方法 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
import requests import re # 正則表達(dá)式庫(kù) from bs4 import BeautifulSoup url = "https://python123.io/ws/demo.html" r = requests.get(url, timeout=30) r.encoding = r.apparent_encoding demo = r.text soup = BeautifulSoup(demo, "html.parser") # find_all:name、attrs、recursive、string、其他參數(shù) # 標(biāo)簽名、標(biāo)簽屬性值、是否檢索子孫節(jié)點(diǎn)默認(rèn)True、標(biāo)簽中字符串 # name # 獲取全部鏈接 for link in soup.find_all('a'):print(link.get("href")) # 獲取a和p標(biāo)簽內(nèi)容 print("獲取a和p標(biāo)簽內(nèi)容") print(soup.find_all(['a', 'p'])) # 列表形式 for s in soup.find_all(['a', 'p']):print(s) # 獲取soup的全部標(biāo)簽 print("全部標(biāo)簽名稱") for tag in soup.find_all(True):print(tag.name) print("使用正則表達(dá)式查找以b開(kāi)頭的標(biāo)簽名稱") for tag in soup.find_all(re.compile('b')):print(tag.name) # attrs print("獲取p標(biāo)簽中屬性為course的內(nèi)容") print(soup.find_all('p', 'course')) print("查找id為link1的內(nèi)容") print(soup.find_all(id='link1')) # 若沒(méi)有則返回空列表 print("使用正則表達(dá)式查找id以link開(kāi)頭的標(biāo)簽內(nèi)容") print(soup.find_all(id=re.compile("link"))) # recursive(遞歸的) print(soup.find_all('a')) print("測(cè)試recursive:") print(soup.find_all('a', recursive=False)) # 為空,說(shuō)明soup兒子節(jié)點(diǎn)無(wú)a標(biāo)簽 print(soup.find_all('a', recursive=True)) # string print("查找Basic Python") print(soup.find_all(string="Basic Python")) # 沒(méi)有輸出空列表 print("使用正則表達(dá)式查找包含Python的內(nèi)容:") print(soup.find_all(string=re.compile("Python"))) # 區(qū)分大小寫(xiě)

?

總結(jié)

以上是生活随笔為你收集整理的信息提取的一般方法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。