python soup findall 第几个元素_python – 如何在BeautifulSoup中获取所有父标签的列表?...
假設(shè)我有這樣的結(jié)構(gòu):
如果我指向書簽,那么只提取所有文件夾行的命令是什么?
例如,
bookmarks = soup.findAll('bookmark')
然后beautifulsoupcommand(書簽[0])將返回:
[,]
我也想知道結(jié)尾標(biāo)簽何時(shí)出現(xiàn).有任何想法嗎?
提前致謝!
解決方法:
以下是我的嘗試:
>>> from BeautifulSoup import BeautifulSoup
>>> html = """
"""
>>> soup = BeautifulSoup(html)
>>> bookmarks = soup.findAll('bookmark')
>>> [p.get('name') for p in bookmarks[0].findAllPrevious(name = 'folder')]
[u'folder2', u'folder1']
與@ eumiro的答案的主要區(qū)別在于我使用的是findAllPrevious而不是findParents.當(dāng)我測試@ eumiro的解決方案時(shí),我發(fā)現(xiàn)findParents僅返回第一個(gè)(立即)父節(jié)點(diǎn),因?yàn)楦腹?jié)點(diǎn)和祖父節(jié)點(diǎn)的名稱相同.
>>> [p.get('name') for p in bookmarks[0].findParents('folder')]
[u'folder2']
>>> [p.get('name') for p in bookmarks[0].findParents()]
[u'folder2', None]
如果父母和祖父母的名字不同,它確實(shí)會(huì)返回兩代父母.
>>> html = """
"""
>>> soup = BeautifulSoup(html)
>>> bookmarks = soup.findAll('bookmark')
>>> [p.get('name') for p in bookmarks[0].findParents()]
[u'folder2', u'folder1', None]
標(biāo)簽:python,xml-parsing,html-parsing,beautifulsoup
總結(jié)
以上是生活随笔為你收集整理的python soup findall 第几个元素_python – 如何在BeautifulSoup中获取所有父标签的列表?...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 无线路由器一直被重置路由器被我重置了怎么
- 下一篇: python 判断子序列_LeetCod