日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

BeautifulSoup 返回网页标签的名称、父标签名称、行号、完整路径

發(fā)布時間:2024/9/27 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 BeautifulSoup 返回网页标签的名称、父标签名称、行号、完整路径 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

? ? ?BeautifulSoup 返回網(wǎng)頁標簽的名稱、父標簽名稱、行號、完整路徑

應(yīng)用beatifulsoup完成網(wǎng)頁標簽的名稱、父標簽名稱、行號、完整路徑的獲取,這里reversed實現(xiàn)對網(wǎng)頁標簽的遍歷。

示例html文件:

<html xmlns="http://www.w3.org/1999/xhtml"><head> <meta content="text/html; charset=utf-8" http-equiv="Content-Type"/> <meta content="IE=Edge" http-equiv="X-UA-Compatible"/> <meta content="webkit" name="renderer"/> <title>交易網(wǎng)</title> </head> <body> <div id="menutab_8_2" style=""> <link href="../Template/Default/ztbzx/css/style.css" rel="stylesheet" type="text/css"/> <script src="../template/default/js/jquery-1.11.0.min.js" type="text/javascript"></script> <script>function iFrameHeight() {var total = document.getElementById("ZtbggxxDetail_LblCount").innerHTML;for(var i=0;i<parseInt(total);i++){var ifm = document.getElementById("iframejjgz"+i.toString());var subWeb = document.frames ? document.frames["iframejjgz"+i.toString()].document : ifm.contentDocument;if (ifm != null && subWeb != null) {ifm.height = subWeb.body.scrollHeight;}}}</script> <div id="ZtbbgggDetail_jsgc1_text"><table border="0" cellpadding="0" cellspacing="0" width="100%"><tbody><tr><td align="center"><h2 class="article-title">海運區(qū)2020年扶貧道路業(yè)績公示</h2></td></tr></tbody></table><table border="0" cellpadding="0" cellspacing="0" width="100%"><tbody><tr> <td align="center" style="line-height: 25px; color: #4e4e4e;">【信息日期:2020/01/22】</td></tr></tbody></table><table border="0" cellpadding="0" cellspacing="0" width="100%"><tbody><tr><td style="text-align:left;"><div><p> </p><p align="center" style="margin-top:0.0000pt;margin-right:0.0000pt;margin-bottom:0.0000pt;margin-left:0.0000pt;padding:0pt 0pt 0pt 0pt ;text-align:left;font-family:Calibri;font-size:12.0000pt;margin-top:0.0000pt;margin-right:0.0000pt;margin-bottom:0.0000pt; margin-left:0.0000pt;padding:0pt 0pt 0pt 0pt ; text-align:center;vertical-align:baseline;"><b><span style="font-family:宋體;color:rgb(51,51,51); letter-spacing:0.0000pt;font-weight:bold;text-transform:none; font-style:normal;font-size:14.0000pt;"><font face="宋體">海運區(qū)</font>2020年扶貧道路建設(shè)項(公平路)施工中標候選人補充業(yè)績公示</span></b></p> <div align="center"> <table border="0" cellspacing="0" style="font-family:'Times New Roman';font-size:10.0000pt;border-collapse:collapse;width:435.8000pt;border:none;"> <tbody> <tr style="height:16.2000pt;"> <td style="width:72.2500pt;padding:0.0000pt 5.4000pt 0.0000pt 5.4000pt ;border-left:1.0000pt solid windowtext;border-right:1.0000pt solid windowtext;border-top:1.0000pt solid windowtext;border-bottom:1.0000pt solid windowtext;background:rgb(255,255,255);" valign="center" width="96"> <p align="center" style="margin-top:0.0000pt;margin-right:0.0000pt;margin-bottom:0.0000pt;margin-left:0.0000pt;padding:0pt 0pt 0pt 0pt ;text-align:left;font-family:Calibri;font-size:12.0000pt;margin-top:0.0000pt;margin-right:0.0000pt;margin-bottom:0.0000pt;margin-left:0.0000pt;text-align:center;vertical-align:baseline;"><b><span style="font-family:宋體;color:rgb(51,51,51);letter-spacing:0.0000pt;font-weight:bold;text-transform:none;font-style:normal;font-size:12.0000pt;">招生人</span></b></p> </td> <td style="width:363.5500pt;padding:0.0000pt 5.4000pt 0.0000pt 5.4000pt ;border-left:none;border-right:1.0000pt solid windowtext;border-top:1.0000pt solid windowtext;border-bottom:1.0000pt solid windowtext;background:rgb(255,255,255);" valign="center" width="484"> <p align="center" style="margin-top:0.0000pt;margin-right:0.0000pt;margin-bottom:0.0000pt;margin-left:0.0000pt;padding:0pt 0pt 0pt 0pt ;text-align:left;font-family:Calibri;font-size:12.0000pt;margin-top:0.0000pt;margin-right:0.0000pt;margin-bottom:0.0000pt;margin-left:0.0000pt;text-align:center;"><span style="font-family:宋體;color:rgb(51,51,51);font-size:12.0000pt;">東臨分局</span></p> </td> </tr></tbody> </table> </div> <p align="justify" style="margin-top:0.0000pt;margin-right:0.0000pt;margin-bottom:0.0000pt;margin-left:0.0000pt;padding:0pt 0pt 0pt 0pt ;text-align:left;font-family:Calibri;font-size:12.0000pt;margin-top:0.0000pt;margin-right:0.0000pt;margin-bottom:0.0000pt; margin-left:0.0000pt;text-indent:28.1000pt;padding:0pt 0pt 0pt 0pt ; text-align:justify;text-justify:inter-ideograph; "><b><span style="font-family:宋體;color:rgb(51,51,51); font-weight:bold;font-size:12.0000pt;"><font face="宋體">若招生人對上述結(jié)果有質(zhì)疑,請在公示期內(nèi),首先以書面形式向本項目招標人提出質(zhì)疑,聯(lián)系電話:</font>3258-23387677;也可以向招標代理公司反映,聯(lián)系電話:5658-</span></b><b><span style="font-family:宋體;color:rgb(51,51,51); font-weight:bold;font-size:12.0000pt;">58956709</span></b><b><span style="font-family:宋體;color:rgb(51,51,51); font-weight:bold;font-size:12.0000pt;"><font face="宋體">;接受投訴單位及電話:交易監(jiān)督管理局電話:</font>3258-23387677。</span></b></p> <br/> <p></p></div></td></tr></tbody></table><table border="0" cellpadding="0" cellspacing="0" width="100%"><tbody><tr><td><div></div></td></tr></tbody></table></div> </div> </body></html>

代碼部分:

from bs4 import BeautifulSoup import os import re import pandas as pd from bs4 import NavigableString,Comment#返回節(jié)點的名稱Full Xpath def getelmentpath(inFile):for n in range(0, 1, 1):f = open(inFile, encoding="utf-8")bindid=os.path.basename(inFile).split('.')[0] + '_'bs = BeautifulSoup(f.read(), 'html.parser') for elem in bs.find('div', {'id': 'menutab_8_2'}).find_all(True): root_childs = '.'.join(reversed([p.name for p in elem.parentGenerator() if p])) print(elem.name+"\t"+elem.parent.name+"\t"+str(elem.sourceline)+"\t"+str(root_childs+"."+elem.name))f.close()if __name__ == '__main__':getelmentpath(r'D:/demo.html')

執(zhí)行結(jié)果:

link div 9 [document].html.body.div.link script div 10 [document].html.body.div.script script div 11 [document].html.body.div.script div div 24 [document].html.body.div.div table div 24 [document].html.body.div.div.table tbody table 24 [document].html.body.div.div.table.tbody tr tbody 24 [document].html.body.div.div.table.tbody.tr td tr 24 [document].html.body.div.div.table.tbody.tr.td h2 td 24 [document].html.body.div.div.table.tbody.tr.td.h2 table div 24 [document].html.body.div.div.table tbody table 24 [document].html.body.div.div.table.tbody tr tbody 24 [document].html.body.div.div.table.tbody.tr td tr 24 [document].html.body.div.div.table.tbody.tr.td table div 24 [document].html.body.div.div.table tbody table 24 [document].html.body.div.div.table.tbody tr tbody 24 [document].html.body.div.div.table.tbody.tr td tr 24 [document].html.body.div.div.table.tbody.tr.td div td 24 [document].html.body.div.div.table.tbody.tr.td.div p div 24 [document].html.body.div.div.table.tbody.tr.td.div.p p div 25 [document].html.body.div.div.table.tbody.tr.td.div.p b p 27 [document].html.body.div.div.table.tbody.tr.td.div.p.b span b 27 [document].html.body.div.div.table.tbody.tr.td.div.p.b.span font span 29 [document].html.body.div.div.table.tbody.tr.td.div.p.b.span.font div div 30 [document].html.body.div.div.table.tbody.tr.td.div.div table div 31 [document].html.body.div.div.table.tbody.tr.td.div.div.table tbody table 33 [document].html.body.div.div.table.tbody.tr.td.div.div.table.tbody tr tbody 34 [document].html.body.div.div.table.tbody.tr.td.div.div.table.tbody.tr td tr 35 [document].html.body.div.div.table.tbody.tr.td.div.div.table.tbody.tr.td p td 39 [document].html.body.div.div.table.tbody.tr.td.div.div.table.tbody.tr.td.p b p 41 [document].html.body.div.div.table.tbody.tr.td.div.div.table.tbody.tr.td.p.b span b 41 [document].html.body.div.div.table.tbody.tr.td.div.div.table.tbody.tr.td.p.b.span td tr 45 [document].html.body.div.div.table.tbody.tr.td.div.div.table.tbody.tr.td p td 49 [document].html.body.div.div.table.tbody.tr.td.div.div.table.tbody.tr.td.p span p 51 [document].html.body.div.div.table.tbody.tr.td.div.div.table.tbody.tr.td.p.span p div 59 [document].html.body.div.div.table.tbody.tr.td.div.p b p 62 [document].html.body.div.div.table.tbody.tr.td.div.p.b span b 62 [document].html.body.div.div.table.tbody.tr.td.div.p.b.span font span 63 [document].html.body.div.div.table.tbody.tr.td.div.p.b.span.font b p 63 [document].html.body.div.div.table.tbody.tr.td.div.p.b span b 63 [document].html.body.div.div.table.tbody.tr.td.div.p.b.span b p 64 [document].html.body.div.div.table.tbody.tr.td.div.p.b span b 64 [document].html.body.div.div.table.tbody.tr.td.div.p.b.span font span 65 [document].html.body.div.div.table.tbody.tr.td.div.p.b.span.font br div 66 [document].html.body.div.div.table.tbody.tr.td.div.br p div 67 [document].html.body.div.div.table.tbody.tr.td.div.p table div 67 [document].html.body.div.div.table tbody table 67 [document].html.body.div.div.table.tbody tr tbody 67 [document].html.body.div.div.table.tbody.tr td tr 67 [document].html.body.div.div.table.tbody.tr.td div td 67 [document].html.body.div.div.table.tbody.tr.td.div

總結(jié)

以上是生活随笔為你收集整理的BeautifulSoup 返回网页标签的名称、父标签名称、行号、完整路径的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 在线无码va中文字幕无码 | 一区二区三区欧美日韩 | 成人午夜视频免费观看 | 欧洲熟妇的性久久久久久 | 少妇免费视频 | 在线 日本 制服 中文 欧美 | 中文字幕亚洲欧美 | 日韩欧美精品在线播放 | 天天干干天天 | 都市激情 自拍偷拍 | 爱如潮水3免费观看日本高清 | 国产一区二区三区日韩 | 香蕉爱爱视频 | 操色网 | 欧美日韩视频免费 | 精品一区91 | 日韩av不卡一区二区 | 日韩午夜视频在线 | 欧美日韩免费在线视频 | 日本特黄视频 | 狠狠摸狠狠操 | 国产超碰人人爽人人做人人爱 | 歪歪视频在线观看 | 黄色美女av | 国产毛片在线看 | 免费看h网站 | 日韩高清欧美 | 免费爱爱视频网站 | 日本专区在线 | 久久αv | 黄色av毛片| 欧美日韩视频无码一区二区三 | 啪啪的网站 | 奇米影视四色777 | 91精品视频在线看 | 一级黄色片免费观看 | 魔性诱惑 | 国产66页| 91精品国产色综合久久不卡蜜臀 | 中国老熟女重囗味hdxx | 免费的黄色小视频 | 美女搡bbb又爽又猛又黄www | 亚洲丝袜在线观看 | 邻家有女4完整版电影观看 欧美偷拍另类 | 国产精品网站在线 | 欧美一级电影在线 | 国产视频1| 在线免费黄色av | 青草伊人网 | 久久国产亚洲精品无码 | 国产精品制服丝袜 | www.一区二区 | 欧美在线免费 | 在线播放a | 综合久久久久久久久久久 | av首页在线 | 国产精品久久久久久久久久直播 | 欧美色图第一页 | 一级黄av | h视频免费在线观看 | 爆乳熟妇一区二区三区霸乳 | 超碰c | 精品国精品国产 | 亚洲欧美综合网 | 久久综合激情 | 国产网友自拍视频 | 九九影视理伦片 | 日韩毛片中文字幕 | 动漫美女靠逼 | 亚洲乱码国产乱码精品精 | 欧美成人乱码一二三四区免费 | 亚洲男同视频 | 色综合久久久久 | 天天艹天天爽 | 久久成年视频 | 成人靠逼视频 | 农村激情伦hxvideos | 国内自拍区 | 福利姬在线播放 | 日韩欧美精品 | 干一干操一操 | 中文字幕15页 | 国产精品成人3p一区二区三区 | 成人国产精品视频 | 麻豆成人免费 | 亚洲欧美另类自拍 | 性欧美18一19内谢 | 国产在线一区不卡 | 中文一二三区 | 欧美日韩一区二区三 | 亚洲激情| 欧美精品一 | 少妇高潮久久久 | 久久色网 | 日本高清视频www | 美女少妇直播 | 欧美日韩一区二区三区四区五区六区 | 亚洲av久久久噜噜噜噜 | 国产在线午夜 |