日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python 对指定URL获取其子链接

發布時間:2025/3/21 python 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python 对指定URL获取其子链接 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

仿照http://blog.csdn.net/lming_08/article/details/44710779里面的方法, 獲取指定URL 的所需的子鏈接及其描述.

#!/usr/bin/python # -*- coding: utf-8 -*- import sys import urllib2 import reif len(sys.argv) != 2:print "%s url" % __file__sys.exit(-1)url=sys.argv[1]user_agent = 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6' headers = { 'User-Agent' : user_agent } ''' <a href="http://faxian.smzdm.com/p/488573" target="_blank" onclick="ga('send', 'event','發現頻道','列表_文章圖片','488573_HITACHI 日立 CM-N1000 冷凍收縮毛孔多功能美容儀');" class="picBox"> <img src="http://ym.zdmimg.com/201503/29/5517b316c0c752738.jpg_d200.jpg" alt="HITACHI 日立 CM-N1000 冷凍收縮毛孔多功能美容儀" title="" height= ''' req = urllib2.Request(url, headers = headers) try:html = urllib2.urlopen(req).read()pattern = re.compile(r"<a href=.* target=\"_blank\" onclick=.*\s?.*<img src=.*\.jpg\" alt=.*title=\"\".*height=") # correctres_list = pattern.findall(html)for content in res_list:pat = re.compile(r"http://.*p/\d{6}")url = pat.search(content).group()pat = re.compile(r"alt=\".*\" title")desc = pat.search(content).group()[5:-8]print url, re.sub(r"\s?", "", desc) except urllib2.HTTPError:print "failed parsing web url"

執行結果為:

lming_08@ubuntu:~/MyWorkSpace/Pycode/htmlparse$ python get_smzdm_productinfo.py http://faxian.smzdm.com/fenlei/nvshixiangshui http://faxian.smzdm.com/p/487641 TOMMYHILFIGER都市新貴女士EDT淡香水30m http://faxian.smzdm.com/p/487231 GUERLAIN嬌蘭AquaAllegoria花草水語系列橙花伊甸園女士淡香 http://faxian.smzdm.com/p/482913 山東福利:LANCOME蘭蔻珍愛愛戀女士香水30m http://faxian.smzdm.com/p/479941 SalvatoreFerragamo菲拉格慕仲夏之夢淡香水噴霧100ml/3.4o http://faxian.smzdm.com/p/478681 VIVIENNEWESTWOODBoudoir密室女士香水(50ml http://faxian.smzdm.com/p/478055 SwissArmyMountainWater香 http://faxian.smzdm.com/p/475269 BURBERRY博柏利周末香水DEP50m http://faxian.smzdm.com/p/473353 MOSCHINO霧仙濃奧莉芙娃娃淡香水4.9m http://faxian.smzdm.com/p/472327 GALIMARD加利馬爾藍色妖姬綻放夏日限量版30m http://faxian.smzdm.com/p/471217 Dior迪奧真我淡香水50m http://faxian.smzdm.com/p/470015 BVLGARI寶格麗淡香水噴霧100m http://faxian.smzdm.com/p/469435 ANNASUI安娜蘇幻境綺緣女士持久淡香水50m http://faxian.smzdm.com/p/468123 CalvinKlein卡文克萊因為你女用淡香水100ml(簡裝 http://faxian.smzdm.com/p/467927 BURBERRY博柏利body肌體香水噴霧35M http://faxian.smzdm.com/p/467535 SalvatoreFerragamo菲拉格慕閃耀光采淡香水噴霧100m http://faxian.smzdm.com/p/467391 SalvatoreFerragamo菲拉格慕花水時刻淡香水噴霧100m http://faxian.smzdm.com/p/464821 BURBERRY博柏利周末香水噴霧50m http://faxian.smzdm.com/p/462473 Annasui安娜蘇搖滾心情淡香水噴霧50m http://faxian.smzdm.com/p/461755 LANVIN浪凡我愿意女士香水4.5m http://faxian.smzdm.com/p/461189 Lanvin浪凡光韻女士香水5m

?

總結

以上是生活随笔為你收集整理的python 对指定URL获取其子链接的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。