python人人语音爬虫(登陆尚未完成,需要使用先登录在查cookie中的t)
生活随笔
收集整理的這篇文章主要介紹了
python人人语音爬虫(登陆尚未完成,需要使用先登录在查cookie中的t)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
2019獨角獸企業重金招聘Python工程師標準>>>
import?urllib,?urllib2,?cookielib,re,jsondef?LoginRenren(url,t_cookie):cookie?=?{"t":?t_cookie}#cookie中的t需要到瀏覽器中去查cookie?=?"".join(x?+?"="?+?cookie[x]?+?";"?for?x?in?cookie)opener?=?urllib2.build_opener(urllib2.HTTPCookieProcessor(cookielib.CookieJar()))urllib2.install_opener(opener)req?=?urllib2.Request(url)???req.add_header('Cookie',?cookie)content?=?urllib2.urlopen(req).read()return?contentdef?searchMp3(content):????reMp3?=?r'http://fmn.rrimg.com/fmn\d{3}/audio/\d{8}/\d{4}/\w+.mp3'mp3Url?=?re.findall(reMp3,content)return?mp3Urldef?downloadMp3(mp3Url,num):localPath?=?r"C:\Users\john\Desktop\renrenMp3\%d.mp3"%numurllib.urlretrieve(mp3Url,localPath)def?main(albumUrl,t_cookie):#firstpagenum?=?0pageNum?=?0mp3Url=?[]while?True:pageUrl?=?albumUrl+'/bypage/ajax?curPage=%d&pagenum=40'%pageNumjsonContent?=?LoginRenren(pageUrl,t_cookie)content?=?json.loads(jsonContent)if?content["photoList"]:tempList?=?searchMp3(jsonContent)mp3Url?=?mp3Url+tempListelse:breakpageNum?+=1print?mp3Urlfor?eachMp3?in?mp3Url:num+=1downloadMp3(eachMp3,num)if?__name__=='__main__':#albumUrl?=?raw_input("albumUrl=")#http://photo.renren.com/photo/465457202/album-868663788#t_cookie?=?raw_input("t_cookie=")#134cc936f2785fa03902fe3185e517f64albumUrl?=?'http://photo.renren.com/photo/465457202/album-868663788't_cookie?=?'134cc936f2785fa03902fe3185e517f64'main(albumUrl,t_cookie)轉載于:https://my.oschina.net/u/1159199/blog/226584
總結
以上是生活随笔為你收集整理的python人人语音爬虫(登陆尚未完成,需要使用先登录在查cookie中的t)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: LVS+Keepalived负载均衡方式
- 下一篇: Python: 使用装饰器“@”取得函数