日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

【python爬虫-爬微博】爬取王思聪所有微博数据

發布時間:2024/1/18 python 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【python爬虫-爬微博】爬取王思聪所有微博数据 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1. 準備:

  • 代理IP 。網上有很多免費代理ip,如西刺免費代理IP http://www.xicidaili.com/,自己可找一個可以使用的進行測試;?
  • 抓包分析 。通過抓包獲取微博內容地址。當然web下的api地址可以通過瀏覽器獲得。

以下是通過瀏覽器調試獲得的接口:

個人信息接口:

微博列表接口:

2. 完整代碼:

import urllib.request import json import timeid = '1826792401' # 定義要爬取的微博id。王思聰微博https://m.weibo.cn/u/1826792401 proxy_addr = "122.241.72.191:808" # 設置代理IP# 定義頁面打開函數 def use_proxy(url,proxy_addr):req = urllib.request.Request(url)req.add_header("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0")proxy = urllib.request.ProxyHandler({'http': proxy_addr})opener = urllib.request.build_opener(proxy, urllib.request.HTTPHandler)urllib.request.install_opener(opener)data = urllib.request.urlopen(req).read().decode('utf-8', 'ignore')return data# 獲取微博主頁的containerid,爬取微博內容時需要此id def get_containerid(url):data = use_proxy(url, proxy_addr)content = json.loads(data).get('data')for data in content.get('tabsInfo').get('tabs'):if(data.get('tab_type') == 'weibo'):containerid = data.get('containerid')return containerid# 獲取微博用戶的基本信息,如:微博昵稱、微博地址、微博頭像、關注人數、粉絲數、性別、等級等 def get_userInfo(id):url = 'https://m.weibo.cn/api/container/getIndex?type=uid&value='+id # 個人信息接口data = use_proxy(url, proxy_addr)content = json.loads(data).get('data')profile_image_url = content.get('userInfo').get('profile_image_url')description = content.get('userInfo').get('description')profile_url = content.get('userInfo').get('profile_url')verified = content.get('userInfo').get('verified')guanzhu = content.get('userInfo').get('follow_count')name = content.get('userInfo').get('screen_name')fensi = content.get('userInfo').get('followers_count')gender = content.get('userInfo').get('gender')urank = content.get('userInfo').get('urank')print("微博昵稱:"+name+"\n"+"微博主頁地址:"+profile_url+"\n"+"微博頭像地址:"+profile_image_url+"\n"+"是否認證:"+str(verified)+"\n"+"微博說明:"+description+"\n"+"關注人數:"+str(guanzhu)+"\n"+"粉絲數:"+str(fensi)+"\n"+"性別:"+gender+"\n"+"微博等級:"+str(urank)+"\n")pass# 獲取微博內容信息,并保存到文本中,內容包括:每條微博的內容、微博詳情頁面地址、點贊數、評論數、轉發數等 def get_weibo(id, file):i = 1while True:url = 'https://m.weibo.cn/api/container/getIndex?type=uid&value='+idweibo_url = 'https://m.weibo.cn/api/container/getIndex?type=uid&value='+id+'&containerid='+get_containerid(url)+'&page='+str(i)print(url)print(weibo_url)try:data = use_proxy(weibo_url, proxy_addr)content = json.loads(data).get('data')cards = content.get('cards')if(len(cards)>0):for j in range(len(cards)):print("第"+str(i)+"頁,第"+str(j)+"條微博")card_type = cards[j].get('card_type')if(card_type == 9):mblog = cards[j].get('mblog')attitudes_count = mblog.get('attitudes_count')comments_count = mblog.get('comments_count')created_at = mblog.get('created_at')reposts_count = mblog.get('reposts_count')scheme = cards[j].get('scheme')text = mblog.get('text')with open(file, 'a', encoding='utf-8') as fh:fh.write("第"+str(i)+"頁,第"+str(j)+"條微博"+"\n")fh.write("微博地址:"+str(scheme)+"\n"+"發布時間:"+str(created_at)+"\n"+"微博內容:"+text+"\n"+"點贊數:"+str(attitudes_count)+"\n"+"評論數:"+str(comments_count)+"\n"+"轉發數:"+str(reposts_count)+"\n")passpasspassi += 1time.sleep(0.05)passelse:breakexcept Exception as e:print(e)passpasspassif __name__ == "__main__":print('開始---')file = id+".txt"get_userInfo(id)get_weibo(id, file)print('完成---') pass

3.?原博主認為:

一般做爬蟲爬取網站,首選的都是m站,其次是wap站,最后考慮PC站。當然,這不是絕對的,有的時候PC站的信息最全,而你又恰好需要全部的信息,那么PC站是你的首選。一般m站都以m開頭后接域名, 所以本文開搞的網址就是 m.weibo.cn。

感謝原博主的偉大貢獻,真實還原了微博api的思路和接口。

-

總結

以上是生活随笔為你收集整理的【python爬虫-爬微博】爬取王思聪所有微博数据的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 亚洲无吗一区二区三区 | 嫩草国产在线 | 欧美久久久久久久久久久久 | 国产黄色自拍视频 | jizzz18| 色哟哟免费在线观看 | 麻豆激情视频 | 三级亚洲| 在线免费观看网站入口在哪 | 日韩毛片基地 | 蜜桃视频欧美 | 成人青青草 | 色偷偷免费 | 国产片在线 | 久久久久久久女国产乱让韩 | 欧美天堂在线视频 | www.伊人 | 99热在线观看精品 | 奇米成人 | 婷婷五月综合激情 | 无人在线观看高清视频 | 日韩精品电影一区二区三区 | 5d肉蒲团之性战奶水 | 亚洲图片视频小说 | 青青草91 | 国产精品一区二区av | 中文黄色片 | 日韩av在线影院 | 天天舔天天操天天干 | 日韩资源| 中文字幕91爱爱 | 8050午夜一级毛片久久亚洲欧 | 第四色影音先锋 | 特黄特色大片免费播放器使用方法 | 在线观看日韩中文字幕 | 就操成人网 | 国产福利小视频在线 | 亚洲五级片 | 在线观看免费观看在线 | 91精品婷婷国产综合久久 | 黄色三级网 | 少妇肥臀大白屁股高清 | 主播福利在线 | 综合激情视频 | 极品人妻一区二区三区 | 精品在线视频一区二区 | 怎么可能高潮了就结束漫画 | av片在线观看 | 欧美大喷水吹潮合集在线观看 | 激情偷拍| 国内免费av| 在线免费av播放 | 男人久久天堂 | 亚洲小说春色综合另类 | 精品产国自在拍 | 夜夜骚视频 | 久操国产在线 | 日产mv免费观看 | 处女朱莉第一次 | 国产成人av一区二区三区不卡 | jizz日本在线播放 | 日日噜噜噜夜夜爽爽狠狠 | 人人射人人爱 | 香港a毛片| 天天摸天天添 | 丝袜美女啪啪 | αv在线| 日韩黄色短视频 | 欧美色视频在线 | 欧美在线免费 | 男生和女生靠逼视频 | 韩国妻子的朋友 | 宅男视频污 | 粉嫩av一区二区夜夜嗨 | 免费看麻豆 | 爱乃なみ加勒比在线播放 | 亚洲国产精品无码久久 | 影音先锋成人在线 | 精品熟女一区二区三区 | 国产11页| 精品一区二区三区三区 | 国产女人叫床高潮大片免费 | 国产一级aa大片毛片 | 国产成人午夜精华液 | 成人国产精品久久久 | 狠狠91| 欧美精品久久久久久久多人混战 | 国模在线视频 | 国产黄色网 | 久草新免费 | 国产亚洲精品久久久久久久久动漫 | 麻豆一区产品精品蜜桃的特点 | 先锋影音一区二区三区 | 国内成人在线 | 奇米影视第四色888 免费观看a毛片 | 麻豆av在线 | 亚洲无人区小视频 | 三级av在线播放 | 深夜国产视频 |