日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python+requests+re匹配抓取猫眼上映电影信息

發布時間:2025/3/21 python 80 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python+requests+re匹配抓取猫眼上映电影信息 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

python+requests抓取貓眼中上映電影,re正則匹配獲取對應電影的排名,圖片地址,片名,主演及上映時間和評分

?

import requests import re, json def get_html(url):"""獲取網頁html源碼:return:"""user_agent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) " \"AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36"# 瀏覽器信息headers = {"User-Agent": user_agent}r = requests.get(url, headers=headers) html = r.text# print(html)return htmldef parse_one_page(html):"""正則匹配需要內容:param html::return:"""# 排名+圖片地址+主演+上映時間+評分pattern = re.compile('<dd>.*?board-index.*?>(\d+)</i>.*?data-src="(.*?)".*?name"><a'+ '.*?>(.*?)</a>.*?star">(.*?)</p>.*?releasetime">(.*?)</p>'+ '.*?integer">(.*?)</i>.*?fraction">(.*?)</i>.*?</dd>', re.S)items = re.findall(pattern, html)for item in items:yield {"排名": item[0],"圖片地址": item[1],"片名": item[2],"主演": item[3].strip()[3:],"上映時間": item[4].strip()[4:],"分數": item[5] + item[6]}# 數據存儲def write_file(content):with open("result.txt", 'a+', encoding='utf-8') as f:f.write(json.dumps(content, ensure_ascii=False) + "\n")def main():"""主函數:return:"""url = "http://maoyan.com/board/4"html = get_html(url)for item in parse_one_page(html):print(item)write_file(item)if __name__ == '__main__':main()

?

轉載于:https://www.cnblogs.com/CesareZhang/p/11027772.html

總結

以上是生活随笔為你收集整理的python+requests+re匹配抓取猫眼上映电影信息的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。