日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

Python3-正则表达式~爬取猫眼电影应用

發布時間:2023/12/20 python 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python3-正则表达式~爬取猫眼电影应用 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
import re,json from urllib import request #maoyan.com #1.獲取網頁內容 base_url='http://maoyan.com/board' response=request.urlopen(base_url) html=response.read() html=html.decode('utf-8') #寫入文件 with open('maoyan_film.html','w',encoding='utf-8') as f:f.write(html)f.close()#2.提取數據 #(1)縮小范圍 # pattern=re.compile(r'<dd>(.*?)</dd>',re.S)#(.*?)只要括號內的內容 pattern=re.compile(r'<dd>.*?</dd>',re.S)#包括<dd>.*?</dd>所有內容 movie_list=pattern.findall(html) # print(len(s)) # print(s[0]) for movie in movie_list:# print(movie) # 拿排名 # pattern=re.compile(r'<i class="board-index board-index-\d*">(\d+)</i>') pattern=re.compile(r'<i class="board-index board-index-\d*">(\d{1,2})</i>')# index=pattern.search(movie) # print(index.group(1)) index=pattern.findall(movie)# print(index[0]) # 拿名稱 pattern=re.compile(r'title="(.*?)"')title=pattern.findall(movie)print(title[0])# 拿圖片 pattern=re.compile(r'<img data-src="(.*?)@')img=pattern.findall(movie)print(img[0])# 拿主演 # pattern = re.compile(r'<p class="star">(.*?)</p>')#由于‘\n’原因取不著。 #方法一 # pattern=re.compile(r'<p class="star">(.*?)</p>',re.S) # star=pattern.findall(movie) # print(star[0].strip()) # 方法2 pattern = re.compile(r'<p class="star">([\w\W]*?)</p>') # \s\S,\d\D star = pattern.findall(movie)print(star[0].strip())# 上映時間 pattern=re.compile(r'<p class="releasetime">(.*?)</p>')releaseTime=pattern.findall(movie)print(releaseTime[0])# 評分 #方法一 # pattern=re.compile(r'<i class="integer">(\d\.?)</i>') # score1=pattern.findall(movie) # # pattern = re.compile(r'<i class="fraction">(\d?)</i>') # score2 = pattern.findall(movie) # print(score1[0]+score2[0]) # 方法二 pattern = re.compile(r'<p class="score"><i class="integer">(\d+\.)</i><i class="fraction">(\d)</i></p> ')score = pattern.findall(movie)print(score[0][0] + score[0][1])

/Library/Frameworks/Python.framework/Versions/3.6/bin/python3.6 /Users/apple/PycharmProjects/stage4/spider/2018——0307/spider_maoyan_films.py
頭號玩家
http://p0.meituan.net/movie/a547dd7f6851d7ced67ec1b6c8b7f3b2447754.jpg
主演:泰爾·謝里丹,奧利維亞·庫克,本·門德爾森
上映時間:2018-03-30
9.1
狂暴巨獸
http://p0.meituan.net/movie/d414df29b364e010976c4be97d5ee907290840.jpg
主演:道恩·強森,娜奧米·哈里斯,杰弗里·迪恩·摩根
上映時間:2018-04-13
9.0
起跑線
http://p0.meituan.net/movie/cf9ff1aad19254d99aae31cd53065a271370654.jpg
主演:伊爾凡·可汗,薩巴·卡瑪爾,內哈·迪胡皮阿
上映時間:2018-04-04
8.9
黃金花
http://p1.meituan.net/movie/15f0ae1961a0229f71e5c5106a8c55902561485.jpg
主演:毛舜筠,凌文龍,呂良偉
上映時間:2018-04-28
8.8
巴霍巴利王2:終結
http://p0.meituan.net/movie/3e42788f6f6283f430e74ac2381dd6ad151806.jpg
主演:帕拉巴斯,拉納·達格巴帝,安努舒卡·謝蒂
上映時間:2018-05-04
8.7
青年馬克思
http://p1.meituan.net/movie/3b5a995b705b11b5b190e9fd556eecba780985.jpg
主演:奧古斯特·迪赫,史特凡·柯納斯克,薇姬·克里普斯
上映時間:2018-05-05
8.5
米花之味
http://p0.meituan.net/movie/2129e4efaea8c67a515d6bb0c50cb443992318.jpg
主演:英澤,葉不勒
上映時間:2018-04-20
8.5
脫單告急
http://p0.meituan.net/movie/50fc70e63364f92ff540ef02d26f8102631867.jpg
主演:董子健,鐘楚曦,春夏
上映時間:2018-04-20
8.4
21克拉
http://p0.meituan.net/movie/8b154402ef3ac5d59e4a89649f4f5190375170.jpg
主演:郭京飛,迪麗熱巴,大鵬
上映時間:2018-04-20
8.2
冰雪女王3:火與冰
http://p1.meituan.net/movie/cb0c58e1da76a387e4433b69627c9680305708.jpg
主演:杰森·格里菲,勞里·海梅斯,迪·布拉雷·貝克爾
上映時間:2018-04-05
8.2


Process finished with exit code 0

總結

以上是生活随笔為你收集整理的Python3-正则表达式~爬取猫眼电影应用的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。