日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python下载网页歌词_python3个人学习笔记-批量下载分析歌词2

發布時間:2025/3/11 python 55 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python下载网页歌词_python3个人学习笔记-批量下载分析歌词2 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

我發現之前自己真是太愚蠢了沒有搞清楚正則表達的各種用法。

不同詞語的篩選根本不用像re.sub('另一個想替換的內容','另一個替換后的內容',re.sub('想要替換的內容','替換后的內容',x))這樣傻了吧唧地篩一層又一層……(受linux的pipe荼毒太深)

正則表達中不同字符的or其實大家都知道是[abcde1234]這樣的,但是不同詞語的時候如果寫[(remix)(acoustic)]的話匹配的并不是兩個單詞而是ra,rc,ro……以此類推。

實際上你需要使用|把兩個間隔開后再括上括號([]也行)才可以匹配。

下面我們來看幾個例子:

import re

str1='remix acoustic remixxxx acous remi 1234 reacu acoustic1'

str2=re.sub('.*((remix)|(acoustic)).*','替換',str1)

str3=re.sub('.*(remix)|(acoustic).*','替換',str1)

str4=re.sub('(remix)|(acoustic)','替換',str1)

str5=re.sub('[(remix)|(acoustic)]','替換',str1)

print(str2)

print(str3)

print(str4)

print(str5)

######輸出結果

#替換

#替換xxx acous remi 1234 reacu 替換

#替換 替換 替換xxx acous remi 1234 reacu 替換1

#替換替換替換替換替換 替換替換替換替換替換替換替換替換 替換替換

#替換替換替換替換替換替換 替換替換替換替換替換 替換替換替換替換 1234 替換替換替換替換替換 替換替換替換替換替換替換替換替換1

所以我們為了篩選出更合適的不重復歌曲,就可以用這樣寫:

if (re.search(".*((remix)|(acoustic)|(edition)|(feat\.)).*",links))==None:

另外為了防止Taylor最多的詞語是shake這種沙雕情況,這次換了一個算法:

lyricswords=[]

for lyric in lyric_dict.values():

lyricswords=lyricswords + list(set(sorted(lyric.split(' ')))) #unique words in one song

#the 300 most frequent words

ly_frenquency=Counter(sorted(lyricswords)).most_common(300)

for item in ly_frenquency:

print(re.sub(r"[()']",'',str(item)))

原理很樸素,就是利用set的特性把這個有重復詞語的list變成無重復的set,最后再變回list加入到dict中(其實第二步轉換沒有必要?)。

那么我們來看一下結果吧!

笑成傻吊了……都怪我覺得說唱歌手詞匯更豐富一點,根本就是想太多了。

麻辣雞的歌詞精選:

aint, 33

money, 20

niggas, 18

bitch, 17

nicki, 17

fuck, 17

nigga, 16

bitches, 15

young, 14

queen, 13

ride, 13

hit, 12

ya, 12

boy, 12

ass, 10

pussy, 9

bout, 8

hoes, 8

rap, 8

kiss, 7

fucking, 7

minaj, 5

pink, 5

red, 5

然后再來看一下喇嘛

nigga, 43

shit, 41

down, 40

life, 39

fuck, 37

bitch, 31

man, 31

one, 31

niggas, 31

love, 30

said, 30

look, 30

em, 29 #我覺得這可能是'em而不是真的emmmm吧畢竟英語里都沒有這個說法

take, 29

feel, 28

god, 27

yeah, 27

world, 27

black, 27

就真的也沒好到哪里去,不過這么簡單粗暴的概括語言并不能說明什么,僅供娛樂吧哈哈哈哈。

ps說真的急需一個新project給我玩,可是一時半會兒想不出什么好玩的,想做的微博bot之類的又太超出我現有水平,苦惱.jpg

總結

以上是生活随笔為你收集整理的python下载网页歌词_python3个人学习笔记-批量下载分析歌词2的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。