日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

完整的中英文词频统计

發布時間:2025/5/22 编程问答 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 完整的中英文词频统计 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
#讀取fire文本文件 f = open('fire.txt','r',encoding='utf-8') fire = f.read() f.close() print(fire) #預處理 print(fire.lower()) #全部字母小寫 a = ",.;:'`" #特殊符號歸集為字符串 for b in a:fire.replace(b,' ') #利用for循環語句把特殊符號替換成空格print(fire)#分別從空格提取單詞 firelist = fire.split() print(firelist)#統計每個單詞出現的次數 fireset = set(firelist) #把列表firelist轉換成集合,使得單詞不會重復出現 #排除語法型詞匯,代詞、冠詞、連詞等無語義詞 se = {'a','the','and','we','you','of'} fireset =fireset-se firedict = {} #創建一個空字典,用于存儲 # #遍歷fireset集合,放入單詞為鍵,統計的次數為值的strdict字典 for word in fireset:firedict[word] = firelist.count(word) print(len(firedict),firedict) wordlist = list(firedict.items()) #按單詞的頻數排序 wordlist.sort(key=lambda x:x[1],reverse=True) print(wordlist) #輸出TOP(20) for i in range(20):print(wordlist[i]) import jieba f=open('cry.txt','r',encoding='utf-8') cry=f.read() f.close() crylist=list(jieba.cut(cry)) crydict={} for word in crylist:if len(word)==1:continueelse:crydict[word]=crydict.get(word,0)+1wordlist=list(crydict.items()) wordlist.sort(key=lambda x:x[1],reverse=True)for a in range(15):print(wordlist[a])

?

?

?

?

轉載于:https://www.cnblogs.com/xsxsx/p/9775957.html

《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀

總結

以上是生活随笔為你收集整理的完整的中英文词频统计的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。