日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程语言 > python >内容正文

python

python制作词典_我的词典我做主!python3.5生成自己的词性词典

發(fā)布時(shí)間:2023/11/30 python 22 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python制作词典_我的词典我做主!python3.5生成自己的词性词典 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

由于朋友需要做文本分析,前提是要將文本中的名詞和動(dòng)詞剔除掉,但沒(méi)有現(xiàn)成的名詞和動(dòng)詞的txt格式的詞典。于是找來(lái)了一個(gè)英漢詞典,根據(jù)每一行出現(xiàn)的adj、adv、n、prep等,使用正則表達(dá)式匹配需要的詞性,并將其追加寫入到txt文件中。

建議大家使用python3.5,3的優(yōu)點(diǎn)是避免了很多編碼問(wèn)題。3代表著python的未來(lái),大家還是應(yīng)該多多的對(duì)未來(lái)投資。

比如,我要生成形容詞的詞典。步驟:

1、應(yīng)先使用正則表達(dá)式,匹配含有‘a(chǎn)dj’的行字符串,返回的是list。

2、獲得adj結(jié)尾處的索引值

3、對(duì)行字符串進(jìn)行切片處理,獲得索引值后的全部字符

4、如果獲得的字符串有 ‘,’ 那再用正則表達(dá)式,匹配中文字符,獲得的是中文的list

代碼實(shí)現(xiàn)如下:

import re

strs = open(r'C:/Users/myl/Desktop/SegChineseToWords/英漢詞典TXT格式.txt','r',encoding='utf-8').readlines()

for str in strs:

# 形容詞典

adj_re = re.search('adj', str)

if adj_re != None:

adj_num = adj_re.end()+1

adj_str = str[adj_num:]

adj_list = re.findall("[\u4e00-\u9fa5]+", adj_str)

for ele_adj in adj_list:

ele_adj = ele_adj + '\n'

with open(r'C:/Users/myl/Desktop/SegChineseToWords/Dict/adj_dict.txt', 'a+',encoding='utf-8') as f:

f.write(ele_adj)

實(shí)現(xiàn)的效果如下圖:

本代碼中用到 re模塊 的 research方法 ,具體大家去百度下,這個(gè)方法的相關(guān)知識(shí)。

現(xiàn)在附上 練習(xí)材料和最終代碼,大家可以比照著練習(xí)下正則。

歡迎關(guān)注公眾號(hào):大鄧帶你玩轉(zhuǎn)python

----------------------------------作者:鄧旭東

歡迎關(guān)注 簡(jiǎn)書賬號(hào) 鄧旭東HIT

知乎: 鄧旭東HIT

微信公眾號(hào): 大鄧帶你玩轉(zhuǎn)python

大家也可以加小編微信:tszhihu (備注:Python),拉大家到 Python愛(ài)好者社區(qū) 微信群,可以跟鄧旭東、崔慶才等老師互相交流。謝謝

大家記得關(guān)注我,明天晚上 崔慶才老師教你玩 Python爬蟲知乎用戶信息,記得關(guān)注。內(nèi)容:

1. 分析知乎Ajax請(qǐng)求及爬取邏輯

2. 用Scrapy實(shí)現(xiàn)遞歸爬取

3. 爬取結(jié)果存儲(chǔ)到MongoDB 報(bào)名地址:爬取知乎所有用戶詳細(xì)信息 。后面到 Live也弄幾場(chǎng),感謝關(guān)注。

創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來(lái)咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)

總結(jié)

以上是生活随笔為你收集整理的python制作词典_我的词典我做主!python3.5生成自己的词性词典的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。