日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

jieba分词提取小说人名

發布時間:2024/7/5 编程问答 43 豆豆
生活随笔 收集整理的這篇文章主要介紹了 jieba分词提取小说人名 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

    • 1. 讀入文本
    • 2. 分詞
    • 3. 計數
    • 4. 排序
    • 5. 添加用戶字典

以《神雕俠侶》為例:

使用 jieba.posseg獲取詞性,人名的詞性為 nr

1. 讀入文本

import jieba.posseg as psg with open('shendiaoxialv.txt',encoding='utf-8') as f:text = f.readlines() print(text[:10])

輸出:

['\ufeff 第 一 回\u3000風月無情\n', '\n', ' “越女采蓮秋水畔,窄袖輕羅,暗露雙金釧。\n', '\n', ' 照影摘花花似面,芳心只共絲爭亂。\n', '\n', ' 雞尺溪頭風浪晚,霧重煙輕,不見來時伴。\n', '\n', ' 隱隱歌聲歸掉遠,離愁引看江南岸。”\n', '\n'] len(text)

輸出:16741,文本有1萬6千多行

2. 分詞

for t in text:res = psg.cut(t)print([(item.word, item.flag) for item in res])

輸出:

Building prefix dict from the default dictionary ... Loading model from cache C:\Users\computer~1\AppData\Local\Temp\jieba.cache Loading model cost 1.023 seconds. Prefix dict has been built succesfully. [('\ufeff', 'x'), (' ', 'x'), ('第', 'm'), (' ', 'x'), ('一', 'm'), (' ', 'x'), ('回', 'v'), ('\u3000', 'x'), ('風月', 'n'), ('無情', 'n'), ('\n', 'x')] [('\n', 'x')] [(' ', 'x'), (' ', 'x'), (' ', 'x'), (' ', 'x'), ('“', 'x'), ('越女', 'nr'), ('采蓮', 'nr'), ('秋水', 'nr'), ('畔', 'ng'), (',', 'x'), ('窄', 'a'), ('袖輕羅', 'i'), (',', 'x'), ('暗露', 'v'), ('雙金釧', 'nr'), ('。', 'x'), ('\n', 'x')] [('\n', 'x')] [(' ', 'x'), (' ', 'x'), (' ', 'x'), (' ', 'x'), ('照影', 'n'), ('摘花', 'n'), ('花', 'v'), ('似面', 'd'), (',', 'x'), ('芳心', 'n'), ('只', 'm'), ('共絲', 'n'), ('爭亂', 'v'), ('。', 'x'), ('\n', 'x')] [('\n', 'x')] [(' ', 'x'), (' ', 'x'), (' ', 'x'), (' ', 'x'), ('雞尺', 'n'), ('溪頭', 'n'), ('風浪', 'n'), ('晚', 'tg'), (',', 'x'), ('霧', 'n'), ('重煙', 'n'), ('輕', 'd'), (',', 'x'), ('不見', 'v'), ('來時', 't'), ('伴', 'v'), ('。', 'x'), ('\n', 'x')]

3. 計數

dict = {} for t in text:res = psg.cut(t)for item in res:if item.flag == 'nr' and item.word in dict:dict[item.word] += 1elif item.flag == 'nr' and item.word not in dict:dict[item.word] = 1 print(dict)

輸出:

{'越女': 1, '采蓮': 3, '秋水': 3, '雙金釧': 1, '水蒙蒙': 1, '歐陽修': 2, ..省略.. '杜': 1, '須髯戟': 1, '掌力直': 1, '后平飛': 1, '古語云': 1, '秦失其鹿': 1, '冷森森': 1, '子雙掌': 1, '掌力擊': 1, '齊口': 1, '蒼猿': 2, '葉': 1, '秋風': 1, '秋月明': 1, '屠龍記': 1}

4. 排序

name_count = sorted(dict.items(), key=lambda x : x[1], reverse=True) print(name_count[:30])

輸出:頻次最高的前30位人物

[('楊', 4749), ('小龍女', 2003), ('郭靖', 972), ('李莫愁', 938), ('武功', 932), ('黃蓉', 871), ('陸無雙', 574), ('周伯通', 554), ('趙志敬', 482), ('郭襄', 386), ('郭芙', 366), ('裘千尺', 325), ('郭', 283), ('耶律齊', 272), ('尹志平', 259), ('歐陽鋒', 251), ('武三通', 240), ('黃藥師', 239), ('楊過心', 239), ('公孫止', 234), ('尼摩星', 229), ('程英', 226), ('武修文', 226), ('武氏兄弟', 206), ('朱子柳', 203), ('尹克西', 201), ('楊過見', 188), ('洪七公', 186), ('孫婆婆', 185), ('明白', 173)]

發現第一的人名是 楊,而不是楊過

5. 添加用戶字典

import jieba jieba.load_userdict('mydict.txt')


再次運行程序

最后輸出結果:

[('楊過', 4586), ('小龍女', 2010), ('郭靖', 982), ('李莫愁', 938), ('武功', 932), ('黃蓉', 932), ('陸無雙', 574), ('周伯通', 554), ('趙志敬', 482), ('郭襄', 386), ('郭芙', 366), ('裘千尺', 325), ('郭', 282), ('耶律齊', 272), ('尹志平', 259), ('歐陽鋒', 251), ('武三通', 240), ('黃藥師', 239), ('楊過心', 239), ('公孫止', 234), ('尼摩星', 229), ('程英', 226), ('武修文', 226), ('武氏兄弟', 206), ('朱子柳', 203), ('尹克西', 201), ('楊過見', 188), ('洪七公', 186), ('孫婆婆', 185), ('明白', 173)]

總結

以上是生活随笔為你收集整理的jieba分词提取小说人名的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 久久精品视频一区二区 | 青青青国产在线 | 拔插拔插华人 | 精品一区二区在线免费观看 | 日韩欧美在线精品 | 欧美日韩福利视频 | 日在线视频 | 日韩一卡二卡 | 久久久美女| 亚洲男性天堂 | 人人舔人人插 | 无码人妻精品一区二区三区在线 | www.白丝 | 视频一区二区在线 | 亚洲精品视 | 成人在线h | 欧美黑人性生活 | 成人av入口 | 久久黄色小视频 | 国产精品久久77777 | 欧美日韩大片 | 青草伊人久久 | 国产吃瓜在线 | 怎么可能高潮了就结束漫画 | 国产美女精品视频 | 韩国毛片一区二区 | 天天看夜夜 | 国产伦精品一区二区三区妓女下载 | 中国爆后菊女人的视频 | 2020亚洲男人天堂 | 91亚洲精品在线观看 | 在线不卡中文字幕 | 国产美女在线精品 | 少妇在线观看 | 91久久精品一区二区三 | 91精品国产91 | 欧美成人精品一区二区男人看 | 免费av播放| 最近中文字幕av | 窝窝午夜理论片影院 | 爱爱小视频网站 | 91免费观看网站 | 欧美猛操 | h亚洲 | 成人国产三级 | 91精品国产色综合久久不卡98口 | 欧美成人免费观看 | 亚洲精品一区二区三区在线 | 在线观看三级网站 | 国产极品美女高潮无套在线观看 | 超碰777 | 亚洲 小说区 图片区 都市 | www.99色| 日韩欧美一区二区三区在线 | 开心激情网站 | 国产黄网站 | 女女h百合无遮羞羞漫画软件 | 日本888xxxx| 九九九久久久精品 | 麻豆changesxxx国产 | 久久精品色妇熟妇丰满人妻 | 国产模特av私拍大尺度 | 第一福利在线 | 四虎伊人 | 白丝校花扒腿让我c | 国产99久久久国产精品成人免费 | 精品国产乱码久久久久久预案 | 四虎网站最新网址 | 亚洲精品乱码久久 | 国产午夜免费福利 | 黄色网页在线免费观看 | 免费av观看网址 | 国产又粗又黄又爽的视频 | 婷婷777 | 欧美性猛交xxxx乱大交蜜桃 | 一区二区三区免费视频观看 | 国产成人午夜 | 国产丝袜自拍 | 免费看av网| 欧美成一区二区三区 | 欧美黑人激情 | 99婷婷| 在线播放亚洲 | 色欲久久久天天天综合网 | 痴汉电车在线播放 | 伊人国产在线观看 | 国产一区免费看 | 国产精品网站视频 | 91色国产 | 亚洲成人婷婷 | 黄色小网站在线观看 | 老牛影视av老牛影视av | 欧美黑人疯狂性受xxxxx野外 | 黄色精品 | 久久99久久99精品免观看软件 | 在线观看中文字幕一区 | 九九三级 | 初尝人妻少妇中文字幕 | 国产精品欧美综合亚洲 |