基于中文主观性知识库的句子主观性计算项目
ChineseZhuguanDectection
項(xiàng)目地址:https://github.com/liuhuanyong/ZhuguanDetection
Chinese Subjective Dectection based on subjective knowlegebase, 基于中文主觀性知識(shí)庫(kù)的句子主觀性評(píng)定方法。
#項(xiàng)目介紹
主觀性是中文輿情和文本挖掘一個(gè)必不可少的一項(xiàng)環(huán)節(jié)。
對(duì)于英文而言,我調(diào)研過(guò)textblob的主觀性接口,對(duì)于輸入一個(gè)句子,textblob用的是詞語(yǔ)主觀性詞典+加權(quán)的打法,相應(yīng)的介紹可以查看我的總結(jié)材料(documents下的pdf文件)
而針對(duì)目前github開(kāi)源平臺(tái)上還缺少有對(duì)中文句子主觀性評(píng)定的接口,本項(xiàng)目將嘗試彌補(bǔ)這一空缺。
本項(xiàng)目將從中文自身的特點(diǎn)出發(fā),通過(guò)總結(jié)并挖掘中文句子主觀性線索知識(shí)庫(kù)和客觀性線索知識(shí)庫(kù),提供一個(gè)面向中文句子的主觀性判定方法。
主觀性字典
主觀性計(jì)算規(guī)則
使用方式:
from zhuguang import * handler = ZhuguanDetect() sent = '''你要分析的文本''' score = handler.detect(sent) print(score)效果
content = '今天天氣晴朗' score = 0.0 ********************** content = '江龍船艇:臺(tái)風(fēng)“山竹”造成直接經(jīng)濟(jì)損失400萬(wàn)至500萬(wàn)' score = 0.09375 ********************** content = '中華人民共和國(guó)萬(wàn)歲' score = 0.200 ********************** content = '這兩天經(jīng)濟(jì)不景氣,恐怕這單子有得毀掉了' score = 0.2092 ********************** content = '9月底美聯(lián)儲(chǔ)再次加息幾乎板上釘釘,央行大概率小幅跟隨加息,與此同時(shí)的定向降準(zhǔn)對(duì)沖顯得更為重要。預(yù)計(jì)10月前后可能再次實(shí)施定向降準(zhǔn)措施。' score = 0.237 ********************** content = '預(yù)計(jì)明后兩天江西會(huì)有大到暴雨' score = 0.36 ********************** content = '我喜歡你' score = 0.767 *****************************總結(jié)
1)本項(xiàng)目以詞匯知識(shí)庫(kù)的方式,通過(guò)總結(jié)歸納出主觀性線索詞,并加以規(guī)則進(jìn)行計(jì)算。
2) 從上面的效果來(lái)看,還像是那么回事,但還有提升空間。
3) 主觀性配合情感得分,相信能夠在輿情分析上起到一定作用。
4)詞庫(kù)歡迎補(bǔ)充。send mail to: lhy_in_blcu@126.com
項(xiàng)目地址:https://github.com/liuhuanyong/ZhuguanDetection
If any question about the project or me ,see https://liuhuanyong.github.io/
總結(jié)
以上是生活随笔為你收集整理的基于中文主观性知识库的句子主观性计算项目的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: “猜心思”的Hard模式:问答系统在智能
- 下一篇: 【LeetCode】3月29日打卡-Da