日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

基于中文主观性知识库的句子主观性计算项目

發(fā)布時(shí)間:2024/7/5 编程问答 46 豆豆
生活随笔 收集整理的這篇文章主要介紹了 基于中文主观性知识库的句子主观性计算项目 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

ChineseZhuguanDectection

項(xiàng)目地址:https://github.com/liuhuanyong/ZhuguanDetection
Chinese Subjective Dectection based on subjective knowlegebase, 基于中文主觀性知識(shí)庫(kù)的句子主觀性評(píng)定方法。

#項(xiàng)目介紹
主觀性是中文輿情和文本挖掘一個(gè)必不可少的一項(xiàng)環(huán)節(jié)。
對(duì)于英文而言,我調(diào)研過(guò)textblob的主觀性接口,對(duì)于輸入一個(gè)句子,textblob用的是詞語(yǔ)主觀性詞典+加權(quán)的打法,相應(yīng)的介紹可以查看我的總結(jié)材料(documents下的pdf文件)
而針對(duì)目前github開(kāi)源平臺(tái)上還缺少有對(duì)中文句子主觀性評(píng)定的接口,本項(xiàng)目將嘗試彌補(bǔ)這一空缺。
本項(xiàng)目將從中文自身的特點(diǎn)出發(fā),通過(guò)總結(jié)并挖掘中文句子主觀性線索知識(shí)庫(kù)和客觀性線索知識(shí)庫(kù),提供一個(gè)面向中文句子的主觀性判定方法。

主觀性字典

  • degree_words.txt:程度副詞,221個(gè)
  • deny_words.txt:否定副詞,29個(gè)
  • lianci_words.txt:連詞,93個(gè)
  • nengyuan_words.txt:能愿副詞,719個(gè)
  • pingjia_words.txt:評(píng)價(jià)詞,6846個(gè)
  • qingtai_words.txt:情態(tài)動(dòng)詞,29個(gè)
  • rencheng_words.txt:人稱代詞,32個(gè)
  • senti_words:情感詞,2090個(gè)
  • tanci_words:嘆詞,139個(gè)
  • yiwen_words:疑問(wèn)代詞,26個(gè)
  • yuqi_words:語(yǔ)氣詞,17個(gè)
  • zhishi_words.txt:指示代詞,64個(gè)
  • zhuangtai_words.txt:狀態(tài)詞,49個(gè)
  • zhuzhang_words.txt:主張?jiān)~,235個(gè)
  • 主觀性計(jì)算規(guī)則

  • 文本分句
  • 計(jì)算每個(gè)句子的主觀性。
  • 每個(gè)句子主觀性計(jì)算方式:主觀線索詞*主觀線索詞權(quán)重,做加權(quán)累加和平均
  • 每個(gè)句子主觀性求平均
  • 輸出文本主觀性
  • 使用方式:

    from zhuguang import * handler = ZhuguanDetect() sent = '''你要分析的文本''' score = handler.detect(sent) print(score)

    效果

    content = '今天天氣晴朗' score = 0.0 ********************** content = '江龍船艇:臺(tái)風(fēng)“山竹”造成直接經(jīng)濟(jì)損失400萬(wàn)至500萬(wàn)' score = 0.09375 ********************** content = '中華人民共和國(guó)萬(wàn)歲' score = 0.200 ********************** content = '這兩天經(jīng)濟(jì)不景氣,恐怕這單子有得毀掉了' score = 0.2092 ********************** content = '9月底美聯(lián)儲(chǔ)再次加息幾乎板上釘釘,央行大概率小幅跟隨加息,與此同時(shí)的定向降準(zhǔn)對(duì)沖顯得更為重要。預(yù)計(jì)10月前后可能再次實(shí)施定向降準(zhǔn)措施。' score = 0.237 ********************** content = '預(yù)計(jì)明后兩天江西會(huì)有大到暴雨' score = 0.36 ********************** content = '我喜歡你' score = 0.767 *****************************

    總結(jié)

    1)本項(xiàng)目以詞匯知識(shí)庫(kù)的方式,通過(guò)總結(jié)歸納出主觀性線索詞,并加以規(guī)則進(jìn)行計(jì)算。
    2) 從上面的效果來(lái)看,還像是那么回事,但還有提升空間。
    3) 主觀性配合情感得分,相信能夠在輿情分析上起到一定作用。
    4)詞庫(kù)歡迎補(bǔ)充。send mail to: lhy_in_blcu@126.com

    項(xiàng)目地址:https://github.com/liuhuanyong/ZhuguanDetection
    If any question about the project or me ,see https://liuhuanyong.github.io/

    總結(jié)

    以上是生活随笔為你收集整理的基于中文主观性知识库的句子主观性计算项目的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

    如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。