宗成庆统计自然语言处理第二版第13章读书笔记-文本分类与情感分类
生活随笔
收集整理的這篇文章主要介紹了
宗成庆统计自然语言处理第二版第13章读书笔记-文本分类与情感分类
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
情感分析
- 情感分析定義
- 文本表示
情感分析定義
宗老師在《統(tǒng)計(jì)自然語言處理》(第二版)里對情感分析做如下定義:
其任務(wù)是借助計(jì)算機(jī)幫助用戶快速獲取、整理和分析相關(guān)評價(jià)信息,對帶有情感 色彩的主觀性文本進(jìn)行分析、處理、歸納和推理[Pang and Lee,2008]。情感 分析包含較多的任務(wù),如情感分類(sentiment classification)、觀點(diǎn)抽取 (opinion extraction)、觀點(diǎn)問答和觀點(diǎn)摘要等。具體地來說,情感分析可以看成是從一段文字當(dāng)中抽取含一定目的性的標(biāo)簽、短語或者句子等。具體的細(xì)分領(lǐng)域有:
很難簡單地將情感分析劃歸為某一個(gè)領(lǐng)域,往往從不同的角度將其劃歸到不同的方向。 如果單純地判別文本的傾向性,可以將其看作是一個(gè)分類任務(wù);如果要從觀點(diǎn)句中抽取 相關(guān)的要素(觀點(diǎn)持有者、觀點(diǎn)評價(jià)對象等),則是一個(gè)信息抽取任務(wù);而如果要從海 量文本中找到對某一事物的觀點(diǎn),則可以看作是一個(gè)檢索任務(wù)。目前關(guān)于情感分析的論文在各大學(xué)術(shù)會議上都有獨(dú)立的專題,如ACL、EMNLP、COLING、SIGIR、CIKM等針對一個(gè)文本分類任務(wù)來說,大體上分為四個(gè)步驟:
對于輸入文檔,先做文檔預(yù)處理,然后對處理后的文本進(jìn)行文本表示,然后輸入分類器進(jìn)行判別,最后輸出一個(gè)文本類別,即為簡約版本的文本分類任務(wù)。
文本表示
通常文本采用向量空間表示,向量空間模型(vector space model, VSM)
---------分割線-------2019.06.17-------
總結(jié)
以上是生活随笔為你收集整理的宗成庆统计自然语言处理第二版第13章读书笔记-文本分类与情感分类的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java forward 修改请求参数_
- 下一篇: flask sqlalchemy 单表