双向LSTM中文微博情感分类项目
雙向LSTM中文微博情感分類項(xiàng)目
- 1、數(shù)據(jù)集說明
- 2、雙向LSTM中文微博情感分類項(xiàng)目實(shí)戰(zhàn)
1、數(shù)據(jù)集說明
??這里完成一個(gè)中文微博情感分類項(xiàng)目。這里我使用的數(shù)據(jù)集是從新浪微博收集的 12 萬條數(shù)據(jù),正負(fù)樣本各一半。標(biāo)簽中 1 表示正面評(píng)論,0 表示負(fù)面評(píng)論。數(shù)據(jù)來源為https://github.com/SophonPlus/ChineseNlpCorpus/blob/master/datasets/weibo_sen ti_100k/intro.ipynb如果你有其他數(shù)據(jù)的話,也可以使用其他數(shù)據(jù)。
??這一次我們使用的數(shù)據(jù)需要自己做處理,所以我們需要對(duì)句子進(jìn)行分詞,分詞后再對(duì)每 個(gè)詞根據(jù)頻率來進(jìn)行編號(hào)。這里我們要使用的分詞工具是結(jié)巴分詞,結(jié)巴分詞是一個(gè)很好用 的中文分詞工具,安裝方式為打開命令提示符,然后輸入命令:
pip install jieba??安裝好以后在 python 程序中直接 import jieba 就可以使用了。
2、雙向LSTM中文微博情感分類項(xiàng)目實(shí)戰(zhàn)
??上一博客我們講解了 CNN 在中文微博情感分類項(xiàng)目中的應(yīng)用,這一篇文章我們改用 LSTM 來完成,前期數(shù)據(jù)處理部分都是一樣的流程,只有建模部分的程序
總結(jié)
以上是生活随笔為你收集整理的双向LSTM中文微博情感分类项目的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: jqprint 分页打印_javascr
- 下一篇: zigbee里面的CC2530外设驱动代