日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

20行代码实现电影评论情感分析

發布時間:2025/4/5 编程问答 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 20行代码实现电影评论情感分析 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

背景

情感分析有很多的應用場景,比如做一個電商網站,賣家需要時刻關心用戶對于商品的評論是否是正面的。再比如做一個電影的宣傳和策劃,電影在鍵盤俠們中的口碑也至關重要。互聯網上關于任何一個事件或物品都有可能產生成千上萬的文本評論,如何定義每一個文本的情緒是正面或是負面的,是一個很有挑戰的事情。挑戰體現在以下幾個方面,區別于結構化數據,評論數據的長短不一,很難限定到固定的維度。另外很難通過某個詞判斷用戶的情緒,舉個極端的例子,fu*k通常被認為是貶義詞,但是如果一條評論是“傲海 is fu*kinghandsome”,那么其實就是一個正向的意義。本文我要使用IMDB數據集,通過20行的Tensorflow代碼實現一個電影評論預測模型,準確率可以超過百分之九十五,里面涉及到一些詞袋模型以及embedding的概念,這些我等下一篇文章再講,這一次我們就講實踐。


數據


介紹下本文用到的訓練數據IMDB,完全開源的一個電影評價數據集,有好幾萬條真實的電影評論數據。


每一個數據都被儲存為txt文件存放,其中pos文件夾就存放正面評論的數據,neg文件夾存放負面情緒的數據。這些數據可以通過一些簡單的代碼提取出來,并且標記。數據集下載地址:http://ai.stanford.edu/~amaas/data/sentiment/

簡單來說,在數據預處理階段,需要把這些文本按照正向和負向打標,并且把文本向量化,比如“Aohai is fuc*inggentle”這種話要怎么變成數值向量,下一篇文章會具體說明。


代碼


代碼其實不止20行,但是真正建模并訓練的就是只有20行,簡單介紹下哈:

trainX = pad_sequences(trainX, maxlen=100, value=0.) testX = pad_sequences(testX, maxlen=100, value=0.) # Converting labels to binary vectors trainY = to_categorical(trainY, nb_classes=2) testY = to_categorical(testY, nb_classes=2)# Network building net = tflearn.input_data([None, 100]) net = tflearn.embedding(net, input_dim=vocabulary_size, output_dim=128) net = tflearn.lstm(net, 128, dropout=0.8) net = tflearn.fully_connected(net, 2, activation='softmax') net = tflearn.regression(net, optimizer='adam', learning_rate=0.001,loss='categorical_crossentropy')# Training model = tflearn.DNN(net, tensorboard_verbose=0) model.fit(trainX, trainY,n_epoch=1, validation_set=(testX, testY), show_metric=True,batch_size=32) predictions = model.predict(trainX) print(predictions)

前4行應該比較容易懂

  • pad_sequences把輸入的詞向量轉成矩陣,不夠的用0補
  • to_categorical:把目標列分成0和1,0是負樣本,1是正樣本
  • 用的是Tensorflow的high level的庫tflearn去構建神經網絡計算圖
  • embedding下次講,大家可以理解為把每個詞表示成向量
  • 用的是lstm模型,好處就是這種網絡結構比較適合做上下文關聯的分析,適合NLP的場景
  • full connect加regression,分類的標準組合
  • 然后fit一下,開啟訓練,n_epoch是迭代的輪數,為了快速出結果我就寫的1
  • 利用模型對訓練數據做一次predict,大家也可以換成自己的數據

  • 運行結果

    代碼層級是這樣的:


    執行文件emotional.py和下載的IMDB數據放到同一級目錄,train文件夾下有pos和neg兩個文件夾,分別存放正向和負向的評論~

    算了,大家直接clone我的項目,我放一些數據在里面,直接運行:

    python emotional.py就行

    需要安裝Tensorflow和tflearn這兩個庫,當然也可以用阿里云機器學習PAI的notebook,這樣就不用安裝了,下圖就是我用PAI跑出來的截圖。

    運行結果:




    epoch表示的是迭代次數,代碼里只設置了迭代一次。最下面的這一串矩陣一共有兩列,每一行對應一個需要預測的評論數據,每一行的第一列表示這個評論屬于負向的概率,每一行的第二列表示這個評論屬于正向的概率。


    代碼地址


    我只放了一點點測試數據,完整的數據大家自己去IMDB下吧:https://github.com/jimenbian/sentiment-analysis

    與網上的案例不同,其它案例都缺少自定義數據集的功能,限制在了IMDB,使用本文的code可以任意修改預測數據集

    參考:http://blog.csdn.net/aliceyangxi1987/article/details/76176746




    總結

    以上是生活随笔為你收集整理的20行代码实现电影评论情感分析的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 国产suv一区二区 | 久久久久亚洲av成人毛片韩 | 亚洲蜜桃av | 精品国产鲁一鲁一区二区三区 | 国产精品福利一区二区 | xxx性欧美| 青青久久国产 | 偷拍亚洲欧美 | 成人动漫在线观看视频 | 先锋影音色 | 欧美日韩精品在线 | www.男人的天堂 | 成人小视频免费在线观看 | 韩国理论午夜 | 毛片资源 | 九九亚洲精品 | 国产福利在线播放 | 欧美成人午夜免费视在线看片 | 免费观看av毛片 | 午夜黄色一级片 | 免费观看91视频 | 在线观看aaa| 激情毛片视频 | 成年人看片网站 | 欧美日韩h | 中文字幕网站 | 国产伦精品一区二区三区妓女下载 | 成人免费毛片色戒 | 欧美三级韩国三级日本三斤在线观看 | 黄色片免费观看 | 长篇高h乱肉辣文 | 国产高清www | 亚洲国产欧洲 | 伦乱天堂| 美国做爰xxxⅹ性视频 | 办公室荡乳欲伦交换bd电影 | 日本免费黄色 | 一起草av在线 | 日韩欧美在线看 | 在线观看欧美日韩 | 处女朱莉第一次 | 国产区第一页 | 日本xxxwww | 狠狠干欧美 | 国产香蕉在线 | 欧美黑人欧美精品刺激 | 天天射寡妇 | 国产情趣视频 | 午夜精品久久久久久 | 日韩图片区 | 99热国产在线 | 色视频在线观看 | 麻豆精品国产传媒av | 女人下边被添全过视频 | 精品91自产拍在线观看二区 | sao浪受的饥渴日常 91免费入口 | jizz在亚洲| 色骚综合 | 欧美精品一区二区三区视频 | www.69视频| 黄在线免费看 | 青青青手机在线视频 | av黄色大片| 欧美成人精品在线观看 | 五月天综合在线 | 日本午夜精品 | 快色网站| 日韩a视频| 欧美成人一区二区三区高清 | 三a大片| 国产区第一页 | 污片免费观看 | 免费成人美女在线观看. | 久久久久97| a∨色狠狠一区二区三区 | 日韩三级免费观看 | 中文自拍| 性免费网站 | 免费人成在线观看视频播放 | 国模无码视频一区二区三区 | 欧美性生活网址 | 国产免费又黄又爽又色毛 | 日韩视频精品在线 | 精品人妻一区二区三区四区五区 | 精品在线视频观看 | 成人在线观| 超清纯大学生白嫩啪啪 | 免费激情 | 国产一级二级三级视频 | 国产网红主播精品av | 国产精品美女在线观看 | 制服.丝袜.亚洲.中文.综合 | a级全黄| 成人免费播放视频 | 亚洲 欧美 激情 小说 另类 | av第一页| 亚洲精品丝袜 | 欧美国产在线观看 | 少妇饥渴放荡91麻豆 |