當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

fasttext初步使用

發(fā)布時(shí)間：2023/12/20 编程问答 36 豆豆

生活随笔收集整理的這篇文章主要介紹了 fasttext初步使用小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

轉(zhuǎn)載自：

http://blog.csdn.net/lxg0807/article/details/52960072#comments

訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)來自網(wǎng)盤：

https://pan.baidu.com/s/1jH7wyOY

https://pan.baidu.com/s/1slGlPgx

訓(xùn)練以上數(shù)據(jù)

# _*_coding:utf-8 _*_ import logging logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO) import fasttext #訓(xùn)練模型 classifier = fasttext.supervised("news_fasttext_train.txt","news_fasttext.model",label_prefix="__label__")

進(jìn)行測(cè)試：

注意每次訓(xùn)練的模型都有不同，所以測(cè)試的結(jié)果大概是0.87~0.92左右

進(jìn)行最終評(píng)價(jià)：

# -*- coding:utf-8 -*-import logging logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO) import fasttext#load訓(xùn)練好的模型 classifier = fasttext.load_model('news_fasttext.model.bin', label_prefix='__label__') result = classifier.test("news_fasttext_test.txt") print result.precision print result.recall labels_right = [] texts = [] with open("news_fasttext_test.txt") as fr:lines = fr.readlines() for line in lines:labels_right.append(line.split("\t")[1].rstrip().replace("__label__",""))texts.append(line.split("\t")[0].decode("utf-8")) # print labels # print texts # break labels_predict = [e[0] for e in classifier.predict(texts)] #預(yù)測(cè)輸出結(jié)果為二維形式 # print labels_predicttext_labels = list(set(labels_right)) text_predict_labels = list(set(labels_predict)) print text_predict_labels print text_labelsA = dict.fromkeys(text_labels,0) #預(yù)測(cè)正確的各個(gè)類的數(shù)目 B = dict.fromkeys(text_labels,0) #測(cè)試數(shù)據(jù)集中各個(gè)類的數(shù)目 C = dict.fromkeys(text_predict_labels,0) #預(yù)測(cè)結(jié)果中各個(gè)類的數(shù)目 for i in range(0,len(labels_right)):B[labels_right[i]] += 1C[labels_predict[i]] += 1if labels_right[i] == labels_predict[i]:A[labels_right[i]] += 1print A print B print C #計(jì)算準(zhǔn)確率，召回率，F值 for key in B:p = float(A[key]) / float(B[key])r = float(A[key]) / float(C[key])f = p * r * 2 / (p + r)print "%s:\tp:%f\t%fr:\t%f" % (key,p,r,f)

之所以搞這么一出，是因?yàn)閒asttext提供的p值（準(zhǔn)確率）和r值（召回率）只是針對(duì)所有結(jié)果的，而不是針對(duì)各個(gè)類別分別進(jìn)行計(jì)算p值（準(zhǔn)確率）和r值（召回率）的，所以該作者自己寫了計(jì)算方法。

輸出結(jié)果：

[u'affairs', u'fashion', u'lottery', u'house', u'sports', u'game', u'economic', u'ent', u'edu', u'home', u'stock', u'constellation', u'science'] ['affairs', 'fashion', 'house', 'sports', 'game', 'economic', 'ent', 'edu', 'home', 'stock', 'science'] {'science': 8921, 'affairs': 8544, 'fashion': 2148, 'house': 9572, 'sports': 9814, 'game': 9389, 'economic': 9492, 'ent': 9660, 'edu': 9671, 'home': 8027, 'stock': 8525} {'science': 10000, 'affairs': 10000, 'fashion': 3369, 'house': 10000, 'sports': 10000, 'game': 10000, 'economic': 10000, 'ent': 10000, 'edu': 10000, 'home': 10000, 'stock': 10000} {u'science': 10311, u'affairs': 8953, u'fashion': 2176, u'lottery': 28, u'house': 10502, u'sports': 10288, u'game': 10182, u'economic': 11087, u'ent': 10940, u'edu': 10991, u'home': 8171, u'constellation': 466, u'stock': 9274} science: p:0.892100 0.865193r: 0.878440 affairs: p:0.854400 0.954317r: 0.901599 fashion: p:0.637578 0.987132r: 0.774752 house: p:0.957200 0.911445r: 0.933763 sports: p:0.981400 0.953927r: 0.967468 game: p:0.938900 0.922117r: 0.930433 economic: p:0.949200 0.856138r: 0.900270 ent: p:0.966000 0.882998r: 0.922636 edu: p:0.967100 0.879902r: 0.921443 home: p:0.802700 0.982377r: 0.883496 stock: p:0.852500 0.919237r: 0.884611

總結(jié)

以上是生活随笔為你收集整理的fasttext初步使用的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

fasttext

上一篇： wingIDE右侧文件列表移动到左侧
下一篇： rstrip的用法

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

fasttext初步使用

總結(jié)