NLP 关键词抽取
關(guān)鍵詞抽取算法
TF=該次在該文章中出現(xiàn)的次數(shù)這篇文章中所有詞的總數(shù)TF=\frac{該次在該文章中出現(xiàn)的次數(shù)}{這篇文章中所有詞的總數(shù)}TF=這篇文章中所有詞的總數(shù)該次在該文章中出現(xiàn)的次數(shù)?
IDF=log(所有文章數(shù)出現(xiàn)過該詞的文章數(shù)+1)IDF=log(\frac{所有文章數(shù)}{出現(xiàn)過該詞的文章數(shù)+1})IDF=log(出現(xiàn)過該詞的文章數(shù)+1所有文章數(shù)?)
TF?IDF=TF?IDFTF-IDF=TF*IDFTF?IDF=TF?IDF
總結(jié)