【java机器学习】词向量在贝叶斯中的概念
向量:
在數學中,向量(也稱為歐幾里得向量、幾何向量、矢量),指具有大小(magnitude)和方向的量
詞向量:
詞向量(Word embedding),又叫Word嵌入式自然語言處理(NLP)中的一組語言建模和特征學習技術的統稱,其中來自詞匯表的單詞或短語被映射到實數的向量。 從概念上講,它涉及從每個單詞一維的空間到具有更低維度的連續向量空間的數學嵌入。
單詞條件概率計算步驟:
對每篇訓練文檔:
對每個類別:
如果詞條出現在文檔中------增加該詞條的計數值
增加所有詞條的計數值
對每個類別:
對每個詞條:將該詞條的數目除以總詞條數目得到條件概率
計算結果表示:
來源:https://blog.csdn.net/charlesqinjiaqi/article/details/78272598?utm_source=blogxgwz3
[ 0.04166667 0.04166667 0.04166667 0. 0. 0.04166667
0.04166667 0.04166667 0. 0.04166667 0.04166667 0.04166667
0.04166667 0. 0. 0.08333333 0. 0.
0.04166667 0. 0.04166667 0.04166667 0. 0.04166667
0.04166667 0.04166667 0. 0.04166667 0. 0.04166667
0.04166667 0.125 ]
p1Vect:
[ 0. 0. 0. 0.05263158 0.05263158 0. 0.
0. 0.05263158 0.05263158 0. 0. 0.
0.05263158 0.05263158 0.05263158 0.05263158 0.05263158 0.
0.10526316 0. 0.05263158 0.05263158 0. 0.10526316
0. 0.15789474 0. 0.05263158 0. 0. 0. ]
從結果中,可以看出詞匯表中第一個詞是cute,其在類別0中出現一次,而在類別1中未出現,對應的條件概率為別為0.04166667和0。
總結
以上是生活随笔為你收集整理的【java机器学习】词向量在贝叶斯中的概念的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 标准IO概述和操作
- 下一篇: 窗口函数和hive优化简记