文本挖掘(part7)--Word2vec
生活随笔
收集整理的這篇文章主要介紹了
文本挖掘(part7)--Word2vec
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
學習筆記,僅供參考,有錯必糾
文章目錄
- 文檔信息的向量化
- word2vec: CBOW(連續詞袋)
- word2vec降低運算量的方式(分層softmax、負例采樣)
- 分層softmax
- 負例采樣
- word2vec對文本中信息的學習效果:關系類比
- word2vec對文本中信息的學習效果:語義理解
- Word2Vec存在的問題
文檔信息的向量化
word2vec: CBOW(連續詞袋)
word2vec使用上下文詞匯同時預測中間詞,其本質上只是一個線性分類器. 顯然,短語料不適合用word2vec來分析.
- word2vec的結構
輸入層:仍然直接使用BOW(bag of ward)方式表示.
投射層:對向量直接求和(平均),以降低向量維度; 實質上是去掉了投射層.
隱含層:直接去除.
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的文本挖掘(part7)--Word2vec的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 矩阵求逆(LUP分解算法)
- 下一篇: 机器学习实验中的编程技术(part4)-