當前位置：首頁 >

python语义分析_Python差异的潜在语义分析

發布時間：2025/3/12 28 豆豆

生活随笔收集整理的這篇文章主要介紹了 python语义分析_Python差异的潜在语义分析小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

我正在嘗試使用以下代碼在

Python中遵循

Wikipedia Article on latent semantic indexing：

documentTermMatrix = array([[ 0.,1.,0.,1.],[ 0.,0.],[ 1.,0.]])

u,s,vt = linalg.svd(documentTermMatrix,full_matrices=False)

sigma = diag(s)

## remove extra dimensions...

numberOfDimensions = 4

for i in range(4,len(sigma) -1):

sigma[i][i] = 0

queryVector = array([[ 0.],# same as first column in documentTermMatrix

[ 0.],[ 0.],[ 1.],[ 1.]])

數學怎么說應該有效：

dtMatrixToQueryAgainst = dot(u,dot(s,vt))

queryVector = dot(inv(s),dot(transpose(u),queryVector))

similarityToFirst = cosineDistance(queryVector,dtMatrixToQueryAgainst[:,0]

# gives 'matrices are not aligned' error. should be 1 because they're the same

什么工作,數學看起來不正確:(從here)

dtMatrixToQueryAgainst = dot(s,vt)

queryVector = dot(transpose(u),queryVector)

similarityToFirst = cosineDistance(queryVector,dtMatrixToQueryAgainsst[:,0])

# gives 1,which is correct

為什么路由工作,而第一個沒有,當我能找到關于LSA數學的所有東西顯示第一個是正確的？我覺得我錯過了一些明顯的東西……

創作挑戰賽新人創作獎勵來咯，堅持創作打卡瓜分現金大獎

總結

以上是生活随笔為你收集整理的python语义分析_Python差异的潜在语义分析的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。