當(dāng)前位置:
首頁 >
python实现e2lsh高维数据集k近邻搜索——实现流程
發(fā)布時間:2025/3/21
22
豆豆
生活随笔
收集整理的這篇文章主要介紹了
python实现e2lsh高维数据集k近邻搜索——实现流程
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
- lsh學(xué)習(xí)鏈接:
LSH(Locality Sensitive Hashing)原理與實現(xiàn)
對高維數(shù)據(jù)查詢最近鄰,推薦使用p-stable LSH;
minLSH是針對文檔查詢最近鄰得方法; - python學(xué)習(xí)與使用:
python入門之類 - 常用函數(shù):
random.gauss(mu, sigma):均值為mu且標(biāo)準(zhǔn)偏差為sigma的高斯分布
random.uniform(x, y):將隨機生成下一個實數(shù),它在 [x, y] 范圍內(nèi)。
numpy.inner():返回一維數(shù)組的向量內(nèi)積。對于更高的維度,它返回最后一個軸上的和的乘積。
字典(Dictionary) update() :函數(shù)把字典dict2的鍵/值對更新到dict里。 - lsh參數(shù)計算學(xué)習(xí)鏈接:
參考論文:2004 Locality-sensitive hashing using stable distributions
E2LSH的原理與實現(xiàn)
LSH在歐式空間的應(yīng)用(1)–碰撞概率分析
LSH在歐式空間的應(yīng)用(2)–工作原理
LSH在歐式空間的應(yīng)用(3)–參數(shù)選擇
以上三個鏈接是用R語言舉例;
正態(tài)分布就是高斯分布; - knn搜索
在使用lsh做近似近鄰搜索后,得到近鄰索引,通過近鄰索引對近鄰數(shù)據(jù)做k近鄰檢索,得到精確的k個最近鄰。
python做 knn可以調(diào)用庫函數(shù)實現(xiàn):
綜上,完成lsh對數(shù)據(jù)集k近鄰查詢;
查詢結(jié)果(對數(shù)據(jù)集做兩遍查詢,一次e2lsh,一次knn,對比查詢結(jié)果):
總結(jié)
以上是生活随笔為你收集整理的python实现e2lsh高维数据集k近邻搜索——实现流程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vm15+ubuntu+hadoop3.
- 下一篇: anaconda安装环境变量问题、pyt