日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

python实现e2lsh高维数据集k近邻搜索——实现流程

發(fā)布時間:2025/3/21 22 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python实现e2lsh高维数据集k近邻搜索——实现流程 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
  • lsh學(xué)習(xí)鏈接:
    LSH(Locality Sensitive Hashing)原理與實現(xiàn)
    對高維數(shù)據(jù)查詢最近鄰,推薦使用p-stable LSH;
    minLSH是針對文檔查詢最近鄰得方法;
  • python學(xué)習(xí)與使用:
    python入門之類
  • 常用函數(shù):
    random.gauss(mu, sigma):均值為mu且標(biāo)準(zhǔn)偏差為sigma的高斯分布
    random.uniform(x, y):將隨機生成下一個實數(shù),它在 [x, y] 范圍內(nèi)。
    numpy.inner():返回一維數(shù)組的向量內(nèi)積。對于更高的維度,它返回最后一個軸上的和的乘積。
    字典(Dictionary) update() :函數(shù)把字典dict2的鍵/值對更新到dict里。
  • lsh參數(shù)計算學(xué)習(xí)鏈接:
    參考論文:2004 Locality-sensitive hashing using stable distributions
    E2LSH的原理與實現(xiàn)
    LSH在歐式空間的應(yīng)用(1)–碰撞概率分析
    LSH在歐式空間的應(yīng)用(2)–工作原理
    LSH在歐式空間的應(yīng)用(3)–參數(shù)選擇
    以上三個鏈接是用R語言舉例;
    正態(tài)分布就是高斯分布;
  • knn搜索
    在使用lsh做近似近鄰搜索后,得到近鄰索引,通過近鄰索引對近鄰數(shù)據(jù)做k近鄰檢索,得到精確的k個最近鄰。
    python做 knn可以調(diào)用庫函數(shù)實現(xiàn):
from sklearn.neighbors import NearestNeighbors # 函數(shù)功能:對數(shù)據(jù)集x的前1000個數(shù)據(jù)做10近鄰搜索; # 搜索范圍:數(shù)據(jù)集x內(nèi)全體數(shù)據(jù); def knn_search(X):# 查詢點y:x內(nèi)前一千個數(shù);Y = X[0:1000]# 查詢范圍:x內(nèi)全體數(shù)據(jù);查詢11近鄰;nbs = NearestNeighbors(n_neighbors=11, algorithm='ball_tree').fit(X)# distances:最近鄰距離;indices:最近鄰索引號;distances, indices = nbs.kneighbors(Y)# knn近鄰搜索范圍包含自己,返回結(jié)果去除自己(即去除查詢結(jié)果第一列),得到查詢點的十近鄰;return indices[:, 1:]

綜上,完成lsh對數(shù)據(jù)集k近鄰查詢;
查詢結(jié)果(對數(shù)據(jù)集做兩遍查詢,一次e2lsh,一次knn,對比查詢結(jié)果):

總結(jié)

以上是生活随笔為你收集整理的python实现e2lsh高维数据集k近邻搜索——实现流程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。