日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

近似最近邻搜索ANN(Approximate Nearest Neighbor)

發布時間:2025/3/21 编程问答 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 近似最近邻搜索ANN(Approximate Nearest Neighbor) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目前ANN近似近鄰搜索有兩種比較流行的方法:樹方法和哈希方法。

特點概括

基于樹的方法的一些特點概括:

  • 遞歸了劃分數據:分而治之。Recursively partition the data: Divide and Conquer。

  • 查詢時間為:\( O(log n) \)(with constants exponential in dimension)

  • 隨著數據維數的增加,基于樹的ANN其表現性能會急劇的下降,Performance degrades with high-dimensional data。

  • 需要的存儲開銷很大,Large storage needs,因為需要存儲樹結構(?)。

  • 在運行的時候,需要保存原始數據,Original data is required at run-time。同樣會增加內存的開銷。

  • 哈希方法的一些特點:

  • 數據庫中的每一個item都被用一個編碼來表達。Each item in database represented as a code。

  • 可以極大的降低內存空間。Significant reduction in storage。

  • 查詢時間為:\( O(1) \)或是線性的。Expected query time: O(1) or sublinear in n。

  • 4.Compact codes preferred。

    Precision-Recall權衡

  • 如果想要得到較高的精度,則需要較長的編碼。For high precision, longer codes (i.e. large?\( m \)) preferred。

  • 編碼長度m增長的話,則item碰撞的概率會成倍的減小,從而導致召回率下降。 Large m reduces the probability of collision exponentially → low recall

  • 為了得到較高的召回率,則需要多個哈希表。Many tables (large L) necessary to get good recall → Large storage

  • from:?http://yongyuan.name/blog/approximate-nearest-neighbor-search.html 《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀

    總結

    以上是生活随笔為你收集整理的近似最近邻搜索ANN(Approximate Nearest Neighbor)的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。