机器学习笔记 - 什么是UMAP?
1、UMAP概述
??統一流形逼近和投影 (UMAP) 是一種降維技術,可用于類似于 t-SNE 的可視化,但也可用于一般的非線性降維。UMAP 是一種基于流形學習技術和拓撲數據分析思想的降維算法。它為處理流形學習和降維提供了一個非常通用的框架,但也可以提供具體的具體實現。
??該算法基于對數據的三個假設:
??數據均勻分布在黎曼流形上;
??黎曼度量是局部常數(或可以近似);
??歧管是本地連接的。
??根據這些假設,可以用模糊拓撲結構對流形進行建模。通過搜索具有最接近的等效模糊拓撲結構的數據的低維投影來找到嵌入。
??UMAP與 t-SNE 相比,它提供了許多優勢,最顯著的是提高了速度并更好地保存了數據的全局結構。
??UMAP 的核心與 t-SNE 非常相似——兩者都使用圖形布局算法在低維空間中排列數據。在最簡單的意義上,UMAP 構建數據的高維圖表示,然后優化低維圖以使其在結構上盡可能相似。雖然 UMAP 用于構建高維圖的數學是先進的,但它們背后的直覺卻非常簡單。
??為了構建初始的高維圖,UMAP 構建了一個叫做“模糊單純復形”的東西。這實際上只是加權圖的表示,邊權重表示兩個點連接的可能性。為了確定連通性,UMAP 從每個點向外擴展一個半徑,當這些半徑重疊時連接點。選擇這個半徑很關鍵——選擇太小會導致小而孤立的集群,而選擇太大會將所有東西連接在一起。UMAP 通過根據到每個點n的距離在本地選擇半徑來克服這一挑戰th 最近的鄰居。UMAP 然后通過隨著半徑的增長降低連接的可能性來使圖形“模糊”。最后,通過規定每個點必須至少連接到其最近的鄰居,UMAP 確保局部結構與全局結構保持平衡。
2、UMAP安裝
??UMAP
總結
以上是生活随笔為你收集整理的机器学习笔记 - 什么是UMAP?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: jmu-python-函数-找钱
- 下一篇: 解决笔记本,如微星GS65偶尔卡顿,黑屏