MATLAB中K-means函数表达方式
K-means算法以偶是距離作為相似度測度,它是求對應某一初始聚類中心向量V最優分類,使得評價指標J最小。算法采用誤差平方和準則函數作為聚類準則函數
K-means聚類算法采用的是將NP的矩陣X劃分為K個類,使得類內對象之間的距離最大,而類之間的距離最小。
使用方法:
Idx=Kmeans(X,K)
[Idx,C]=Kmeans(X,K)
[Idx,C,sumD]=Kmeans(X,K)
[Idx,C,sumD,D]=Kmeans(X,K)
[…]=Kmeans(…,’Param1’,Val1,’Param2’,Val2,…)
各輸入輸出參數介紹:
X :NP的數據矩陣
K: 表示將X劃分為幾類,為整數
Idx :N1的向量,存儲的是每個點的聚類標號
C: KP的矩陣,存儲的是K個聚類質心位置
sumD 1K的和向量,存儲的是類間所有點與該類質心點距離之和
D NK的矩陣,存儲的是每個點與所有質心的距離
[…]=Kmeans(…,‘Param1’,Val1,‘Param2’,Val2,…)
這其中的參數Param1、Param2等,主要可以設置為如下:
1. ‘Distance’(距離測度)
‘sqEuclidean’ 歐式距離(默認時,采用此距離方式)
‘cityblock’ 絕度誤差和,又稱:L1
‘cosine’ 針對向量
‘correlation’ 針對有時序關系的值
‘Hamming’ 只針對二進制數據
2. ‘Start’(初始質心位置選擇方法)
‘sample’ 從X中隨機選取K個質心點
‘uniform’ 根據X的分布范圍均勻的隨機生成K個質心
‘cluster’ 初始聚類階段隨機選擇10%的X的子樣本(此方法初始使用’sample’方法)
matrix 提供一K*P的矩陣,作為初始質心位置集合
3. ‘Replicates’(聚類重復次數) 整數
總結
以上是生活随笔為你收集整理的MATLAB中K-means函数表达方式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 陈润生院士:我给自己取了个微信名,叫“微
- 下一篇: 这个工具可以快速查看文章引用、获取全文、