日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

聚类分析(一)基本思想

發(fā)布時間:2025/3/15 编程问答 18 豆豆
生活随笔 收集整理的這篇文章主要介紹了 聚类分析(一)基本思想 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

聚類分析

1.什么是聚類分析

????????聚類分析是將個體或對象分類,使得同一類中的對象之間的相似性比其他類的對象的相似性更強。

2.目的

????????目的是把相似的研究對象歸成類,使類內對象的同質性最大化和類與類間對象的異質性最大化。

3.聚類分析的基本思想

????????我們認為,所研究的樣品或指標(變量)之間存在程度不同的相似性(親疏關系)。于是根據(jù)一批樣品的多個觀測指標,具體找出一些能夠度量樣品或指標之間相似程度的統(tǒng)計量,以這些統(tǒng)計量作為劃分類型的依據(jù),把一些相似程度較大的樣品(或指標)聚合為一類,把另外一些彼此之間相似程度較大的樣品(或指標)聚合為另一類......關系密切的聚合到一個小的分類單位,關系疏遠的聚合到一個大的分類單位,直到把所有的樣品(或指標)都聚合完畢,把不同的類型一一劃分出來,形成一個由小到大的分類系統(tǒng)。最后再把整個分類系統(tǒng)畫成一張分群圖(又稱譜系圖),用它把所有的樣品(或指標)間的親疏關系表示出來。

????????聚類分析不僅可以用來對樣品進行分類,也可以用來對變量進行分類。

????????對樣品分類常稱為Q型聚類分析,對變量的分類常稱為R型聚類分析

????????聚類分析的方法還是比較粗糙的,理論上也不算完善,但由于它能解決許多實際問題,所以很受實際研究者重視,同回歸分析、判別分析一起稱為多元分析的三大方法

4.聚類分析方法的分類

聚類分析給人們提供了豐富多彩的分類方法,這些方法大致可歸納為:

(1)系統(tǒng)聚類法。首先,將n個樣品看成n類(一類包含一個樣品),然后將性質最接近的兩類合并成一個新類,得到n-1類,再從中找出最接近的兩類加以合并,變成n-2類,如此下去,最后所有的樣品均在一類,將上述并類過程畫成一張圖(稱為聚類圖)便可決定分多少類,每類各有哪些樣品。

(2)模糊聚類法。將模糊數(shù)學的思想觀點用到聚類分析中產生的方法。該方法多用于定性變量的分類。

(3)K-均值法。K-均值法是一種非譜系聚類法,它是把樣品聚集成k個類的集合,類的個數(shù)k可以預先給定或者在聚類過程中確定。該方法可應用于比系統(tǒng)聚類法適用的大得多的數(shù)據(jù)組。

(4)有序樣品的聚類。n個樣品按某種原因(時間、底層深度等)排成次序,必須是次序相鄰的樣品才能聚成一類。

(5)分解法。它的程序正好和系統(tǒng)聚類法相反,首先所有的樣品均在一類,然后用某種最優(yōu)準則將它分為兩類。再試圖用同種準則將這兩類各自分裂為兩類,從中選一個使目標函數(shù)較好者,這樣由兩類變成三類。如此下去,一直分裂到每類只有一個樣品為止(或用其他停止規(guī)則),將上述分裂過程畫成圖,由圖便可求得各個類。

(6)加入法。將樣品依次加入,每次加入后將它放到當前聚類圖的應在位置上,全部加入后,即可得到聚類圖。

5.聚類分析的應用

(1)聚類一方面本身就是一種模型技術,另一方面,又常常作為數(shù)據(jù)分析過程中,前期進行數(shù)據(jù)摸底和數(shù)據(jù)清洗、數(shù)據(jù)整理的工具。
(2)聚類分析技術在數(shù)據(jù)化運營實踐中常見的業(yè)務應用場景:目標用戶的群體分類、搜索推薦業(yè)務、不同產品的價值組合、探測、發(fā)現(xiàn)孤立點、異常值等。

【參考】

??多元統(tǒng)計分析/何曉群編著.? -4版. --北京:中國人民大學出版社,2015.3

?

轉載于:https://my.oschina.net/u/3888421/blog/2049827

總結

以上是生活随笔為你收集整理的聚类分析(一)基本思想的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。