ML — 浅谈聚类和分类的区别
?
機(jī)器學(xué)習(xí)技術(shù)近來得到普遍關(guān)注,其中人們談?wù)撟疃嗟膬深悪C(jī)器學(xué)習(xí)算法就是分類和聚類。簡(jiǎn)單說,分類就是向事物分配標(biāo)簽,聚類就是將相似的事物放在一起。
先上一張對(duì)比圖做以簡(jiǎn)單了解
舉個(gè)例子
假設(shè)有一批人的年齡的數(shù)據(jù),大致知道其中有一堆少年兒童,一堆青年人,一堆老年人。
聚類就是自動(dòng)發(fā)現(xiàn)這三堆數(shù)據(jù),并把相似的數(shù)據(jù)聚合到同一堆中。所以對(duì)于這個(gè)例子,如果要聚成3堆的話,那么輸入就是一堆年齡數(shù)據(jù),注意,此時(shí)的年齡數(shù)據(jù)并不帶有類標(biāo)號(hào),也就是說我只知道里面大致有三堆人,至于誰是哪一堆,現(xiàn)在是不知道的,而輸出就是每個(gè)數(shù)據(jù)所屬的類標(biāo)號(hào),聚類完成之后,就知道誰和誰是一堆了。
而分類就是,我事先告訴你,少年兒童、青年人及老年人的年齡是什么樣的,現(xiàn)在新來了一個(gè)年齡,輸出它的類標(biāo)號(hào),就是它是屬于少年兒童、青年人、老年人的哪個(gè)類。一般來說,分類器是需要訓(xùn)練的,也就是要告訴你的算法,每個(gè)類的特征是什么樣子,它才能識(shí)別新的數(shù)據(jù)。
下面再舉一個(gè)實(shí)際的例子。
對(duì)于聚類,比如有些搜索引擎有“查看相似網(wǎng)頁”的功能,這個(gè)就可以用聚類來做,把網(wǎng)頁就行聚類,在聚類的結(jié)果中,每一個(gè)類中的網(wǎng)頁看成是相似的。
對(duì)于分類,比如手寫識(shí)別就可以看到是分類問題,比如我寫了10個(gè)“我”字,然后對(duì)這10個(gè)“我”字進(jìn)行特征提取,就可以告訴算法,“我”字具有什么樣的特征,于是來了一個(gè)新的“我”字,雖然筆畫和之前的10個(gè)“我”字不完全一樣,但是特征高度相似,于是就把這個(gè)手寫的字分類到“我”這個(gè)類,就識(shí)別出來了。
總結(jié)
以上是生活随笔為你收集整理的ML — 浅谈聚类和分类的区别的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 取球博弈
- 下一篇: ElasticSearch教程——自定义