ML — 浅谈聚类和分类的区别
?
機器學習技術近來得到普遍關注,其中人們談論最多的兩類機器學習算法就是分類和聚類。簡單說,分類就是向事物分配標簽,聚類就是將相似的事物放在一起。
先上一張對比圖做以簡單了解
舉個例子
假設有一批人的年齡的數據,大致知道其中有一堆少年兒童,一堆青年人,一堆老年人。
聚類就是自動發現這三堆數據,并把相似的數據聚合到同一堆中。所以對于這個例子,如果要聚成3堆的話,那么輸入就是一堆年齡數據,注意,此時的年齡數據并不帶有類標號,也就是說我只知道里面大致有三堆人,至于誰是哪一堆,現在是不知道的,而輸出就是每個數據所屬的類標號,聚類完成之后,就知道誰和誰是一堆了。
而分類就是,我事先告訴你,少年兒童、青年人及老年人的年齡是什么樣的,現在新來了一個年齡,輸出它的類標號,就是它是屬于少年兒童、青年人、老年人的哪個類。一般來說,分類器是需要訓練的,也就是要告訴你的算法,每個類的特征是什么樣子,它才能識別新的數據。
下面再舉一個實際的例子。
對于聚類,比如有些搜索引擎有“查看相似網頁”的功能,這個就可以用聚類來做,把網頁就行聚類,在聚類的結果中,每一個類中的網頁看成是相似的。
對于分類,比如手寫識別就可以看到是分類問題,比如我寫了10個“我”字,然后對這10個“我”字進行特征提取,就可以告訴算法,“我”字具有什么樣的特征,于是來了一個新的“我”字,雖然筆畫和之前的10個“我”字不完全一樣,但是特征高度相似,于是就把這個手寫的字分類到“我”這個類,就識別出來了。
總結
以上是生活随笔為你收集整理的ML — 浅谈聚类和分类的区别的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 取球博弈
- 下一篇: ElasticSearch教程——自定义