分类、回归和聚类辨析
開學有兩個禮拜了,在經歷了體檢、選課、見導師等一系列活動之后,我的研究生生活總算是要開始了。我準備在量子物理的學習之外,學習一些機器學習的知識,不管是為了什么,學就是了。
主要參考書籍:周志華《機器學習》
學習篇(一)分類、回歸和聚類
首先,來一個基礎的類別分析:
分類和回歸是屬于監督學習(Supervised learning)的,而聚類則是屬于無監督學習(Unsupervised learning)。
其次,進行細致的學習:
1.分類(Classification)和回歸(Regression)
判斷一個人是否患有癌癥,是一個分類問題;
輸入一個人的數據,判斷他20年后的經濟能力,是一個回歸問題。
分類和回歸是屬于監督學習(Supervised learning)的兩大應用。
分類針對離散值,學習結果產生幾個函數,通過函數劃分為幾個集合。
(常見的應用:郵件過濾,客戶評級,醫療診斷等)
常見方法:后面補充
回歸針對連續值,學習結果產生幾個函數,通過函數產生連續的結果。
(常見的應用:等)
常見方法:后面補充
2.聚類(clustering)
若將168,169和120在沒有任何參考標準的情況下分成兩類,機器學習應該會將168和169分為一類,而120是單獨的一類。因為前兩者之間的距離為1,而與120的距離分別是48和49,這就是一個聚類問題。
聚類是屬于無監督學習(Unsupervised learning)的應用。
聚類,學習結果將產生幾個集合,集合中的元素彼此相似。
聚類有點類似分類,分類預先知道結果屬性的范圍,而聚類不知道結果屬性的范圍。
(常見的應用:細分客戶,文章推薦,等)
常見方法:K-means(K均值法),GMM(高斯混合模型)
集合內部的元素間具有較高的相似度,相似度的衡量可以通過歐幾里得距離、概率距離、加權重距離計算。
總結
以上是生活随笔為你收集整理的分类、回归和聚类辨析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PHP银行卡信息基类大全
- 下一篇: Arts 第十九周(7/22 ~ 7/2