期望最大化算法
多次見到,今天特此記錄下!
期望最大化算法是基于質心得一個聚類算法,它依賴于距離的某種度量,通常是歐幾里得距離。
如果預先指定了簇數n,則首先從隨機選擇n個記錄作為n個簇的質心開始。數據集中的每個記錄都分配給它最近的質心,因此分配給它的質心代表的簇。在下一輪中,每個質心都移動到屬于該群集的所有記錄的均值的位置。同樣,每個記錄都分配給它最近的質心,因此也分配給相應的簇。重復此過程,直到基于所有點到質心的平方距離的某種誤差測量值降至某個閾值以下。
現在,每個記錄已分配給一個群集。 k均值的變化不僅估計每個聚類的平均值,而且將每個聚類建模為高斯核,同時也估計方差。這既是期望最大化算法 的基本思想了。
總結
- 上一篇: Java基础----对象与类
- 下一篇: 剑指offer-week1