DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪聲的基于密度的聚類方法)是一種很典型的密度聚類算法,和K-Means,BIRCH這些一般只適用于凸樣本集的聚類相比,DBSCAN既可以適用于凸樣本集,也可以適用于非凸樣本集。下面我們就對DBSCAN算法的原理做一個總結(jié)。
1. 密度聚類原理
DBSCAN是一種基于密度的聚類算法,這類密度聚類算法一般假定類別可以通過樣本分布的緊密程度決定。同一類別的樣本,他們之間的緊密相連的,也就是說,在該類別任意樣本周圍不遠(yuǎn)處一定有同類別的樣本存在。
通過將緊密相連的樣本劃為一類,這樣就得到了一個聚類類別。通過將所有各組緊密相連的樣本劃為各個不同的類別,則我們就得到了最終的所有聚類類別結(jié)果。
2. DBSCAN密度定義
在上一節(jié)我們定性描述了密度聚類的基本思想,本節(jié)我們就看看DBSCAN是如何描述密度聚類的。DBSCAN是基于一組鄰域來描述樣本集的緊密程度的,參數(shù)(
延伸閱讀
學(xué)習(xí)是年輕人改變自己的最好方式