譜聚類（spectral clustering）原理總結(jié)

發(fā)布時(shí)間：2017年01月11日作者：文章轉(zhuǎn)自網(wǎng)絡(luò)，版權(quán)歸原作者所有，反饋可立刻刪除

　譜聚類（spectral clustering）是廣泛使用的聚類算法，比起傳統(tǒng)的K-Means算法，譜聚類對(duì)數(shù)據(jù)分布的適應(yīng)性更強(qiáng)，聚類效果也很優(yōu)秀，同時(shí)聚類的計(jì)算量也小很多，更加難能可貴的是實(shí)現(xiàn)起來也不復(fù)雜。在處理實(shí)際的聚類問題時(shí)，個(gè)人認(rèn)為譜聚類是應(yīng)該首先考慮的幾種算法之一。下面我們就對(duì)譜聚類的算法原理做一個(gè)總結(jié)。

1. 譜聚類概述

　　　　譜聚類是從圖論中演化出來的算法，后來在聚類中得到了廣泛的應(yīng)用。它的主要思想是把所有的數(shù)據(jù)看做空間中的點(diǎn)，這些點(diǎn)之間可以用邊連接起來。距離較遠(yuǎn)的兩個(gè)點(diǎn)之間的邊權(quán)重值較低，而距離較近的兩個(gè)點(diǎn)之間的邊權(quán)重值較高，通過對(duì)所有數(shù)據(jù)點(diǎn)組成的圖進(jìn)行切圖，讓切圖后不同的子圖間邊權(quán)重和盡可能的低，而子圖內(nèi)的邊權(quán)重和盡可能的高，從而達(dá)到聚類的目的。

　　　　乍一看，這個(gè)算法原理的確簡(jiǎn)單，但是要完全理解這個(gè)算法的話，需要對(duì)圖論中的無向圖，線性代數(shù)和矩陣分析都有一定的了解。下面我們就從這些需要的基礎(chǔ)知識(shí)開始，一步步學(xué)習(xí)譜聚類。

2. 譜聚類基礎(chǔ)之一：無向權(quán)重圖

　　　　由于譜聚類是基于圖論的，因此我們首先溫習(xí)下圖的概念。對(duì)于一個(gè)圖

分類導(dǎo)航

譜聚類（spectral clustering）原理總結(jié)

1. 譜聚類概述

2. 譜聚類基礎(chǔ)之一：無向權(quán)重圖

網(wǎng)友評(píng)論

更多精彩分享