版權(quán)聲明:本文為博主原創(chuàng)文章,轉(zhuǎn)載請(qǐng)指明轉(zhuǎn)載地址
www.cnblogs.com/fydeblog/p/7140974.html
前言
這篇notebook是關(guān)于機(jī)器學(xué)習(xí)中監(jiān)督學(xué)習(xí)的k近鄰算法,將介紹2個(gè)實(shí)例,分別是使用k-近鄰算法改進(jìn)約會(huì)網(wǎng)站的效果和手寫識(shí)別系統(tǒng).
操作系統(tǒng):ubuntu14.04 運(yùn)行環(huán)境:anaconda-python2.7-notebook 參考書(shū)籍:機(jī)器學(xué)習(xí)實(shí)戰(zhàn) notebook writer ----方陽(yáng)
k-近鄰算法(kNN)的工作原理:存在一個(gè)樣本數(shù)據(jù)集合,也稱作訓(xùn)練樣本集,并且樣本集中的每個(gè)數(shù)據(jù)都存在標(biāo)簽,即我們知道樣本集中每一組數(shù)據(jù)與所屬分類的對(duì)應(yīng)關(guān)系,輸入沒(méi)有標(biāo)簽的新數(shù)據(jù)后,將新數(shù)據(jù)的每個(gè)特征與樣本集中數(shù)據(jù)對(duì)應(yīng)的特征進(jìn)行比較,然后算法提取樣本集中特征最相似的分類標(biāo)簽。