K近鄰法(KNN)原理小結(jié)這篇文章,我們討論了KNN的原理和優(yōu)缺點,這里我們就從實踐出發(fā),對scikit-learn 中KNN相關的類庫使用做一個小結(jié)。主要關注于類庫調(diào)參時的一個經(jīng)驗總結(jié)。

1. scikit-learn 中KNN相關的類庫概述

在scikit-learn 中,與近鄰法這一大類相關的類庫都在sklearn.neighbors包之中。KNN分類樹的類是KNeighborsClassifier,KNN回歸樹的類是KNeighborsRegressor。除此之外,還有KNN的擴展,即限定半徑最近鄰分類樹的類RadiusNeighborsClassifier和限定半徑最近鄰回歸樹的類RadiusNeighborsRegressor, 以及最近質(zhì)心分類算法NearestCentroid。

在這些算法中,KNN分類和回歸的類參數(shù)完全一樣。限定半徑最近鄰法分類和回歸的類的主要參數(shù)也和KNN基本一樣。

比較特別是的最近質(zhì)心分類算法,由于它是直接選擇最近質(zhì)心來分類,所以僅有兩個參數(shù),距離度量和特征選擇距離閾值,比較簡單,因此后面就不再專門講述最近質(zhì)心分類算法的參數(shù)。

另外幾個在sklearn.neighbors包中但不是做分類回歸預測的類也值得關注。kneighbors_graph類返回用KNN時和每個樣本最近的K個訓練集樣本的位置。radius_neighbors_graph返回用限定半徑最近鄰法時和每個樣本在限定半徑內(nèi)的訓練集樣本的位置。NearestNeighbors是個大雜燴,它即可以返回用KNN時和每個樣本最近的K個訓練集樣本的位置,也可以返回用限定半徑最近鄰法時和每個樣本最近的訓練集樣本的位置,常常用在聚類模型中。

2. K近鄰法和限定半徑最近鄰法類庫參數(shù)小結(jié)

本節(jié)對K近鄰法和限定半徑最近鄰法類庫參數(shù)做一個總結(jié)。包括KNN分類樹的類KNeighborsClassifier,KNN回歸樹的類KNeighborsRegressor, 限定半徑最近鄰分類樹的類RadiusNeighborsClassifier和限定半徑最近鄰回歸樹的類RadiusNeighborsRegressor。這些類的重要參數(shù)基本相同,因此我們放到一起講。

    1. <sub id="lhaj5"></sub>
        參數(shù) KNeighborsClassifier KNeighborsRegressor RadiusNeighborsClassifier

        網(wǎng)友評論