1.特征選擇
特征選擇是降維的一種方法,即選擇對(duì)預(yù)測(cè)結(jié)果相關(guān)度高的特征或者消除相似度高的特征,以提高估計(jì)函數(shù)的準(zhǔn)確率或者提高多維度數(shù)據(jù)集上的性能。
2.刪除低方差特征
1)思路:設(shè)置一個(gè)閥值,對(duì)每個(gè)特征求方差,如果所求方差低于這個(gè)閥值,則刪除此特征。默認(rèn)情況下會(huì)刪除0方差。
2)核心函數(shù)
sklearn.feature_selection.VarianceThreshold
3)主要參數(shù):
threshold :設(shè)置的閥值