主成分分析,主成份是原始變量的線性組合,在考慮所有主成份的情況下主成份和原始變量間是可以逆轉(zhuǎn)的。即“簡化變量”,將變量以不同的系數(shù)合起來,得到好幾個復(fù)合變量,然后在從中挑幾個能表示整體的復(fù)合變量就是主成份,然后計(jì)算得分。
因子分析,公共因子和原始變量的關(guān)系是不可逆轉(zhuǎn)的,但是可以通過回歸得到。是將變量拆開,分成公共因子和特殊因子。過程是:因子載荷計(jì)算,因子旋轉(zhuǎn),因子得分。
主成份分析
主成份分析需要知道兩變量之間的相關(guān)性,生成協(xié)方差舉證和相關(guān)新矩陣,對應(yīng)的生成的新向量矩陣Y還有特征值λi,對應(yīng)是第I個新向量對總體信息的貢獻(xiàn)率為λi/(λ1+λ2+...+λn),對應(yīng)的還有一個累積貢獻(xiàn)率。
確定主成份的個數(shù)的方法有:特征值大于1(要求原始數(shù)據(jù)的每一個變量至少能貢獻(xiàn)1各單位的變異)、陡坡檢驗(yàn)法(陡坡圖中開始平坦的點(diǎn)之前的點(diǎn)的個數(shù))、累積解釋變異比例法(即(λ1+...+λi)/(λ1+λ2+...+λn)>70%)。
同時也可以知道主成分分析對應(yīng)的幾個難點(diǎn)①是使用協(xié)方差矩陣還是相關(guān)系數(shù)矩陣②如何確定主成份的個數(shù)。當(dāng)數(shù)據(jù)中不同變量的度量單位不同并且數(shù)值相差較大就用標(biāo)準(zhǔn)化后的相關(guān)系數(shù)矩陣,當(dāng)數(shù)值相差不大并且指標(biāo)的權(quán)重不一樣時,考慮用協(xié)方差矩陣。對于個數(shù)的確定就是我們一些邊界問題是否1左右的也可以囊括進(jìn)主成份中,是否難以確定開始變平坦的是那個點(diǎn),是否70%不夠。等幾個問題。
主成分分析可以用兩個過程步完成PROC FACTORS 、PROC PRINCOMP。后者能處理的數(shù)據(jù)量大一些,效率高一些,,前者輸出的內(nèi)容豐富些,還可以做旋轉(zhuǎn)因子。