主成分分析,主成份是原始變量的線性組合,在考慮所有主成份的情況下主成份和原始變量間是可以逆轉(zhuǎn)的。即“簡(jiǎn)化變量”,將變量以不同的系數(shù)合起來(lái),得到好幾個(gè)復(fù)合變量,然后在從中挑幾個(gè)能表示整體的復(fù)合變量就是主成份,然后計(jì)算得分。
因子分析,公共因子和原始變量的關(guān)系是不可逆轉(zhuǎn)的,但是可以通過(guò)回歸得到。是將變量拆開,分成公共因子和特殊因子。過(guò)程是:因子載荷計(jì)算,因子旋轉(zhuǎn),因子得分。
主成份分析
主成份分析需要知道兩變量之間的相關(guān)性,生成協(xié)方差舉證和相關(guān)新矩陣,對(duì)應(yīng)的生成的新向量矩陣Y還有特征值λi,對(duì)應(yīng)是第I個(gè)新向量對(duì)總體信息的貢獻(xiàn)率為λi/(λ1+λ2+...+λn),對(duì)應(yīng)的還有一個(gè)累積貢獻(xiàn)率。
確定主成份的個(gè)數(shù)的方法有:特征值大于1(要求原始數(shù)據(jù)的每一個(gè)變量至少能貢獻(xiàn)1各單位的變異)、陡坡檢驗(yàn)法(陡坡圖中開始平坦的點(diǎn)之前的點(diǎn)的個(gè)數(shù))、累積解釋變異比例法(即(λ1+...+λi)/(λ1+λ2+...+λn)>70%)。
同時(shí)也可以知道主成分分析對(duì)應(yīng)的幾個(gè)難點(diǎn)①是使用協(xié)方差矩陣還是相關(guān)系數(shù)矩陣②如何確定主成份的個(gè)數(shù)。當(dāng)數(shù)據(jù)中不同變量的度量單位不同并且數(shù)值相差較大就用標(biāo)準(zhǔn)化后的相關(guān)系數(shù)矩陣,當(dāng)數(shù)值相差不大并且指標(biāo)的權(quán)重不一樣時(shí),考慮用協(xié)方差矩陣。對(duì)于個(gè)數(shù)的確定就是我們一些邊界問(wèn)題是否1左右的也可以囊括進(jìn)主成份中,是否難以確定開始變平坦的是那個(gè)點(diǎn),是否70%不夠。等幾個(gè)問(wèn)題。
主成分分析可以用兩個(gè)過(guò)程步完成PROC FACTORS 、PROC PRINCOMP。后者能處理的數(shù)據(jù)量大一些,效率高一些,,前者輸出的內(nèi)容豐富些,還可以做旋轉(zhuǎn)因子。
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動(dòng)安全 [無(wú)線安全]玩轉(zhuǎn)無(wú)線電——不安全的藍(lán)牙鎖 2017-07-26
- 消息隊(duì)列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標(biāo)分割】 2017-07-26
- 詞向量-LRWE模型-更好地識(shí)別反義詞同義詞 2017-07-26
- 從棧不平衡問(wèn)題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實(shí)現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26
- 阿里移動(dòng)安全 Android端惡意鎖屏勒索應(yīng)用分析 2017-07-26
- 集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來(lái)看看(二) 2017-07-26