主成分分析,主成份是原始變量的線性組合,在考慮所有主成份的情況下主成份和原始變量間是可以逆轉(zhuǎn)的。即“簡(jiǎn)化變量”,將變量以不同的系數(shù)合起來(lái),得到好幾個(gè)復(fù)合變量,然后在從中挑幾個(gè)能表示整體的復(fù)合變量就是主成份,然后計(jì)算得分。

因子分析,公共因子和原始變量的關(guān)系是不可逆轉(zhuǎn)的,但是可以通過(guò)回歸得到。是將變量拆開,分成公共因子和特殊因子。過(guò)程是:因子載荷計(jì)算,因子旋轉(zhuǎn),因子得分。

主成份分析

主成份分析需要知道兩變量之間的相關(guān)性,生成協(xié)方差舉證和相關(guān)新矩陣,對(duì)應(yīng)的生成的新向量矩陣Y還有特征值λi,對(duì)應(yīng)是第I個(gè)新向量對(duì)總體信息的貢獻(xiàn)率為λi/(λ1+λ2+...+λn),對(duì)應(yīng)的還有一個(gè)累積貢獻(xiàn)率。

確定主成份的個(gè)數(shù)的方法有:特征值大于1(要求原始數(shù)據(jù)的每一個(gè)變量至少能貢獻(xiàn)1各單位的變異)、陡坡檢驗(yàn)法(陡坡圖中開始平坦的點(diǎn)之前的點(diǎn)的個(gè)數(shù))、累積解釋變異比例法(即(λ1+...+λi)/(λ1+λ2+...+λn)>70%)。

同時(shí)也可以知道主成分分析對(duì)應(yīng)的幾個(gè)難點(diǎn)①是使用協(xié)方差矩陣還是相關(guān)系數(shù)矩陣②如何確定主成份的個(gè)數(shù)。當(dāng)數(shù)據(jù)中不同變量的度量單位不同并且數(shù)值相差較大就用標(biāo)準(zhǔn)化后的相關(guān)系數(shù)矩陣,當(dāng)數(shù)值相差不大并且指標(biāo)的權(quán)重不一樣時(shí),考慮用協(xié)方差矩陣。對(duì)于個(gè)數(shù)的確定就是我們一些邊界問(wèn)題是否1左右的也可以囊括進(jìn)主成份中,是否難以確定開始變平坦的是那個(gè)點(diǎn),是否70%不夠。等幾個(gè)問(wèn)題。

主成分分析可以用兩個(gè)過(guò)程步完成PROC FACTORS 、PROC PRINCOMP。后者能處理的數(shù)據(jù)量大一些,效率高一些,,前者輸出的內(nèi)容豐富些,還可以做旋轉(zhuǎn)因子。

網(wǎng)友評(píng)論