主成分分析,主成份是原始變量的線性組合,在考慮所有主成份的情況下主成份和原始變量間是可以逆轉的。即“簡化變量”,將變量以不同的系數合起來,得到好幾個復合變量,然后在從中挑幾個能表示整體的復合變量就是主成份,然后計算得分。
因子分析,公共因子和原始變量的關系是不可逆轉的,但是可以通過回歸得到。是將變量拆開,分成公共因子和特殊因子。過程是:因子載荷計算,因子旋轉,因子得分。
主成份分析
主成份分析需要知道兩變量之間的相關性,生成協(xié)方差舉證和相關新矩陣,對應的生成的新向量矩陣Y還有特征值λi,對應是第I個新向量對總體信息的貢獻率為λi/(λ1+λ2+...+λn),對應的還有一個累積貢獻率。
確定主成份的個數的方法有:特征值大于1(要求原始數據的每一個變量至少能貢獻1各單位的變異)、陡坡檢驗法(陡坡圖中開始平坦的點之前的點的個數)、累積解釋變異比例法(即(λ1+...+λi)/(λ1+λ2+...+λn)>70%)。
同時也可以知道主成分分析對應的幾個難點①是使用協(xié)方差矩陣還是相關系數矩陣②如何確定主成份的個數。當數據中不同變量的度量單位不同并且數值相差較大就用標準化后的相關系數矩陣,當數值相差不大并且指標的權重不一樣時,考慮用協(xié)方差矩陣。對于個數的確定就是我們一些邊界問題是否1左右的也可以囊括進主成份中,是否難以確定開始變平坦的是那個點,是否70%不夠。等幾個問題。
主成分分析可以用兩個過程步完成PROC FACTORS 、PROC PRINCOMP。后者能處理的數據量大一些,效率高一些,,前者輸出的內容豐富些,還可以做旋轉因子。
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動安全 [無線安全]玩轉無線電——不安全的藍牙鎖 2017-07-26
- 消息隊列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標分割】 2017-07-26
- 詞向量-LRWE模型-更好地識別反義詞同義詞 2017-07-26
- 從棧不平衡問題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實現JSON轉Model - HandyJSON使用講解 2017-07-26
- 阿里移動安全 Android端惡意鎖屏勒索應用分析 2017-07-26
- 集合結合數據結構來看看(二) 2017-07-26