實際意義

判別分析于聚類分析的功能差不多,區(qū)別在于,聚類分析之前,沒有人知道具體的是怎么分的類,分了哪幾大類。而判別分析是已經(jīng)把類別給分好,要做的是把沒有分好類的數(shù)據(jù)觀測,按照之前分好的類再進行分類。這里不同于生活中常見的分類先有具體的分類邏輯(這里叫做判別函數(shù))。所以判別分的難點在于先由分好類的數(shù)據(jù)觀測找到一個或者多個判別函數(shù),然后對未進行分類的觀測按照該判別公式進行分類。

進行判別分析需要滿足的條件是:

①每一個判別變量都不能是其他判別變量的線性組合

②各個判別變量之間具有多元正態(tài)分布,即控制N-1個變量為固定值時,第N個變量滿足正態(tài)分布

③滿足②條件時,使用參數(shù)法計算判別函數(shù),否則使用非參數(shù)法計算判別函數(shù)。

判別分析方法

距離判別法:D2(X)=(X-μ)22

馬氏距離(廣義平方距離):W(X)=DB2(X)-DA2(X