
《探索性因素分析》PPT课件.ppt
23页探索性因素分析:主成分分析與因素分析1相關矩陣nObserved correlation matrixn由觀察變項計算得到的相關係數矩陣nReproduced correlation matrixn由因素導出的相關係數矩陣nResidual correlation matrixn觀察相關係數矩陣與重製相關係數矩陣的差異2因素分析的各類矩陣nOrthogonal rotation直交轉軸n所有的因素不具有相關的轉軸結果nOblique rotation斜交轉軸n因素間具有相關的轉軸結果nLoading matrix因素負荷矩陣n直交轉軸後各觀察變項與因素間的相關係數矩陣nStructure matrix結構矩陣n斜交轉軸後各觀察變項與因素間的相關係數矩陣nPattern matrix型態矩陣n斜交轉軸後各觀察變項與因素間排除因素間相關後之相關係數矩陣n為斜交轉軸可以反應因素意義的係數nFactor score coefficients matrix因素分數係數矩陣n用以反應因素得分的類迴歸方程式係數矩陣3因素分析的目的與問題n因素分析的主要目的在將繁多的變項縮減為少數的因素,找出變項背後的結構,涉及下列問題的探討n因素數目的決定n因素的內容與性質n因素的重要性n理論的檢驗n因素分數的估計4因素分析的限制n理論層次的問題n因素的抽取必須具有相當的理論與邏輯基礎。
重要的因素必須被涵蓋,無關的測量應該被排除n因素背後應有特定且穩定的測量變項, 稱為marker variable,是用來定義因素的重要變項n因素內的複雜性需被仔細的評估反應在與多個因素有關係的觀察變項n樣本的選取需能涵蓋測量變項的變異性n樣本間的比較亦能反應因素的特性n實務層次的問題n因素分析受到相關係數的特性所影響,任何影響相關係數的原因都可能干擾因素分析n樣本數、遺漏值、常態性、線性關係、偏離值n多元共線性(multicollinearity)與單一性(singularity),極端的共線性與單一性對於因素分析具有影響n相關係數的大小:如果觀察矩陣中相關係數均小於.3,抽取因素能力低,可能需放棄使用因素分析n因素分析的偏離值:當某測量變項不被因素所解釋時當僅有兩個變項所決定的因素,可能是一種不穩定的因素5因素分析的類型n不同萃取方法皆產生直交的成分或因素來反應觀察相關矩陣Rn不同點在於抽取的標準不同,例如最大變異、最小殘差等n當樣本數大、觀察變項數目多或共同性估計相近時,各方法差異不大n因素分析結果是否穩定不是決定於萃取的方法而是變項間的關係n方法目的nPCA:單純的化簡測量(得到成分components)nFA:尋找測量題目背後的結構與理論意涵,並利用這些潛在結構進行分析應用(得到因素factors )n萃取過程n差異在於兩者對於觀察相關矩陣的處理方式n也就是處理變異數上的差異nPCA analyzes variance: 觀察變項的所有變異量均被分析(觀察相關係數矩陣中對角線總和)nFA analyzes covariance: 僅有共同變異量(shared variance)被分析(觀察相關係數矩陣中對角線以共同性來取代)n萃取結果nPCA:n以最少的直交成分來解釋最大的變項變異量n具有單一的數學解nFA:n以最少的直交因素來反應相關矩陣n具有不同的最佳解6不同的萃取方法一n主成分法(Principal components)n目的在使每一個成分能夠代表最大的觀察變異量n第一個主成分為觀察變項的線性整合,能夠反應最大的變異量,依序發展各主成分n可以得到最大的解釋變異量n主要因素法(principal factors)n以共同性為分析的對象n因素的抽取以疊代程序來進行,起始值為SMC(squared multiple correlations),反覆帶入共同性直到無改善n能夠產生最理想的重製矩陣n映像因素萃取(image factor extraction)n各觀察變項的變異量為其他變項的投射。
每一個變項的映像分數係以多元迴歸的方法來計算,映像分數的共變矩陣被進行PCAn類似PCA,能夠產生單一的數學解,對角線與FA相同,為共同性n因素負荷量不是相關係數,而是變項與因素的共變7不同的萃取方法二n最大概似因素萃取(maximum likelihood factor extraction)n以因素負荷量的母數估計數為主要目的n計算樣本求得之觀察矩陣能夠反應母體的最大機率之負荷量n因素可進行顯著性考驗,適用於驗證性分析n也即是求取變項與因素間的最大典型相關n無加權最小平方法(unweighted least squares factoring)n求取觀察與重製矩陣的殘差的最小平方值n只有非對角線上的數據被納入分析n共同性是分析完成之後才進行計算n一般加權最小平方法(generalized weighted least squares factoring)n在無加權平方法下,增加權數的考量(以共同性加權)n有較大的共同變異的變項被較大的加權nAlpha法(alpha factoring)n處理共同因素的信度,提高因素的類化性(generalizability)n共同性的估計是在使因素的alpha信度達到最大8Rotation 轉軸n轉軸的時機n依目的:得到最佳的結構,或保留因素的原始面貌n利用因素散佈圖協助判斷:觀察變項應在各軸上:接近各軸,遠離原點,形成群落nOrthogonal rotation(直交轉軸)nVarimax:使負荷量的變異數在因素內最大( Г =1)nQuartimax :使負荷量的變異數在變項內最大( Г =0)nEquamax :綜合前兩者,使負荷量的變異數在因素內與變項內同時最大( Г =.5)nГ(gamma)指標:表示簡化的程度:0表變項最簡化,1表因素最簡化,.5表兩者各半nOblique rotation(斜交轉軸)n允許因素間具有相關之轉軸n因素間最大的相關由δ(delta)決定, 負的δ越小,表示月接近直交, δ=-4為直交, δ接近1時,因素間的相關可能最高nDirect oblimin:使因素負荷量的差積(cross-products)最小化nDirect quartimin:使型態矩陣中的負荷量平方的差積(cross-products)最小化nOrthoblique:使用quartimax算式將因素負荷量重新量尺化(rescaled)以產生直交的結果,因此最後的結果保有斜交的性質nPromax:將直交轉軸(varimax)的結果再進行有相關的斜交轉軸。
因素負荷量取2,4,6次方以產生接近0但不為零的值,藉以找出因素間的相關,但仍保有最簡化因素的特性9直交轉軸概念圖1011四種萃取方法之比較主成分分析主軸因子Alpha 因素萃取法映像因素萃取法12121212COST-.087 -.988 -.086 -.981 -.086 -.981 -.086 -.968 LIFT-.072 .989 -.071 .977 -.071 .977 -.071 .965 DEPTH.997 -.026 .994 -.026 .994 -.026 .993 -.026 POWDER.998 .040 .997 .040 .997 .040 .993 .040 特徵值2.016 1.942 2.005 1.909 1.9971.917 1.984 1.870 解釋%50.41 48.54 50.12 47.73 49.9347.92 49.61 46.74 轉軸特徵值2.003 1.955 1.995 1.919 1.9951.919 1.983 1.871 直交%50.07 48.88 49.87 47.99 49.8747.99 49.59 46.76 總變異%98.95 97.85 97.85 96.35 1213因素分析的範例說明n CostCost of ski ticketLiftSpeed of ski liftDepthDepth of snowPowderMoisture of snowS132646567S261376265S359404543S436623435S562464340CostLiftDepthPowderCost1.000-.953.055-.130Lift-.9531.000-.091-.036Depth-.055-.0911.000.990Powder-.130-.036.9901.00014特徵向量與特徵值n相關矩陣中的對角線代表變項的標準化的變異量(1.00) n因素分析經由因素的萃取對於觀察變項相關矩陣進行萃取後,轉換成為特徵值(L) L=V’RV V’V=InV稱為特徵向量n上式可以轉換為R=AA’,A稱為因素負荷矩陣相關矩陣R特徵值矩陣L15因素負荷矩陣n前式可以轉換為R=AA’,A稱為因素負荷矩陣16直交轉軸nVarimax法:將因素負荷量的變異數最大化n將高相關更高,低相關更低(19度轉軸)17共同性與解釋百分比nCommunality共同性:n變項的變異量被因素解釋的百分比(-.086)2+(.981)2=.970(997)2+(-.040)2=.996(.994)2+(.026)2=.989(-.071)2+(-.997)2=.9603.9151.9941.919SUM= .98 .50 .48%=18重製矩陣n重製矩陣為由因素所推導出的相關矩陣19Factor scores 因素分數n因素分數的產生由因素負荷量為基礎,透過迴歸分析原理來獲得一組因素分數係數,即可計算因素分數n因素分數係數為因素負荷量與相關係數反矩陣的乘積n因素分數為原始變項分數轉換為Z分數後乘以因素分數係數而得n各變項由因素得到的預測分數公式如下2021因素數目判斷原則n一般原則:解釋變異量n因素越多,解釋變異量越大n因素越多,簡效性越低(模式越複雜)n因素數目判斷方法n特徵值n大於1(表示大於1.00的原始觀察變異量)n因素數目合理範圍為變項數除以3至除以5之間n陡坡檢定Scree test (Cattell, 1966)n特徵值明顯出現變化時為合理數目n殘差分析n殘差類似於各變項間的相關在移除了因素的影響後的淨相關n檢驗不同因素數目下,殘差矩陣中的數值,高於.05或.10以上者過多,表示可能在其他因素n因素負荷量檢驗n單一觀察變項的因素並不恰當n二個觀察變項的因素在兩變項相關高(r>.7),與其他變項相關低時,為合理。
n顯著性考驗n驗證性因素分析提供因素的顯著性考驗nBartlett檢驗考驗全部因素的顯著性意義n研究上的考量n探索性的目的,想要瞭解因素的結構時,邊緣強度的因素可以保留,以瞭解其性質n當研究者需要穩定的因素進行研究時,保留信度高的因素即可22因素的解釋與命名n因素負荷量的判斷n.71(50%)優秀n.63(40%)非常好n.55(30%)好n.45(20%)普通n.32(10%)不好n.32以下:不及格n不同轉軸法下的考量n直交轉軸使用轉軸後矩陣n斜交轉軸使用型態矩陣,以獲悉因素的意義(結構矩陣中的係數被因素間的相關擴張,導致高估)23。
