
ch11平均数的差异检定-t考验.ppt
39页第十一章 平均數的變異分析:ANOVA,1/39,第十章 平均數的差異檢定— t考驗,Test for difference among the means: t Test,第十一章 平均數的變異分析:ANOVA,2/39,課程目標,瞭解變異數分析的原理 瞭解F考驗的原理與程序 瞭解整體考驗與事後考驗的差異 瞭解相依樣本的ANOVA 瞭解共變數分析的原理 熟習ANOVA的SPSS統計應用,第十一章 平均數的變異分析:ANOVA,3/39,基本定義,平均數考驗方法 變異數分析是一套應用於探討平均數差異的統計方法 當研究者所欲分析的資料是不同樣本的平均數,也就是探討類別變項對於連續變項的影響,平均數的差異成為主要分析重點 超過兩個以上的平均數的考驗,其原理是運用F考驗來檢驗平均數間的變異量是否顯著的高於隨機變異量,又稱為變異數分析,第一節,第十一章 平均數的變異分析:ANOVA,4/39,變異數分析的基本原理,平均數的變異分析 超過兩個平均數的考驗,其原理仍是以平均數間的變異數(組間變異)除以隨機變異得到的比值(F值),來取代平均數差異與隨機差異的比值(t或Z值),而能夠同時檢驗三個平均數的差異情形 當F值越大,表示研究者關心的組平均數的分散情形較誤差變異來得大,若大於研究者設定的臨界值,研究者即可獲得拒絕虛無假設、接受對立假設的結論。
第二節,第十一章 平均數的變異分析:ANOVA,5/39,單因子變異數分析資料實例,可以計算出四個平均數,即三個組平均數與一個總平均數(grand mean)變異數分析檢驗的就是這三個組平均數是否具有顯著的差異 研究假設為:高、中、低三種不同運動量的受測者,其睡眠時間不同,第二節,第十一章 平均數的變異分析:ANOVA,6/39,,,,,,SSwithin and SSbetween,第二節,第十一章 平均數的變異分析:ANOVA,7/39,實驗、族系與比較錯誤率,實驗誤差率(experiment-wise error rate;EWE) 統計的決策,是以整個實驗的型I錯誤率維持一定(例如.05)的情況下,導出各次決策所犯的型I錯誤率為何 族系誤差率(familywise error rate; FWE) 將每一個被檢驗的效果(例如主要效果、交互效果)的統計考驗的型I錯誤率維持一定,導出各次決策所犯的型I錯誤率 比較錯誤率(comparison-wise error rate) 將型I錯誤率設定於每一次的統計考驗,均有相同的犯第一類型錯誤的機率 實驗與族系誤差率 為了維持整體的α水準為.05,必須降低各次考驗的α水準,,第二節,第十一章 平均數的變異分析:ANOVA,8/39,固定效果模式與隨機效果模式,固定效果模式(fixed effect model) 當一個研究的自變項的水準個數(k組),包括了該變項所有可能的水準數(K組),也就是樣本的水準數等於母體的水準數(K=k) 。
例如比較大學四個年級學生的曠課次數,此時自變項為年級,具有四個水準,而母體亦為四個年級 隨機效果模式(random effect model) 研究所取用的自變項,只包含特定的一些水準,而並非包括所有可能的類別,即樣本的水準數小於母體的水準數(Kk) 例如教育學者比較不同地區的學校教學方法的成效有所不同,因此隨機選取幾個地區的一些學校共四所(自變項),該研究所關心的四個水準,可以說是隨機自教學方法的母體中,隨機取用得來的第二節,第十一章 平均數的變異分析:ANOVA,9/39,,變異量拆解,SStotal=SSb+SSw SStotal:依變項觀察值的變異全體樣本在依變項得分的變異情形,即總離均差平方和) SSb「導因於獨變項影響的變異」 (組間離均差平方和,sum of squares between groups) SSw「導因於獨變項以外的變異」(隨機變異)(組內離均差平方和,sum of squares within groups) 各離均差平方和平均化後,得到均方和(MS),即為變異數的概念,,,,,,,,,,第二節,第十一章 平均數的變異分析:ANOVA,10/39,F ratio,兩個變異數的比值稱為F統計量 F統計量的機率分配為F分配 F值越大,表示研究者關心的組平均數的分散情形較誤差變異來得大 若大於臨界值,研究者即可獲得拒絕H0的結論,,第二節,第十一章 平均數的變異分析:ANOVA,11/39,變異數分析摘要表,變異數分析的結果可以整理成摘要表形式,第二節,第十一章 平均數的變異分析:ANOVA,12/39,相依樣本的變異數分析,相依樣本設計(correlated sample design) 進行變異數分析檢驗時,獨變項的不同水準的受試者並非獨立無關的個體,而是具有關聯的樣本 基本形式 重複量數設計(repeated measured design; RM) 指同一個受試者重複接受不同的實驗處理或進行多次測量的變異數分析,稱為RM分析。
配對樣本設計(randomized block design, RB) 指具有配對關係的樣本接受不同的實驗處理的變異數分析,每一個配對稱為一個區組(block) 又稱為隨機區組設計(randomized blocked design),第二節,第十一章 平均數的變異分析:ANOVA,13/39,單因子相依樣本設計的資料形式,獨變項分組平均數 表示實驗或分組效果(p個獨變項各水準下的分組平均數) 區組平均數(橫列上區組平均數) 反應該區組的平均水準,也就是區組同質性所造成在依變項上的水準高低 細格效果 每一個細格只有一個觀察值,因此沒有細格內變異,沒有交互效果 細格間的變異視為隨機誤差,,細格效果,第二節,第十一章 平均數的變異分析:ANOVA,14/39,F考驗與摘要表,,,,,,,第二節,第十一章 平均數的變異分析:ANOVA,15/39,ANOVA的基本假設,(一)常態性假設 變異數分析需處理超過三個以上的平均數,須假設樣本是抽取自常態化母群體,當樣本數越大,常態化的假設越不易違反 (二)變異數同質性假設 多個樣本平均數的比較,必須建立在樣本的其他參數保持恆定的基礎上,如果樣本的變異數不同質,將造成推論上的偏誤。
也就是樣本變異數同質性假設(homogeneity of variance) (三)可加性假設 變異數分析牽涉到變異量的拆解,因此,各種變異來源的變異量須相互獨立,且可以進行累積與加減,稱為可加性(additivity)假設在進行加總時,係使用離均差平方和,而非變異數本身 (四)球面性假設(sphericity) 適用於相依樣本的變異數分析,係指不同水準的同一組樣本,在依變項上的得分,兩兩配對相減所得的差的變異數必須相等(同質)也就是說,不同的受試者在不同水準間配對或重複測量,其變動情形應具有一致性第二節,第十一章 平均數的變異分析:ANOVA,16/39,ω2(omega square)量數,類似於迴歸分析的R2 定義式 ω2量數 為組間變異與總變異的比值 表示依變項變異量能被獨變項解釋的百分比 亦即獨變項與依變項的關聯強度 樣本估計式:,,,第二節,第十一章 平均數的變異分析:ANOVA,17/39,ω2量數的判斷,ω2量數的特性 數值介於0到1之間,越接近1表示關聯越強 ω2量數值分佈為以.05到.06為眾數的正偏態分配,達到.1以上者,即屬於高強度的獨變項效果 一般期刊上所發表的實證論文的,也僅多在.06左右 Cohen(1988)建議下列的判斷準則,第二節,第十一章 平均數的變異分析:ANOVA,18/39,η2 (eta square)量數,η2是迴歸分析當中的R2,除了作為X對Y解釋強度的指標外,經常也被視為效果量的指標 樣本數小時,為母體的偏估計數,需以下式進行調整,以得到不偏估計數(Wherry, 1931) 淨η2 (partial η2 )量數 扣除了其他效果項的影響後的關聯強度量數,,,第二節,第十一章 平均數的變異分析:ANOVA,19/39,效果量係數,效果量(size of effect)係數 用來衡量獨變項強度的統計量。
D量數 最簡單的效果量 指平均數之間的差異程度 平均數間差異越大,表示獨變項的強度越強 f量數 適用於當平均數數目大於2時,,,,第三節,第十一章 平均數的變異分析:ANOVA,20/39,關聯強度分析,統計顯著性(statistical significance) 基於機率理論的觀點,說明獨變項效果相對於隨機變化的一種統計意義的檢驗 例如利用F考驗來決定獨變項效果的統計意義 實務顯著性(practical significance) 反應獨變項效果在真實世界的強度意義 常用ω2 、 η2、f量數表示 也稱為臨床顯著性(clinical significance),第二節,第十一章 平均數的變異分析:ANOVA,21/39,整體考驗與多重比較,整體考驗(overall test) 當變異數分析F考驗值達顯著水準,即推翻了平均數相等的虛無假設,亦即表示至少有兩組平均數之間有顯著差異存在多個平均數整體效果(overall effect)達顯著水準 當整體考驗顯著後必須檢驗哪幾個平均數之間顯著有所不同,即進行多重比較(multiple comparison)來檢驗 多重比較在進行F考驗之前進行,稱為事前比較(priori comparisons),在獲得顯著的F值之後所進行的多重比較,稱為事後比較(posteriori comparisons)。
第三節,第十一章 平均數的變異分析:ANOVA,22/39,多重比較問題,第一類型錯誤膨脹問題 當比較次數越多,犯下決策錯誤的可能性就更高 多重比較的統計原理多以族系錯誤率(FWE)的控制為主,期能使整體的錯誤率維持在一定的水準之下 變異數同質假設問題 多個平均數的比較必須在變異數同質假設維繫的情況下才有相同的標準誤 如果各組變異數不同質時,多重比較的顯著性考驗還必須對變異數不同質進行調整處理,第三節,第十一章 平均數的變異分析:ANOVA,23/39,事前比較,時機 在進行研究之前,研究者即基於理論的推理或個人特定的需求,事先另行建立研究假設,以便能夠進行特定的兩兩樣本平均數的考驗 事前比較所處理的是個別比較的假設考驗,在顯著水準的處理上,屬於比較面顯著水準,而不需考慮實驗面的顯著水準 可直接應用t考驗,針對特定的水準,進行平均數差異考驗,第三節,第十一章 平均數的變異分析:ANOVA,24/39,事後比較,變異數同質時(當各組樣本數相同時) Tukey’s HSD法:將所有的配對比較視為一體,使整個研究的第一類型錯誤維持衡定,第一類型錯誤是一種實驗誤差(experiment-wise error) LSD法又稱為Fisher擔保t檢定(Fisher’s protected t-test),表示這個t檢定是以F考驗達到顯著之後所進行的後續考驗,同時也在F考驗的誤差估計下所進行,,第三節,第十一章 平均數的變異分析:ANOVA,25/39,HSD法,HSD法原理 在常態性、同質性假設成立下,各組人數相等的一種以族系誤差率的控制為原則的多重比較程序 稱為誠實顯著差異(Honestly Significant Difference) 所謂誠實,就是在凸顯LSD法並沒有考慮到實驗與族系面誤差的問題 代價是降低了統計考驗的檢定力。
以HSD法所得到的顯著性,會比沒有考慮型一錯誤膨脹問題的檢定方法來的高(例如如果比較次數為三次,HSD的p值為會是LSD法的三倍) Kramer則將Tukey的方法加以延伸至各組樣本數不相等的情況下,由於原理相同,故合稱為Tukey-Kramer法,,第三節,第十一章 平均數的變異分析:ANOVA,26/39,Newman-Keuls Methed,原理及計算公式與Tukey’s HSD法相同,唯一不同的是臨界值的使用 N-K法考慮相比較的兩個平均數在排列次序中相差的層級數r(the nu。












