單變量變異數分析(ANOVA).ppt

第十章 單變量變異數分析(ANOVA) 

10-1 變異數分析
10-2 單因子變異數分析的設計
10-3 變異數分析的基本假設條件
10-4 單變量變異數分析
10-5 單變量變異數分析範例
10-6 單變量變異數分析範例:One-Way ANOVA
10-7 重複量數Repeated Measures

10-1 變異數分析
變異數分析(Analysis of Variance)一般分為二大類,分別是ANOVA ( Analysis of Variance)和MANOVA(Multivariate Analysis of Variance),我們簡介如下:
 
單變量變異數分析 (ANOVA), 只有一個依變數(計量),一個或多個的自變數(非計量,名目),寫成數學式如下:

Y1 = X1 + X2 + X3+……+Xn
        (計量)              (非計量)

    MANOVA (多變量變異數分析)有多個依變數(計量),一個或多個的自變數(非計量),寫成數學式如下:

Y1+ Y2+……..+ Yn = X1 + X2 + X3+……+Xn
                     (計量)                  (非計量, 例如:名目)
10-2 單因子變異數分析的設計
    自變數只有一個的變異數分析, 稱為單因子變異數分析, 也就是 y1+y2+…= x (y 可以是一個(含)以上, x 只有 1 個)。單因子變異數分析的2種設計方式:  1. 獨立樣本   2. 相依樣本

1.獨立樣本
  受測者隨機分派至不同組別,各組別的受測者没有任何關係,
  也稱為完全隨機化設計
  (1)各組人數相同: HSD 法, Newman-Keals 法
  (2)各組人數不同 (或每次比較2個以上平均數時): Scheffe法

2.相依樣本,有二種情形
  (1)重複量數:同一組受測者, 重複接受多次(k)的測試以比較
      之間的差異
  (2)配對組法:選擇一個與依變數有關控制配對條件完全相同,
      以比較k組受測者在依變數的差異
10-3 變異數分析的基本假設條件
變異數分析的基本假設條件有常態、線性、變異數同質性。我們介紹如下:

常態:直方圖, 偏度(skewness)和峰度(kcat osis), 檢定, 改正 (非常態可以透過資料轉型來改正)

線性:變數的散布圖, 檢定, 簡單廻歸+ residual

變異數同質性:   1y, 用Levene檢定
                           >= 2y時, 用Box’s M檢定
10-4 單變量變異數分析
    單變量變異數分析(ANOVA)主要是看依變數(y)只有一個,當我們在比較平均數的不同時,若是我們透過自變數(x)將依變數(y)分成兩組來比較時,稱為t檢定,分成三組(含以上)來比較,稱為ANOVA,t檢定也是ANOVA的一種,我們分別介紹如下:

t檢定 (Test)
    t Test 是用來檢定2 個獨立樣本的平均數差異是否達到顯著的水準。
    這二個獨立樣本可以透過分組來達成,計算t檢定時,會需要2個變數,依變數(y)為觀察值,自變數x為分組之組別,其資料的排序如下:



    檢定2個獨立樣本的平均數是否有差異(達顯著水準)得考慮從2個母體隨機抽樣本後,其平均數u和變異數σ的各種情形,分別有平均數u相同而變異數平方相同或不同時的情形,平均數u不同而變異數平方相同或不同的情形,我們整理如下表:




    在計算2個母體的平均數有無差異時,若是母體的變異數為已知,則使用z檢定,一般很少用,在一般情形下,母體的變異數為未知的情形下,我們都會使用獨立樣本的t檢定,若是樣本小,母體不是常態分佈,則會使用無母數分析,我們整理t檢定於2個獨立母體平均數的比較時,使用時機如下表:

大樣本 (n ≥ 30)
 變異數σ已知  ---- 使用z檢定
 變異數σ 未知  ---- 使用t檢定

小樣本 (n< 30) , 母體常態分配
 變異數σ 已知  ---- 使用z檢定
 變異數σ 未知  ---- 使用t檢定

小樣本 (n< 30) , 母體非常態分配
 無論變異數已知或未知 – 使用無母數分析

t檢定的程序
    我們進行t檢定的目的是要用來拒絕或無法拒絕先前建立的虛無假設 (Null hypothesis),我們整理t檢定的程序如下:

計算t值
 t值 = u1 (平均數) -  u2 (平均數) /  組的平均數標準差
 u1 是第一組的平均數
 u2 是第二組的平均數

查t crit標準值
 在研究者指定可接受t分配型態 I (type I) 錯誤機率a (例如:
 0.05或0.01)
 樣本1和樣本2的degree of freedm    = (N1+N2) – 2
 我們可以透過查表, 得到 t crit標準值

比較t值和t crit標準值
 當t值>t crit值時,會拒絕 Null hypothesis (u1 = u2),
 也就是u1 ≠ u2,兩群有顯著差異,接著,我們就可以
 檢定平均數的大小或高低,來解釋管理上意義
 當t值<tcrit值時,不會拒絕 (有些研究者視為接受) Null
 hypothesis,也就是 u1= u2,兩群蕪顯者差異,我們就
 可以解釋管理上的意義。

F檢定
 除了t檢定外,我們也常用F值來檢定單變量多組平均數
 是否顥著

10-5 單變量變異數分析範例
    我們想了解不同年齡層 A組20 ~29歲,B組30 ~39歲,C組40~49歲,對筆記型Bubble喜好程度是否有差異,隨機抽取年齡層各5個人,以1 – 10的分數請他們評分如下:

三種不同年齡層對筆記型電腦的喜好


F,05,2,12 = 3.89
F>F crit, 所以在5%水準下,顯著,拒絕接受Ho
    表示三個階層年齡的人對於筆記型電腦的喜好有顯著的不同,這時候,尚需要進一步地檢定,平均數中的u,有幾個相等,有幾個不同或則是將排列大小,例如:本例題中,對於筆記型電腦的喜好程度是 30 ~ 39歲 >20 ~ 29歲>40 ~ 49歲



SPSS實務操作如下:
  1. 開啟範例ANOVA.SAV
  2. 按Analyze      General Linear Model       Univariate
  3. 開啟Univariate視窗後, 點選得分score
  4. 按,將得分score選入依變數Dependent Variable, 再選編碼code
  5. 將編碼code選入自變數的固定因子Fixed Factor
  6. 按Model模式
  7. 按continue, 回到Univariate畫面
  8. 按contrast (比對)
  9. 按continue, 回到畫面Univariate
10. 按Plots
11. 按continue, 回到Univariate畫面
12. 按Post Hoc, 選取code
13. 按, 將code選入Post Hoc Test for:, 再選取Scheffe, Tukey 和Duncan
14. 按Continue, 回到畫面Univerate
15. 按Options選項, 選取想要顯示的統計量
16. 按Continue, 回到Univariate畫面
17. 按OK, 出現輸出報表

報表分析結果如下:
Univariate Analysis of Variance





Tests the null hypothesis that the error variance of the dependent variable is equal across groups.
a  Design: Intercept+code

Levene’s Test 是用來判定”變異數同質性”的檢定, 我們需要的是不顯著, 才不會違反變異數同質性的條件

我們查看報表結果, F值 = 0.43, Sig顯著的, P值= 0.66 > 0.05, 是不顯著, 代表變異數是同質性, 可以繼續查看結果

Post Hoc Tests
code
Multiple Comparisons

Post Hoc 檢定, 從多重比較的表中, 可以看出Turkey和Scheffe的檢定結果是一樣的, 都是(I) code 2 和 (J) code 3, 此時(I-J)達正向顯著, 反之, code 3 - code 2時會呈現負向顯著, 代表著code 2  30 ~39歲和code 3  40 ~49歲, 對筆記型電腦的喜好是有顯著差異, 30 ~39歲對於筆記型電腦的平均數高於 40 ~ 49歲對於筆記型電腦的喜好程度

我們整理ANOVA分析的結果如下:
我們經由Levene檢定,結果為不顯著,代表變異數是同質性,經由多重比較後得到 30~39歲和40~49歲,對筆記型電腦的喜好是有顯著的差異,最後再經由敍述性統計分析結果加以判定 30~39歲對於筆記型電腦喜好的平均數高於40~49歲,對於筆記型電腦的喜好程度。
10-6單變量變異數分析範例:   One-Way ANOVA
我們在電腦展中,訪問27位人員,經過參觀資訊展後,我們想了解根據適用(Fit)的特性而購買國內品牌,組裝電腦或國外品牌的程度是否有差異?
Category 1國內品牌,Category 2組裝電腦,Category 3國外品牌
我們整理根據 適用(Fit)購買國內品牌、組裝電腦或國外品牌電腦的資料如下表:



我們將購買國內品牌、組裝電腦和國外品
牌的評分資料輸入至SPSS。
如下表:


實務操作:
開啟範例檔 ANOVA1. SAV
按Analyze→Compare Means→One-Way ANOVA
開啟One-Way ANOVA 視窗,選fit 入Dependent List,選Category入Factor
按Post Hoc,選Scheffe 和Tukey
按Continue
按Option,選Descriptive 和Homogeneity of variance test
按Continue,
按OK,出現報表結果

我們整理報表結果如下:



變異數分析摘要表有組間(Between Groups)、組內(Within Groups)及全體(Total)三部分。
組間(Between Groups)的離均差平方和(Sum of Squares)=20.222,自由度=2,均方(Mean Square)=10.111,F 值=3.445,顯著性值 p=0.048。
組內(Within Groups) 的離均差平方和(Sum of Squares)=70.444,自由度=24,均方(Mean Square)=2.935 。
全體(Total) 的離均差平方和(Sum of Squares)= 90.667,自由度=26。
對fit (適用) 依變項而言,F 達到顯著水準(F=3.445;p=.048<.05)。因此拒絕虛無假設,接受對立假設,表示不同產品(1 國內品牌,2 組裝電腦,3 國外品牌)的fit (適用)有顯著差異存在,而那些配對組別的差異達到顯著,須要進行事後比較。


Post Hoc Tests 事後比較


事後比較結果,採兩兩配對組別比較。從 Scheffe 方法作事後比較可以看出以適用度而言,國外品牌顯著高於國內品牌,國外品牌與組裝電腦沒有顯著差異,國內品牌與組裝電腦沒有顯著差異。
範例結果整理如下:
1.敘述性統計量






2.變異數分析統計表







*P<.05
事後比較:
事後比較結果,以適用度而言,國外品牌顯著高於國內品牌,國外品牌與組裝電腦沒有顯著差異,國內品牌與組裝電腦沒有顯著差異。
10-7 重複量數Repeated                                                     Measures
同一組受測者,重複接受多次(k)的測試以比較之間的差異。
重複量數Repeated Measures 範例:
在學習統計分析的學生中,我們想知道學生在學習前,學習中和學習後的評價情形,分別請15 位學生在學習前,學習中和學習後給予評分如下:









score1學習前、score2學習中、score3學習後

實務操作:
開啟範例檔 ANOVA2. SAV
按Analyze  General Linear Model  Repeated Measures
開啟Repeated Measures視窗,在Within-Subject Factor Name:輸入factor,Number of Levels:輸入
按Add
按Define
選score1,按,選score2,按,選score3,按
按Options,選factor,按,選Compare main effects,選Descriptive statistics
按Continue,回到Repeated Measures視窗
按OK,出現報表結果

我們整理報表結果如下:
Measure: MEASURE_1




score1學習前、score2學習中、score3學習後
Descriptive Statistics敘述性統計量





score1學習前 的平均數=5.93,標準差=1.831。
score2學習中 的平均數=6.53,標準差=1.06。
score3學習後 的平均數=7.33,標準差=1.234。

Multivariate Tests(b)



a Exact statistic
b Design: Intercept  Within Subjects Design: factor
在單因子相依樣本變異數分析中,無解釋意義,此部分的結果可以省略。

Mauchly's Test of Sphericity(b)
Measure: MEASURE_1





球形檢定:檢定問卷填答的分數,兩兩成對相減而得到差異值的變異數是否相等,Mauchly‘s W 值需大於0.75,Greenhouse-Geisser 值需大於0.75,Huynh-Feldt 值需大於 0.75,未達顯著水準,表示未違反變異數分析之球形檢定,代表問卷填答的分數,兩兩成對相減而得到差異值的變異數是相等。
本範例的球形檢定Mauchly 檢定值為.822,卡方值等於2.55,df=2,顯著性p=.279>.05,未達顯著水準,應接受虛無假設,表示未違反變異數分析之球形檢定。

Tests of Within-Subjects Effects
Measure: MEASURE_1





由於之前球面性檢定結果並未違反球面性假定,直接看「假設為球形」(Sphericity Assumed)之橫列資料,typeIII 之SS=14.8,df=2,MS=7.4,F=4.723,顯著性p=.017<.05,達到.05 顯著水準,表示自變項的效果顯著。

Tests of Between-Subjects Effects
Measure: MEASURE_1
Transformed Variable: Average







填答問卷者間效果的檢定值 (Tests of Between-Subjects Effects ) 即相依樣本中,區塊(Block)間的差異,包括的離均差平方和=40.133、自由度=14、均方值=2.867。

Estimated Marginal Means
factor
Estimates
Measure: MEASURE_1






估計邊緣平均數,其內容包括各水準的平均數、平均數的估計標準誤、平均數95%的信賴區間。

Pairwise Comparisons
Measure: MEASURE_1









Based on estimated marginal means
* The mean difference is significant at the .05 level.
a Adjustment for multiple comparisons: Least Significant Difference(equivalent to no adjustments).
星號(*)代表平均數差異值(Mean Difference)達到.05 顯著水準。
相依樣本的事後比較:
由上表中我們可以發現:學習後之評價 (M=7.333)顯著的高於學習前之評價 (M=5.933),學習後之評價與學習中之評價沒有顯著差異,學習中之評價與學習前之評價沒有顯著差異。


範例結果整理如下:
敘述性統計量





變異數分析統計表







**P<.01
相依樣本的事後比較:
由上表中我們可以發現:學習後之評價(M=7.333)顯著的高於學習前之評
價(M=5.933),學習後之評價與學習中之評價沒有顯著差異,學習中之評
價與學習前之評價沒有顯著差異。