雙因子變異數分析 (Two Way ANOVA)

套路23: 雙因子變異數分析 (Two Way ANOVA)

應用雙因子變異數分析的資料有二影響因子,就是有兩個自變項。此檢定有三組H0HA
H0: m因子1-1 = m因子1-2 = … = m因子1-mHA: 至少有一組平均值不同。
H0: m因子2-1 = m因子2-2 = … = m因子2-nHA: 至少有一組平均值不同。
H0: 因子1與因子2互不影響HA: 因子1與因子2互相影響。

1. 使用時機: 變異數分析適用連續資料之差異分析,若自變項有兩個,就是雙因子變異數分析。
2. 分析類型: 母數分析(parametric analysis)直接使用資料數值算統計叫parametric方法,把資料排序之後用排序的名次算統計叫non-parametric方法。
3. 假設前提: 每組資料(observations within each cell)都是常態分布(normally distributed)且具相同變異數(equal variances)
4. 範例資料: 咪路調查人類血漿中鉀離子濃度(mg/100 ml)資料如下:
沒注射賀爾蒙
注射賀爾蒙
16.3
15.3
38.1
34.0
20.4
17.4
26.2
22.8
12.4
10.9
32.3
27.8
15.8
10.3
35.8
25.0
9.5
6.7
30.2
29.3
H0: 注射賀爾蒙沒影響 HA: 注射賀爾蒙有影響
H0: 性別沒影響HA: 性別有影響
H0: 性別及注射賀爾蒙沒交互作用HA: 性別及注射賀爾蒙有交互作用

第一步: 使用基本模組(base)read.table函數輸入建立資料儲存到變數m
m <- read.table(header = TRUE, text = "
Hor Sex Conc
N_H F 16.3
N_H F 20.4
N_H F 12.4
N_H F 15.8
N_H F 9.5
N_H M 15.3
N_H M 17.4
N_H M 10.9
N_H M 10.3
N_H M 6.7
A_H F 38.1
A_H F 26.2
A_H F 32.3
A_H F 35.8
A_H F 30.2
A_H M 34
A_H M 22.8
A_H M 27.8
A_H M 25
A_H M 29.3")  # 資料間以空白間隔N_H: 沒注射賀爾蒙A_H: 有注射賀爾蒙
attach(m)  # 告知R使用資料m
names(m)  # 指定資料標題

5. 畫圖看資料分佈:
: 安裝程式套件ggplot2
第二步: 呼叫ggplot2
  library(ggplot2)
第三步: 使用函數ggplot代入m資料畫box
  ggplot(m, aes(x = Hor, y = Conc, color = Sex)) +
     geom_boxplot()    # box
6. 檢查因子間是否有交互作用(interaction):
第一步: 使用基本模組(base)interaction.plot函數來畫兩個因子交互作用的狀況。
  interaction.plot(Sex, Hor, Conc)
  # 兩線有交叉表示有兩因子interaction,兩線平行表示兩因子無interaction,兩線接近平行表示
    兩因子interaction很弱。

7. 計算雙因子變異數分析:
第一步: 使用基本模組(base)aov函數代入m中資料來計算雙因子變異數分析,結果儲存到變數fm
  fm <- aov(Conc ~ Hor * Sex, data = m)
第二步: 使用基本模組(base)summary函數代入fm來顯示雙因子變異數分析結果。
  summary(fm)
                    Df Sum Sq Mean Sq F value   Pr(>F)   
Hor          1 1386.1  1386.1  73.585 2.22e-07 ***
Sex          1   70.3    70.3   3.733   0.0713 . 
Hor:Sex      1    4.9     4.9   0.260   0.6170   
Residuals   16  301.4    18.8                    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
  # Hor p < 0.05H0: 注射賀爾蒙沒影響,不成立。
  # Sex p > 0.05H0: 性別沒影響,成立。
  # Hor:Sex p > 0.05H0: 雙因子沒交互作用,成立。
第三步: 使用基本模組(base)TukeyHSD函數代入fm來計算顯示有差異的組別。
  TukeyHSD(fm)
      Tukey multiple comparisons of means
        95% family-wise confidence level
Fit: aov(formula = Conc ~ Hor * Sex, data = m)
$Hor
              diff       lwr       upr p adj
N_H-A_H -16.65 -20.76469 -12.53531 2e-07
$Sex
     diff       lwr       upr     p adj
M-F -3.75 -7.864692 0.3646918 0.0712638
$`Hor:Sex`
                  diff        lwr        upr     p adj
N_H:F-A_H:F -17.64 -25.493382  -9.786618 0.0000452  # p < 0.05
A_H:M-A_H:F  -4.74 -12.593382   3.113382 0.3428025
N_H:M-A_H:F -20.40 -28.253382 -12.546618 0.0000078  # p < 0.05
A_H:M-N_H:F  12.90   5.046618  20.753382 0.0012416  # p < 0.05
N_H:M-N_H:F  -2.76 -10.613382   5.093382 0.7485244
N_H:M-A_H:M -15.66 -23.513382  -7.806618 0.0001729  # p < 0.05
  # p < 0.05是平均值有差異的組別。

8. 檢查不同組別數值是否符合常態分布假設前提(Check the normality assumption)
第一步: 使用基本模組(base)residuals函數代入fm來顯示雙因子分析的殘差結果存入變數    
  aov_residuals
  aov_residuals <- residuals(object = fm)
第二步: 使用基本模組(base)shapiro.test函數代入aov_residuals來檢查不同組別數值是否符合常態分布。
  shapiro.test(x = aov_residuals)
        Shapiro-Wilk normality test
data:  aov_residuals
W = 0.94671, p-value = 0.3198
 # p < 0.05不同組別數值不符合常態分布。
 # p > 0.05不同組別數值符合常態分布。

9. 檢查不同組別數值是否符合相同變異數假設前提(Check the homogeneity of variance assumption)
第一步: 安裝car程式套件。
第二步: 呼叫car程式套件備用。
  library(car)
第三步: 閱讀car程式套件leveneTest函數使用說明。
  help(leveneTest)
第四步: 使用leveneTest函數檢查不同組別數值是否符合相同變異數。
  leveneTest(Conc ~ Hor * Sex, data = m)
Levene's Test for Homogeneity of Variance (center = median)
          Df F value Pr(>F)
group  3  0.0382 0.9897
          16  
  # p < 0.05不同組別數值不符合相同變異數。
  # p > 0.05不同組別數值符合相同變異數。

來勁了嗎? 想知道更多?? 補充資料(連結):
4. 關於R基礎R繪圖及統計快速入門:
   b. Cookbook for R: http://www.cookbook-r.com/
   d. Statistical tools for high-throughput data analysis (STHDA): http://www.sthda.com/english/
e. The Handbook of Biological Statistics: http://www.biostathandbook.com/
f. An R Companion for the Handbook of Biological Statistics: http://rcompanion.org/rcompanion/index.html
5. Zar, JH. 2010. Biostatistical Analysis, Fifth Edition, Pearson.

留言

這個網誌中的熱門文章

統計不球人 目錄 (Table of Contents)

如何選擇統計方法 1

單因子多樣本中位數差異檢定 (Kruskal-Wallis test)