比較二或多組變異數Bartlett’s檢定 (Bartlett’s Test for Comparing Two or More Variances)

套路26: 比較二或多組變異數Bartlett’s檢定
 (Bartlett’s Test for Comparing Two or More Variances)

什麼是比較多組獨立樣本變異數檢定? 說白了就是多組分別獨立取樣的資料做比較的假設檢定。**注意** ”比較變異數” (comparing variances)變異數分析” (analysis of variance)不同。變異數分析是多組資料比較平均值。統計假設檢定檢定什麼?H0。例如多組獨立樣本假設檢定H0 : s12 = s22 = … = sk2HA : 至少有一組變異數不同是檢定多組資料的變異數是否相同。假設相等時為雙尾 (two-tailed test) 檢定。

1. 使用時機: 用於比較觀測到的兩組或多組變異數(variances)
2. 分析類型: 母數分析(parametric analysis)直接使用資料數值算統計叫parametric方法,把資料排序之後用排序的名次算統計叫non-parametric方法。
3. 前提假設: 資料均為常態分布(normal distribution)或接近常態分布。
4. 資料範例1兩組變異數: 咪路調查高一和大一學生體重(kg)資料如下:
高一
41
35
33
36
40
46
31
37
34
30
38
大一
52
57
62
55
64
57
56
55
60
59

請問高一和大一學生體重變異數是否相同? H0: σ21 = σ22HA: σ21σ22

第一步: 輸入建立資料用小c將資料放入名稱為h1u1vector (R最基本資料結構)。用rep函數產生與資料相同數目的(1110)大寫HU放入名稱為h2u2vector再組合成名稱為datdata frame
  h1 <- c(41, 35, 33, 36, 40, 46, 31, 37, 34, 30, 38)
  u1 <- c(52, 57, 62, 55, 64, 57, 56, 55, 60, 59)
  h2 <- rep("H", 11)
  u2 <- rep("U", 10)
  Weight <- c(h1, u1)
  School <- c(h2, u2)
  dat <- data.frame(Weight, School)

第二步: 畫圖看資料分布。
動作1: 安裝ggplot2程式套件。
動作2: 呼叫ggplot2程式套件備用。
  library(ggplot2)
動作3: 畫圖。
  ggplot(dat, aes(x = School, y = Weight)) +
     geom_boxplot(color = "red")+
     geom_jitter(position = position_jitter(0.05))
  # 同時畫x-y散布(黑色點)圖及盒圖(紅色box plot)
  # ggplot2程式套件geom_jitter函數讓重疊(數值相同)的資料點錯開,避免誤判

第三步: 檢查資料是否為常態分布:
動作1: 閱讀基本模組(base)shapiro.test函數的說明書。
  help(shapiro.test)
動作2: 使用基本模組(base)shapiro.test函數檢查h1u1中資料是否為常態分布。
  shapiro.test(h1)
  shapiro.test(u1)
動作3: 判讀結果。
             Shapiro-Wilk normality test
data:  h1
W = 0.97057, p-value = 0.8922
        Shapiro-Wilk normality test
data:  u1
W = 0.97281, p-value = 0.9156
  # p-value > 0.05,資料符合常態分布。
  # p-value < 0.05,資料不符合常態分布。

第四步: 檢查兩組資料是否為相同變異數(H0: s21 = s22HA: s21s22)
動作1: 閱讀基本模組(base)bartlett.test函數的使用說明。
  help(bartlett.test)
動作2: 使用基本模組(base)bartlett.test函數代入dat中資料。
  bartlett.test(Weight ~ School, data = dat)
動作3: 判讀結果。
            Bartlett test of homogeneity of variances
data:  Weight by School
Bartlett's K-squared = 0.61443, df = 1, p-value = 0.4331
sample estimates: ratio of variances 1.69556
  # p-value > 0.05H0: s21 = s22成立資料相同變異數。
  # p-value < 0.05H0: s21 = s22不成立資料不同變異數。

5. 資料範例2多組變異數: 咪路調查餵食不同飼料的肉雞體重(g)資料如下:
飼料1
飼料2
飼料3
飼料4
60.8
68.7
69.6
61.9
67.0
67.7
77.1
64.2
65.0
75.0
75.2
63.1
68.6
73.3
71.5
66.7
61.7
71.8

60.3
H0: σ21 = σ22 = σ23 = σ24 HA: 餵食不同飼料的肉雞體重變異數不完全相同

第一步: 輸入建立資料用小c將資料放入名稱為d1-d4vector (R最基本資料結構)。用rep函數產生與資料相同數目的(45)大寫F1-F4放入名稱為f1-f4vector再組合成名稱為datdata frame
  d1 <- c(60.8, 67.0, 65.0, 68.6, 61.7)
  d2 <- c(68.7, 67.7, 75.0, 73.3, 71.8)
  d3 <- c(69.6, 77.1, 75.2, 71.5)
  d4 <- c(61.9, 64.2, 63.1, 66.7, 60.3)
  f1 <- rep("F1", 5)
  f2 <- rep("F2", 5)
  f3 <- rep("F3", 4)
  f4 <- rep("F4", 5)
  Weight <- c(d1, d2, d3, d4)
  Feed <- c(f1, f2, f3, f4)
  dat <- data.frame(Weight, Feed)

第二步: 畫圖看資料分布。
動作1: 安裝ggplot2程式套件。
動作2: 呼叫ggplot2程式套件備用。
  library(ggplot2)
動作3: 畫圖。
  ggplot(dat, aes(x = Feed, y = Weight)) +
     geom_boxplot(color = "red")+
     geom_jitter(position = position_jitter(0.05))
# 同時畫x-y散布(黑色點)圖及盒圖(紅色box plot)
# ggplot2程式套件geom_jitter函數讓重疊(數值相同)的資料點錯開,避免誤判

第三步: 檢查資料是否為常態分布:
動作1: 閱讀基本模組(base)shapiro.test函數的說明書。
  help(shapiro.test)
動作2: 使用基本模組(base)shapiro.test函數檢查d1-d4中資料是否為常態分布。
  shapiro.test(d1)
  shapiro.test(d2)
  shapiro.test(d3)
  shapiro.test(d4)
動作3: 判讀結果。
             Shapiro-Wilk normality test
data:  d1
     W = 0.93315, p-value = 0.618     # p-value > 0.05,資料符合常態分布。
        Shapiro-Wilk normality test
data:  d2
W = 0.94389, p-value = 0.6936    # p-value > 0.05,資料符合常態分布。
        Shapiro-Wilk normality test
data:  d3
W = 0.95202, p-value = 0.7287    # p-value > 0.05,資料符合常態分布。
        Shapiro-Wilk normality test
data:  d4
W = 0.99027, p-value = 0.9806    # p-value > 0.05,資料符合常態分布。
  # p-value > 0.05,資料符合常態分布。
  # p-value < 0.05,資料不符合常態分布。

第四步: 檢查多組資料是否有相同變異數H0: σ21 = σ22 = σ23 = σ24 HA: 餵食不同飼料的肉雞體重變異數不完全相同
動作1: 閱讀基本模組(base)bartlett.test函數的使用說明。
  help(bartlett.test)
動作2: 使用基本模組(base)bartlett.test函數代入dat中資料。
  bartlett.test(Weight ~ Feed, data = dat)
動作3: 判讀結果。
             Bartlett test of homogeneity of variances
data:  Weight by Feed
Bartlett's K-squared = 0.47515, df = 3, p-value = 0.9243
  # p-value > 0.05H0: σ21 = σ22 = σ23 = σ24成立資料變異數相同。
  # p-value < 0.05H0: σ21 = σ22 = σ23 = σ24不成立資料變異數不同。

來勁了嗎? 想知道更多?? 補充資料(連結):
5. 關於R基礎R繪圖及統計快速入門:
   b. Cookbook for R: http://www.cookbook-r.com/
   d. Statistical tools for high-throughput data analysis (STHDA): http://www.sthda.com/english/
e. The Handbook of Biological Statistics: http://www.biostathandbook.com/
f. An R Companion for the Handbook of Biological Statistics: http://rcompanion.org/rcompanion/index.html
6. Zar, JH. 2010. Biostatistical Analysis, Fifth Edition, Pearson.

留言

這個網誌中的熱門文章

統計不球人 目錄 (Table of Contents)

如何選擇統計方法 1

單因子多樣本中位數差異檢定 (Kruskal-Wallis test)