列聯表: 異質性檢定 2 (Contingency Table: Heterogeneity Test 2)

套路54: 列聯表: 異質性檢定 2
(Contingency Table: Heterogeneity Test 2)

1. 使用時機: 用於檢定兩組以上列聯表資料是否均質(homogeneous)如果是均質則資料可合併重算卡方獨立檢定
2. 分析類型: 類別資料分析(Categorical Data Analysis)
3. 咪路調查大學生不同性別慣用左手或右手人數,將四次調查資料用R進行卡方異質性檢定程序如下:

程序Part I. 先分別計算四次調查資料的卡方獨立檢定。
試問慣用左手或右手是否與性別有關?
H0: 慣用左手或右手與性別無關(independent)
HA: 慣用左手或右手與性別有關。
調查1
男生
女生
總數
慣用左手
6
12
18
慣用右手
28
24
52

第一步: 輸入建立資料
  v1 <- c(6, 12)
  v2 <- c(28, 24)
  w <- matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
  # 將兩組vector組合成2 x 2矩陣。
第二步: 閱讀基本模組(base)chisq.test函數使用說明。
  help(chisq.test)
第三步: 使用基本模組(base)chisq.test函數代入w
  chisq.test(w, correct = FALSE, simulate.p.value = TRUE, B = 2000)
  # correct = FALSE注意: 雖然自由度為1但此時不做葉慈修正
  # simulate.p.value = TRUE, B = 2000估計p值。
第四步: 判讀結果
        Pearson's Chi-squared test with simulated p-value (based on 2000 replicates)
data:  w
X-squared = 2.2524, df = NA, p-value = 0.1839

調查2
男生
女生
總數
慣用左手
4
7
11
慣用右手
25
13
38

重複上述步驟:
  v1 <- c(4, 7)
  v2 <- c(25, 13)
  x <- matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
chisq.test(x, correct = FALSE, simulate.p.value = TRUE, B = 2000)
        Pearson's Chi-squared test with simulated p-value (based on 2000 replicates)
data:  x
X-squared = 3.0578, df = NA, p-value = 0.07846

調查3
男生
女生
總數
慣用左手
7
10
17
慣用右手
27
18
45

重複上述步驟:
  v1 <- c(7, 10)
  v2 <- c(27, 18)
  y <- matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
chisq.test(y, correct = FALSE, simulate.p.value = TRUE, B = 2000)
            Pearson's Chi-squared test with simulated p-value (based on 2000 replicates)
data:  y
X-squared = 1.7653, df = NA, p-value = 0.2324

調查4
男生
女生
總數
慣用左手
4
7
11
慣用右手
22
14
36

重複上述步驟:
  v1 <- c(4, 7)
  v2 <- c(22, 14)
  z <- matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
chisq.test(z, correct = FALSE, simulate.p.value = TRUE, B = 2000)
        Pearson's Chi-squared test with simulated p-value (based on 2000 replicates)
data:  z
X-squared = 2.0877, df = NA, p-value = 0.1944

程序Part II. 利用FunChisq程式套件中的cp.chisq.test函數進行卡方異質性檢定
H0: 四組調查資料是均質的(homogeneous)
HA: 四組調查資料不是均質的(heterogeneous)

第一步: 安裝FunChisq程式套件。
第二步: 呼叫FunChisq程式套件備用。
  library(FunChisq)
第三步: 閱讀FunChisq程式套件中的cp.chisq.test函數的使用說明。
  help(cp.chisq.test)
第四步: 輸入四次調查資料(四個matrix)建立合併資料(一個list)
  w <- matrix(c(6,12,18,28,24,52), nrow = 2, , byrow = TRUE)
  x <- matrix(c(4,7,11,25,13,38), nrow = 2, , byrow = TRUE)
  y <- matrix(c(7,10,17,27,18,45), nrow = 2, , byrow = TRUE)
  z <- matrix(c(4,7,11,22,14,36), nrow = 2, , byrow = TRUE)
  m <- list(w, x, y, z)
第五步: 使用FunChisq程式套件中的cp.chisq.test函數代入m
  cp.chisq.test(m)
第六步: 判讀結果
        Comparative chi-square heterogeneity test
data:  m
statistic = 2.4637, parameter = 6, p-value = 0.8725
  # p-value < 0.05H0: 四組調查資料是均質的(homogeneous)不成立。
  # p-value > 0.05H0: 四組調查資料是均質的(homogeneous)成立。

程序Part III. 如果卡方異質性檢定結果同意資料是均質的,則合併(加總)資料重新做卡方獨立檢定。此時要注意資料為2 x 2列聯表(degree of freedom = 1)時需做葉慈修正(Yates' correction)如下列範例所示:
咪路調查大學生不同性別慣用左手或右手人數,四組資料加總如下:

男生
女生
總數
慣用左手
21
36
57
慣用右手
102
69
171
試問慣用左手或右手是否與性別有關?
H0: 慣用左手或右手與性別無關(independent)
HA: 慣用左手或右手與性別有關。

第一步: 輸入建立資料
  v1 <- c(21, 36)
  v2 <- c(102, 69)
  m <- matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
  # 將兩組vector組合成2 x 2矩陣。
第二步: 閱讀基本模組(base)chisq.test函數使用說明。
  help(chisq.test)
第三步: 使用基本模組(base)chisq.test函數代入m
  chisq.test(m, correct = TRUE, simulate.p.value = TRUE, B = 2000)
  # correct = TRUE 2 x 2列聯表(degree of freedom = 1)時需做葉慈修正(Yates' correction)
  # simulate.p.value = TRUE, B = 2000估計p值。
第四步: 判讀結果。
        Pearson's Chi-squared test with simulated p-value (based on 2000 replicates)
data:  m
X-squared = 8.9505, df = NA, p-value = 0.002999
  # p-value < 0.05H0: 慣用左手或右手與性別無關(independent),不成立。
  # p-value > 0.05H0: 慣用左手或右手與性別無關(independent),成立。
  # 注意: 四組資料分開計算時結論都是慣用左手或右手與性別無關。然而資料合併重新計算的結果推翻先前的結論。新的結論是慣用左手或右手與性別有關

來勁了嗎? 想知道更多?? 補充資料(連結):
2. 關於Pearson's chi-squared test (https://en.wikipedia.org/wiki/Pearson%27s_chi-squared_test)
4. 關於R基礎R繪圖及統計快速入門:
   b. Cookbook for R: http://www.cookbook-r.com/
   d. Statistical tools for high-throughput data analysis (STHDA): http://www.sthda.com/english/
e. The Handbook of Biological Statistics: http://www.biostathandbook.com/
f. An R Companion for the Handbook of Biological Statistics: http://rcompanion.org/rcompanion/index.html
5. Zar, JH. 2010. Biostatistical Analysis, Fifth Edition, Pearson.

留言

這個網誌中的熱門文章

統計不球人 目錄 (Table of Contents)

三因子變異數分析 (Three Way ANOVA)

比較二或多組變異數Levene’s 檢定 (Levene’s Test for Comparing Two or More Variances)