列聯表: 異質性檢定 2 (Contingency Table: Heterogeneity Test 2)

套路54: 列聯表: 異質性檢定 2
(Contingency Table: Heterogeneity Test 2)

1. 使用時機: 用於檢定兩組以上列聯表資料是否均質(homogeneous)如果是均質則資料可合併重算卡方獨立檢定
2. 分析類型: 類別資料分析(Categorical Data Analysis)
3. 咪路調查大學生不同性別慣用左手或右手人數,將四次調查資料用R進行卡方異質性檢定程序如下:

程序Part I. 先分別計算四次調查資料的卡方獨立檢定。
試問慣用左手或右手是否與性別有關?
H0: 慣用左手或右手與性別無關(independent)
HA: 慣用左手或右手與性別有關。
調查1
男生
女生
總數
慣用左手
6
12
18
慣用右手
28
24
52

第一步: 輸入建立資料
  v1 <- c(6, 12)
  v2 <- c(28, 24)
  w <- matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
  # 將兩組vector組合成2 x 2矩陣。
第二步: 閱讀基本模組(base)chisq.test函數使用說明。
  help(chisq.test)
第三步: 使用基本模組(base)chisq.test函數代入w
  chisq.test(w, correct = FALSE, simulate.p.value = TRUE, B = 2000)
  # correct = FALSE注意: 雖然自由度為1但此時不做葉慈修正
  # simulate.p.value = TRUE, B = 2000估計p值。
第四步: 判讀結果
        Pearson's Chi-squared test with simulated p-value (based on 2000 replicates)
data:  w
X-squared = 2.2524, df = NA, p-value = 0.1839

調查2
男生
女生
總數
慣用左手
4
7
11
慣用右手
25
13
38

重複上述步驟:
  v1 <- c(4, 7)
  v2 <- c(25, 13)
  x <- matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
chisq.test(x, correct = FALSE, simulate.p.value = TRUE, B = 2000)
        Pearson's Chi-squared test with simulated p-value (based on 2000 replicates)
data:  x
X-squared = 3.0578, df = NA, p-value = 0.07846

調查3
男生
女生
總數
慣用左手
7
10
17
慣用右手
27
18
45

重複上述步驟:
  v1 <- c(7, 10)
  v2 <- c(27, 18)
  y <- matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
chisq.test(y, correct = FALSE, simulate.p.value = TRUE, B = 2000)
            Pearson's Chi-squared test with simulated p-value (based on 2000 replicates)
data:  y
X-squared = 1.7653, df = NA, p-value = 0.2324

調查4
男生
女生
總數
慣用左手
4
7
11
慣用右手
22
14
36

重複上述步驟:
  v1 <- c(4, 7)
  v2 <- c(22, 14)
  z <- matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
chisq.test(z, correct = FALSE, simulate.p.value = TRUE, B = 2000)
        Pearson's Chi-squared test with simulated p-value (based on 2000 replicates)
data:  z
X-squared = 2.0877, df = NA, p-value = 0.1944

程序Part II. 利用FunChisq程式套件中的cp.chisq.test函數進行卡方異質性檢定
H0: 四組調查資料是均質的(homogeneous)
HA: 四組調查資料不是均質的(heterogeneous)

第一步: 安裝FunChisq程式套件。
第二步: 呼叫FunChisq程式套件備用。
  library(FunChisq)
第三步: 閱讀FunChisq程式套件中的cp.chisq.test函數的使用說明。
  help(cp.chisq.test)
第四步: 輸入四次調查資料(四個matrix)建立合併資料(一個list)
  w <- matrix(c(6,12,18,28,24,52), nrow = 2, , byrow = TRUE)
  x <- matrix(c(4,7,11,25,13,38), nrow = 2, , byrow = TRUE)
  y <- matrix(c(7,10,17,27,18,45), nrow = 2, , byrow = TRUE)
  z <- matrix(c(4,7,11,22,14,36), nrow = 2, , byrow = TRUE)
  m <- list(w, x, y, z)
第五步: 使用FunChisq程式套件中的cp.chisq.test函數代入m
  cp.chisq.test(m)
第六步: 判讀結果
        Comparative chi-square heterogeneity test
data:  m
statistic = 2.4637, parameter = 6, p-value = 0.8725
  # p-value < 0.05H0: 四組調查資料是均質的(homogeneous)不成立。
  # p-value > 0.05H0: 四組調查資料是均質的(homogeneous)成立。

程序Part III. 如果卡方異質性檢定結果同意資料是均質的,則合併(加總)資料重新做卡方獨立檢定。此時要注意資料為2 x 2列聯表(degree of freedom = 1)時需做葉慈修正(Yates' correction)如下列範例所示:
咪路調查大學生不同性別慣用左手或右手人數,四組資料加總如下:

男生
女生
總數
慣用左手
21
36
57
慣用右手
102
69
171
試問慣用左手或右手是否與性別有關?
H0: 慣用左手或右手與性別無關(independent)
HA: 慣用左手或右手與性別有關。

第一步: 輸入建立資料
  v1 <- c(21, 36)
  v2 <- c(102, 69)
  m <- matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
  # 將兩組vector組合成2 x 2矩陣。
第二步: 閱讀基本模組(base)chisq.test函數使用說明。
  help(chisq.test)
第三步: 使用基本模組(base)chisq.test函數代入m
  chisq.test(m, correct = TRUE, simulate.p.value = TRUE, B = 2000)
  # correct = TRUE 2 x 2列聯表(degree of freedom = 1)時需做葉慈修正(Yates' correction)
  # simulate.p.value = TRUE, B = 2000估計p值。
第四步: 判讀結果。
        Pearson's Chi-squared test with simulated p-value (based on 2000 replicates)
data:  m
X-squared = 8.9505, df = NA, p-value = 0.002999
  # p-value < 0.05H0: 慣用左手或右手與性別無關(independent),不成立。
  # p-value > 0.05H0: 慣用左手或右手與性別無關(independent),成立。
  # 注意: 四組資料分開計算時結論都是慣用左手或右手與性別無關。然而資料合併重新計算的結果推翻先前的結論。新的結論是慣用左手或右手與性別有關

來勁了嗎? 想知道更多?? 補充資料(連結):
2. 關於Pearson's chi-squared test (https://en.wikipedia.org/wiki/Pearson%27s_chi-squared_test)
4. 關於R基礎R繪圖及統計快速入門:
   b. Cookbook for R: http://www.cookbook-r.com/
   d. Statistical tools for high-throughput data analysis (STHDA): http://www.sthda.com/english/
e. The Handbook of Biological Statistics: http://www.biostathandbook.com/
f. An R Companion for the Handbook of Biological Statistics: http://rcompanion.org/rcompanion/index.html
5. Zar, JH. 2010. Biostatistical Analysis, Fifth Edition, Pearson.

留言

這個網誌中的熱門文章

統計不球人 目錄 (Table of Contents)

如何選擇統計方法 1

單因子多樣本中位數差異檢定 (Kruskal-Wallis test)