列聯表: 異質性檢定 2 (Contingency Table: Heterogeneity Test 2)
套路54: 列聯表: 異質性檢定 2
(Contingency Table: Heterogeneity Test 2)
1. 使用時機: 用於檢定兩組以上列聯表資料是否均質(homogeneous),如果是均質則資料可合併重算卡方獨立檢定。
2. 分析類型: 類別資料分析(Categorical Data Analysis)。
3. 咪路調查大學生不同性別慣用左手或右手人數,將四次調查資料用R進行卡方異質性檢定程序如下:
程序Part I. 先分別計算四次調查資料的卡方獨立檢定。
試問慣用左手或右手是否與性別有關?
H0: 慣用左手或右手與性別無關(independent)。
HA: 慣用左手或右手與性別有關。
調查1
|
男生
|
女生
|
總數
|
慣用左手
|
6
|
12
|
18
|
慣用右手
|
28
|
24
|
52
|
第一步: 輸入建立資料。
v1 <- c(6, 12)
v2 <- c(28, 24)
w <-
matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
# 將兩組vector組合成2 x 2矩陣。
第二步: 閱讀基本模組(base)的chisq.test函數使用說明。
help(chisq.test)
第三步: 使用基本模組(base)的chisq.test函數代入w。
chisq.test(w, correct =
FALSE, simulate.p.value = TRUE, B = 2000)
# correct = FALSE注意: 雖然自由度為1但此時不做葉慈修正。
# simulate.p.value =
TRUE, B = 2000估計p值。
第四步: 判讀結果。
Pearson's Chi-squared
test with simulated p-value (based on 2000 replicates)
data: w
X-squared = 2.2524, df = NA, p-value = 0.1839
調查2
|
男生
|
女生
|
總數
|
慣用左手
|
4
|
7
|
11
|
慣用右手
|
25
|
13
|
38
|
重複上述步驟:
v1 <- c(4, 7)
v2 <- c(25, 13)
x <-
matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
chisq.test(x, correct = FALSE, simulate.p.value = TRUE, B = 2000)
Pearson's Chi-squared
test with simulated p-value (based on 2000 replicates)
data:
x
X-squared = 3.0578, df = NA, p-value =
0.07846
調查3
|
男生
|
女生
|
總數
|
慣用左手
|
7
|
10
|
17
|
慣用右手
|
27
|
18
|
45
|
重複上述步驟:
v1 <- c(7, 10)
v2 <- c(27, 18)
y <-
matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
chisq.test(y, correct = FALSE, simulate.p.value = TRUE, B = 2000)
Pearson's Chi-squared test with
simulated p-value (based on 2000 replicates)
data: y
X-squared = 1.7653, df = NA, p-value = 0.2324
調查4
|
男生
|
女生
|
總數
|
慣用左手
|
4
|
7
|
11
|
慣用右手
|
22
|
14
|
36
|
重複上述步驟:
v1 <- c(4, 7)
v2 <- c(22, 14)
z <-
matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
chisq.test(z, correct = FALSE, simulate.p.value = TRUE, B = 2000)
Pearson's Chi-squared test with
simulated p-value (based on 2000 replicates)
data: z
X-squared = 2.0877, df = NA, p-value = 0.1944
程序Part II. 利用FunChisq程式套件中的cp.chisq.test函數進行卡方異質性檢定。
H0: 四組調查資料是均質的(homogeneous)。
HA: 四組調查資料不是均質的(heterogeneous)。
第一步: 安裝FunChisq程式套件。
第二步: 呼叫FunChisq程式套件備用。
library(FunChisq)
第三步: 閱讀FunChisq程式套件中的cp.chisq.test函數的使用說明。
help(cp.chisq.test)
第四步: 輸入四次調查資料(四個matrix),建立合併資料(一個list)。
w <-
matrix(c(6,12,18,28,24,52), nrow = 2, , byrow = TRUE)
x <-
matrix(c(4,7,11,25,13,38), nrow = 2, , byrow = TRUE)
y <-
matrix(c(7,10,17,27,18,45), nrow = 2, , byrow = TRUE)
z <-
matrix(c(4,7,11,22,14,36), nrow = 2, , byrow = TRUE)
m <- list(w, x, y, z)
第五步: 使用FunChisq程式套件中的cp.chisq.test函數代入m。
cp.chisq.test(m)
第六步: 判讀結果。
Comparative chi-square heterogeneity test
data: m
statistic = 2.4637, parameter = 6, p-value = 0.8725
# p-value < 0.05,H0: 四組調查資料是均質的(homogeneous),不成立。
# p-value > 0.05,H0: 四組調查資料是均質的(homogeneous),成立。
程序Part III. 如果卡方異質性檢定結果同意資料是均質的,則合併(加總)資料重新做卡方獨立檢定。此時要注意,資料為2 x 2列聯表(degree of freedom = 1)時需做葉慈修正(Yates' correction),如下列範例所示:
咪路調查大學生不同性別慣用左手或右手人數,四組資料加總如下:
|
男生
|
女生
|
總數
|
慣用左手
|
21
|
36
|
57
|
慣用右手
|
102
|
69
|
171
|
試問慣用左手或右手是否與性別有關?
H0: 慣用左手或右手與性別無關(independent)。
HA: 慣用左手或右手與性別有關。
第一步: 輸入建立資料。
v1 <- c(21, 36)
v2 <- c(102, 69)
m <-
matrix(cbind(c(v1, v2)), nrow = 2, byrow = TRUE)
# 將兩組vector組合成2 x 2矩陣。
第二步: 閱讀基本模組(base)的chisq.test函數使用說明。
help(chisq.test)
第三步: 使用基本模組(base)的chisq.test函數代入m。
chisq.test(m, correct =
TRUE, simulate.p.value = TRUE, B = 2000)
# correct = TRUE 2 x 2列聯表(degree of freedom = 1)時需做葉慈修正(Yates' correction)。
# simulate.p.value =
TRUE, B = 2000估計p值。
第四步: 判讀結果。
Pearson's Chi-squared
test with simulated p-value (based on 2000 replicates)
data: m
X-squared = 8.9505, df = NA, p-value = 0.002999
# p-value < 0.05,H0: 慣用左手或右手與性別無關(independent),不成立。
# p-value > 0.05,H0: 慣用左手或右手與性別無關(independent),成立。
# 注意: 四組資料分開計算時結論都是”慣用左手或右手與性別無關”。然而資料合併重新計算的結果推翻先前的結論。新的結論是”慣用左手或右手與性別有關”。
來勁了嗎? 想知道更多?? 補充資料(連結):
4. 關於R基礎,R繪圖及統計快速入門:
a. R Tutorial: https://www.tutorialspoint.com/r/index.htm
b. Cookbook for R: http://www.cookbook-r.com/
c. Quick-R: https://www.statmethods.net/
d. Statistical tools
for high-throughput data analysis (STHDA): http://www.sthda.com/english/
e. The Handbook of Biological Statistics: http://www.biostathandbook.com/
f. An R Companion for the Handbook of
Biological Statistics: http://rcompanion.org/rcompanion/index.html
5. Zar, JH. 2010. Biostatistical Analysis, Fifth Edition,
Pearson.
留言
張貼留言