兩組獨立樣本曼恩-惠尼U檢定 (Two-Sample Mann–Whitney U Test)

套路14: 兩組獨立樣本曼恩-惠尼U檢定 
(Two-Sample Mann–Whitney U Test) 又名 
兩組獨立樣本魏克生等級和檢定 
(Two-Sample Wilcoxon Rank Sum Test)

什麼是兩組獨立樣本假設檢定? 說白了就是兩組分別獨立取樣的資料做比較的假設檢定。統計假設檢定檢定什麼?H0。例如兩組獨立樣本假設檢定H0 : median1 = median2HA : median1median2是檢定兩組資料的中位數是否相同。又例如兩組獨立樣本假設檢定H0 : median1 < median2HA : median1 ³ median2是檢定第一組資料的中位數是否小於第二組資料的中位數。假設相等時為雙尾 (two-tailed test) 檢定。假設不相等時為單尾 (one-tailed test) 檢定。如下圖所示:
1. 使用時機: 用於比較觀測到的兩組獨立資料中位數(median)
2. 分析類型: 無母數分析(non-parametric analysis)直接使用資料數值算統計叫parametric方法把資料排序之後用排序的名次算統計叫non-parametric方法。
3. 前提假設: 兩組資料均為可排序(ordinal data)且彼此獨立。
4. 資料範例: 咪路調查高一和大一學生體重(kg)資料如下:
高一
41
35
33
36
40
46
31
37
34
30
38
大一
52
57
62
55
64
57
56
55
60
59

請問兩組體重中數是否相同? H0: median1 = median2HA: median1median2

5. 輸入建立資料:
第一步: 用小c將資料放入名稱為h1u1vector (R最基本資料結構)。用rep函數產生與資料相同
  數目的(1110)大寫HU放入名稱為h2u2vector再組合成名稱為datdata frame
  h1 <- c(41, 35, 33, 36, 40, 46, 31, 37, 34, 30, 38)
  u1 <- c(52, 57, 62, 55, 64, 57, 56, 55, 60, 59)
  h2 <- rep("H", 11)
  u2 <- rep("U", 10)
  Weight <- c(h1, u1)
  School <- c(h2, u2)
  dat <- data.frame(Weight, School)

6. 畫圖看資料分布:
第一步: 安裝ggplot2程式套件。
第二步: 呼叫ggplot2程式套件備用。
library(ggplot2)
第三步: 畫圖。
ggplot(dat, aes(x = School, y = Weight)) +
   geom_boxplot(color = "red")+
   geom_jitter(position = position_jitter(0.05))
  # 同時畫x-y散布(黑色點)圖及盒圖(紅色box plot)
  # ggplot2程式套件geom_jitter函數讓重疊(數值相同)的資料點錯開,避免誤判

7. 使用R計算兩組獨立樣本曼恩-惠尼U檢定:
第一步: 閱讀基本模組(base)中的wilcox.test函數的使用說明。
  help(wilcox.test)
第二步: 使用基本模組(base)中的wilcox.test函數代入資料數值。
  wilcox.test(h1, u1, alternative = "two.sided", paired = FALSE, conf.level = 0.95)
  # paired = FALSE不是成對資料檢定。
  # alternative = "two.sided" 執行雙尾檢定。
  # 檢定: H0: m1m2HA: m1 < m2H0: m1 > m2HA: m1m2alternative = "less"
  # 檢定: H0: m1m2HA: m1 > m2H0: m1 < m2HA: m1m2alternative =  "greater"
第三步: 判讀結果
        Wilcoxon rank sum test with continuity correction
data:  h1 and u1
W = 0, p-value = 0.0001229   # p-value < 0.05H0: m1 = m2不成立。
alternative hypothesis: true location shift is not equal to 0
  # p-value < 0.05H0: m1 = m2不成立。
  # p-value > 0.05H0: m1 = m2成立。

來勁了嗎? 想知道更多?? 補充資料(連結):
4. Mann-Whitney U TestWilcoxon Rank Sum Test (https://en.wikipedia.org/wiki/Mann%E2%80%93Whitney_U_test)
7. 關於R基礎R繪圖及統計快速入門:
   b. Cookbook for R: http://www.cookbook-r.com/
   d. Statistical tools for high-throughput data analysis (STHDA): http://www.sthda.com/english/
e. The Handbook of Biological Statistics: http://www.biostathandbook.com/
f. An R Companion for the Handbook of Biological Statistics: http://rcompanion.org/rcompanion/index.html
8. Zar, JH. 2010. Biostatistical Analysis, Fifth Edition, Pearson.

留言

這個網誌中的熱門文章

統計不球人 目錄 (Table of Contents)

如何選擇統計方法 1

單因子多樣本中位數差異檢定 (Kruskal-Wallis test)