成對樣本曼恩-惠尼U檢定 (Mann–Whitney U Test for Paired Data)

套路16: 成對樣本曼恩-惠尼U檢定 
(Mann–Whitney U Test for Paired Data)
成對樣本魏克生等級和檢定
(Wilcoxon Rank Sum Test for Paired Data)

什麼是兩組成對資料假設檢定? 說白了就是兩組成對的資料做比較的假設檢定。統計假設檢定檢定什麼?H0。例如兩組成對資料假設檢定H0 : median1 = median2HA : median1median2是檢定兩組資料的中位數是否相同。又例如兩組獨立樣本假設檢定H0 : median1 < median2HA : median1 ³ median2是檢定第一組資料的中位數是否小於第二組資料的中位數。假設相等時為雙尾 (two-tailed test) 檢定。假設不相等時為單尾 (one-tailed test) 檢定。如下圖所示:
1. 使用時機: 用於比較觀測到的成對資料中位數(median)
2. 分析類型: 無母數分析(non-parametric analysis)直接使用資料數值算統計叫parametric方法把資料排序之後用排序的名次算統計叫non-parametric方法。
3. 前提假設: 兩組資料均為可排序(ordinal data)且為成對資料。
4. 資料範例: 咪路測量幫愛斯基摩人拉車的狗狗前腿與後腿長度,資料如下:
狗狗
後腿(cm)
前腿(cm)
1
14.2
13.8
2
14.0
13.6
3
14.4
14.7
4
14.4
13.9
5
14.2
14.3
6
14.6
14.1
7
14.9
14.3
8
15.0
14.5
9
14.2
13.6
10
14.8
14.6
H0拉車的狗狗前腿與後腿長度沒差。HA拉車的狗狗前腿與後腿長度有差。
5. 畫圖看資料分布:
第一步: 用小c將資料放入名稱為h1f1vector (R最基本資料結構)。用rep函數產生與資料相同
  數目的(10)大寫HF放入名稱為h2f2vector再組合成名稱為datdata frame
  h1 <- c(14.2, 14.0, 14.4, 14.4, 14.2, 14.6, 14.9, 15.0, 14.2, 14.8)
  f1 <- c(13.8, 13.6, 14.7, 13.9, 14.3, 14.1, 14.3, 14.5, 13.6, 14.6)
  h2 <- rep("H", 10)
  f2 <- rep("F", 10)
  Length <- c(h1, f1)
  Leg <- c(h2, f2)
  dat <- data.frame(Length, Leg)
第二步: 安裝ggplot2程式套件。
第三步: 呼叫ggplot2程式套件備用。
  library(ggplot2)
第四步: 畫圖。
  ggplot(dat, aes(x = Leg, y = Length)) +
   geom_boxplot(color = "red")+
   geom_jitter(position = position_jitter(0.05))
  # 同時畫x-y散布(黑色點)圖及盒圖(紅色box plot)
  # ggplot2程式套件geom_jitter函數讓重疊(數值相同)的資料點錯開,避免誤判

6. 使用R計算成對樣本曼恩-惠尼U檢定:
第一步: 閱讀基本模組(base)中的wilcox.test函數的使用說明。
  help(wilcox.test)
第二步: 使用stats程式套件的wilcox.test函數代入資料數值。
  wilcox.test(h1, f1, alternative = "two.sided", paired = TRUE, conf.level = 0.95)
  # paired = TRUE樣本為成對資料。
  # alternative = "two.sided" 執行雙尾檢定。
  # 檢定: H0: 狗狗前腿比後腿長 & HA: 狗狗前腿比後腿短,alternative = "less"
  # 檢定: H0: 狗狗前腿比後腿短 & HA: 狗狗前腿比後腿長,alternative = "greater"
第三步: 判讀結果
        Wilcoxon signed rank test with continuity correction
data:  h1 and f1
V = 51, p-value = 0.01867  # p-value < 0.05H0狗狗前腿與後腿長度沒差不成立。
alternative hypothesis: true location shift is not equal to 0
  # p-value < 0.05H0拉車的狗狗前腿與後腿長度沒差不成立。
  # p-value > 0.05H0拉車的狗狗前腿與後腿長度沒差成立。

來勁了嗎? 想知道更多?? 補充資料(連結):
4. Mann-Whitney U TestWilcoxon Rank Sum Test (https://en.wikipedia.org/wiki/Mann%E2%80%93Whitney_U_test)
7. 關於R基礎R繪圖及統計快速入門:
   b. Cookbook for R: http://www.cookbook-r.com/
   d. Statistical tools for high-throughput data analysis (STHDA): http://www.sthda.com/english/
e. The Handbook of Biological Statistics: http://www.biostathandbook.com/
f. An R Companion for the Handbook of Biological Statistics: http://rcompanion.org/rcompanion/index.html
8. Zar, JH. 2010. Biostatistical Analysis, Fifth Edition, Pearson.

留言

這個網誌中的熱門文章

統計不球人 目錄 (Table of Contents)

比較二或多組變異數Levene’s 檢定 (Levene’s Test for Comparing Two or More Variances)

三因子變異數分析 (Three Way ANOVA)