單一樣本Wilcoxon signed-rank 檢定 (One-Sample Wilcoxon signed-rank test,non-parametric)
套路8: 單一樣本Wilcoxon signed-rank 檢定 (One-Sample Wilcoxon signed-rank test,non-parametric)
什麼是單一樣本假設檢定? 說白了就是只有一組資料做假設檢定。統計假設檢定檢定什麼?看H0。例如單一樣本假設檢定H0 : median等於 0,HA : median不等於0是檢定資料的平均值是否為0。又例如單一樣本假設檢定H0 : median
小於 8,HA : median
大於等於 8是檢定資料的平均值是否小於8。假設相等時為雙尾 (two-tailed test) 檢定。假設不相等時為單尾 (one-tailed test) 檢定。如下圖所示:
1. 使用時機: 用於比較觀測到的中位數(median)和理論(期望)值。資料偏離常態分布或有離群值不適用parametric方法時。
2. 分析類型: 無母數分析(non-parametric analysis)。直接使用資料數值算統計叫parametric方法,把資料排序之後用排序的名次算統計叫non-parametric方法。
3. 前提假設: 資料可排序(ordinal data)。
4. 資料範例: 咪路調查淡水河口彈塗魚的體長(cm),資料如下:
14.3, 15.8, 14.6, 16.1, 12.9, 15.1, 17.3, 14.0, 14.5, 13.9,
16.2, 14.3, 14.6, 13.3, 15.5, 11.8, 14.8, 13.5, 16.3, 15.4, 15.5, 13.9, 10.7,
14.8, 12.9, 15.4
問: 這種彈塗魚的身長中數為15 cm? H0: median 等於15。HA: median
不等於 15。
5. 畫圖看資料分布:
第一步: 用小c將資料放入名稱為Len的vector (R最基本資料結構)。用rep函數產生與資料相同數目的(26個)大寫F放入名稱為Fish的vector,再組合成名稱為dat的data frame。
Len <- c(14.3, 15.8, 14.6, 16.1, 12.9, 15.1, 17.3, 14.0, 14.5,
13.9, 16.2, 14.3, 14.6, 13.3, 15.5, 11.8, 14.8, 13.5, 16.3, 15.4, 15.5, 13.9,
10.7, 14.8, 12.9, 15.4)
Fish <- rep("F",
26)
dat <- data.frame(Len, Fish)
第二步: 安裝ggplot2程式套件。
第三步: 呼叫ggplot2程式套件備用。
library(ggplot2)
第四步: 畫圖。
ggplot(dat, aes(x = Fish, y = Len)) +
geom_boxplot(color = "red") +
geom_jitter(position =
position_jitter(0.05))
# 同時畫x-y散布(黑色點)圖及盒圖(紅色box plot)。
# ggplot2程式套件geom_jitter函數讓重疊(數值相同)的資料點錯開,避免誤判。
6. 使用R計算單一樣本曼恩-惠尼U檢定:
第一步: 閱讀基本模組(base)中的wilcox.test函數的使用說明。
help(wilcox.test)
第二步: 使用基本模組(base)中的wilcox.test函數代入資料數值。
wilcox.test(Len,
alternative = "two.sided", mu = 15, conf.level = 0.95)
# mu = 15是待測的期望值,H0: m = 15。
# alternative =
"two.sided" 執行雙尾檢定。
# 如果要檢定: H0: m ≥ 15 & HA: m < 15或H0: m > 15 & HA: m ≤ 15,alternative = "less"。
# 如果要檢定: H0: m ≤ 15 & HA: m > 15或H0: m < 15 & HA: m ≥ 15,alternative = "greater"。
第三步: 判讀結果。
Wilcoxon signed rank
test with continuity correction
data: Len
V = 121, p-value = 0.1699
alternative hypothesis: true location is not equal to 15
# p-value < 0.05,H0: m
= 15不成立。
# p-value > 0.05,H0: m
= 15成立。
來勁了嗎? 想知道更多?? 補充資料(連結):
1. Henry Mann (https://en.wikipedia.org/wiki/Henry_Mann)
2. Frank Wilcoxon (https://en.wikipedia.org/wiki/Frank_Wilcoxon)
3. Talk:Mann–Whitney U test (https://en.wikipedia.org/wiki/Talk:Mann%E2%80%93Whitney_U_test)
4. Mann-Whitney U Test,Wilcoxon Rank Sum Test (https://en.wikipedia.org/wiki/Mann%E2%80%93Whitney_U_test)
5. Statistical hypothesis testing (https://en.wikipedia.org/wiki/Statistical_hypothesis_testing)
6. Test statistic (https://en.wikipedia.org/wiki/Test_statistic)
7. 關於R基礎,R繪圖及統計快速入門:
a. R Tutorial: https://www.tutorialspoint.com/r/index.htm
b. Cookbook for R: http://www.cookbook-r.com/
c. Quick-R: https://www.statmethods.net/
d. Statistical tools for high-throughput data
analysis (STHDA): http://www.sthda.com/english/
e. The Handbook of Biological Statistics: http://www.biostathandbook.com/
f. An R Companion for the Handbook of
Biological Statistics: http://rcompanion.org/rcompanion/index.html
8. Zar, JH. 2010. Biostatistical Analysis, Fifth Edition,
Pearson.
留言
張貼留言