首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » (獨立)雙樣本中位數差異檢定

(獨立)雙樣本中位數差異檢定
Wilcoxon rank-sum test
此處使用的統計分析方法為美國統計學家Frank Wilcoxon所提出的無母數方法,稱為Wilcoxon等級和(rank-sum)檢定,當資料包含兩組樣本時,可用此方法檢定此兩組樣本間母體中位數的差異值是否大於、小於或等於某一特定數值。此方法又稱為曼-惠特妮U檢定(Mann-Whitney U test),當樣本數夠大時(通常樣本個數≧30的樣本可視為樣本數夠大),建議可用(獨立)雙樣本平均數差異t檢定(Two-sample t-test)檢定平均數差。
註:母體中位數經常和平均數一樣, 因此檢定中位數差即檢定平均數差。

本方法使用之R相關套件與參考文獻:
相關套件:stats、base
參考文獻:(依套件名稱排序)
  1. R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
範例A-2:石油定價差異的分析

物價不斷上揚,舉凡各項與民生問題有關的物品都會受到關注,而每日上班需使用到交通工具使用的汽油與柴油對於大眾也是一個重要的支出。由於石油是一種具有戰略考量與民生問題雙重屬性的特殊物品,因此油價的波動會影響民生問題甚鉅,為了推動國內油價市場的公平性與合理性,降低非經濟因素的影響,使國內油價能回歸市場機制,負責部門於2007年1月開始實施浮動油價的機制,並經過多次的修訂與調整,此一計價制度推行至今。由於近幾個月來國際油價的波動劇烈,進而影響到一般百姓最關心的汽柴油價格,某研究民生議題的機構想了解該國主要兩個石油公司A公司及B公司的浮動油價訂立是否有差異,由北至南蒐集了A公司與B公司在該國9個地區的加油站標示油價(元/公升),如下表所示。

地區 1 2 3 4 5 6 7 8 9
中油 30.3 30.1 31 29.6 29.9 32.3 30.3 29 31
台塑 30.4 30.1 31.5 30 30 31.9 30.5 29.1 31.3

Q2:由於浮動油價制度使得各石油公司可針對成本的差異而訂立不同的油價,研究機構想了解國內最大的兩油品供應商的訂定的油價平均是否有差異?
問題解析:此處可將兩油品供應商於各地所收集的油價資料加以比較,討論問題"A公司的平均油價減去B公司的平均油價是否不為0?"。
統計方法:此問題中變數為石油公司的油價,為單一變數(一個變數,建議選擇單變數分析);石油公司有兩家,可視為兩組樣本且僅有樣本數9個,小於30筆;另A公司與B公司油價訂定應無關係,故兩組資料可視為獨立;可採用分析方法:(獨立)雙樣本中位數差異檢定(Wilcoxon rank-sum test),檢定"A公司的平均油價減去B公司的平均油價是否不為0?"。

解析:
1. 此題可建立虛無假設為"A公司的平均油價減去B公司的平均油價等於0?",即H0: mA- mB=0。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果: two sample rank sum test
(獨立)雙樣本中位數差異檢定 - 分析結果
  • 分析方法:(獨立)雙樣本中位數差異檢定
  • 資料名稱:範例A-2
  • 檢定變數:_NEW_
  • 分組變數:_GROUP_(A公司, B公司)
  • 顯著水準:0.05
  • 檢定中位數差異:0
  • 檢定方向:雙尾檢定
  • 計算時間:0.098秒

  • 樣本敘述統計量I
    變數名稱
    Variable
    分組變數(_GROUP_)
    Class Variable(_GROUP_)
    樣本數
    Count
    平均數
    Mean
    中位數
    Median
    最小值
    Minimum
    最大值
    Maximum
    標準差
    Std. dev.
    _NEW_ A公司930.388930.32932.30.9545
    B公司930.533330.429.131.90.8818
    不分組(Total)1830.461130.32932.30.8945
    I:樣本敘述統計量皆不包含遺失值

  • 等級資訊:
    變數名稱
    variable
    分組變數(_GROUP_)
    class variable(_GROUP_)
    個數
    count
    等級平均
    mean rank
    等級和
    rank sum
    _NEW_ A公司 9 8.833333 79.5
    B公司 9 10.16667 91.5

  • 雙樣本中位數差異檢定(獨立樣本)I
    虛無假設:母體中位數差異 = 0
    H0m1 - m2 = 0
    變數名稱
    variable
    威爾考克森
    W檢定統計量
    Wilcoxon
    W statistics
    曼-惠特尼
    U檢定統計量
    Mann-Whitney
    U statistics
    z檢定統計量
    z-statistics
    臨界值
    z(α/2)
    p-值II
    p-value
    _NEW_ 79.5 34.5 -0.5309 -1.96 0.59548
    I:分組變數為_GROUP_
    II:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 分析結果建議:由於檢定結果P-值(0.59548) > 顯著水準0.05,因此無法拒絕虛無假設。
[重新分析]
範例A-4:糖果銷售分析

兒童節快到了,某連鎖超商經理想趁著節日的到來舉辦促銷活動並藉此提高超商的業績,因此他針對店中販賣之三種糖果品牌的銷售狀況,蒐集了10天的銷售數資料(單位:公斤),想了解不同糖果品牌最受到兒童們的喜愛程度,資料列於表中。

天數 1 2 3 4 5 6 7 8 9 10
好吃牌 23 11 15 16 30 15 14 20 18 16
乾淨牌 11 12 19 12 13 15 17 11 13 9
快樂牌 18 12 11 11 19 19 20 24 22 20

Q2:另一糖果商認為他們的商品在該店銷售較佳,因此說服店經理主打他們的商品"乾淨牌",但依據該超商店員的經驗"好吃牌較乾淨牌受歡迎",店經理該相信誰呢?
問題解析:要知道兩個品牌的銷售狀況,需比較兩種品牌的平均銷售量,故討論好吃牌的平均銷售量是否大於乾淨牌的平均銷售量,即為"好吃牌的平均銷售量減去乾淨牌的平均銷售量是否不為0?"。
統計方法:此問題中,變數為糖果品牌的銷售狀況,為單一變數(一個變數,建議選擇單變數分析);比較好吃牌與乾淨牌共有二種可視為有二組的資料,且樣本數10小於30;二個品牌的銷售關聯性不大可視為獨立樣本;可採用分析方法:(獨立)雙樣本中位數差異檢定(Wilcoxon rank-sum test),檢定"好吃牌的平均銷售量減去乾淨牌的平均銷售量是否不為0?"。

解析:
1. 此題可建立虛無假設為"好吃牌的平均銷售量減去乾淨牌的平均銷售量等於0",即H0: m好吃牌- m乾淨牌=0。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果:
(獨立)雙樣本中位數差異檢定 - 分析結果
  • 分析方法:(獨立)雙樣本中位數差異檢定
  • 資料名稱:範例A-4
  • 檢定變數:_NEW_
  • 分組變數:_GROUP_(好吃牌, 乾淨牌)
  • 顯著水準:0.05
  • 檢定中位數差異:0
  • 檢定方向:雙尾檢定
  • 計算時間:0.087秒

  • 樣本敘述統計量I
    變數名稱
    Variable
    分組變數(_GROUP_)
    Class Variable(_GROUP_)
    樣本數
    Count
    平均數
    Mean
    中位數
    Median
    最小值
    Minimum
    最大值
    Maximum
    標準差
    Std. dev.
    _NEW_ 好吃牌1017.81611305.4119
    乾淨牌1013.212.59193.0111
    不分組(Total)2015.5159304.872
    I:樣本敘述統計量皆不包含遺失值

  • 等級資訊:
    變數名稱
    variable
    分組變數(_GROUP_)
    class variable(_GROUP_)
    個數
    count
    等級平均
    mean rank
    等級和
    rank sum
    _NEW_ 好吃牌 10 13.4 134
    乾淨牌 10 7.6 76

  • 雙樣本中位數差異檢定(獨立樣本)I
    虛無假設:母體中位數差異 = 0
    H0m1 - m2 = 0
    變數名稱
    variable
    威爾考克森
    W檢定統計量
    Wilcoxon
    W statistics
    曼-惠特尼
    U檢定統計量
    Mann-Whitney
    U statistics
    z檢定統計量
    z-statistics
    臨界值
    z(1-α/2)
    p-值II
    p-value
    _NEW_ 76 21 2.2013 1.96 0.027714 *
    I:分組變數為_GROUP_
    II:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 分析結果建議:由於檢定結果P-值(0.027714) < 顯著水準0.05,因此可拒絕虛無假設。
[重新分析]
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「R資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為: