首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » (獨立)雙樣本機率分配差異檢定

(獨立)雙樣本機率分配差異檢定
Two-sample Kolmogorov-Smirov test
此處使用的統計分析方法為無母數方法中的Kolmogorov-Smirov機率分配檢定,此方法主要是檢定資料中感興趣的樣本是否符合某一種已知的機率分配,如多項(multinomial)分配、常態(normal)分配、珈碼(gamma)分配或是卜瓦松(Poisson)分配等。
1. 當你的樣本數僅有一組時,可利用單一樣本機率分配檢定(One-sample Kolmogorov-Smirov test)卡方適合度檢定(Chi-square test for goodness of fit)來檢驗資料中感興趣樣本的機率分配。
2. 當資料中感興趣的樣本數有兩組時,則可利用(獨立)雙樣本機率分配差異檢定(Two-sample Kolmogorov-Smirov test)檢驗兩組樣本是否來自相同的機率分配。

本方法使用之R相關套件與參考文獻:
相關套件:stats、base
參考文獻:(依套件名稱排序)
  1. R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
範例A-7:電影市場的分析

看電影一直是現代人的重要休閒活動,隨著影音科技的日新月異,電影院的聲光效果更是一種高級享受,吸引著許多民眾前往消費。但是伴隨著享受的同時,電影的票價也是節節的升高,有最便宜的早場優待票220元,也有3D IMAX的400元票價,在消費與享受之間如何吸引民眾前往,也是業者的一個重要課題。影城工會為了瞭解電影院的市場是否已趨飽和,特別委託某研究機構調查,該機構抽查北部與南部各100家電影院,得到過去3個月的營業收入(單位:萬元),並製作一次數分配表,列出8個不同收入的區間,並將每家電影院依收入高低歸於各區間,列於表中。

表:電影院的收入區間次數分配表。
收入區間 1000以下 1001-2000 2001-3000 3001-4000 4001-5000 5001-6000 6001-7000 7001以上
北部 6 6 18 25 24 11 6 4
南部 12 8 30 22 16 6 5 1
系統中所提供的範例資料檔為原始資料(即未分組前的資料)

Q2:由於南北部民情的不同,再加上都市發展的差異性,故研究機構對於南部與北部電影院的收入差異非常的感興趣,想分析南北部電影院的收入區間分布是否有差異,以增加電影院業者對市場評估的訊息。
問題解析:分析南北部電影院的收入區間分布是否有差異,可討論"北部的電影院收入分布與南部電影院的收入分布是否有差異?"。
統計方法:此問題中,變數為不同收入區間的電影院家數,為單一變數(一個變數,建議選擇單變數分析),討論南部與北部電影院收入故視為二組樣本,且兩地區的電影院收入應無關聯,可視為獨立樣本;可採用分析方法:(獨立)雙樣本機率分配檢定(two-sample Kolmogorov-Smirov test),檢定"北部的電影院收入分布與南部電影院的收入分布是否有差異?"。

解析:
1. 此題可建立虛無假設為"北部的電影院收入分布與南部電影院的收入分布無差異"。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果: two sample ks test
(獨立)雙樣本機率分配差異檢定 - 分析結果
  • 分析方法:(獨立)雙樣本機率分配差異檢定
  • 資料名稱:範例A-7
  • 檢定變數:_NEW_
  • 分組變數:_GROUP_(北部, 南部)
  • 顯著水準:0.05
  • 計算時間:0.087秒

  • 樣本敘述統計量I
    變數名稱
    Variable
    分組變數(_GROUP_)
    Class Variable(_GROUP_)
    樣本數
    Count
    平均數
    Mean
    中位數
    Median
    最小值
    Minimum
    最大值
    Maximum
    標準差
    Std. dev.
    _NEW_ 北部993924.7475368748590011702.7628
    南部993203.4545300229678001625.3355
    不分組(Total)1983564.1013430.529690011699.1824
    I:樣本敘述統計量皆不包含遺失值

  • 雙樣本機率分配差異檢定I
    虛無假設:兩組資料來自相同母體分配
    變數名稱
    variable
    Kolmogorov-Smirov D 檢定統計量
    Kolmogorov-Smirov D-statistics
    p-值II
    p-value
    _NEW_ 0.2323 0.0095589 **
    I:分組變數為_GROUP_
    II:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 分析結果建議:由於檢定結果P-值為(0.0095589) < 顯著水準0.05,因此可拒絕虛無假設。
[重新分析]
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「R資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為: