首頁
» 分析方法 » 單一樣本機率分配檢定
此處使用的統計分析方法為無母數方法中的Kolmogorov-Smirov機率分配檢定,此方法主要是檢定資料中感興趣的樣本是否符合某一種已知的機率分配,如多項(multinomial)分配、常態(normal)分配、珈碼(gamma)分配或是卜瓦松(Poisson)分配等。
1. 當你的樣本數僅有一組時,可利用單一樣本機率分配(One-sample Kolmogorov-Smirov test) 檢定了解你的資料是否來自某種已知分配。此外,亦可使用卡方適合度檢定(Chi-square test for goodness of fit)達到相同目的。
2. 當資料中感興趣的樣本數有兩組時,則可利用雙樣本機率分配檢定(Two-sample Kolmogorov-Smirov test)了解此兩組樣本是否來自相同的機率分配。
本方法使用之R相關套件與參考文獻:
相關套件:stats、base
參考文獻:(依套件名稱排序)
1. 當你的樣本數僅有一組時,可利用單一樣本機率分配(One-sample Kolmogorov-Smirov test) 檢定了解你的資料是否來自某種已知分配。此外,亦可使用卡方適合度檢定(Chi-square test for goodness of fit)達到相同目的。
2. 當資料中感興趣的樣本數有兩組時,則可利用雙樣本機率分配檢定(Two-sample Kolmogorov-Smirov test)了解此兩組樣本是否來自相同的機率分配。
本方法使用之R相關套件與參考文獻:
相關套件:stats、base
參考文獻:(依套件名稱排序)
- R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
範例A-7:電影市場的分析
看電影一直是現代人的重要休閒活動,隨著影音科技的日新月異,電影院的聲光效果更是一種高級享受,吸引著許多民眾前往消費。但是伴隨著享受的同時,電影的票價也是節節的升高,有最便宜的早場優待票220元,也有3D IMAX的400元票價,在消費與享受之間如何吸引民眾前往,也是業者的一個重要課題。影城工會為了瞭解電影院的市場是否已趨飽和,特別委託某研究機構調查,該機構抽查北部與南部各100家電影院,得到過去3個月的營業收入(單位:萬元),並製作一次數分配表,列出8個不同收入的區間,並將每家電影院依收入高低歸於各區間,列於表中。
表:電影院的收入區間次數分配表。
系統中所提供的範例資料檔為原始資料(即未分組前的資料)
Q1:研究機構想了解各家電影院的收入高低是否有差異,並以北部的電影院為分析對象,希望以某種機率分配來描述收入的分布,若是資料屬於左偏分配,即可知道多數的電影院收入在平均收入之上,若資料屬於右偏分配可知多數的電影院收入在平均收入之下,若資料為對稱分配且多數於平均數(中位數)附近(如常態分配),則可知大多數的電影院收入在中間的區間。依據商業經營模式,店家的收入區間大多數成常態分配,電影院的收入區間也是如此嗎?
問題解析:此處討論電影院的收入資料是否也於其他的商業經營模式一致,會呈現常態分配,故討論問題"北部電影院的收入區間是否為常態分配?"。
統計方法:此問題中,變數為不同收入區間的電影院家數,為單一變數(一個變數,建議選擇單變數分析)且僅討論北部的電影院為一組樣本;可採用分析方法:單一樣本機率分配檢定(one-sample Kolmogorov-Smirov test)及卡方適合度檢定(Chi-square test for goodness of fit),檢定"北部電影院的收入區間是否為常態分配?"。
解析:
1. 此題可建立虛無假設為"北部電影院的收入區間為常態分配(參數未知,由資料估計)"。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果:one sample ks test
[重新分析]
看電影一直是現代人的重要休閒活動,隨著影音科技的日新月異,電影院的聲光效果更是一種高級享受,吸引著許多民眾前往消費。但是伴隨著享受的同時,電影的票價也是節節的升高,有最便宜的早場優待票220元,也有3D IMAX的400元票價,在消費與享受之間如何吸引民眾前往,也是業者的一個重要課題。影城工會為了瞭解電影院的市場是否已趨飽和,特別委託某研究機構調查,該機構抽查北部與南部各100家電影院,得到過去3個月的營業收入(單位:萬元),並製作一次數分配表,列出8個不同收入的區間,並將每家電影院依收入高低歸於各區間,列於表中。
表:電影院的收入區間次數分配表。
收入區間 | 1000以下 | 1001-2000 | 2001-3000 | 3001-4000 | 4001-5000 | 5001-6000 | 6001-7000 | 7001以上 |
北部 | 6 | 6 | 18 | 25 | 24 | 11 | 6 | 4 |
南部 | 12 | 8 | 30 | 22 | 16 | 6 | 5 | 1 |
Q1:研究機構想了解各家電影院的收入高低是否有差異,並以北部的電影院為分析對象,希望以某種機率分配來描述收入的分布,若是資料屬於左偏分配,即可知道多數的電影院收入在平均收入之上,若資料屬於右偏分配可知多數的電影院收入在平均收入之下,若資料為對稱分配且多數於平均數(中位數)附近(如常態分配),則可知大多數的電影院收入在中間的區間。依據商業經營模式,店家的收入區間大多數成常態分配,電影院的收入區間也是如此嗎?
問題解析:此處討論電影院的收入資料是否也於其他的商業經營模式一致,會呈現常態分配,故討論問題"北部電影院的收入區間是否為常態分配?"。
統計方法:此問題中,變數為不同收入區間的電影院家數,為單一變數(一個變數,建議選擇單變數分析)且僅討論北部的電影院為一組樣本;可採用分析方法:單一樣本機率分配檢定(one-sample Kolmogorov-Smirov test)及卡方適合度檢定(Chi-square test for goodness of fit),檢定"北部電影院的收入區間是否為常態分配?"。
解析:
1. 此題可建立虛無假設為"北部電影院的收入區間為常態分配(參數未知,由資料估計)"。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果: