首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » 費雪精確檢定

費雪精確檢定
Fisher's exact test
此處的統計分析方法為費雪精確檢定,此方法與卡方齊一性或獨立性檢定的用法相同,皆是用於檢定兩個類別型變數間的關係,但此方法較常用於資料中樣本數較小的情況(通常樣本個數<30的樣本可視為樣本數較小),因此無法以大樣本近似理論來處理資料。當樣本數較大時(通常樣本個數≧30的樣本可視為樣本數較大),可利用卡方獨立性(或稱齊一性)檢定(chi-square test of independence or homogeneity)來分析。

本方法使用之R相關套件與參考文獻:
相關套件:stats、base
參考文獻:(依套件名稱排序)
  1. R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
範例B-1:收入與保險的相關性研究

隨著時代的進步,現代人已經逐漸接受買保險的觀念,且隨著人口的增加,保險市場可以說是欣欣向榮、蓬勃發展。為了分食廣大的保險市場利益,某壽險公司想分析市場以了解民眾購買保險的習性,希望了解民眾所得收入的高低是否會影響到其參加壽險保障的意願,隨機調查了200人,搜集資料中包含有參加壽險及沒參加壽險,並將每個人的所得收入區分為高收入與低收入兩組,列於表中。

表:有否參加壽險與收入高低之列聯表。
收入高 收入低
有參加壽險 78 49
無參加壽險 31 42

Q1:壽險公司想了解所得高低是否會影響到參加壽險的意願來決定市場決策的方向,此處想了解所得高低是否會影響到參加壽險的意願?
問題解析:此處想了解是否較高所得的民眾會有較多的人參加壽險,而較低收入的民眾則參加壽險的人數較少,當有此關係時表示兩者之間是有相關的,此即為討論問題"收入高低與是否參加壽險是否有相關性?"。
統計方法:此問題中有兩個變數,分別是參加壽險情形及所得收入(兩個變數,不探討因果關係,建議選擇雙變數分析I);變數皆為類別變數,分別有兩種類別,可採用分析方法:費雪精確檢定(Fisher's exact test)或是卡方獨立性(或稱齊一性)檢定(chi-square test of independence or homogeneity),檢定"收入高低與是否參加壽險是否有相關性?"。

解析:
1. 此題可建立虛無假設為"收入高低與是否參加壽險無相關"
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果: fisher's exact test
費雪精確檢定 - 分析結果
  • 分析方法:費雪精確檢定
  • 資料名稱:範例B-1
  • 變數名稱:有無參加保險, 收入高低
  • 顯著水準:0.05
  • 計算時間:

  • 列聯表(有無參加保險*收入高低)I
    收入高低 合計
    Total
    01
    有無參加保險0
    78
    39.00
    61.42
    71.56
    49
    24.50
    38.58
    53.85
    127
    1
    31
    15.50
    42.47
    28.44
    42
    21.00
    57.53
    46.15
    73
    合計 Total10991200
    I:列聯表內容為觀察值個數 / 百分比 / 列百分比 / 行百分比

  • 費雪列聯表檢定:
    虛無假設:兩變數之間無關聯
    p-值I
    p-value
    0.012112 *
    I:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 分析結果建議:由於檢定結果P-值為(0.012112) < 顯著水準0.05,因此可拒絕虛無假設。
[重新分析]
範例B-2:機位種類的選擇和旅途距離相關性的研究

隨著時代的進步以及科技的日新月異,人們賴以移動的交通工具不斷的進步,從早期的利用動物拖曳,到工業革命時期發明蒸氣機後以車、船代步,大大的縮短各地區之間交通往返的時間。有了這些技術之後,人們開始征服天空,發明了飛機能讓人們翱翔於天空,這個發明更讓地球間的距離縮短到一日之內,成了名副其實的地球村。現今工商發達,跨國之間的行業比比皆是,隨之衍生出必要的生意往來,對於航空交通的需求量相當龐大;而休閒產業的發展,出國旅遊更是成為國人每年的必安排的行程。有鑑於此龐大的商機,某航空公司想對市場民眾的需求加以了解,在機場隨機調查了300名旅客,將民眾購買飛機票的類型分為頭等艙、商務艙與經濟艙三種,飛行類型分為國內與國外兩種,分析購買飛機票的種類是否會受到飛行的類型影響;資料記錄於表中。

表:飛行類型與購買機票類型之列聯表。
頭等艙 商務艙 經濟艙
國內 50 49 63
國外 60 42 36

Q1:在長途旅行中常常會使得人產生很嚴重的疲累感,因此在搭乘交通工具時的舒適性就顯得非常重要,但由於飛機上的空間有限,較舒適的乘坐空間必須犧牲一些載客的人數才能達成,航空公司為了能妥善的規劃飛機上的不同艙等的座位數,想透過了解飛行的距離的差異(國內航線與國外航線)是否與乘客選擇不同的艙等有影響來決定,該如何訂定決策呢?
問題解析:此問題中想了解搭乘較遠距離的國外線是否會選擇較舒適的商務艙或頭等艙呢,而搭乘較近距離的國內線則會選擇便宜的經濟艙,此即是討論問題"飛行距離的長短與座艙的選擇是否有相關性?"。
統計方法:此問題中有兩個變數,分別是購買飛機票的類型及飛行類型(兩個變數,不探討因果關係,建議選擇雙變數分析I);變數皆為類別變數,可採用分析方法:費雪精確檢定(Fisher's exact test)或是卡方獨立性(或稱齊一性)檢定(chi-square test of independence or homogeneity),檢定"飛行距離的長短與座艙的選擇是否有相關性?"。

解析:
1. 此題可建立虛無假設為"飛行距離的長短與座艙的選擇無相關"
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果:
費雪精確檢定 - 分析結果
  • 分析方法:費雪精確檢定
  • 資料名稱:範例B-2
  • 變數名稱:旅行類型, 購買機票類型
  • 顯著水準:0.05
  • 計算時間:0.011秒

  • 列聯表(旅行類型*購買機票類型)I
    購買機票類型 合計
    Total
    1_頭等艙2_商務艙3_經濟艙
    旅行類型1_國內
    50
    16.67
    30.86
    45.45
    49
    16.33
    30.25
    53.85
    63
    21.00
    38.89
    63.64
    162
    2_國外
    60
    20.00
    43.48
    54.55
    42
    14.00
    30.43
    46.15
    36
    12.00
    26.09
    36.36
    138
    合計 Total1109199300
    I:列聯表內容為觀察值個數 / 百分比 / 列百分比 / 行百分比

  • 費雪列聯表檢定:
    虛無假設:兩變數之間無關聯
    p-值I
    p-value
    0.030276 *
    I:顯著性代碼:‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1

  • 分析結果建議:由於檢定結果P-值為(0.030276) < 顯著水準0.05,因此可拒絕虛無假設。
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「R資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為:
  
以列聯表型態直接輸入資料 列聯表共列*行