首頁
» 分析方法 » Cochran-Armitage趨勢分析
Cochran-Armitage趨勢檢定 (William Cochran, 1954; Peter Armitage, 1955) 是一種分析類別型資料的統計方法。此檢定主要的目的在評估一個二分組的類別型變數與另一個順序尺度型變數間是否有關聯性存在,例如疾病的治愈比例(二分組的類別型變數)是否隨著用藥劑量的增加(順序尺度型變數)呈現某種趨勢的現象。本方法提供自由度為1的卡方統計量。
本方法使用之R相關套件與參考文獻:
相關套件:stats、base
參考文獻:(依套件名稱排序)
本方法使用之R相關套件與參考文獻:
相關套件:stats、base
參考文獻:(依套件名稱排序)
- R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
範例B-2:機位種類的選擇和旅途距離相關性的研究
工商發達,跨國之間經常衍生出必要的生意往來,對於航空交通的需求也相當龐大。此外,出國旅遊更是成為國人每年必安排的行程。有鑑於此龐大的商機,某航空公司想對市場民眾的需求加以了解,在機場隨機調查了300名收入較高的旅客,將民眾購買飛機票的類型分為頭等艙、商務艙與經濟艙三種,旅行的類型分為國內與國外兩種,分析購買飛機票的種類是否會受到旅行的類型影響;資料記錄於表中。
表:旅行類型與購買機票類型之列聯表。
Q2:長途旅行中常常會使得人產生很嚴重的疲累感,因此在選擇搭乘交通工具時的舒適性就顯得非常重要。考量艙等舒適性,頭等艙優於商務艙優於經濟艙。航空公司為了能妥善的規劃飛機上不同艙等的座位數,想了解是否乘客選擇不同等級的艙等有受國內線或國外線的影響,即是想了解是否頭等艙旅客中為國外線的比例高於商務艙旅客中為國外線的比例,且商務艙旅客中為國外線的比例高於經濟艙旅客中為國外線的比例?
統計方法:此問題中有兩個變數,分別是購買機票的類型及旅行類型(兩個變數,不探討因果關係,建議可選擇分析方法中的卡方獨立性檢定(或費雪精確檢定)。但旅行類型為二分組的類別型變數,購買的機票依頭等艙、商務艙及經濟艙具有順序尺度的性質,因此可採用Cochran-Armitage趨勢檢定來分析,以強化檢定力。
解析:
1. 此題的虛無假設為 "座艙等級(頭等艙、商務艙、經濟艙)的選擇和國內線或國外線無關" ,即H0:P國外線|頭等艙=P國外線|商務艙= P國外線|經濟艙, 對立假設為HA:P國外線|頭等艙>P國外線|商務艙> P國外線|經濟艙。
2. 以列聯表型態直接輸入資料或建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果:[重新分析]
工商發達,跨國之間經常衍生出必要的生意往來,對於航空交通的需求也相當龐大。此外,出國旅遊更是成為國人每年必安排的行程。有鑑於此龐大的商機,某航空公司想對市場民眾的需求加以了解,在機場隨機調查了300名收入較高的旅客,將民眾購買飛機票的類型分為頭等艙、商務艙與經濟艙三種,旅行的類型分為國內與國外兩種,分析購買飛機票的種類是否會受到旅行的類型影響;資料記錄於表中。
表:旅行類型與購買機票類型之列聯表。
頭等艙 | 商務艙 | 經濟艙 | |
國內 | 50 | 49 | 63 |
國外 | 60 | 42 | 36 |
Q2:長途旅行中常常會使得人產生很嚴重的疲累感,因此在選擇搭乘交通工具時的舒適性就顯得非常重要。考量艙等舒適性,頭等艙優於商務艙優於經濟艙。航空公司為了能妥善的規劃飛機上不同艙等的座位數,想了解是否乘客選擇不同等級的艙等有受國內線或國外線的影響,即是想了解是否頭等艙旅客中為國外線的比例高於商務艙旅客中為國外線的比例,且商務艙旅客中為國外線的比例高於經濟艙旅客中為國外線的比例?
統計方法:此問題中有兩個變數,分別是購買機票的類型及旅行類型(兩個變數,不探討因果關係,建議可選擇分析方法中的卡方獨立性檢定(或費雪精確檢定)。但旅行類型為二分組的類別型變數,購買的機票依頭等艙、商務艙及經濟艙具有順序尺度的性質,因此可採用Cochran-Armitage趨勢檢定來分析,以強化檢定力。
解析:
1. 此題的虛無假設為 "座艙等級(頭等艙、商務艙、經濟艙)的選擇和國內線或國外線無關" ,即H0:P國外線|頭等艙=P國外線|商務艙= P國外線|經濟艙, 對立假設為HA:P國外線|頭等艙>P國外線|商務艙> P國外線|經濟艙。
2. 以列聯表型態直接輸入資料或建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果:
範例B-7:基因型與癲癇的研究
癲癇是常見的神經疾病之一,每一千人中大約有5~10人患有此疾病。研究發現有一基因與癲癇控制有關,此基因包含了數個單核苷酸多型性(single nucleotide polymorphism, SNP),其中有三個單核苷酸多型性,已知其對應的遺傳模式分別為顯性、隱性及加成性模式。某醫師想了解此基因的這三個單核苷酸多型性之基因型與癲癇病症是否為“難治型”有相關,於是收集院內62位癲癇患者的基因型資料。表一至表三分別為三個單核苷酸多型性基因型及癲癇疾病型態的列聯表:
第一個SNP:SNP_1相對於A為顯性遺傳模式
第二個SNP:SNP_2相對於A為隱性遺傳模式
第三個SNP:SNP_3相對於A為加成遺傳模式
Q1:癲癇病症中,有分為難治型與非難治型,醫師懷疑可能是基因造成此差別,於是利用三個單點核酸多型性研究基因型態與是否為難治型癲癇有關?
統計方法:此問題中有兩個變數,分別是單核苷酸多型性的基因型變數及癲癇病症的二分類(難治型及非難治型)變數。單核苷酸多型性的基因型有三類,分別為AA、Aa、aa,可依其已知的遺傳模式(顯性、隱性或加成性)將基因型變數歸為順序尺度型變數,採用Cochran-Armitage趨勢檢定,檢定"單核苷酸多型性的基因型與是否為難治型癲癇病症有相關?"。
解析:
1. 此題依三個單核苷酸多型性之遺傳模式不同,可建立虛無假設分別如下:
3. 依分析步驟說明分析資料。
4. 趨勢計分設定預設值部分,AA、Aa、aa三種基因型所對應的預設值在顯性遺傳模式分別為1,1,0(A視為顯性,有A即為1);在隱性遺傳模式為1,0,0(A視為隱性,有兩個A才為1);而在加成遺傳模式為2,1,0(根據A的個數判定,一個A為1、兩個A為2)。
5. 分析結果:
[重新分析]
癲癇是常見的神經疾病之一,每一千人中大約有5~10人患有此疾病。研究發現有一基因與癲癇控制有關,此基因包含了數個單核苷酸多型性(single nucleotide polymorphism, SNP),其中有三個單核苷酸多型性,已知其對應的遺傳模式分別為顯性、隱性及加成性模式。某醫師想了解此基因的這三個單核苷酸多型性之基因型與癲癇病症是否為“難治型”有相關,於是收集院內62位癲癇患者的基因型資料。表一至表三分別為三個單核苷酸多型性基因型及癲癇疾病型態的列聯表:
第一個SNP:SNP_1相對於A為顯性遺傳模式
難治型癲癇\SNP_1基因型 | AA | Aa | aa | Total |
否 | 7 | 9 | 12 | 28 |
是 | 12 | 11 | 11 | 34 |
Total | 19 | 20 | 23 | 62 |
第二個SNP:SNP_2相對於A為隱性遺傳模式
難治型癲癇\SNP_2基因型 | AA | Aa | aa | Total |
否 | 8 | 8 | 12 | 28 |
是 | 14 | 9 | 11 | 34 |
Total | 22 | 17 | 23 | 62 |
第三個SNP:SNP_3相對於A為加成遺傳模式
難治型癲癇\SNP_3基因型 | AA | Aa | aa | Total |
否 | 8 | 9 | 11 | 28 |
是 | 17 | 10 | 7 | 34 |
Total | 25 | 19 | 18 | 62 |
Q1:癲癇病症中,有分為難治型與非難治型,醫師懷疑可能是基因造成此差別,於是利用三個單點核酸多型性研究基因型態與是否為難治型癲癇有關?
統計方法:此問題中有兩個變數,分別是單核苷酸多型性的基因型變數及癲癇病症的二分類(難治型及非難治型)變數。單核苷酸多型性的基因型有三類,分別為AA、Aa、aa,可依其已知的遺傳模式(顯性、隱性或加成性)將基因型變數歸為順序尺度型變數,採用Cochran-Armitage趨勢檢定,檢定"單核苷酸多型性的基因型與是否為難治型癲癇病症有相關?"。
解析:
1. 此題依三個單核苷酸多型性之遺傳模式不同,可建立虛無假設分別如下:
- SNP_1: "顯性遺傳模式之基因型與是否為難治型癲癎無關",即
H0:P難治型癲癇|AA=P難治型癲癇|Aa= P難治型癲癇|aa。
對立假設為 HA:P難治型癲癇|AA=P難治型癲癇|Aa>P難治型癲癇|aa或 HA:P非難治型癲癇|AA=P非難治型癲癇|Aa>P非難治型癲癇|aa。 - SNP_2: "隱性遺傳模式之基因型與是否為難治型癲癎無關",即
H0:P難治型癲癇|AA=P難治型癲癇|Aa= P難治型癲癇|aa。
對立假設為 HA:P難治型癲癇|AA>P難治型癲癇|Aa=P難治型癲癇|aa或 HA:P非難治型癲癇|AA>P非難治型癲癇|Aa=P非難治型癲癇|aa。 - SNP_3: "加成遺傳模式之基因型與是否為難治型癲癎無關",即
H0:P難治型癲癇|AA=P難治型癲癇|Aa= P難治型癲癇|aa。
對立假設為 HA:P難治型癲癇|AA>P難治型癲癇|Aa>P難治型癲癇|aa或 HA:P非難治型癲癇|AA>P非難治型癲癇|Aa>P非難治型癲癇|aa。
3. 依分析步驟說明分析資料。
4. 趨勢計分設定預設值部分,AA、Aa、aa三種基因型所對應的預設值在顯性遺傳模式分別為1,1,0(A視為顯性,有A即為1);在隱性遺傳模式為1,0,0(A視為隱性,有兩個A才為1);而在加成遺傳模式為2,1,0(根據A的個數判定,一個A為1、兩個A為2)。
5. 分析結果: