R資料分析暨導引系統

首頁 » 分析方法 » Cochran-Armitage趨勢分析

Cochran-Armitage趨勢檢定
Cochran-Armitage Trend Test

方法簡介
範例B-2(2)
範例B-7
影音教學
維基百科(英文)

Cochran-Armitage趨勢檢定 (William Cochran, 1954; Peter Armitage, 1955) 是一種分析類別型資料的統計方法。此檢定主要的目的在評估一個二分組的類別型變數與另一個順序尺度型變數間是否有關聯性存在，例如疾病的治愈比例(二分組的類別型變數)是否隨著用藥劑量的增加(順序尺度型變數)呈現某種趨勢的現象。本方法提供自由度為1的卡方統計量。

本方法使用之R相關套件與參考文獻：
相關套件：stats、base
參考文獻：(依套件名稱排序)

R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL：http://www.R-project.org/.

範例B-2：機位種類的選擇和旅途距離相關性的研究

工商發達，跨國之間經常衍生出必要的生意往來，對於航空交通的需求也相當龐大。此外，出國旅遊更是成為國人每年必安排的行程。有鑑於此龐大的商機，某航空公司想對市場民眾的需求加以了解，在機場隨機調查了300名收入較高的旅客，將民眾購買飛機票的類型分為頭等艙、商務艙與經濟艙三種，旅行的類型分為國內與國外兩種，分析購買飛機票的種類是否會受到旅行的類型影響；資料記錄於表中。

表：旅行類型與購買機票類型之列聯表。

	頭等艙	商務艙	經濟艙
國內	50	49	63
國外	60	42	36

Q2：長途旅行中常常會使得人產生很嚴重的疲累感，因此在選擇搭乘交通工具時的舒適性就顯得非常重要。考量艙等舒適性，頭等艙優於商務艙優於經濟艙。航空公司為了能妥善的規劃飛機上不同艙等的座位數，想了解是否乘客選擇不同等級的艙等有受國內線或國外線的影響，即是想了解是否頭等艙旅客中為國外線的比例高於商務艙旅客中為國外線的比例，且商務艙旅客中為國外線的比例高於經濟艙旅客中為國外線的比例?
統計方法：此問題中有兩個變數，分別是購買機票的類型及旅行類型(兩個變數，不探討因果關係，建議可選擇分析方法中的卡方獨立性檢定(或費雪精確檢定)。但旅行類型為二分組的類別型變數，購買的機票依頭等艙、商務艙及經濟艙具有順序尺度的性質，因此可採用Cochran-Armitage趨勢檢定來分析，以強化檢定力。

解析：
1. 此題的虛無假設為 "座艙等級(頭等艙、商務艙、經濟艙)的選擇和國內線或國外線無關" ，即H₀：P_{國外線|頭等艙}=P_{國外線|商務艙}= P_{國外線|經濟艙}，對立假設為H_A：P_{國外線|頭等艙}>P_{國外線|商務艙}> P_{國外線|經濟艙}。
2. 以列聯表型態直接輸入資料或建立資料檔上傳，檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果：

Cochran-Armitage趨勢檢定 - 分析結果

分析方法：Cochran-Armitage趨勢檢定
資料名稱：範例B-2
變數名稱：旅行類型, 購買機票類型
顯著水準：0.05
計算時間：0.016秒

列聯表(旅行類型*購買機票類型)^I：

購買機票類型 合計
Total

1_頭等艙 2_商務艙 3_經濟艙
旅行類型 1_國內 5016.67
30.86
45.45 4916.33
30.25
53.85 6321.00
38.89
63.64 162
2_國外 6020.00
43.48
54.55 4214.00
30.43
46.15 3612.00
26.09
36.36 138
合計 Total 110 91 99 300

I：列聯表內容為觀察值個數 / 百分比 / 列百分比 / 行百分比

Cochran-Armitage趨勢檢定：

趨勢計分設定

購買機票類型　1_頭等艙　　2_商務艙　　3_經濟艙　

計分 1 2 3

虛無假設：兩變數間無相關

卡方檢定統計量
chi-square statistics 自由度
d.f. p-值^I
p-value

6.9231 1 0.0085089 **

I：顯著性代碼：‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1
分析結果建議：由於檢定結果P-值為(0.0085089) < 顯著水準0.05，因此可拒絕虛無假設。

[重新分析]

範例B-7：基因型與癲癇的研究

癲癇是常見的神經疾病之一，每一千人中大約有5~10人患有此疾病。研究發現有一基因與癲癇控制有關，此基因包含了數個單核苷酸多型性(single nucleotide polymorphism, SNP)，其中有三個單核苷酸多型性，已知其對應的遺傳模式分別為顯性、隱性及加成性模式。某醫師想了解此基因的這三個單核苷酸多型性之基因型與癲癇病症是否為“難治型”有相關，於是收集院內62位癲癇患者的基因型資料。表一至表三分別為三個單核苷酸多型性基因型及癲癇疾病型態的列聯表：

第一個SNP：SNP_1相對於A為顯性遺傳模式

難治型癲癇\SNP_1基因型	AA	Aa	aa	Total
否	7	9	12	28
是	12	11	11	34
Total	19	20	23	62

第二個SNP：SNP_2相對於A為隱性遺傳模式

難治型癲癇\SNP_2基因型	AA	Aa	aa	Total
否	8	8	12	28
是	14	9	11	34
Total	22	17	23	62

第三個SNP：SNP_3相對於A為加成遺傳模式

難治型癲癇\SNP_3基因型	AA	Aa	aa	Total
否	8	9	11	28
是	17	10	7	34
Total	25	19	18	62

Q1：癲癇病症中，有分為難治型與非難治型，醫師懷疑可能是基因造成此差別，於是利用三個單點核酸多型性研究基因型態與是否為難治型癲癇有關?
統計方法：此問題中有兩個變數，分別是單核苷酸多型性的基因型變數及癲癇病症的二分類(難治型及非難治型)變數。單核苷酸多型性的基因型有三類，分別為AA、Aa、aa，可依其已知的遺傳模式(顯性、隱性或加成性)將基因型變數歸為順序尺度型變數，採用Cochran-Armitage趨勢檢定，檢定"單核苷酸多型性的基因型與是否為難治型癲癇病症有相關?"。

解析：
1. 此題依三個單核苷酸多型性之遺傳模式不同，可建立虛無假設分別如下：

SNP_1: "顯性遺傳模式之基因型與是否為難治型癲癎無關"，即 H₀：P_{難治型癲癇|AA}=P_{難治型癲癇|Aa}= P_{難治型癲癇|aa}。
對立假設為 H_A：P_{難治型癲癇|AA}=P_{難治型癲癇|Aa}>P_{難治型癲癇|aa}或 H_A：P_{非難治型癲癇|AA}=P_{非難治型癲癇|Aa}>P_{非難治型癲癇|aa}。
SNP_2: "隱性遺傳模式之基因型與是否為難治型癲癎無關"，即 H₀：P_{難治型癲癇|AA}=P_{難治型癲癇|Aa}= P_{難治型癲癇|aa}。
對立假設為 H_A：P_{難治型癲癇|AA}>P_{難治型癲癇|Aa}=P_{難治型癲癇|aa}或 H_A：P_{非難治型癲癇|AA}>P_{非難治型癲癇|Aa}=P_{非難治型癲癇|aa}。
SNP_3: "加成遺傳模式之基因型與是否為難治型癲癎無關"，即 H₀：P_{難治型癲癇|AA}=P_{難治型癲癇|Aa}= P_{難治型癲癇|aa}。
對立假設為 H_A：P_{難治型癲癇|AA}>P_{難治型癲癇|Aa}>P_{難治型癲癇|aa}或 H_A：P_{非難治型癲癇|AA}>P_{非難治型癲癇|Aa}>P_{非難治型癲癇|aa}。

2. 以列聯表型態直接輸入資料或建立資料檔上傳，檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 趨勢計分設定預設值部分，AA、Aa、aa三種基因型所對應的預設值在顯性遺傳模式分別為1,1,0(A視為顯性，有A即為1)；在隱性遺傳模式為1,0,0(A視為隱性，有兩個A才為1)；而在加成遺傳模式為2,1,0(根據A的個數判定，一個A為1、兩個A為2)。
5. 分析結果：

Cochran-Armitage趨勢檢定 - 分析結果

分析方法：Cochran-Armitage趨勢檢定
資料名稱：範例B-7
變數名稱：難治型癲癇, SNP_1
顯著水準：0.05
計算時間：0.018秒
列聯表(難治型癲癇*SNP_1)^I：

SNP_1 合計
Total

AA Aa aa
難治型癲癇 否 711.29
25.00
36.84 914.52
32.14
45.00 1219.35
42.86
52.17 28
是 1219.35
35.29
63.16 1117.74
32.35
55.00 1117.74
32.35
47.83 34
合計 Total 19 20 23 62

I：列聯表內容為觀察值個數 / 百分比 / 列百分比 / 行百分比
Cochran-Armitage趨勢檢定：

趨勢計分設定

SNP_1 　AA　　Aa　　aa　

計分 1 1 0

虛無假設：兩變數間無相關

卡方檢定統計量
chi-square statistics 自由度
d.f. p-值^I
p-value

0.726 1 0.39417

I：顯著性代碼：‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1
分析結果建議：由於檢定結果P-值為(0.39417) > 顯著水準0.05，因此無法拒絕虛無假設。

Cochran-Armitage趨勢檢定 - 分析結果

分析方法：Cochran-Armitage趨勢檢定
資料名稱：範例B-7
變數名稱：難治型癲癇, SNP_2
顯著水準：0.05
計算時間：0.017秒
列聯表(難治型癲癇*SNP_2)^I：

SNP_2 合計
Total

AA Aa aa
難治型癲癇 否 812.90
28.57
36.36 812.90
28.57
47.06 1219.35
42.86
52.17 28
是 1422.58
41.18
63.64 914.52
26.47
52.94 1117.74
32.35
47.83 34
合計 Total 22 17 23 62

I：列聯表內容為觀察值個數 / 百分比 / 列百分比 / 行百分比
Cochran-Armitage趨勢檢定：

趨勢計分設定

SNP_2 　AA　　Aa　　aa　

計分 1 0 0

虛無假設：兩變數間無相關

卡方檢定統計量
chi-square statistics 自由度
d.f. p-值^I
p-value

1.0657 1 0.30192

I：顯著性代碼：‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1
分析結果建議：由於檢定結果P-值為(0.30192) > 顯著水準0.05，因此無法拒絕虛無假設。

Cochran-Armitage趨勢檢定 - 分析結果

分析方法：Cochran-Armitage趨勢檢定
資料名稱：範例B-7
變數名稱：難治型癲癇, SNP_3
顯著水準：0.05
計算時間：0.018秒
列聯表(難治型癲癇*SNP_3)^I：

SNP_3 合計
Total

AA Aa aa
難治型癲癇 否 812.90
28.57
32.00 914.52
32.14
47.37 1117.74
39.29
61.11 28
是 1727.42
50.00
68.00 1016.13
29.41
52.63 711.29
20.59
38.89 34
合計 Total 25 19 18 62

I：列聯表內容為觀察值個數 / 百分比 / 列百分比 / 行百分比
Cochran-Armitage趨勢檢定：

趨勢計分設定

SNP_3 　AA　　Aa　　aa　

計分 2 1 0

虛無假設：兩變數間無相關

卡方檢定統計量
chi-square statistics 自由度
d.f. p-值^I
p-value

3.6314 1 0.056698 #

I：顯著性代碼：‘***’ : < 0.001, ‘**’ : < 0.01, ‘*’ : < 0.05, ‘#’ : < 0.1
分析結果建議：由於檢定結果P-值為(0.056698) > 顯著水準0.05，因此無法拒絕虛無假設。

[重新分析]

影音教學內容為本系統資料處理與分析方法之操作說明，
可供使用者即時參考及線上自學，
輕鬆上手「R資料分析暨導引系統」!

		購買機票類型			合計 Total
		1_頭等艙	2_商務艙	3_經濟艙	合計 Total
旅行類型	1_國內	5016.67 30.86 45.45	4916.33 30.25 53.85	6321.00 38.89 63.64	162
旅行類型	2_國外	6020.00 43.48 54.55	4214.00 30.43 46.15	3612.00 26.09 36.36	138
合計 Total		110	91	99	300

趨勢計分設定
購買機票類型	1_頭等艙	2_商務艙	3_經濟艙
計分	1	2	3

虛無假設：兩變數間無相關
卡方檢定統計量 chi-square statistics	自由度 d.f.	p-值^I p-value
6.9231	1	0.0085089 **

		SNP_1			合計 Total
		AA	Aa	aa	合計 Total
難治型癲癇	否	711.29 25.00 36.84	914.52 32.14 45.00	1219.35 42.86 52.17	28
難治型癲癇	是	1219.35 35.29 63.16	1117.74 32.35 55.00	1117.74 32.35 47.83	34
合計 Total		19	20	23	62

		SNP_2			合計 Total
		AA	Aa	aa	合計 Total
難治型癲癇	否	812.90 28.57 36.36	812.90 28.57 47.06	1219.35 42.86 52.17	28
難治型癲癇	是	1422.58 41.18 63.64	914.52 26.47 52.94	1117.74 32.35 47.83	34
合計 Total		22	17	23	62

		SNP_3			合計 Total
		AA	Aa	aa	合計 Total
難治型癲癇	否	812.90 28.57 32.00	914.52 32.14 47.37	1117.74 39.29 61.11	28
難治型癲癇	是	1727.42 50.00 68.00	1016.13 29.41 52.63	711.29 20.59 38.89	34
合計 Total		25	19	18	62