首頁
» 分析方法 » Cox比例風險模式
使用本分析方法必須先定義個案的"時間變數值",其表示個案在存活研究中從進入研究開始觀察一直到死亡或研究結束的時間距離。另外也必須定義"事件變數值"用來表示觀察時間是否為存活時間的指標(即設限指標)。若"是"的話,事件變數值定義"1",否則為"0",通常事件變數值為"1"時,又稱為一個事件,"0"時稱為設限。例如,一個癌症病人的研究,某病人於2001年2月初進入癌症研究,此研究於2006年7月初結束時此病人仍然存活,則此人的時間變數值即為65個月,事件變數值為0。若此人不幸於2003年7月初死亡,此人的時間變數值為29個月,事件變數值為1。
Cox比例風險模式是由英國統計學家考克斯(David Cox)爵士於1972年所提出,為存活分析中最常用的一種迴歸分析模型,此方法常簡稱為Cox model或是proportional hazard model。當存活資料中另有共變數(covariates)(或稱為解釋變數(explanatory variables)、風險因子(risk factors)) 時,Cox model可用來推估這些共變數對存活時間的影響,也可用來預測特定時間的存活機會。
存活分析也可以用來分析一般"事件發生時間(time-to-event)" 的資料。例如,公司破產的時間,或同一疾病復發的時間,等。
本方法使用之R相關套件與參考文獻:
相關套件:stats、base、survival、MASS
參考文獻:(依套件名稱排序)
Cox比例風險模式是由英國統計學家考克斯(David Cox)爵士於1972年所提出,為存活分析中最常用的一種迴歸分析模型,此方法常簡稱為Cox model或是proportional hazard model。當存活資料中另有共變數(covariates)(或稱為解釋變數(explanatory variables)、風險因子(risk factors)) 時,Cox model可用來推估這些共變數對存活時間的影響,也可用來預測特定時間的存活機會。
存活分析也可以用來分析一般"事件發生時間(time-to-event)" 的資料。例如,公司破產的時間,或同一疾病復發的時間,等。
本方法使用之R相關套件與參考文獻:
相關套件:stats、base、survival、MASS
參考文獻:(依套件名稱排序)
- R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
- Therneau T (2013). _A Package for Survival Analysis in S_. R package version 2.37-4. URL: http://CRAN.R-project.org/package=survival
- Venables, W. N. & Ripley, B. D. (2002) Modern Applied Statistics with S. Fourth Edition. Springer, New York. ISBN 0-387-95457-0
範例E-1:抽煙有害健康
隨著醫療科技的進步,最威脅人類生命的疾病已經從幾十年前的傳染病改變成癌症,癌症可以說是現代人的文明病,許多的癌症發生都與現代人的生活習慣有關,如口腔癌的發生有很大的機率與嚼食檳榔有關;而肺癌則與吸菸的習關有很大的關聯。依行政院衛生署所公佈的統計數據顯示因癌症死亡佔所有死亡人數的28.1%,連續28年為台灣十大死因榜首,在這麼多的癌症中,肺癌則是死亡人數最高的。因此對於癌症的治療,可以說是醫學研究中最不遺餘力的事,某醫學機構針對肺癌做了一個長期性的追蹤研究,歷時5年,共收集了80個患有肺癌的病人的資料,資料中記錄病患的性別、年齡等基本資料,以及抽菸習慣,手術及治療方式,並記載進入與離開追蹤研究的時間,詳細說明見表及註。
表:受測市民健康資料
註一: 0表女性、1表男性
註二: 0表未吸菸、1表吸菸
註三: 0表未接受手術治療、1表接受手術治療
註四: 1表化學治療、2表放射治療、3表兩者同時
註五: 以月份為單位,1代表進入研究1個月,60代表進入研究5年
註六: 0表存活、1表死亡
Q4:在討論影響疾病患者存活機率時,影響的因素通常不是唯一,且不是單獨的影響,若想同時了解不同性別、吸菸與否及年齡等因素對於肺癌病患存活率的影響,該如何分析較佳?
問題解析:此處想同時了解不同性別、吸菸與否及年齡等因素對於肺癌病患存活率的影響,可利用存活分析中的Cox比例風險模式來分析,將性別、吸菸與否及年齡等三個變數當作共變數,即可同時討論多個影響因素對於存活率的影響,分析"性別、吸菸與否及年齡是否會影響肺癌病患的存活函數?"。
統計方法:此問題中有五個變數,分別是追蹤研究時間(時間變數)、最後追蹤的狀態(事件變數)、性別(共變數)、吸菸(共變數)及年齡(共變數)。此範例中想同時了解不同性別、吸菸與否及年齡等三個因素對於肺癌存活率的影響,建議選擇存活分析,有三個共變數(類別與連續皆可),可採用分析方法:Cox比例風險模型(Cox proportional hazards model),分析"性別、吸菸與否及年齡是否會影響肺癌病患的存活函數?"。
解析:
1. 此題可利用Cox比例風險模型探討性別、吸菸及年齡等因素對於肺癌存活率的影響。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果:[重新分析]
隨著醫療科技的進步,最威脅人類生命的疾病已經從幾十年前的傳染病改變成癌症,癌症可以說是現代人的文明病,許多的癌症發生都與現代人的生活習慣有關,如口腔癌的發生有很大的機率與嚼食檳榔有關;而肺癌則與吸菸的習關有很大的關聯。依行政院衛生署所公佈的統計數據顯示因癌症死亡佔所有死亡人數的28.1%,連續28年為台灣十大死因榜首,在這麼多的癌症中,肺癌則是死亡人數最高的。因此對於癌症的治療,可以說是醫學研究中最不遺餘力的事,某醫學機構針對肺癌做了一個長期性的追蹤研究,歷時5年,共收集了80個患有肺癌的病人的資料,資料中記錄病患的性別、年齡等基本資料,以及抽菸習慣,手術及治療方式,並記載進入與離開追蹤研究的時間,詳細說明見表及註。
表:受測市民健康資料
病患編號 | 1 | 2 | 3 | ... | 79 | 80 |
性別(註一) | 0 | 1 | 0 | ... | 1 | 0 |
年齡 | 40 | 48 | 39 | ... | 55 | 46 |
是否吸菸(註二) | 0 | 1 | 1 | ... | 0 | 1 |
是否接受手術治療(註三) | 0 | 1 | 1 | ... | 1 | 1 |
後續治療方式(註四) | 1 | 2 | 2 | ... | 2 | 3 |
追蹤研究時間(註五) | 19 | 50 | 27 | ... | 38 | 42 |
最後追蹤的狀態(註六) | 0 | 1 | 0 | ... | 0 | 1 |
註二: 0表未吸菸、1表吸菸
註三: 0表未接受手術治療、1表接受手術治療
註四: 1表化學治療、2表放射治療、3表兩者同時
註五: 以月份為單位,1代表進入研究1個月,60代表進入研究5年
註六: 0表存活、1表死亡
Q4:在討論影響疾病患者存活機率時,影響的因素通常不是唯一,且不是單獨的影響,若想同時了解不同性別、吸菸與否及年齡等因素對於肺癌病患存活率的影響,該如何分析較佳?
問題解析:此處想同時了解不同性別、吸菸與否及年齡等因素對於肺癌病患存活率的影響,可利用存活分析中的Cox比例風險模式來分析,將性別、吸菸與否及年齡等三個變數當作共變數,即可同時討論多個影響因素對於存活率的影響,分析"性別、吸菸與否及年齡是否會影響肺癌病患的存活函數?"。
統計方法:此問題中有五個變數,分別是追蹤研究時間(時間變數)、最後追蹤的狀態(事件變數)、性別(共變數)、吸菸(共變數)及年齡(共變數)。此範例中想同時了解不同性別、吸菸與否及年齡等三個因素對於肺癌存活率的影響,建議選擇存活分析,有三個共變數(類別與連續皆可),可採用分析方法:Cox比例風險模型(Cox proportional hazards model),分析"性別、吸菸與否及年齡是否會影響肺癌病患的存活函數?"。
解析:
1. 此題可利用Cox比例風險模型探討性別、吸菸及年齡等因素對於肺癌存活率的影響。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果:
範例E-2:飲食的重要
國人十大死因中有一些疾病是較不為人所熟知,但卻已經對於生命有一定的威脅性,其中第七名的腎臟病即是如此,腎臟病的種類繁多,而且容易因其他疾病而引起腎臟的病變,如糖尿病及高血壓患者皆易發生。腎臟是人體內非常重要的器官,主要的功能是調節身體內的水份,且會分泌紅血球生成素及一些重要物質,當腎臟一旦受損,對於身體的健康影響巨大,也會影響到正常生活。而現代人的飲食習慣造成了腎臟巨大的負荷,進而罹患了腎臟的疾病,因此良好的飲食習慣及飲食內容是分常重要的。大部份的長期腎臟病治療方法為透析治療或是腎臟移植,由於器官的取得不易且費用昂貴,大部份的病患會選擇透析治療,透析治療又分為兩種,一種是血液透析治療,另一種稱為腹膜透析治療。這兩種治療方法各有其優點與缺點,對於不同狀況的病人,醫生可能會採取不同的透析方法,因此哪一種方法的醫療效果較佳就成為研究人員非常關心的議題。有一組醫療研究人員觀察醫院近十年的腎臟病洗腎患者進行透析治療的結果,詳細的記錄了洗腎病患的資料,共有80位洗腎病患,詳細說明見表及註。
表:受測市民健康資料
註一:0表女性、1表男性
註二: 1表血液透析治療、2表腹膜透析治療
註三: 該病患於研究中追蹤之時間長度(單位:月)
註四: 0表存活(或設限)、1表死亡
Q3:在討論影響疾病患者存活機率時,影響的因素通常不是唯一,且不是單獨的影響,若想同時了解性別、年齡及透析治療方法等因素對於洗腎病患存活率的影響,適合用何種方法?
問題解析:此處想同時了解性別、年齡及透析治療方法等因素對於洗腎病患存活率的影響,可利用存活分析中的Cox比例風險模式來分析,將性別、年齡及透析治療方法等三個變數當作共變數,即可同時討論多個影響因素對於存活率的影響,分析"性別、年齡即透析治療方法是否會影響洗腎病患的存活函數?"。
統計方法:此問題中有五個變數,分別是最追蹤研究時間(時間變數)、最後追蹤的狀態(事件變數)、性別(共變數)、年齡(共變數)及透析治療方法(共變數)。此範例中想同時了解不同性別、年齡以及透析治療方法等三個因素對於洗腎病患存活率的影響,建議選擇存活分析,有三個共變數(類別與連續皆可),可採用分析方法:Cox比例風險模型(Cox proportional hazards model),分析"性別、年齡即透析治療方法是否會影響洗腎病患的存活函數?"。
解析:
1. 此題可利用Cox比例風險模型探討性別、年齡及透析治療方法等因素對於洗腎病患存活率的影響。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果:[重新分析]
國人十大死因中有一些疾病是較不為人所熟知,但卻已經對於生命有一定的威脅性,其中第七名的腎臟病即是如此,腎臟病的種類繁多,而且容易因其他疾病而引起腎臟的病變,如糖尿病及高血壓患者皆易發生。腎臟是人體內非常重要的器官,主要的功能是調節身體內的水份,且會分泌紅血球生成素及一些重要物質,當腎臟一旦受損,對於身體的健康影響巨大,也會影響到正常生活。而現代人的飲食習慣造成了腎臟巨大的負荷,進而罹患了腎臟的疾病,因此良好的飲食習慣及飲食內容是分常重要的。大部份的長期腎臟病治療方法為透析治療或是腎臟移植,由於器官的取得不易且費用昂貴,大部份的病患會選擇透析治療,透析治療又分為兩種,一種是血液透析治療,另一種稱為腹膜透析治療。這兩種治療方法各有其優點與缺點,對於不同狀況的病人,醫生可能會採取不同的透析方法,因此哪一種方法的醫療效果較佳就成為研究人員非常關心的議題。有一組醫療研究人員觀察醫院近十年的腎臟病洗腎患者進行透析治療的結果,詳細的記錄了洗腎病患的資料,共有80位洗腎病患,詳細說明見表及註。
表:受測市民健康資料
病患編號 | 1 | 2 | 3 | ... | 79 | 80 |
性別(註一) | 0 | 1 | 0 | ... | 1 | 0 |
年齡 | 40 | 48 | 39 | ... | 55 | 46 |
透析治療方式(註二) | 2 | 1 | 2 | ... | 1 | 1 |
追蹤研究時間(註三) | 32 | 15 | 65 | ... | 72 | 30 |
最後追蹤的狀態(註四) | 0 | 0 | 1 | ... | 0 | 1 |
註二: 1表血液透析治療、2表腹膜透析治療
註三: 該病患於研究中追蹤之時間長度(單位:月)
註四: 0表存活(或設限)、1表死亡
Q3:在討論影響疾病患者存活機率時,影響的因素通常不是唯一,且不是單獨的影響,若想同時了解性別、年齡及透析治療方法等因素對於洗腎病患存活率的影響,適合用何種方法?
問題解析:此處想同時了解性別、年齡及透析治療方法等因素對於洗腎病患存活率的影響,可利用存活分析中的Cox比例風險模式來分析,將性別、年齡及透析治療方法等三個變數當作共變數,即可同時討論多個影響因素對於存活率的影響,分析"性別、年齡即透析治療方法是否會影響洗腎病患的存活函數?"。
統計方法:此問題中有五個變數,分別是最追蹤研究時間(時間變數)、最後追蹤的狀態(事件變數)、性別(共變數)、年齡(共變數)及透析治療方法(共變數)。此範例中想同時了解不同性別、年齡以及透析治療方法等三個因素對於洗腎病患存活率的影響,建議選擇存活分析,有三個共變數(類別與連續皆可),可採用分析方法:Cox比例風險模型(Cox proportional hazards model),分析"性別、年齡即透析治療方法是否會影響洗腎病患的存活函數?"。
解析:
1. 此題可利用Cox比例風險模型探討性別、年齡及透析治療方法等因素對於洗腎病患存活率的影響。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果: