首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » 兩個(含)以上存活函數的比較

兩個(含)以上存活函數的比較
Comparison for two or more survival functions
使用本分析方法必須先定義個案的"時間變數值",其表示個案在存活研究中從進入研究開始觀察一直到死亡或研究結束的時間距離。另外也必須定義"事件變數值"用來表示觀察時間是否為存活時間的指標(即設限指標)。若"是"的話,事件變數值定義"1",否則為"0",通常事件變數值為"1"時,又稱為一個事件,"0"時稱為設限。例如,一個癌症病人的研究,某病人於2001年2月初進入癌症研究,此研究於2006年7月初結束時此病人仍然存活,則此人的時間變數值即為65個月,事件變數值為0。若此人不幸於2003年7月初死亡,此人的時間變數值為29個月,事件變數值為1。

當資料中包含兩組(含)以上存活資料時,可用此方法比較存活函數間的差異。一般較常用的方法為對數-等級檢定(log-rank test) ,存活函數的比較是由美國知名統計學家Nathan Mantel(1919–2002)所提出, 並由英國學者Richard Peto與Julian Peto夫婦命名。此檢定方法有多個名稱,有時也被稱為Cox-Mantel檢定、Mantel-Haenszel檢定,或是Peto-Mantel-Haenszel檢定。檢定兩組(含)以上的存活函數是否相同並非只有這個方法。進階選項中亦提供其他可用的檢定方法:
1. Wilcoxon檢定:當兩組(含)以上的存活函數在前段的差異較大時,建議使用。此方法又稱為Gehan-Breslow檢定或是Gehan檢定。
2. Peto-Wilcoxon檢定:當兩組(含)以上的存活函數在後段的差異較大時,建議使用。

存活分析也可以用來分析一般"事件發生時間(time-to-event)"的資料。例如,公司破產的時間,或同一疾病復發的時間,等。

本方法使用之R相關套件與參考文獻:
相關套件:stats、base、survival
參考文獻:(依套件名稱排序)
  1. R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
  2. Therneau T (2013). _A Package for Survival Analysis in S_. R package version 2.37-4. URL: http://CRAN.R-project.org/package=survival
範例E-1:抽煙有害健康

隨著醫療科技的進步,最威脅人類生命的疾病已經從幾十年前的傳染病改變成癌症,癌症可以說是現代人的文明病,許多的癌症發生都與現代人的生活習慣有關,如口腔癌的發生有很大的機率與嚼食檳榔有關;而肺癌則與吸菸的習關有很大的關聯。依行政院衛生署所公佈的統計數據顯示因癌症死亡佔所有死亡人數的28.1%,連續28年為台灣十大死因榜首,在這麼多的癌症中,肺癌則是死亡人數最高的。因此對於癌症的治療,可以說是醫學研究中最不遺餘力的事,某醫學機構針對肺癌做了一個長期性的追蹤研究,歷時5年,共收集了80個患有肺癌的病人的資料,資料中記錄病患的性別、年齡等基本資料,以及抽菸習慣,手術及治療方式,並記載進入與離開追蹤研究的時間,詳細說明見表及註。

表:受測市民健康資料
病患編號 1 2 3 ... 79 80
性別(註一) 0 1 0 ... 1 0
年齡 40 48 39 ... 55 46
是否吸菸(註二) 0 1 1 ... 0 1
是否接受手術治療(註三) 0 1 1 ... 1 1
後續治療方式(註四) 1 2 2 ... 2 3
追蹤研究時間(註五) 19 50 27 ... 38 42
最後追蹤的狀態(註六) 0 1 0 ... 0 1
註一: 0表女性、1表男性
註二: 0表未吸菸、1表吸菸
註三: 0表未接受手術治療、1表接受手術治療
註四: 1表化學治療、2表放射治療、3表兩者同時
註五: 以月份為單位,1代表進入研究1個月,60代表進入研究5年
註六: 0表存活、1表死亡

Q3:吸菸有害健康,由其對於肺部疾病的影響甚鉅,這組肺癌病患是否反映出此種情況呢?吸菸與不吸菸的病患存活函數有差異嗎?
問題解析:此處想了解吸菸與否對於病患的存活率是否有影響,並分析存活函數的差異,在資料中暸解兩個重要變數,一為時間變數:病人在研究中的停留的時間,一為事件變數:病人在研究中的狀態(死亡或者發病),再加入吸菸與否的變數為分組變數,此分組資料即可使用存活分析討論"吸菸與否的存活函數是否有差異?"。
統計方法:此問題中有三個變數,分別是追蹤研究時間(時間變數)、最後追蹤的狀態(事件變數)與吸菸與否(分組變數)。此範例中想了解吸菸與否的肺癌病患的存活函數的差異,建議選擇存活分析。吸菸與否為類別型共變數,將資料區分為兩組,且需檢定兩組存活函數的差異,可採用分析方法:兩個(含)以上存活函數的比較(comparison for two or more survival functions),檢定"吸菸與否的存活函數是否有差異?"。

解析:
1. 此題可利用兩組(含以上)存活函數比較探討吸菸與不吸菸的病患存活函數的差異。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果:
兩個(含)以上存活函數的比較 - 分析結果
  • 分析方法:兩個(含)以上存活函數的比較
  • 資料名稱:範例E-1
  • 時間變數:時間
  • 事件變數:事件 (設限指標:0)
  • 分組變數:是否抽菸 (0, 1)
  • 計算時間:0.802秒

  • 設限與事件的個數摘要I
    分組變數
    (是否抽菸)
    觀察值個數
    No. of subjects
    事件
    Event
    設限
    Censored
    058751
    122913
    I:設限與事件的個數摘要皆不包含遺失值

  • 存活函數比較:
    虛無假設:各存活函數間無顯著差異
    檢定方法
    method
    檢定統計量
    statistics
    自由度
    d.f.
    p-值
    p-value
    Log-Rank檢定7.604110.0058
    Wilcoxon檢定9.553310.002
    Peto-Wilcoxon檢定8.445110.0037

  • 存活函數估計表:
    分組變數
    (是否抽菸)
    時間
    time
    涉險人數
    no. at risk
    事件人數
    no. of event
    K-M 存活率估計
    K-M survival
    標準差
    std. err
    95 % 信賴區間
    95 % C.I.
    下界
    lower
    上界
    upper
    0334910.97960.02020.94081
    433810.95380.03220.89281
    503110.9230.04340.84181
    532810.89010.05290.79221
    552520.81890.06860.69490.9649
    572210.78170.07490.64780.9431
    1252110.95240.04650.86551
    371810.89950.06760.77631
    381720.79370.09220.63210.9966
    421510.74070.10010.56840.9653
    441410.68780.1060.50850.9304
    471310.63490.11030.45170.8924
    501010.57140.11610.38370.8509
    55810.50.12160.31040.8053

  • 存活函數圖:

  • 累積事件圖:

  • 累積風險圖:

  • 對數風險圖:

[重新分析]
範例E-2:飲食的重要

國人十大死因中有一些疾病是較不為人所熟知,但卻已經對於生命有一定的威脅性,其中第七名的腎臟病即是如此,腎臟病的種類繁多,而且容易因其他疾病而引起腎臟的病變,如糖尿病及高血壓患者皆易發生。腎臟是人體內非常重要的器官,主要的功能是調節身體內的水份,且會分泌紅血球生成素及一些重要物質,當腎臟一旦受損,對於身體的健康影響巨大,也會影響到正常生活。而現代人的飲食習慣造成了腎臟巨大的負荷,進而罹患了腎臟的疾病,因此良好的飲食習慣及飲食內容是分常重要的。大部份的長期腎臟病治療方法為透析治療或是腎臟移植,由於器官的取得不易且費用昂貴,大部份的病患會選擇透析治療,透析治療又分為兩種,一種是血液透析治療,另一種稱為腹膜透析治療。這兩種治療方法各有其優點與缺點,對於不同狀況的病人,醫生可能會採取不同的透析方法,因此哪一種方法的醫療效果較佳就成為研究人員非常關心的議題。有一組醫療研究人員觀察醫院近十年的腎臟病洗腎患者進行透析治療的結果,詳細的記錄了洗腎病患的資料,共有80位洗腎病患,詳細說明見表及註。

表:受測市民健康資料
病患編號 1 2 3 ... 79 80
性別(註一) 0 1 0 ... 1 0
年齡 40 48 39 ... 55 46
透析治療方式(註二) 2 1 2 ... 1 1
追蹤研究時間(註三) 32 15 65 ... 72 30
最後追蹤的狀態(註四) 0 0 1 ... 0 1
註一:0表女性、1表男性
註二: 1表血液透析治療、2表腹膜透析治療
註三: 該病患於研究中追蹤之時間長度(單位:月)
註四: 0表存活(或設限)、1表死亡

Q2:在洗腎病患的透析治療中,不同的治療其結果可能不同,故研究人員想了解在此組資料下兩種治療方法下的存活函數會有差異嗎?
問題解析:此處想了解不同的治療方法對於病患的存活率是否有影響,並分析存活函數的差異,在資料中暸解兩個重要變數,一為時間變數:病人在研究中的停留的時間,一為事件變數:病人在研究中的狀態(死亡或者發病),再加上不同透析治療方法的變數為分組變數,此分組資料即可使用存活分析討論"不同透析治療方法下的存活函數是否有差異?"。
統計方法:此問題中有三個變數,分別是最追蹤研究時間(時間變數)、最後追蹤的狀態(事件變數)及透析治療方法(共變數)。 此範例中想了解不同透析治療方法對於洗腎病患的存活是否有影響,建議選擇存活分析。透析治療方法為類別型共變數,將資料區分為兩組,並需檢定兩組存活函數的差異,可採用分析方法:兩個(含)以上存活函數的比較(comparison for two or more survival functions),檢定"不同透析治療方法下的存活函數是否有差異?"。

解析:
1. 此題可利用兩個(含)以上存活函數的比較探討不同透析治療方法的存活函數是否有差異。
2. 建立資料檔上傳,檔案格式請參照上傳檔案說明。
3. 依分析步驟說明分析資料。
4. 分析結果:
兩個(含)以上存活函數的比較 - 分析結果
  • 分析方法:兩個(含)以上存活函數的比較
  • 資料名稱:範例E-2
  • 時間變數:時間
  • 事件變數:事件 (設限指標:0)
  • 分組變數:治療方式 (1, 2)
  • 計算時間:0.805秒

  • 設限與事件的個數摘要I
    分組變數
    (治療方式)
    觀察值個數
    No. of subjects
    事件
    Event
    設限
    Censored
    1411427
    2391425
    I:設限與事件的個數摘要皆不包含遺失值

  • 存活函數比較:
    虛無假設:各存活函數間無顯著差異
    檢定方法
    method
    檢定統計量
    statistics
    自由度
    d.f.
    p-值
    p-value
    Log-Rank檢定0.193710.6598
    Wilcoxon檢定0.079410.778
    Peto-Wilcoxon檢定0.10110.7506

  • 存活函數估計表:
    分組變數
    (治療方式)
    時間
    time
    涉險人數
    no. at risk
    事件人數
    no. of event
    K-M 存活率估計
    K-M survival
    標準差
    std. err
    95 % 信賴區間
    95 % C.I.
    下界
    lower
    上界
    upper
    1303910.97440.02530.9261
    363710.9480.03580.88041
    423510.92090.04380.83891
    503210.89220.0510.79750.998
    552910.86140.05780.75520.9825
    572710.82950.06390.71330.9646
    592410.79490.06990.6690.9445
    612110.75710.07620.62160.9221
    642010.71920.08120.57640.8974
    661810.67930.0860.530.8705
    801410.63070.09250.47310.8408
    861010.56770.10250.39840.8088
    99510.45410.13050.25850.7977
    110210.22710.17330.05091
    2143810.97370.0260.92411
    233510.94590.03730.87561
    423010.91430.04750.82581
    492810.88170.05590.77860.9984
    502710.8490.06270.73470.9812
    602510.81510.06880.69090.9616
    612410.78110.07380.64910.94
    652210.74560.07850.60650.9165
    662110.71010.08240.56560.8915
    672010.67460.08560.5260.8651
    681810.63710.08870.4850.8369
    82810.55750.10760.38190.8137
    84610.46460.12340.2760.7819
    113110NaNNANA

  • 存活函數圖:

  • 累積事件圖:

  • 累積風險圖:

  • 對數風險圖:

[重新分析]
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「R資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為: