評估科克斯比例風險模式 (Cox s proporonal hazard model) 之等比風險假設的方法 生統所李采娟教授 此篇文章介紹兩種方式評估科克斯比例風險模式 (Cox s proporonal hazard model) 的等比風險假設, 此兩種方式分別為畫圖和使用時間相依 (me-dependen) 的變項 並以一個虛擬的資料, 說明 SAS 統計程式撰寫 背景科克斯比例 (Cox s proporonal) 模式的方程式以式 () 表示, 其中 h (, ) 為一個人在特定的一組自變項 ( 以 表示 ) 下, 於時間點 的風險, (,,..., p) 為自變項矩陣 h, ) h ( ) e ( P () 此方程式說明時間點 的風險是兩個項的相乘積, 第一項是 h ( ), 被稱為起始風 險函數, 此項和時間 有關, 但和自變項無關 我們不需事先知道 h ( ) 這個起始 風險函數, 也不要求它服從特定的機率分佈, 因此它有無母數的特性 第二項為 p 個自變項與迴歸係數相乘積 的線性加總後再指數化, 此項和自變項 有 關, 但和時間 無關, 亦就是 獨立於時間, 這些自變項可以是連續變項 類別變項或是有次序的變項, 他們有母數的特性 因此, 科克斯比例風險模式又被稱為半母數模式 (sem-paramerc model) 這個方程式有一重要特性: 等比風險假設 下列將介紹兩種不同檢查等比風險假設的方法. 畫圖方式 * * * * 當我們比較兩組的自變項, 這兩組的自變項以 (,,..., P ) 和 (,,..., p) 來表示, 等比風險的假設可以式 () 表示 ˆ * h (, ) 在任何時間 下, hˆ (, ) rˆ (), 即兩組特定自變項風險比值在任何時間點皆為常數 rˆ, 這代表任何人的風險和其他人風險成比例, 即 ˆ h (, ) rˆ hˆ (, ) 若 S ( ) 和 S ( ) 分別為 * 和 這兩組特定自變項的存活方程式, 而 * 相對 p 於 的風險比為 r,r 為 ˆ * exp[ ( )], 在這假設下, 則此兩存活方程式的 關係可用式 (3) 表示
S ( ) exp[ {exp[ u,) du] exp[ u,) du]} r r S ( )] r u,) du] exp[ r u,) du] (3), 若將式 (3) 取自然對數, 則式 (3) 成為式 (4), log S( ) r log S( ) (4) 對式 (3) 存活函數取自然對數後為負值, 負值無法取自然對數, 因此需乘上 - 後再取自然對數 因此, 將式 (4) 乘上 - 後再取自然對數, 式 (4) 則成式 (5) log[ log S( )] log( r) log[ log S( )] (5) 式 (5) 顯示兩組不同的自變項的 log[ log S ( )] 和 log[ log S ( )] 將平行 以最簡單 的情況, S ( ) 和 S ( ) 分別代表某變項兩個類別下之存活方程式, 將 log[ log Sˆ( )] 當 Y 軸, log( ) 為 軸, 依照此變項類別分層所畫出來的圖若平行, 則表示等比 風險假設成立. 使用時間相依變項 使用時間相依變項評估等比風險假設的策略有三種, 第一種策略為每次評估 一個自變項 ; 第二種策略為同時評估多個自變項 ; 第三種則為在調整多個共變數 後評估一個自變項 包含一個時間相依變項科克斯比例風險模式的方程式可用式 (6) 表示, ) h ( ) exp[ * g( )] g () 函數有三種可能性, 一為 g( ) ; 二為 g( ) log ; 三為 g ( ) 當, 而 g ( ) 當 <, 此種方式將時間切為兩個時間間隔 若 g( ), 評估一 個二項類別自變項 的等比風險假設相當於檢定式 (6) 中的 是否等於零, 可使 (6) 用華德統計量 (Wald sasc) 或概似比值統計量 (lkelhood rao sasc) 若 不等 於零, 則 的迴歸係數隨著時間點改變, 在任何時間點, 為 相對於 為 的風險比將不會成常數, 而會隨著時間變動, 此則違反了在任何時間 若同時檢 定數個變項, 式 (6) 則將延展為式 (7), 評估多個自變項 的等比風險假設相當於 檢定式 (7) 中所有的 是否同時等於零, 可使用概似比值統計量 p, ) h ( ) exp[ * g ( )] 若在調整多個共變數後評估一個自變項等比風險時, 則科克斯比例風險模式 * 可用式 (8) 呈現, 等比風險假設相當於檢定式 (8) 中的 是否等於零, 可使用華德 (7)
統計量 (Wald sasc) 或概似比值統計量 (lkelhood rao sasc) p * * * *, ) h ( ) exp [ * g ( )] 資料庫的描述 接下來將以一個肺癌臨床試驗的資料作為例子, 說明如何利用 SAS 統計軟 體執行上述方法, 以檢查科克斯比例風險模式的假設前提 此資料包含治療方法 (TREAT) 性別 (GENDER) 存活時間 (TIME) 和設限 (CENSOR), 治療方法有兩 種, 一為標準治療方式 ( 譯碼 ), 另一為新藥 ( 譯碼 ); 性別有男生 ( 譯碼 ) 和女 生 ( 譯碼 ) 兩個類別 ; 存活時間為一個連續變數, 單位為天數 ; 設限有兩種情況, 一為發生事件 ( 譯碼 ), 另一為設限 ( 譯碼 ) 此資料共有 68 筆, 為讓讀者瞭解 資料性質, 以下列出此分析資料的前 筆 Obs ID TREAT TIME CENSOR GENDER 88 6 3 3 7 4 4 44 5 5 55 6 6 3 7 7 459 8 8 96 9 9 9 44 449 659 3 3 4 4 53 5 5 5 6 6 6 7 7 87 8 8 89 9 9 44 37 SAS 程式及輸出報表的描述 以下的程式將依照前面所介紹的兩種方法檢查科克斯比例風險模式之等比 風險的假設, 先說明畫圖方式的 SAS 程式, 再介紹以時間相依變項檢查等比風 險的假設, 此方式包含三種策略及三種時間函數 接下來依照程式的順序, 擷取 每個程式最重要的結果 執行以畫圖方式檢查等比風險假設的 SAS 程式 symbol c=black l= w=; symbol c=red l= w=; proc lfees daa=lc_cancer plos=(lls)nocensplo; me me*censor(); sraa rea; < 部分報表省略 > (8) 3
Log Negave Log SDF Tes of Equaly over Sraa Pr > Tes Ch-Square DF Ch-Square Log-Rank 6.7979.9 Wlcoxon 9.468. -Log(LR) 7.867.5 - -4-6 3 4 5 6 7 8 Log of TIME STRATA: TREAT= TREAT= 圖一 : 檢查等比風險假設的 log[ log Sˆ( )] 相對於 log( ) 的圖形 執行以時間相依變項檢查等比風險假設的 SAS 程式 單獨檢查一個變項, 時間函數為 proc phreg daa=lc_cancer; model me*censor()=rea reame; reame=rea*me; 單獨檢查一個變項, 時間函數為 log proc phreg daa=lc_cancer; model me*censor()=rea reame; reame=rea*log(me); 單獨檢查一個變項, 時間函數為兩個時間區間 proc phreg daa=lc_cancer; model me*censor()=rea reame; reame=rea*(me>8); 同時檢查兩個變項, 時間函數為 proc phreg daa=lc_cancer; model me*censor()=rea gender reame sexme; reame=rea*me; sexme=gender*me; proporonaly_es: es reame, sexme; 4
同時檢查兩個變項, 時間函數為 log proc phreg daa=lc_cancer; model me*censor()=rea gender reame sexme; reame=rea*log(me); sexme=gender*log(me) proporonaly_es: es reame, sexme; 同時檢查兩個變項, 時間函數為兩個時間區間 proc phreg daa=lc_cancer; model me*censor()=rea gender reame sexme; reame=rea*(me>8); sexme=gender*(me>8); proporonaly_es: es reame, sexme; 調整一個共變數後, 單獨檢查一個變項, 時間函數為 proc phreg daa=lc_cancer; model me*censor()=rea gender reame; reame=rea*me; 調整一個共變數後, 單獨檢查一個變項, 時間函數為 log proc phreg daa=lc_cancer; model me*censor()=rea gender reame; reame=rea*log(me); 調整一個共變數後, 單獨檢查一個變項, 時間函數為兩個時間區間 proc phreg daa=lc_cancer; model me*censor()=rea gender reame; reame=rea*(me>8); 執行以時間相依變項檢查等比風險假設的 SAS 輸出報表 單獨檢查一個變項, 時間函數為 Analyss of Maxmum Lkelhood Esmaes Parameer Sandard Hazard Parameer DF Esmae Error Ch-Square Pr > ChSq Rao TREAT -.4946.467.459.7.6 reame.7.7474 5.976.6. 單獨檢查一個變項, 時間函數為 log Analyss of Maxmum Lkelhood Esmaes Parameer Sandard Hazard Parameer DF Esmae Error Ch-Square Pr > ChSq Rao TREAT -.699.39593.468.6.537 reame.8448.836.95.33.88 單獨檢查一個變項, 時間函數為兩個時間區間 Analyss of Maxmum Lkelhood Esmaes Parameer Sandard Hazard Parameer DF Esmae Error Ch-Square Pr > ChSq Rao TREAT -.3695.54.75.8.69 5
reame.447.8934 4.5688.36.499 同時檢查兩個變項, 時間函數為 Analyss of Maxmum Lkelhood Esmaes Parameer Sandard Hazard Parameer DF Esmae Error Ch-Square Pr > ChSq Rao TREAT -.567.4633.997.5.6 GENDER -.3549.6356 3.4883.68.737 reame.73.748 5.355.7. sexme.8963.87.63.7. Lnear Hypoheses Tesng Resuls Wald Label Ch-Square DF Pr > ChSq proporonaly_es 6.3543.47 同時檢查兩個變項, 時間函數為 log Analyss of Maxmum Lkelhood Esmaes Parameer Sandard Hazard Parameer DF Esmae Error Ch-Square Pr > ChSq Rao TREAT -.6348.3966.5679.9.53 GENDER -.6457.45657..573.54 reame.8569.8333.576.338.89 sexme.3.955.794.775.9 Lnear Hypoheses Tesng Resuls Wald Label Ch-Square DF Pr > ChSq proporonaly_es.64.339 同時檢查兩個變項, 時間函數為兩個時間區間 Analyss of Maxmum Lkelhood Esmaes Parameer Sandard Hazard Parameer DF Esmae Error Ch-Square Pr > ChSq Rao TREAT -.38355.7.9993.5.68 GENDER -.774.53 4.98.68.758 reame.446.8965 4.95.66.53 sexme.397.456.88.38.36 Lnear Hypoheses Tesng Resuls Wald Label Ch-Square DF Pr > ChSq proporonaly_es 6.845.36 調整一個共變數後, 單獨檢查一個變項, 時間函數為 Analyss of Maxmum Lkelhood Esmaes Parameer Sandard Hazard Parameer DF Esmae Error Ch-Square Pr > ChSq Rao TREAT -.575.465.7699.6.65 GENDER -.643.987.768.96.849 reame.69.7474 5.4.34. 調整一個共變數後, 單獨檢查一個變項, 時間函數為 log Analyss of Maxmum Lkelhood Esmaes Parameer Sandard Hazard Parameer DF Esmae Error Ch-Square Pr > ChSq Rao TREAT -.67.3959.463.66.537 GENDER -.645.987.7768.956.848 reame.848.837.98.39.86 調整一個共變數後, 單獨檢查一個變項, 時間函數為兩個時間區間 Analyss of Maxmum Lkelhood Esmaes 6
Parameer Sandard Hazard Parameer DF Esmae Error Ch-Square Pr > ChSq Rao TREAT -.378.66.6736.6.685 GENDER -.658.987.8.93.847 reame.4464.8935 4.5667.36.499 從結果看來, 治療此變項的等比風險假設, 不論在哪種策略, 當時間函數為 log 時才符合等比風險假設, 而在 和兩個時間區間時, 則都違反等比風險假設 研究者可考慮以 log 來建立此資料的科克斯比例風險模式 7