第二章 兩組樣本平均值比較 邱顯財 統計分析師 在分析資料的過程中, 最常見的問題, 就是比較兩組連續資料的集中趨勢 (central tendency) 有無差異 本次內容將針對描述兩組連續型的資料, 以及檢定兩 組的集中趨勢, 說明如何撰寫 SAS 程式 1-0. 資料描述語法介紹 - 連續型資料 : 在 Base SAS 模組中, 有兩個程序可以描述連續型資料, 在本節中將分別介紹 這兩個程序語法的撰寫, 以及呈現報表的判讀 1-1. 資料描述 -PROC UNIIVARIATE 的應用 : 以腎臟科的資料庫為例, 我們想要了解不同洗腎型態病人其生化值的描述性統計量, 可以藉由 程式 01-1 PROC UNIVARIATE 語法獲得各組別病人在各種生化值上詳細的統計量 其中腹膜透析 (treat=0) 病人的白蛋白數值 (Albumin) 的描述性統計量如圖 01-1 所示 PROC UNIVARIATE DATA=esrd NORMAL; VAR albumin k ca p; 程式 01-1 PROC UNIVARIATE 語法 圖 01-1 中呈現的統計量有幾個部分, 為有關動差 (moment) 的統計量, 樣本數 (N) 可以從此得知 ; 為基本且常見的描述性統計量, 集中趨勢有平均值 (Mean) 中位數 (Median) 眾數(Mode), 變異程度有標準差 (Std Deviation) 變異數(Variance) 全距 (Range) 四分位距(Interquartile Range); 為檢定資料是否成常態分布, 較常用來判定資料成常態分布的檢定是 Shapiro-Wilk,p-value<0.05 代表資料違反常態假設
圖 01-1 PROC UNIVARIATE 的輸出結果 ( 腹膜透析 白蛋白 ) 第 1-1 節重要指令說明 : 1. NORMAL: 在報表中呈現常態檢定的結果 2. CLASS 變項名稱 ( 類別 ): 依照 class 所宣告的類別變項分組呈現資料分析結果 在這個例子中我們將資料分為腹膜透析 (treat=0) 與血液透析兩組 (treat=1) 來分析 使用 CLASS 敘述不需要排序 3. VAR 變項名稱串 : 列出要分析的變項 1-2. 資料描述 -PROC MEANS 應用 : 另一種呈現描述性統計量的方式, 是使用 程式 01-2 PROC MEANS 語法獲得比較精簡的摘要描述性統計量, 輸出結果如圖 01-2 所示 在報表中, 可以一目瞭然地得知不同洗腎型態病人各種生化值的摘要統計量, 例如平均值 (mean) 標準差 (std deviation) 中位數(median) 四分位距(interquartile range)
PROC MEANS DATA=esrd N MEAN STD MEDIAN QRANGE MAXDEC=2; VAR albumin k ca p; 程式 01-2 PROC MEANS 語法 圖 01-2 PROC MEANS 的結果 第 1-2 節重要指令說明 : 1. PROC MEANS 預設輸出的統計量有樣本數 平均值 標準差 最大值 最小值 在此特別指定以下統計量 -N: 樣本數 ; MEAN: 平均值 ; STD: 標準差 ; MEDIAN: 中位數 ; QRANGE: 四分位距 MAXDEC= 設定輸出的最大小數位數 2. CLASS 變項名稱 ( 類別 ): 依照 class 所宣告的類別變項分組呈現資料分析結果 3. VAR 變項名稱串 : 列出要分析的變項
2-0. 資料類型與對應的統計方法 : 兩組樣本的比較 前一節我們已經學會撰寫語法以取得資料的描述性統計量, 以對資料有概略地認識 假設我們關心的研究問題是腹膜透析與血液透析的病人其生化值有無差異, 先以數值差異較大的鉀 (K) 離子濃度為例, 腹膜透析病人平均濃度為 5.39 meq/l, 血液透析病人平均濃度為 4.66 meq/l ( 圖 01-2), 然而兩組病人在鉀濃度上的差異是否有統計上顯著呢? 要回答這個問題, 我們可以從表 02-1 找到合適的統計方法進行檢定 如果我們想要檢定的變項為連續資料, 且比較的兩個組別是獨立的, 參考表 02-1 我們可以有兩種選擇 :(1) 當資料在比較的兩組中均服從常態假設或中央極限定理成立時, 可以使用 獨立樣本 t 檢定 (Independent t-test);(2) 當兩組中任一組資料違反常態假設或中央極限定理不成立時, 則應使用 魏克森等級和檢定 (Wilcoxon rank sum test) 因此, 我們可以先利用 程式 01-1 PROC UNIVARIATE 語法判定這些生化值是否服從常態分布, 並評估樣本數大小, 然後利用合適的統計方法加以檢定 表 02-1 資料型態與適用統計方法 (1) 欲檢定的變項 / 依變項 (Y) 欲進行比較的組別數 / 自變項 (X) 兩組三組或以上獨立樣本相依樣本獨立樣本相依樣本 連續 連續資料集中趨勢 (central tendency) 相關分析 常態假設或中央極限 定理成立 Independent t-test Paired t-test ANOVA Repeated measure ANOVA correlation /Linear regression 常態假設或中央極限 定理不成立 Wilcoxon Rank sum test Wilcoxon signed-rank test Kruskal-Wallis test Friedman test Spearman correlation 類別資料 關聯性 (Association) 兩個類別 with Yate's correction McNemar 's test Cochran's Q test Logistic regression 三類以上 Cochran's Q test Cochran's Q test Multinomial / Ordinal logistic regression
2-1. 兩組樣本平均值比較 -PROC TTEST 應用 : 整理 程式 01-1 PROC UNIVARIATE 語法的結果, 可以得知白蛋白與鈣離子濃度不論在腹膜透析或血液透析病人中, 都符合常態分布的假設 因此 程式 02-1 PROC TTEST 語法便可用來檢定兩組病人的白蛋白與鈣離子濃度平均值是否有顯著差異 結果如圖 02-1 所示 /* Independent t-test */ PROC TTEST DATA=esrd; VAR Albumin Ca; 程式 02-1 PROC TTEST 語法 在圖 02-1 呈現了獨立樣本 t 檢定的結果, 描述性統計量的部分可以從 PROC UNIVARIATE 或 PROC MEANS 取得 要判定檢定的結果是否顯著要經過以下步驟 : 從 Equality of Variance 的檢定結果來研判兩組資料的變異數是否均等, 若 Pr>F 的數值大於 0.05, 則 T-Tests 應選擇 Variances 為 Equal 的檢定結果,Pr> t 若小於 0.05 代表兩組間均值有統計上顯著差異 若 變異數均等的假設不成立 (Pr>F 小於 0.05), 則 T-Tests 時選擇 Variances 為 Unequal 的檢定結果
圖 02-1 PROC TTEST 的結果 第 2-1 節重要指令說明 : 1. CLASS 變項名稱 : 欲比較的分組變項 ( 限兩組 ) 2. VAR 變項名稱串 : 列出要分析的變項 2-2. 兩組樣本中位數比較 -PROC NPAR1WAY 應用 : 鉀離子與磷離子在兩組洗腎病人中的分布都違反了常態假設, 要比較這兩個生化值在兩組病人中有無差異, 合適的檢定方法應該是無母數的魏克森等級和檢定, 使用的語法為 程式 02-2 PROC NPAR1WAY 其中鉀離子的比較結果如圖 02-2 所示 判讀時應由報表中間的 Wilcoxon Two-Sample Test 段落中 Two-sided Pr> Z 是否小於 0.05 來決定是否有顯著差異 /*Wilcoxon rank sum test */ PROC NPAR1WAY DATA=esrd WILCOXON; VAR k p; 程式 02-2 PROC NPAR1WAY 語法
圖 02-2 PROC NPAR1WAY 的結果 ( 針對 K) 第 2-2 節重要指令說明 : 1. WILCOXON: 指定使用魏克森分數 (Wilcoxon scores) 進行分析, 若不指定則數個內建的無母數檢定都會執行 2. CLASS 變項名稱 : 欲比較的分組變項 3. VAR 變項名稱串 : 列出要分析的變項 將本章第一節與第二節的結果整理之後, 可以得到以下的表格 不論是白蛋 白 鉀離子 鈣離子或磷離子濃度, 在腹膜透析與血液透析的病人之間並無統計 上顯著差異 Table 1. Comparisons of biochemical indices between PD and HD patients PD HD N Mean ± SD Median (25 th pctl - 75 th pctl) N Mean ± SD Median (25 th pctl - 75 th pctl) p-value Albumin 33 2.47 ± 0.60 2.60 (2.10-2.90) 67 2.63 ± 0.67 2.70 (2.10-3.10) 0.261 T K 33 5.39 ± 6.65 4.30 (3.60-4.90) 67 4.66 ± 1.46 4.30 (3.50-5.50) 0.519 W Ca 32 8.67 ± 1.23 8.50 (7.95-9.25) 64 8.70 ± 1.01 8.80 (7.95-9.35) 0.889 T P 32 4.94 ± 2.04 4.45 (3.60-6.10) 56 4.43 ± 2.11 4.40 (2.90-5.75) 0.250 W T : independent t-test; W : Wilcoxon rank sum test