Microsoft Word - 生統e報10月_1_

Similar documents
Microsoft Word - 生統e報.docx

Microsoft Word - 生統e報_ __v3_1210-Final

圖 01-1 PROC UNIVARIATE 的輸出結果 ( 腹膜透析 白蛋白 ) 第 1-1 節重要指令說明 : 1. NORMAL: 在報表中呈現常態檢定的結果 2. CLASS 變項名稱 ( 類別 ): 依照 class 所宣告的類別變項分組呈現資料分析結果 在這個例子中我們將資料分為腹膜透析

102_BS

Microsoft Word - SPSS軟體操作-basic docx

Microsoft Word - 生統e報 _相關係數


)

C19 (1)

Microsoft Word - 生統e報200907[Final].doc


國家圖書館典藏電子全文

0 0 = 1 0 = 0 1 = = 1 1 = 0 0 = 1

Ps22Pdf

Microsoft Word - __日程_定__[1]

Ps22Pdf

(Microsoft PowerPoint - 25\272\330\262\316\255p\244\350\252k\257\265\247\3361_Ruth.ppt)

( ) t ( ) ( ) ( ) ( ) ( ) t-

第一章

840 提示 Excel - Excel -- Excel (=) Excel ch0.xlsx H5 =D5+E5+F5+G5 (=) = - Excel 00

Ps22Pdf

認識 SAS

投影片 1

文件汇编.indd

大 綱 最 有 利 標 目 的 及 類 型 最 有 利 標 之 辦 理 方 式 準 用 最 有 利 標 取 最 有 利 標 精 神 最 有 利 標 之 類 型 及 其 相 關 規 定 適 用 最 有 利 標 準 用 最 有 利 標 及 取 最 有 利 標 精 神 作 業 程 序 及 實 務 分 析

000

Microsoft Word - 94_4_stat_handout_06假設檢定_考古題.doc

Microsoft Word - 95_1_stat_handout_04抽樣與抽樣分配.doc

投影片 1

投影片 1

Microsoft PowerPoint pptx.ppt

(baking powder) 1 ( ) ( ) 1 10g g (two level design, D-optimal) 32 1/2 fraction Two Level Fractional Factorial Design D-Optimal D

Microsoft Word - p11.doc

Microsoft Word - 94_2_stat_handout08_線性迴歸(考古題).doc

untitled

DIY香草植物乾燥

untitled

統計分析入門與應用 說明 : a. 獨立樣本 : 兩個來自於獨立, 沒有相關的樣本 b. 成對樣本 : 兩個平均數來自於同一個樣本, 有關係的樣本 7-2 Means 平均數分析 Means 平均數分析是用在不同類別變數組合下, 連續變數在各組的統計量, 例如 : 平均數 中位數 標準差 總合 最小

Microsoft Word - 94_4_stat_handout_07變異數分析.doc

tech_atmn_h1h4_E

<4D F736F F D20A4BDA640BDC3A5CDAED6A4DFBDD2B57BAFE0A44FB4FAC5E72DA5CDAAABB2CEAD70B8D5C344A4BDA FA7B9BD5AAAA9>

<4D F736F F D20BDD7A4E5A4BAA4E5BB50A5D8BFFD2E646F63>


壹、學校背景

二零一五年施政報告 - 施政綱領 - 第三章 扶貧及為弱勢社群提供支援

育 部 分 則 由 陳 淑 貞 委 員 及 李 兆 環 委 員 共 同 執 行, 在 此 先 感 謝 各 位 委 員 及 學 者 專 家 之 參 與 二 目 前 評 論 報 告 初 稿 之 架 構 區 分 為 對 政 府 機 關 回 應 意 見 之 觀 察 優 點 及 待 改 進 事 項, 以 及

<4D F736F F D20BACBB0B2C8ABD3EBB7C5C9E4D0D4CEDBC8BEB7C0D6CEA1B0CAAEB6FECEE5A1B1B9E6BBAEBCB C4EAD4B6BEB0C4BFB1EA2E646F63>

<4F4BBEFAA576A470BBA15FC160AAED E786C73>

58, ,769 51,911 74,666 35, , , , ,

辽宁铁~1

游戏攻略大全(十).doc

保 险 公 司 金 富 月 盈 两 产 全 品 保 名 险 称 ( 分 红 型 ) 产 分 品 红 类 型 缴 费 年 类 缴 型 缴 10 费 年 期 缴 限 保 险 期 限 ( 年 ) 聚 富 2 号 两 全 保 险 ( 万 能 型 ) 万 能 型 趸 缴 趸 缴 6 年 龙 享 安 康 重 疾

I

海底捞你学不会

YEN/MIAO CHING MS 27FEB DEL HKG

Microsoft Word - 02文本.docx

最新监察执法全书(十一).doc

钓鱼技巧_二_.doc

动物的智慧(五)

健康知识(一)

Microsoft Word - 人民萬歲_宋玉雯.docx

北京(一)

i

园林植物卷(九).doc

家装知识(四)

认识植物(一)

药用植物种植技术(二)

司法鉴定工作手册(十八)

外科疾病诊治(三)

动物杂谈_三_.doc

Transcription:

第四章 卡方檢定及勝算比 (II) 陳冠婷 統計分析師 3 0. 兩類別變項相關性的統計檢定 回到本章的研究主題, 我們想知道洗腎病人其洗腎方式是否與體內白蛋白有關 在第一節已介紹如何將白蛋白由假設的臨床切點分為正常白蛋白與異常白蛋白兩個類別, 透過列聯表及長條圖了解不同洗腎方式下正常白蛋白及異常白蛋白的分布情形, 本節我們進一步利用統計方法探討不同洗腎方式其白蛋白分布是否有顯著差異, 藉由統計檢定判斷洗腎方式與白蛋白間是否相關 洗腎方式及白蛋白正常與否皆為類別變項, 表 03 1 下半部僅列出兩類別變項分析中樣本數夠大時的統計方法 在檢定洗腎病人其洗腎方式與體內白蛋白是否相關時, 如樣本數夠大且期望次數小於 5 的細格 (cell) 未超過全部細格的 20% 時適用於 卡方檢定 (Chi square ) 註 1; 樣本較小且期望次數小於 5 的細格超過全部細格的 20% 時, 使用費雪精確檢定 (Fisher s exact ) 表 03 1 資料型態與適用統計方法 (3) 欲檢定的依變項 (Y) 兩組 欲進行比較的組別數 / 自變項 (X) 類別 三組或以上 獨立樣本相依樣本獨立樣本相依樣本 連續 連續變項欲檢定 : 集中趨勢 (central tendency) 相關分析 常態假設或中央極限定理成立 Independent t Paired t ANOVA Repeated measure ANOVA Person s correlation/ Linear 常態假設或中央極限定理不成立 類別變項 兩個類別 三個類別以上 Wilcoxon rank sum Pearson's Chi square (with Yates' continuity correction) Pearson s Chi square Wilcoxon signed rank Kruskal Wallis 欲檢定 : 關聯性 (Association) McNemar 's Pearson's Chi square Pearson's Chi square Friedman Spearman s correlation Logistic Multinomial /Ordinal logistic 4 6 SAS 教戰手冊

註 1. 卡方檢定的皮爾森 (Pearson's) 卡方統計量易受樣本數大小影響, 樣本數過小時易使皮爾森卡方統計量增大, 造成兩變項間產生統計上的相關 如欲使檢定結果趨於保守的原則下, 當樣本較小且期望次數小於 5 的細格未超過全部細格的 20% 時或卡方自由度為 1 時, 可採用葉氏連續性校正 (Yates' continuity correction) 的卡方檢定統計量做為檢定結果 3 1. 樣本數夠大時檢定兩類別變項相關性 -PROG FREQ 應用 (1) 我們想知道腹膜透析 (PD) 與血液透析 (HD) 的病患中體內正常及異常白蛋白的比例是否有統計上差異 ( 即洗腎方式與白蛋白是否相關 ), 可利用 程式 03 1 執行卡方檢定 /* 利用卡方檢定檢定洗腎方式與正常白蛋白的相關性 ( 含 2 2 列聯表 ) */ PROC FREQ DATA=esrd_02; FORMAT Albumin_1 Albumin. treat treat.; TABLES Albumin_1*treat /EXPECTED CHISQ; 程式 03 1 PROC FREQ 語法執行卡方檢定 執行後輸出報表如圖 03 1, 報表上半部為本章 2 1 節介紹的列聯表 ( 圖中未顯示 ), 而報表下方列出卡方檢定之統計量, 其中 為各式卡方統計量之自由度 (degree of freedom, DF), 為皮爾森 (Pearson's) 卡方統計量 (Chi square value) 為卡方分布下大於或等於此統計量的機率 (Prob), 即 p 值 報表顯示 p = 0.1784 > 0.05, 表示洗腎方式與白蛋白正常與否無顯著相關 在 2 2 列聯表 (DF = 1) 中, 如欲使檢定結果較為保守, 其結果可採用 葉氏連續性校正之卡方統計量 (Continuity adj. Chi square value) 及 p 值 第 3 1 節重要指令說明 : 在 PROC FREQ 中 TABLES 敘述句之附屬選項 圖 03 1 程式 03 1 的輸出結果 CHISQ 選項宣告在 TABLES 中的變項執行卡方檢定, 置於 TABLES 敘述的斜線 (/) 後方 4 7 SAS 教戰手冊

3 2. 小樣本時檢定兩類別變項相關性 -PROG FREQ 應用 (2) 當樣本數過小, 期望次數小於 5 的細格數超過全部細格數的 20% 時, 必須使用費雪精確檢定來分析洗腎方式與白蛋白正常是否相關, 如 程式 03 2 為示範費雪精確檢定, 須在分析前在資料步驟 (DATA step) 中建立新 SAS 資料檔 /* 建立新的 SAS 資料檔 */ DATA Fisher; INPUT Albumin_1 treat@@; DATALINES; 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 1 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 1 1 1 1 1 1 1 1 1 ; /* 檢定兩變項相關性 ( 含列聯表 ) */ PROC FREQ DATA=Fisher; TABLES Albumin_1*treat /EXPECTED CHISQ; 程式 03 2 PROC FREQ 語法執行檢定 圖 03 2 程式 03 2 的輸出結果 執行後報表如圖 03 2, 當該資料的列聯表中有超過 20% 細格的期望次數小於 5 時, 會顯示 警告內容 報表中顯示有 50% 的細格期望次數小於 5, 大於總細格數的 20%, 故採用 費雪精確檢定之 p 值 此分析 p = 0.1968 > 0.05, 代表洗腎方式與白蛋白正常與否無關 4 8 SAS 教戰手冊

中國醫醫藥大學生物物統計中心 2009/ /10 第 3 2 節重要要指令說明 : 在 DATA step 中建立新的 SAS 資料檔 INPUT 變項項名稱串 : 對 SAS 資料檔檔的變項進行行命名 此例例是在名為 Fisher 的 SAS 資 料檔中加入 Albumin_1 及 treat 兩個個變項名稱,@@ 表示示在鍵入資資料內容時一一行 資料的輸入入將超過一一筆 DATALINES; 資料內容 ; : 鍵入的資資料會依 INPUT 敘述句句變項的順序序輸入, 資料間使用空空白間格來來區別 變項, 須注注意分號 (;) 必須自行行為獨立的的一行 4 0. 相關強度度的估計 卡方檢定用用來檢定兩個個獨立類別變變項間的關聯聯性 (association), 但並並未對 關聯聯性的強度 提供一個測測量值 關聯聯性的強度度大小, 不管管是病例對照照研究 (case control study) 或橫斷面研研究設計 (cross sectional study), 可以用 勝算算比 odds ratio,or 來度度量 勝算比顧名名思義為兩個個勝算 (odds) 的比值, 發生某事件件的機率除以以未發生某某事件的機機率 (p/(1 p))) 定義為勝算算 舉例來說, 如圖 04 1, 在某一個個特定的情況 (X 1 ) 下, 發生某件事情 (Y 1 ) 的機率率為 0.7, 不發生 (Y 2 ) 的機機率為 0.3, 因此在 X 1 的情況下 Y 1 發生的勝勝算為 0.7/0.3=2.33, 請您利用圖 04 1 計算在 X 2 的情況下下發生 Y 1 的勝算 是否否真的了解呢? 讓我們再再演練一次, 在某一個個特定的情況 (X 2 ) 下, 發生生某件事情 (Y 1 ) 的機率為 0.4, 不發生 (Y 2 ) 的機率率為 0.6, 因此在 X 2 的情況下 Y 1 發生的勝算為 0.4/0.6=0.67 勝算比比為兩個特定定的情況下 (X 1 及 X 2 ) 其發生某件事 (Y 1 ) 的勝算比比值, 因此在在圖 04 1 中 X 1 發生 Y 1 的勝算為 X 2 的 2.33/ /0.67=3.48 倍, 若勝算比比為 1, 表示示無論在 X 1 或 X 2 的情形下下發生 Y 1 事件的勝算相相同 ; 若大於 1, 表示 X 1 發生 Y 1 事件的勝算比 X 2 高 在生物統計計學上通常以以暴露與得病病間的關係作作為範例, 必須注意在 2 2 列聯表表中, 有病且且曾暴露於於某一危險因因子 (D=yes, E=yes) 須放於於主對角線上上 下節我們們將以勝算比比來估算洗腎腎方式與白白蛋白的相關關強度 圖 04 1 X 與 Y 變項產產生的 2 2 列聯表 4 9 SAS 教戰戰手冊

4 1. 估計兩類別變項的相關強度 -PROG FREQ 應用 (3) 我們想知道腹膜透析 (PD) 其正常白蛋白的勝算是血液透析 (HD) 的病患的幾倍, 是否達統計上顯著, 可利用 程式 04 1 估計勝算比及其 95% 信賴區間 /* 估計並檢定洗腎方式與白蛋白的相關強度 ( 含列聯表 ) */ PROC FREQ DATA=esrd_02; TABLES Albumin_1*treat; EXACT OR; 程式 04 1 PROC FREQ 語法估計勝算比 輸出後如圖 04 2, 為勝算比 (odds ratio), 為 95% 信賴區間 報表顯示勝算比為 0.5151, 表示腹膜透析 (PD) 其正常白蛋白的勝算是血液透析 (HD) 的病患的 0.5151 倍, 但其 95% 信賴區間為 (0.1644,1.4725), 區間包含 1, 故顯示兩種洗腎方式中白蛋白正常的機會無統計上差異 第 4 1 節重要指令說明 : 在 PROC FREQ 中附屬敘述與選項 圖 04 2 程式 04 1 的輸出結果 EXACT 統計選項 : 此敘述句可執行各類的精確統計檢定及其相對應之參數的 95% 信賴區間 OR: 計算 2 2 列聯表的勝算比及其 95% 信賴區間 如欲將第 4 章 PROC FREQ 的結果整理後發表於期刊時, 請參考下表 (Table3), 表中呈現卡方檢定的 p 值 葉氏連續性校正後的 p 值 ( 實務上兩種 p 值擇一即可, 此例應呈現葉氏連續性校正後的 p 值 ) 及勝算比與其 95% 信賴區間 結果皆顯示洗腎病人的洗腎方式與白蛋白正常與否未達統計上相關 Table3. Associations between dialysis therapies and albumin status Dialysis therapies Albumin PD HD Odds ratio (95%CI) p value p value* 3.0 g/dl 7(21.2%) 23(34.3%) 1 <3.0 g/dl 26(78.8%) 44(65.7%) 0.52 (0.16,1.47) 0.18 0.27 95%CI: 95% confidence interval; Chi square ; *Chi square with Yates' continuity correction. 4 10 SAS 教戰手冊