內科部研究能力課程 ( 三 ) 類別變數之統計檢定與 無母數檢定 何宗翰 (Chung-Han Ho) Ph.D. Department of Medical Research Chi Mei Medical Center
無母數檢定 2
資料屬性 大樣本 / 小樣本 資料 屬性 連續變數 / 類別變數 常態 / 非常態 3
有母數 vs. 無母數 有母數統計 : 須假設母體為一已知模型, 甚至要為常態母體才能推論 推論特定參數 無母數統計 : 不受特定母體分配限制 不一定推論母體中特定參數 推論時所使用的抽樣分配通常與母體分配無關 稱 分配自由化 (Distribution Free) 4
無母數 VS. 母數的統計法 5
符號檢定 (The Sign Test) 用來比較兩組非獨立樣本的觀察值 適用於配對樣本 分析相關性高的配對資料,n 對資料 重點 : 每一對樣本的差距 ( 符號 ), 且差距母群體並不需為常態分佈 以正號 (+) 負號 (-) 的個數當統計量做為檢定的基礎 6
Example : 符號檢定 (The Sign Test) 檢定顧客對甲乙兩種車款試乘的滿意程度是否相等? 假設母體不為常態分佈, 檢定水準為 0.05. 顧客編號 1 2 3 4 5 6 7 8 9 10 甲車 3 4 2 5 3 5 1 4 4 3 乙車 2 2 2 4 3 2 2 3 2 2 7
SPSS 操作 Step1: 分析 無母數檢定 歷史對話紀錄 二個相關樣本 8
Step2: 將變數移到成對檢定的方塊中 Step3: 選取符號檢定 Step4: 按確定得到統計報表 9
符號檢定報表解釋 從右表可知甲車種與乙車種的正負差異數量, 並得知其 p-value=0.070. 表示顧客對甲車種與乙車種的喜好程度沒有統計上的差異, 喜好甲車種的程度與乙車種差不多 10
Wilcoxon 符號化等級檢定 (The Wilcoxon Signed-Rank Test) 適用於配對樣本, 且母體不需為常態 比 Sign Test 常用, 因多考慮排序大小 (Rank) 的問題 符號等級檢定不僅考慮差值的正負符號, 同時考慮差值大小的等級的檢定方法 11
SPSS 操作 Step1: 分析 無母數檢定 歷史對話紀錄 二個相關樣本 12
Step2: 將變數移到成對檢定的方塊中 Step3: 選取 Wilcoxon 檢定 Step4: 按確定得到統計報表 13
SPSS 報表解釋 從右表可知甲車種與乙車種的正負差異數量, 並得知其 p-value=0.031. 表示顧客對甲車種與乙車種的喜好程度有統計上的顯著差異, 喜好甲車種的顧客比教多 14
Wilcoxon 等級和檢定 (The Wilcoxon Rank Sum Test) 兩組獨立樣本的檢定,n 1 and n 2 不需成對 母體不需假設為常態或假設母體變異數相等 假設兩母體的分配相等 考慮兩組觀察值合併排序數值大小再以其各自等級和中較小者進行分析 15
範例 : Wilcoxon 等級和檢定 我們想知道 A B 兩組的病人身高分配是否相同, 分別自兩組中隨機抽取了 11 和 12 個樣本 在顯著水準 0.05 下, 試以 Wilcoxon 等級和檢定法檢定之 A 組 163 168 170 181 166 161 179 173 167 175 176 等級 B 組 171 169 183 174 173 170 168 190 167 165 174 172 等級 16
SPSS 操作 Step1: 分析 無母數檢定 歷史對話紀錄 二個獨立樣本 17
Step2: 將變數移到檢定變數清單的方塊中 Step3: 將分組變數移到分組變數的方塊中 Step4: 定義分組變數 Step6: 按確定得到統計報表 Step5: 選定檢定類型 Mann-Whitney U test 18
從報表可得知 p=0.608, 亦即兩個班級的身高沒有統計上的差異 SPSS 報表解釋 19
多組獨立樣本的無母數檢定 : Kruskal-Wallis Test 多組獨立樣本的檢定 母體不需假設為常態或假設母體變異數相等 20
Example 為研究四種不同藥物對兒童咳嗽的治療效果, 將 25 個體質相似的病人隨機分為四組, 各組人數分別為 8 人 4 人 7 人和 6 人, 各自採用 A B C D 四種藥物進行治療, 假定其他條件均保持相同, 五天後測量每位病人每天咳嗽次數如表所示, 試比較這四種藥物的治療效果是否相同 21 林傑斌 林川雄 馮兆康, SPSS 統計分析與實務, p.14-30
SPSS 操作 Step1: 分析 無母數檢定 歷史對話紀錄 二個獨立樣本 22
Step2: 將變數移到檢定變數清單的方塊中 Step3: 將分組變數移到分組變數的方塊中 Step4: 定義分組變數 Step6: 按確定得到統計報表 Step5: 選定檢定類型 Kruskal-Wallis test 23
從報表可得知 p=0.045, 亦即四種不同藥物對兒童咳嗽的治療效果有統計上的差異 SPSS 統計報表結果 24
類別變數之統計檢定
資料屬性 大樣本 / 小樣本 資料屬性 連續變數 / 類別變數 常態 / 非常態
類別資料 資料按名義或順序尺度分類計算人數或個數 例如 : 性別, 教育, 職業 次數分配表 : 單一變項 列聯表 : 二個變項以上 27 4 4 4 2 1 1 1 f H L f f H L f x n r n n n n O O O r n O O O c x y r rc r r c 2 1. 2. 1 2 1 2 1 1 1 12 11 計計
範例 : 次數分配表 次數 (frequency) 與百分比 (percent) 呈現研究樣本基本特性的分佈資訊, 例如 : 性別 教育程度 蔡仁貞, 心臟病患對心臟復健工作的認知與實施需求之探討, 新臺北護理期刊, 1999/08/01, Vol. 1(1), p59-67
列聯表分析 (contingency table analysis) 列聯表分析主要是探討類別變數之間的關聯分佈, 並以表格型式顯示, 但類別變數的值 ( 種類 形式 ) 的數目必須是有限的 列聯表分析可搭配卡方檢定以檢定變數間的獨立性, 此外也提供一些統計量以度量變數間的關聯 (measure of association) 變數二 b 1 b 2 b n 變數一 a 1 a 2 a n
例 : 戴安全帽是否有效
卡方檢定 (CHI-SQUARE TEST)
卡方檢定 以 r 表示列數 c 表示行數的表格為例 i 1 ( O E E rc 2 2 i i ) rc 為所有細格的總個數 O 為觀察值 ;E 是期待值 上式總和之機率分佈近似具有 (r -1)(c -1) 自由度的卡方分佈 因此 2X2 表格有 (2-1)(2-1)=1 的自由度, 而 3X4 的表格有 (3-1)(4-1)=6 的自由度 i 32
自由度 統計學上的自由度 ( 英語 :degree of freedom, df), 是指當以樣本的統計量來估計母體的參數時, 樣本中獨立或能自由變化的數據的個數, 稱為該統計量的自由度 -- 維基百科
卡方檢定 假設檢定 : H 0 : A 變項與 B 變項之間沒有關聯性 H 1 : A 變項與 B 變項之間具有關聯性 判定標準 : χ 2 >χ 2 (r-1)(c-1),α 拒絕 H 0 P 0.05 χ 2 <= χ 2 (r-1)(c-1),α 接受 H 0 P > 0.05 檢定程序 : 檢定每一細格之期望值是否過小 (n < 5) 檢定 A 變項與 B 變項之間是否具有關聯性? 34
卡方分布 為確保機率分佈的有效性, 在任一細格中的期望次數均不能小於 1, 且各細格中期望次數小於 5 的細格總數不能超過 20% 35
費氏精確檢定 (Fisher s Exact Test)
費氏精確檢定法 (Fisher s Exact Test) 對列聯表進行關聯性檢定時, 其方格內 ( 如下表之 A B C D) 樣本大小 n < 5, 費氏精確檢定法比較精準, 其資料形式如下 : 樣品 1 樣品 2 總和 --------------------------------------- 變數 1 A B A+B 變數 2 C D C+D ---------------------------------------- 總和 A+C B+D N 37
費氏精確檢定法 (Fisher s Exact Test) 假設檢定 : H 0 : 兩族群分布相同 H 1 : 兩族群分布不同 費氏精確機率公式 P A C B D A B N A B ( A B)!( C D)!( A C)!( B D)! N! A! B! C! D! 38
SPSS 操作範例 : 卡方檢定與 Fisher s exact test
Example: Lung Cancer Study N=94 Case-control: 1:Case; 2: Control Gender: 1:Male; 2: Female Smoke: 0: Non-smoker; 1: Smoker; 2: Ever smoker DM: 0:No; 1:Yes CAD: 0:No; 1:Yes
卡方檢定 : 分析 敘述統計 交叉表
Step1: 點選變數 Step2: 精確性檢定
Step3: 選取卡方分配
Step4: 點選百分比
報表解讀 在所有 94 位病人中, 有 DM 的 15 人佔全部人數的 16% 而 48 位有 CANCER 人中, 其中 4.3% 的人有 DM 少於 46 位 non-cancer 患者的 11.7% 當 Fisher s exact test, p-value=0.05, 因此 DM 與是否得到肺癌並沒有顯著差異
交叉分析的重點 交叉分析表的每個方格中可有次數 期望次數 列百分比 行百分比和總百分比的資訊 從表中可看出資料大部分出現在那些方格中, 其比例有多少? 若選定列變數的某一個值, 則可由列比例看出, 在此條件下, 行變數的分配狀況 若選定行變數的某一個值, 則可由行比例看出, 在此條件下, 列變數的分配狀況
交叉分析的重點 由卡方檢定可瞭解行變數與列變數是否統計獨立 若是, 則表示行變數與列變數無統計相關 一般卡方檢定的應用, 期望次數低於 5 的方格數不能多於 20% 若多於 20%, 則須考慮合併期望次數低於 5 的方格, 使其能適合條件 若樣本數很小的時候, 採用費雪精確檢定 (Fisher`s Exact Test)
McNemar 配對樣本檢定法
McNemar 配對樣本檢定法 McNemar 檢定又稱相依 ( 配對 ) 樣本的卡方檢定, 主要適用於 2 2 的表格 探討實驗前後由 是 變為 否 與由 否 變為 是 的個數是否相等, 因此被稱為 改變的顯著檢定 例如選民在看電視辯論前後, 調查其投票行為結果, 因結果來自同一位選民, 故此觀測值是具有相關而配對二項隨機變數
SPSS 操作範例 : McNemar test
範例 : 急性心肌梗塞與糖尿病的關聯性 此研究的個案組為 144 位心肌梗塞患者, 為降低年齡與性別的影響, 控制組為經過年齡與性別配對的 144 位無心血管疾病之就診病人 一般作法 : 卡方檢定, p=0.004 統計上正確作法 : McNemar 檢定, p=0.005
McNemar 檢定 : 分析 敘述統計 交叉表
Step1: 點選變數至列與欄
Step2: 點選統計量按鈕 Step3: 勾選 McNemar 檢定
Step5: 按確定產生統計報表 Step4: 點選百分比
McNemar 統計報表 在相同年齡與性別下, 有急性心肌梗塞的病患較無急性心肌梗塞的病患容易患有糖尿病 (p=0.005)
Kappa coefficient
Kappa coefficient Kappa coefficient 為臨床上用來確立不同檢驗或診斷方法是否有一致性的常用方法, 主要應用在 : 評估兩位醫護人員的診斷結果 ( 或兩種檢驗方法 ) 是否有一致性 評估同一位醫護人員 ( 或檢驗方法 ) 重覆診斷的結果是否有一致性 Kappa 值可約略分為五組來表示不同等級的一致性 : 0.0~0.20 極低的一致性 0.21~0.40 一般的一致性 0.41~0.60 中等的一致性 0.61~0.80 高度的一致性 0.81~1 幾乎完全一致性
SPSS 操作範例 二位傳說中的超級名醫, 黑傑克醫師與喬巴醫師, 診斷 20 位病人的病情, 其診斷結果是否有一致性? Step1: 分析 敘述統計 交叉表
Step2: 點選變數分別放至列與欄 Step3: 點選統計量 Step5: 按確定得到統計報表 Step4: 勾選 Kappa 統計量數
Kappa coefficient 報表解釋 從報表中可以發現黑傑克與喬巴二位醫師對 20 位病人的診斷結果之 Kappa 係數為 0.700, 顯著性 p 值為 0.001<0.05, 表示二位醫師的診斷結果有高度的一致性