生物醫學研究之實驗設計與基本統計 (I) 高毓儒 Institute of Physiology Institute of Emergency and Critical Care Medicine School of Medicine National Yang-Ming University 1
1. 導論 2
1. 導論 - 醫學研究的實驗設計種類 醫學研究 實驗型 式 實驗型研究 觀察型研究 (Experimental Study) (Observational Study) 病例對照研究 (Case-control Study) 世代研究 (Cohort Study) 診斷研究 (Diagnostic Study) 統合分析 (Meta-analysis) 過去 大型臨床試驗 (Clinical Trial) 小型前期臨床研究 (Preclinical Study) 前瞻 (Prospective) 回溯 (Retrospective) 現在 3 未來
1. 導論 - 醫學研究的實驗設計種類 醫學研究 實驗型 式 實驗型研究 觀察型研究 (Experimental Study) (Observational Study) 研究者不介入 較易操作且省經費 較無倫理問題之限制 無法控制變因 難以因果關係作結論 常用於臨床及流病研究 研究者介入 較難操作且多費經費 較有倫理問題之限制 可控制一個或多個變因 可定出因果關係作結論 適用於臨床 動物及細胞研究 4
1. 導論 - 實驗設計與統計於醫學研究的角色 醫學研究 實驗的邏輯與內容 研究的邏輯與內容 實驗設計與統 研究主題的了 計 解 進行實驗及與分析 論文撰 寫 醫學論文發表 5
1. 導論 - 實驗設計於醫學研究的重要性 對於自己的實驗 減少偏差 (Bias) 及增加可信度 降低變異數 (Variability) 避免混淆因子 (Confounding Factor) 對於他人的實驗 可明確剖析實驗的內涵 可快速導入實驗的節奏 可判讀資料的可靠性 6
1. 導論 - 醫學統計的重要 醫學統計的 性 資料整理 有效將資料整理及歸納 以公認的方法呈現 判讀資料的離散度與變異度 以樣本投射大族群 資料比較 分析樣本資料間的差異或關聯 以公認的方法比較與呈現 計較差異或關聯是否有意義 用以判讀研究假說的真偽 7
1. 導論 - 實驗設計的功能與統計的關 係 研究構想 實驗資料的圖表製作 研究問題 實驗資料的統計分析與解釋 研究目的 實驗內容及流程 實驗設計 實驗對象的選擇及分組 8
1. 導論 - 一般對各類實驗型式與統計的困 一般對各類 擾 自己操作實驗時 撰寫自己的論文時 閱讀他人的論文時 所操作的實驗型式與實驗設計是否相配? 操作的實驗設計與統計方法分析是否相配? 統計分析結果與結論是否相配? 9
1. 導論 - 克服困擾的解決方 案 不講解統計分析之原理 10
1. 導論 - 克服困擾的解決方 案 不講解如何使用統計軟體分析 11
1. 導論 - 克服困擾的解決方 案 介紹醫學常用實驗設計的類別 以實例提出研究問題並解說其設計 了解實例所用之統計方法 分析不同實驗設計類別的優缺點 12
1. 導論 - 課程內容的原 則 1 由簡單進展到複雜 2 介紹其實用的含意 3 以實例去了解 13
2. 實驗資料之描述 14
2. 資料分佈 (Distribution) 功能 常態分佈 用以了解資料分佈的形態 用以決定資料呈現的方式 用以選擇統計分析的方法 分析方法 非常態分佈 Kolmogorov Smirnov test 檢驗兩個經驗分佈是否不同 檢驗一個經驗分佈與另一個理 想分佈是否不同 15
2. 平均值 (Mean) 定義 全部數值的總合除以總個體數 在一個服用降低血脂值藥物的研究 適用 範例一 當資料常態分怖 中 有五位女性的年齡為 52 55 56 58 和 59 年齡平均值 = 280/5 =56 歲 需留意 資料數值分佈偏左或偏右 此 平均數將無法適切的描述集中 趨勢 16
2. 標準差 (Standard Deviation, SD) 定義 標準差可以指出在一組資料中 平均體重為 80 公斤 標準差為 3 ± 1 數值相對於平均值的分散變異度 SD 以 Mean ± SD 表示 適用 範例二 就是說 68.2% 受測者的體重會在 77 和 83 公斤之間 標準差只能使用在常態分佈 需留意 ±1 SD 包含 68.2% 的資料數值 ±2 SD 包含 95.4% 的資料數值 ±3 SD 包含 99.7% 的資料數值 17
2. 標準誤 (Standard Error, SEM) 定義 標準偏差除以樣本數量的平方 根 適用 使用於基礎醫學研究 以 Mean ± SEM 表示 範例三 若有 20 高血壓病人 其平均年齡 40 歲 標準差為 1.2 歲 1. 其標準誤為 1.2/ 20 0.27 歲 2. 其 95 信賴區間 = mean ± 1.96 SEM = 40 ± 1.96 0.27 39.47, 40.53 18
2. 信賴區間 (Confidence Intervals, CI) 定義 計算一個範圍 ( 區間 ) 表示相 當有把握 ( 可信賴 ) 的真正數值 所在的範圍 使用 用於以樣本之平均值估計母族群 (population) 真正的可能數值範 圍 範例四 在某新藥品試驗中 收案患有高血 壓 100 病人 治療後 血壓平均降 低 20 mmhg 若其 95% 信賴區間為 15 mmhg 到 25 mmhg 這表示我們有 95% 的信心知道此治療能有效地降低病 人 15 mmhg 至 25 mmhg 的血壓 若其 95% 信賴區間為 -5 mmhg 到 45 mmhg 這個信賴區間包含 了 0 也就是没有變化 19
2. 中位數 (Median) 定義 在整份資料中 處在最中間的位 在一個服用降低血脂值藥物的研究 置 所以有一半的數值大於它 中 有五位女性的年齡為 : 52 55 56 58 59 92 一半的數值小於它 使用 範例五 中位數 = 57 歲 ; 並以 IQR 表示其 分佈 用於資料呈現非常態分怖 例如 偏左或偏右的分佈 20
2. 四分位距 (Interquartile Range, IQR) 定義 四分位距通常是用來構建箱形 圖 (Box Plot) 使用 多使用於當資料呈現非常態分 怖時 例如偏左或偏右的分佈 21
2. 四分位距 (Interquartile Range, IQR) 範例六 IQR 為 115 105 = 10 數列 1 2 3 4 5 6 7 8 9 10 11 參數 102 104 105 107 108 109 110 112 115 118 118 Q1 四分位 範例七 Q2 ( 中位 數) Q3 10 第一四分位數 (Q1) = 7 9 中位數 ( 第二四分位數 ) (Median) = 8.5 8 第三四分位數 (Q3) = 9 IQR = Q3 Q1 = 2 7 6 5 22
3. 常用醫學資料關聯或比較之統計方法 23
3. P 值 ( P Values) 定義 P 值 (P = Probability 機率 ) 代表著任何觀察到的差異機會造 成的機率 P = 0.05 表示差異機會造成的機率 為 0.05/1 也就是 1/20 P = 0.01 通常被認為 統計上有顯 著意義 表示差異碰巧發生的可 能性只有百分之一 使用 P 值愈小 差異由機會造成的可 能性就愈小 相對的 統計顯著 性就愈高 24
3. 資料的種類 連續性變數 (Continuous Variable) 離散資料如發病次數 就醫次數 事件發生次數等 連續資料如身高 體重 年齡 身體質量指數 (BMI) 血壓 心跳 血糖 排尿量 細胞激素濃度等 類別變數 (Categorical Variable) 變數有次序 (Ordinal) 如 低中高級 輕中重度 差好優等 變數只有兩類 (Binary) 如 性別 有無發病 存活死亡等 變數有主觀給分的情形 (Score) 如疼痛指數 嚴重指數等 不同種類的特徵 (Nominal) 如 血型 膚色 種族等 25
3. 資料的採樣 Independent Measure ( 獨立樣 本) 1. 投藥組與安慰劑組 資料採樣自兩組不同個體之 Study Groups 2. 低劑量組與高劑量組 組間比較 (Between-subject Comparison) Repeated Measure ( 相關樣 本) 1. 投藥前組與投藥後組 2. 早上組與晚上組 資料採樣自同一組個體 但在不同時間 重複採樣 組內比較 (Within-subject Comparison) 26
3. 實驗資料組別數 Independent Measure Repeated Measure 兩組 三組或更多 27
3. 資料比較的種類 有母數分析方法 (Parametric Tests) 連續性變數 (Continuous Variable) 一般假設母群體為常態分布以進行檢定 的方式 無母數分析方法 (Nonparametric Tests) 適用於類別 序位尺度資料分析與資料分 布未知的情況 無法符合有母數分析所設計的方法 28
3. 統計分析方法 兩組資料之關 聯 相關 (Correlation) 兩個變數呈現一種線性關係時 分析兩變數間的關係 範例七 收案 200 個高血脂的病人 研究其血膽固醇的量與 以相關係數 (Correlation Coefficient, r) 來代表兩個變數 其體重間是否有相關 之間關係的強度 以回歸分析 (Regression) 加以量化 常用皮爾森相關 (Pearson Correlation ) 分析 不是因 果關係之介定 其他相關分析 司匹爾門等級回歸 (Spearman s Rank Correlation) 羅吉斯回歸 (Logistic Regression) Cox 比例危害回歸模型 (Cox Proportional Hazards Regression Model) 29
3. 統計分析方法 兩組資料比較 ( 有母數分 析) 學生氏 t 檢定 (Student ttests) 檢定兩個樣本來自有相同平均值的母群體 為有母數分析所設計的方法 Unpaired ( 獨立 ) t-tests 用於獨立樣本比較 Paired ( 配對 ) t-tests 用於相 關樣本比較 範例八 獨立樣本比較 兩組高血脂病人各 40 個 收案時平 均血膽固醇的量兩組一致 一組服 用 Vytorin 另一組服用 atorvastatin 六個月後比較兩組降 血膽固醇的效果 範例九 相關樣本比較 一組高血脂病人 20 個 測量收案時 基礎血膽固醇的量 及測量服用 Vytorin 六個月後血膽固醇的量 以 求知 Vytorin 是否可降血膽固醇 30
3. 統計分析方法 兩組資料比較 ( 無母數分 析) 曼 惠特尼檢定 (Mann-Whitney Tests) 適用於類別 序位尺度資料分析與資料分布未知的情況 比較兩組獨立樣本 無母數分析所設計的方法 威克遜符號等級檢定 (Wilcoxon Signed-Rank Tests) 比較兩組相關樣本 無母數分析所設計的方法 範例十 獨立樣本比較 兩組高血脂病人各 40 個 其收案時平均 血膽固醇的量兩組一致 一組服用 Vytorin 另一組服用 atorvastatin 六個 月後根據每人血膽固醇的量分為正常 輕 微 嚴重三級 進行比較兩組降血膽固醇 的效果 範例十一 相關樣本比較 一組高血脂病人 20 個 於收案時與服 用 Vytorin 六個月後 依每人血膽固醇 的量分為輕微 嚴重 極嚴重三級進行 分級與比較 以求知 Vytorin 是否可降 血膽固醇 31
3. 統計分析方法 三組資料比較 ( 有母數分析 ) 單因子變異數分析 (One-way Analysis of Variance, ANOVA) 比較大於兩組樣本平均數的有母數分析統計方法 來看看這些樣本是否來 自同一母全體 (population) 若有顯著差異 加作事後檢定 (Post-hoc Tests) 如 LSD Scheffe Bonferroni Tukey Tests Independent Measure ANOVA 用於獨立樣本資料比較 Repeated Measure ANOVA 用於相關樣本資料比較 範例十二 獨立樣本比較 三組高血脂病人各 40 個 收案時平 均血膽固醇的量三組一致 於服用 低 中 高劑量 Vytorin 六個月後 比較三組間降血膽固醇的效果 範例十三 相關樣本比較 一組受測者 20 個人 測量早 中 晚其血壓的變化 以求知單日時間 內血壓的變化 32
3. 統計分析方法 三組資料比較 ( 無母數分 析) Kruskal Wallis Test 比較大於兩組獨立樣本 無母數分析所設計的方法 Friedman Test 比較大於兩組相關樣本 無母數分析所設計的方法 範例十四 獨立樣本比較 三組高血脂病人各 40 個 其收案時平均 血膽固醇的量三組一致 服用低 中 高 劑量 Vytorin 六個月後 根據每人血膽固 醇的量分為輕微 嚴重 極嚴重三級 進 行比較三組降血膽固醇的效果 範例十五 相關樣本比較 一組受測者 100 個人 研究三種不同環 境溫度對心跳的影響 其心跳增加的資 料呈非常態分怖 33
3. 統計分析方法 兩組比例值獨立樣本比較 卡方檢定 (Chi-squared Test) 兩組獨立樣本類別資料 (Categorical Data) 比較某特質出現頻率 ( 比例 ) 所設計的方法 χ2 = 0 是無差異 χ2 愈大差異愈大 也適用三組之比 較 樣本數少時可改用費雪氏確定檢定 (Fisher s Exact Test) 範例十六 兩組高血壓病人各 40 個 其 收案時平均血壓兩組一致 分別服用 A 藥 及 B 藥 六個 月後 個案的血壓若降至少 30 mmhg 為 有改善 反 之則為 無改善 結果 :χ2 = 2.3; P = 0.13; 兩組無差異 A藥 B藥 總數 有改善 (63%) 144 (60%) 160 (67%) 304 無改善 (37%) 96 (40%) 80 (33%) 176 總數 (100%) 240 (100%) 240 (100%) 480 34
3. 統計分析方法 兩組比例值相關樣本比較 麥尼檢定 (McNemar s Test) 比較兩組相關樣本類別資料 (Categorical Data) 比較某特質出現頻率 ( 比 例 ) 所設計的方法 χ2 = 0 是無差異 χ2 愈大差異愈大 B 檢驗 範例十七 以 A 及 B 兩種檢驗方法檢查 100 個病人的檢體中是否有存 在某細菌 結果 :χ2 = 6.86; P < 0.01; 兩組有差異 ; A 檢驗 比較準確 三組用 Cochran s Q test A 檢驗 總數 陽性 陰性 陽性 49 45 4 陰性 51 17 34 總數 38 100 62 35
3. 基本醫學統計方法之整理 獨立樣本 2 group / 3 group Continuous Categorical Normal Non-normal Unpaired t-test / Independent ANOVA M-W test / K-W test M-W: Mann Whitney U test Fisher s exact test / Pearson Chi-square test K-W: Kruskal Wallis test 36
3. 基本醫學統計方法之整理 相關樣本 2 group / 3 group Categorical Continuous Normal Non-normal Paired t-test / Repeated measure ANOVA Wilcoxon test / Friedman test McNemar s test / Cochran s Q test 37
4. 簡單的兩組資料的實驗設計與統計 38
4. 簡單實驗設計 - 兩組資料的研 究 緣由 - 城鄉青少年體適能與家中電話數目皆不同 範例十八 假說 - 城鄉青少年體適能與家中電話數目有關聯 調查族群 - 城市及鄉村有 15 歲青少年家庭各 100 個 統計分析結果 相較於城市青少年 鄉村青少年體適能顯著 性高 但家中平均電話隻數顯著性低 39
4. 簡單實驗設計 - 兩組資料的研 究 統計分析結果 - 城鄉青少年體適能與家中電話數目 呈負相關 結論 -?????? 範例十八 Pearson Correlation Correlation Coefficient r = -0.88 R2= -0.88 x -0.88 = 0.77 77% 的變異有相關 Linear Regression y = a + bx a 是截距 b 是斜率 (Regression Coefficient) 40
4. 範例十八的統計考 量 Pearson Correlation Coefficient r 值 r = 0-0.2 可能無意義 r = 0.2-0.4 低相關 r = 0.4-0.6 合理的相 關 r = 0.6-0.8 高相關 r = 0.8-1.0 極高相關 41
4. 範例十八的統計考量 Spearman s Rank Correlation 至少有一個變數為序位變數 變數非常態分佈 樣本數小 非線性但有單調關係 (monotonic relation) 相關係數 42
4. 簡單實驗設計 - 兩組資料的研 究 緣由 - 黑夜裡人走路聲會驚動另一房間的蟑螂 範例十九 假說 - 蟑螂腿上有感受聲波振動的感覺神經受器 受測者 - 100 隻具 SPF 品質的公母不拘之蟑螂 以高品質聲 波振動儀激發並記錄受測者之活動能力 處理 取得受測者的 informed consent 後 把長有感覺神經 受器的腳以人道方式切除 43
4. 簡單實驗設計 - 兩組資料的研 究 統計分析結果 截肢前後之比較具極顯著差異 結論 -? 獨立樣本? 相關樣本? 44 範例十九
4. 範例十八及十九的統計考量 兩組 Data 之統計檢定類別 - 母數與非母數 檢定 組間比較 組內比較 45
5. 觀察型研究的實驗設計與統計 - 病例對照研 究 (Case-control Study) 46
5. 觀察型研究 - 病例對照研究 (Case-control Study) 以回溯 (Retrospective) 比較罹患 (Case) 及不患 (Control) 某疾病 的人有何不同的特徵 以便探討甚麼罹病影響因子與罹病具有相 關性 配對 (Matching) 可增加其相關性 如性別 年齡 體重 居住地 區等區塊 暴露於影響因子 罹病組 未暴露於影響因子 暴露於影響因子 未罹病組 未暴露於影響因子 過去 未知 現在 回溯 已知 47
5. 範例二十的統計考 量 範例二十 風險比 Risk Ratio 抽煙肺癌組 = a/a+b = 0.8 抽煙二十年對罹患肺癌的影響 列出觀查值 無抽煙肺癌組 = b/a+b = 0.2 勝算 Odds 暴露 未暴露 病例組 a (80) b (20) a+b (100) 對照組 c (20) d (80) c+d (100) 總數 抽煙肺癌組 = a/b = 4 無抽煙肺癌組 = b/a = 0.25 勝算比 Odds Ratio 抽煙罹患肺癌 = 4/0.25 = 16 總數 a+c (100) b+d (100) 48 a+b+c+d (200)
5. 觀察型研究 - 病例對照研究 (Case-control Study) 範例二十一 J Crit Care. 2011; June Acute kidney injury on ventilator initiation day independently predicts prolonged mechanical ventilation in intensive care unit patients 暴露於影響因子 Prolonged MV 未暴露於影響因子 暴露於影響因子 Non-prolonged MV 未暴露於影響因子 過去 現在 回溯 49
5. 觀察型研究 - 病例對照研究 (Case-control Study) 範例二十一 50
5. 觀察型研究 - 病例對照研究 (Case-control Study) 範例二十一 51
5. 觀察型研究 - 病例對照研究 (Case-control Study) 範例二十二 暴露於 ARBs Cancer 組 未暴露於 ARBs 暴露於 ARBs No Cancer 組 未暴露於 ARBs 過去 未知 現在 回溯 已知 52
5. 觀察型研究 - 病例對照研究 (Case-control Study) 範例二十二 53
5. 範例二十一及二十二的統計考 量 Chi-square or Fisher s Exact Test 兩個 Study Groups 間比例值 ( 類別變數 ) 的比較 2 所求數值 X 值愈大其兩 Groups 的差異愈大 以 P 值顯示其差異性 Multivariate Logistic Regression 功能類似線性回歸 (Liner Regression) 適用於變數只有兩 類 會算出每一個影響因子之回歸係數與其標準誤差 及 Odds ratio 與其 95% Confident Interval 以 P 值顯示每一因子相關之差異性 54
5. 觀察型研究 - 病例對照研究 (Case-control Study) 優點 研究時間短 經費需求少 容易操作 可調查一系列不同的危險因子 不會有病人不願意繼續追蹤的問題 缺點 回憶偏差 (Recall Bias) 選擇性偏差 (Selection Bias) 病歷記載品質及項目不一致 不同醫師或單位的認定標準不一 55