圖 01-1 PROC UNIVARIATE 的輸出結果 ( 腹膜透析 白蛋白 ) 第 1-1 節重要指令說明 : 1. NORMAL: 在報表中呈現常態檢定的結果 2. CLASS 變項名稱 ( 類別 ): 依照 class 所宣告的類別變項分組呈現資料分析結果 在這個例子中我們將資料分為腹膜透析

Similar documents
Microsoft Word - 生統e報_ __v3_1210-Final

( ) t ( ) ( ) ( ) ( ) ( ) t-

C19 (1)

102_BS

PDFᅲᆰᄏ커￷

影響未婚同居的因素:以大學生為樣本的問卷調查

表 01 1 使用的變項及部分數據值 DM CVA ID treat Age Albumin Ca P Sex ( 原發病是否 ( 是否有腦血 ( 編號 ) ( 洗腎型態 *) ( 年齡 ) ( 白蛋白 ) ( 鈣 ) ( 磷 ) ( 性別 *) 為糖尿病 *) 管疾病 *)

國家圖書館典藏電子全文

)

統計分析入門與應用 說明 : a. 獨立樣本 : 兩個來自於獨立, 沒有相關的樣本 b. 成對樣本 : 兩個平均數來自於同一個樣本, 有關係的樣本 7-2 Means 平均數分析 Means 平均數分析是用在不同類別變數組合下, 連續變數在各組的統計量, 例如 : 平均數 中位數 標準差 總合 最小


基礎統計

技 巧 5: 避 免 除 以 0 的 運 算 在 做 除 的 運 算 時, 先 檢 查 除 數 的 數 值, 避 免 有 除 以 0 的 情 況 若 運 算 中 除 數 為 0,SAS 會 在 LOG 中 註 記 提 醒 並 將 運 算 結 果 設 定 為 遺 漏 值, 減 慢 程 式 的 執 行

目 录 一 项 目 简 介... 3 二 项 目 核 心 成 果... 6 ( 一 ) 创 新 的 理 论... 7 ( 二 ) 技 术 环 境 与 资 源... 8 三 项 目 的 推 进 方 式 四 项 目 实 施 效 果 ( 一 ) 小 学 语 文 跨 越 式 实 验

~ ( ) ( ) ( ) 5 1 ;005 ( ) 11 ; (1) ( 150 ) () ( ) (3) ( ) ( ) ( ) 006 ( 6 18 ); ( ) 6

Microsoft PowerPoint - spss2-1.ppt

840 提示 Excel - Excel -- Excel (=) Excel ch0.xlsx H5 =D5+E5+F5+G5 (=) = - Excel 00

Microsoft Word - 生統e報200907[Final].doc


spss.doc

投影片 1

Microsoft Word - p11.doc

Microsoft PowerPoint pptx.ppt

<4D F736F F D B0EAA5C1A470BEC7A4CEB0EAA5C1A4A4BEC7B8C9B1CFB1D0BEC7B9EAAC49A4E8AED7>

(Microsoft PowerPoint - 25\272\330\262\316\255p\244\350\252k\257\265\247\3361_Ruth.ppt)

个人及环境卫生调查 (登革热及沙士) 主要报告

(1) z 分數! 分析 / 描述統計 / 描述性統計量! 將變數選入 變數 中, 勾選 將標準化的數值存成變數, 按 選項! 勾選所需要的統計量項目後按 繼續 (2) 其他標準分數 ( 例 T 分數 ) (5) 轉換 / 等級觀察值! 將變數選入 變數 中, 按 等級類型 勾選 常態分數, 按 繼

投影片 1

<4D F736F F D20A5F1A4FBA473A6DBA662C149AE76BB50B0A8AFAAB944A440AC78A67BA976C149BEC7ABE4B751AABAB56FAE692E646F63>


Microsoft Word - 生統e報10月_1_

158 中 極 學 刊 一 前言 清末著名的改良戲曲 黑籍冤魂 原為清末小說家吳趼人寫的短篇小說 名 伶夏月珊將其稍易節目 並搬演於舞臺 由於劇情發人深省 反映社會之弊 故 引 起 當 時 熱 烈 的 迴 響 黑 籍 冤 魂 可 說 是 晚 清 啟 蒙 儀 式 中 最 為 重 要 的 片 段 之 一

附 件 :2015 年 度 普 通 高 等 学 校 本 科 专 业 备 案 和 审 批 结 果 教 育 部 2016 年 2 月 16 日 抄 送 : 国 家 发 展 改 革 委 财 政 部 国 家 卫 生 计 生 委 国 家 中 医 药 管 理 局 部 内 发 送 : 有 关 部 领 导, 办 公

Microsoft Word - A doc

目 录 第 一 部 分 档 案 局 概 况 一 主 要 职 责 二 部 门 决 算 单 位 构 成 第 二 部 分 档 案 局 2016 年 度 部 门 预 算 表 一 2016 年 度 市 级 部 门 收 支 预 算 总 表 二 2016 年 度 市 级 部 门 支 出 预 算 表 三 2016

2015 年 度 收 入 支 出 决 算 总 表 单 位 名 称 : 北 京 市 朝 阳 区 卫 生 局 单 位 : 万 元 收 入 支 出 项 目 决 算 数 项 目 ( 按 功 能 分 类 ) 决 算 数 一 财 政 拨 款 一 一 般 公 共 服 务 支 出 二

投影片 1

0 0 = 1 0 = 0 1 = = 1 1 = 0 0 = 1

Microsoft Word - 生統e報 _相關係數

TA-research-stats.key

untitled

投影片 1

2014 EduG subject effect the effect of object of measurement 2 item effect 3 4 random error error confounding 3 universe of admissible observati

歯WP02-12-부속물.PDF

臺北醫學大學生物統計研究中心 enews 第 6 期 2015/04 R-web 資料分析應用 : 分析方法 變異數 ( 標準差 ) 檢定 吳佩真副統計分析師 回顧前五期的生統 enews 雲端資料分析暨導引系統 ( R-web, 介紹圖表繪製 平均

tech_atmn_h1h4_E

國家圖書館典藏電子全文

ACI pdf

投影片 1

第一章合成.ppt

國立中山大學學位論文典藏.PDF

《儿童少年卫生学》教学大纲

<4D F736F F D20AD5EBB79C5A5C1BFB9EAB2DFB4C1A5BDB3F8A7692E646F63>

< > by /10() 8/11() 1 vs. 2 Z () t 3 Z- t- () 4 () () () 3

城市学研究 编辑委员会 顾 问 徐匡迪 潘云鹤 王梦奎 单霁翔 毛昭晰 杨 卫 潘公凯 弗朗西斯科 班德林 主 任 王国平 副主任 顾树森 叶高翔 编 委 按姓氏笔画排列 匡廷云 江山舞 阮重晖 何 俊 吴缚龙 邹逸麟 陈 跃 陈同滨 庞学铨 罗卫东 郑杭生 胡征宇 裴长洪 黎青平 主 编 胡征宇

Excel VBA Excel Visual Basic for Application


32 醫 學 新 知 (I) (adjusted hazard ratio: 0.35; 95% confidence interval: 0.18 to 0.70; p = 0.003)

untitled

4. 下 列 何 者 不 適 合 用 來 描 述 6 年 8 班 的 血 型 分 佈? (A) 長 條 圖 (bar chart) (B) 盒 鬚 圖 (box plot) (C) 圓 餅 圖 (pie chart) (D) 次 數 多 邊 圖 (frequency polygons) 5. 下 表

101學年度臺灣健康促進學校行動研究成果評選辦法

Microsoft Word - ACI chapter00-1ed.docx

864 现 代 药 物 与 临 床 Drugs & Clinic 第 31 卷 第 6 期 2016 年 6 月 of apoptosis related factors, decrease the incidence of adverse reactions, which is of great

Vol. 15 No. 1 JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY Feb O21 A

投影片 1



常用的統計檢定方法 依變項 DV 類別變數 自變項 IV 連續變數 連續變數 Type A: t 檢定 變異數分析 Type B: 相關 迴歸分析 類別變數 Type C: 卡方檢定 Type D: 判別分析 羅吉斯迴歸

OncidiumGower Ramsey ) 2 1(CK1) 2(CK2) 1(T1) 2(T2) ( ) CK1 43 (A 44.2 ) CK2 66 (A 48.5 ) T1 40 (

SOP Waiting Time

1970 新技術的應用 X = 20 + B 13B δ13c X 1 X

1


4. 下列何者不適合用來描述 6 年 8 班的血型分佈? (A) 長條圖 (bar chart) (B) 盒鬚圖 (box plot) (C) 圓餅圖 (pie chart) (D) 次數多邊圖 (frequency polygons) 5. 下表為 76 名高血壓住院病人之收縮壓 (SBP) 測量

穨CH17VER1a.PDF

<4D F736F F F696E74202D A67EB0EAA4A4B2A6B77EA5CDA668A4B8B669B8F4ABC5BEC9C2B2B3F82DA4A4A473A475B0D32E707074>

中國醫藥大學生物統計中心 2011 年 10 月 評估科克斯比例風險模式 (Cox s proportional hazard model) 之等比風險假設的方法 生統所李采娟教授 此篇文章介紹兩種方式評估科克斯比例風險模式 (Cox s proportional hazard model) 的等比

201(1-22) CDR

Microsoft Word - 生統e報.docx

第五節 2011台灣地區高中生問卷等各項分析

(baking powder) 1 ( ) ( ) 1 10g g (two level design, D-optimal) 32 1/2 fraction Two Level Fractional Factorial Design D-Optimal D

When the rejection rule for a test at every level α can be re-written as then xxx is the p-value of the test. xxx < α, If p-value < α, then the test c

先介紹如何估計存活函數 (survival curve) 常用的方法是採用 Kaplan-Meier 方式估計存活函數 (Kaplan and Meier, 1958) 舉例來說, 若收集到的資料按發生 順序排列如下, 數字後有加號的表示是設限資料 : 3, 4, 5+, 6, 6+, 8, 10,

投影片 1

<4D F736F F D20BDD7A4E5A4BAA4E5BB50A5D8BFFD2E646F63>

75% 2 2

<4D F736F F D B0D3B77EC3FEA7DEC3C0C476C1C9A5BFA6A1B8D5C3442DB57BA6A1B35DAD702DBEC7ACEC2E646F6378>

p.2 1. a. b. c. (i) (ii)

144 Chinese Journal of Zoology 45 S. plumbea 1 S. chinensis Flower Porter / Jefferson cm

PowerPoint 簡報

1-2 二元一次聯立方程式 21 例 1 代入法判斷二元一次聯立方程式的 { x3y5 2xy3 x1y2 x3y3 x2y1 xy 二元一次式 x y x+3y x-y x2y1 x2y1 { x3y5 2xy3 { 2x3y1 xy3 x2y1

第一章 緒論

1 500 表 1: 各國平均分數


學校經營計畫撰寫內容

2010 2,, 3 : 21,,, ; Tony Saich,, ;,,,,,,,, :,,,,,, ;, ( ), : ;, ;,,,,, ( 135 ),, :, ;, 10 ( 1) ;, : 5, 4, 3, 2, , 3, 5,,, , 3 ( ),,, 7



11第十一章階層線性模式.DOC

福 建 福 州 市 长 乐 市 电 视 机 影 音 及 配 件 产 品 小 家 电 产 品 长 乐 市 吴 航 洪 鸣 家 用 电 器 维 修 店 长 乐 市 西 洋 北 路 69 号 福 建 福 州 市 平 潭 县 电 视 机 影 音 及 配 件

Transcription:

第二章 兩組樣本平均值比較 邱顯財 統計分析師 在分析資料的過程中, 最常見的問題, 就是比較兩組連續資料的集中趨勢 (central tendency) 有無差異 本次內容將針對描述兩組連續型的資料, 以及檢定兩 組的集中趨勢, 說明如何撰寫 SAS 程式 1-0. 資料描述語法介紹 - 連續型資料 : 在 Base SAS 模組中, 有兩個程序可以描述連續型資料, 在本節中將分別介紹 這兩個程序語法的撰寫, 以及呈現報表的判讀 1-1. 資料描述 -PROC UNIIVARIATE 的應用 : 以腎臟科的資料庫為例, 我們想要了解不同洗腎型態病人其生化值的描述性統計量, 可以藉由 程式 01-1 PROC UNIVARIATE 語法獲得各組別病人在各種生化值上詳細的統計量 其中腹膜透析 (treat=0) 病人的白蛋白數值 (Albumin) 的描述性統計量如圖 01-1 所示 PROC UNIVARIATE DATA=esrd NORMAL; VAR albumin k ca p; 程式 01-1 PROC UNIVARIATE 語法 圖 01-1 中呈現的統計量有幾個部分, 為有關動差 (moment) 的統計量, 樣本數 (N) 可以從此得知 ; 為基本且常見的描述性統計量, 集中趨勢有平均值 (Mean) 中位數 (Median) 眾數(Mode), 變異程度有標準差 (Std Deviation) 變異數(Variance) 全距 (Range) 四分位距(Interquartile Range); 為檢定資料是否成常態分布, 較常用來判定資料成常態分布的檢定是 Shapiro-Wilk,p-value<0.05 代表資料違反常態假設

圖 01-1 PROC UNIVARIATE 的輸出結果 ( 腹膜透析 白蛋白 ) 第 1-1 節重要指令說明 : 1. NORMAL: 在報表中呈現常態檢定的結果 2. CLASS 變項名稱 ( 類別 ): 依照 class 所宣告的類別變項分組呈現資料分析結果 在這個例子中我們將資料分為腹膜透析 (treat=0) 與血液透析兩組 (treat=1) 來分析 使用 CLASS 敘述不需要排序 3. VAR 變項名稱串 : 列出要分析的變項 1-2. 資料描述 -PROC MEANS 應用 : 另一種呈現描述性統計量的方式, 是使用 程式 01-2 PROC MEANS 語法獲得比較精簡的摘要描述性統計量, 輸出結果如圖 01-2 所示 在報表中, 可以一目瞭然地得知不同洗腎型態病人各種生化值的摘要統計量, 例如平均值 (mean) 標準差 (std deviation) 中位數(median) 四分位距(interquartile range)

PROC MEANS DATA=esrd N MEAN STD MEDIAN QRANGE MAXDEC=2; VAR albumin k ca p; 程式 01-2 PROC MEANS 語法 圖 01-2 PROC MEANS 的結果 第 1-2 節重要指令說明 : 1. PROC MEANS 預設輸出的統計量有樣本數 平均值 標準差 最大值 最小值 在此特別指定以下統計量 -N: 樣本數 ; MEAN: 平均值 ; STD: 標準差 ; MEDIAN: 中位數 ; QRANGE: 四分位距 MAXDEC= 設定輸出的最大小數位數 2. CLASS 變項名稱 ( 類別 ): 依照 class 所宣告的類別變項分組呈現資料分析結果 3. VAR 變項名稱串 : 列出要分析的變項

2-0. 資料類型與對應的統計方法 : 兩組樣本的比較 前一節我們已經學會撰寫語法以取得資料的描述性統計量, 以對資料有概略地認識 假設我們關心的研究問題是腹膜透析與血液透析的病人其生化值有無差異, 先以數值差異較大的鉀 (K) 離子濃度為例, 腹膜透析病人平均濃度為 5.39 meq/l, 血液透析病人平均濃度為 4.66 meq/l ( 圖 01-2), 然而兩組病人在鉀濃度上的差異是否有統計上顯著呢? 要回答這個問題, 我們可以從表 02-1 找到合適的統計方法進行檢定 如果我們想要檢定的變項為連續資料, 且比較的兩個組別是獨立的, 參考表 02-1 我們可以有兩種選擇 :(1) 當資料在比較的兩組中均服從常態假設或中央極限定理成立時, 可以使用 獨立樣本 t 檢定 (Independent t-test);(2) 當兩組中任一組資料違反常態假設或中央極限定理不成立時, 則應使用 魏克森等級和檢定 (Wilcoxon rank sum test) 因此, 我們可以先利用 程式 01-1 PROC UNIVARIATE 語法判定這些生化值是否服從常態分布, 並評估樣本數大小, 然後利用合適的統計方法加以檢定 表 02-1 資料型態與適用統計方法 (1) 欲檢定的變項 / 依變項 (Y) 欲進行比較的組別數 / 自變項 (X) 兩組三組或以上獨立樣本相依樣本獨立樣本相依樣本 連續 連續資料集中趨勢 (central tendency) 相關分析 常態假設或中央極限 定理成立 Independent t-test Paired t-test ANOVA Repeated measure ANOVA correlation /Linear regression 常態假設或中央極限 定理不成立 Wilcoxon Rank sum test Wilcoxon signed-rank test Kruskal-Wallis test Friedman test Spearman correlation 類別資料 關聯性 (Association) 兩個類別 with Yate's correction McNemar 's test Cochran's Q test Logistic regression 三類以上 Cochran's Q test Cochran's Q test Multinomial / Ordinal logistic regression

2-1. 兩組樣本平均值比較 -PROC TTEST 應用 : 整理 程式 01-1 PROC UNIVARIATE 語法的結果, 可以得知白蛋白與鈣離子濃度不論在腹膜透析或血液透析病人中, 都符合常態分布的假設 因此 程式 02-1 PROC TTEST 語法便可用來檢定兩組病人的白蛋白與鈣離子濃度平均值是否有顯著差異 結果如圖 02-1 所示 /* Independent t-test */ PROC TTEST DATA=esrd; VAR Albumin Ca; 程式 02-1 PROC TTEST 語法 在圖 02-1 呈現了獨立樣本 t 檢定的結果, 描述性統計量的部分可以從 PROC UNIVARIATE 或 PROC MEANS 取得 要判定檢定的結果是否顯著要經過以下步驟 : 從 Equality of Variance 的檢定結果來研判兩組資料的變異數是否均等, 若 Pr>F 的數值大於 0.05, 則 T-Tests 應選擇 Variances 為 Equal 的檢定結果,Pr> t 若小於 0.05 代表兩組間均值有統計上顯著差異 若 變異數均等的假設不成立 (Pr>F 小於 0.05), 則 T-Tests 時選擇 Variances 為 Unequal 的檢定結果

圖 02-1 PROC TTEST 的結果 第 2-1 節重要指令說明 : 1. CLASS 變項名稱 : 欲比較的分組變項 ( 限兩組 ) 2. VAR 變項名稱串 : 列出要分析的變項 2-2. 兩組樣本中位數比較 -PROC NPAR1WAY 應用 : 鉀離子與磷離子在兩組洗腎病人中的分布都違反了常態假設, 要比較這兩個生化值在兩組病人中有無差異, 合適的檢定方法應該是無母數的魏克森等級和檢定, 使用的語法為 程式 02-2 PROC NPAR1WAY 其中鉀離子的比較結果如圖 02-2 所示 判讀時應由報表中間的 Wilcoxon Two-Sample Test 段落中 Two-sided Pr> Z 是否小於 0.05 來決定是否有顯著差異 /*Wilcoxon rank sum test */ PROC NPAR1WAY DATA=esrd WILCOXON; VAR k p; 程式 02-2 PROC NPAR1WAY 語法

圖 02-2 PROC NPAR1WAY 的結果 ( 針對 K) 第 2-2 節重要指令說明 : 1. WILCOXON: 指定使用魏克森分數 (Wilcoxon scores) 進行分析, 若不指定則數個內建的無母數檢定都會執行 2. CLASS 變項名稱 : 欲比較的分組變項 3. VAR 變項名稱串 : 列出要分析的變項 將本章第一節與第二節的結果整理之後, 可以得到以下的表格 不論是白蛋 白 鉀離子 鈣離子或磷離子濃度, 在腹膜透析與血液透析的病人之間並無統計 上顯著差異 Table 1. Comparisons of biochemical indices between PD and HD patients PD HD N Mean ± SD Median (25 th pctl - 75 th pctl) N Mean ± SD Median (25 th pctl - 75 th pctl) p-value Albumin 33 2.47 ± 0.60 2.60 (2.10-2.90) 67 2.63 ± 0.67 2.70 (2.10-3.10) 0.261 T K 33 5.39 ± 6.65 4.30 (3.60-4.90) 67 4.66 ± 1.46 4.30 (3.50-5.50) 0.519 W Ca 32 8.67 ± 1.23 8.50 (7.95-9.25) 64 8.70 ± 1.01 8.80 (7.95-9.35) 0.889 T P 32 4.94 ± 2.04 4.45 (3.60-6.10) 56 4.43 ± 2.11 4.40 (2.90-5.75) 0.250 W T : independent t-test; W : Wilcoxon rank sum test