投影片 1

Similar documents
投影片 1

投影片 1

投影片 1

投影片 1

102_BS

( ) t ( ) ( ) ( ) ( ) ( ) t-

)

圖 01-1 PROC UNIVARIATE 的輸出結果 ( 腹膜透析 白蛋白 ) 第 1-1 節重要指令說明 : 1. NORMAL: 在報表中呈現常態檢定的結果 2. CLASS 變項名稱 ( 類別 ): 依照 class 所宣告的類別變項分組呈現資料分析結果 在這個例子中我們將資料分為腹膜透析

國家圖書館典藏電子全文

untitled

(Microsoft Word - PK254P\262\331\327\366\312\326\262\341.doc)

投影片 1

建築工程品質管理案例研討

C19 (1)

Business Objects 5.1 Windows BusinessObjects 1

WinMDI 28

Microsoft Word - p11.doc

Microsoft Word - 生統e報_ __v3_1210-Final

Microsoft PowerPoint - C_Structure.ppt

Microsoft Word - 3D手册2.doc

untitled

11第十一章階層線性模式.DOC

統計分析入門與應用 說明 : a. 獨立樣本 : 兩個來自於獨立, 沒有相關的樣本 b. 成對樣本 : 兩個平均數來自於同一個樣本, 有關係的樣本 7-2 Means 平均數分析 Means 平均數分析是用在不同類別變數組合下, 連續變數在各組的統計量, 例如 : 平均數 中位數 標準差 總合 最小

第一章合成.ppt

untitled

Excel VBA Excel Visual Basic for Application

敘述統計概論

Microsoft Word doc

(1) z 分數! 分析 / 描述統計 / 描述性統計量! 將變數選入 變數 中, 勾選 將標準化的數值存成變數, 按 選項! 勾選所需要的統計量項目後按 繼續 (2) 其他標準分數 ( 例 T 分數 ) (5) 轉換 / 等級觀察值! 將變數選入 變數 中, 按 等級類型 勾選 常態分數, 按 繼

USING MAYA ANIMATION Keyset set Maya sets partitions MEL MEL copykey cutkey pastekey scalekey snapkey keytangent bakeresults MEL Command Reference Edi

Spyder Anaconda Spyder Python Spyder Python Spyder Spyder Spyder 開始 \ 所有程式 \ Anaconda3 (64-bit) \ Spyder Spyder IPython Python IPython Sp

個 人 的 手, 拉 著 瞎 子 的 手 把 他 帶 往 村 外 的 時 候, 對 於 瞎 子 來 講, 那 個 人 的 手 和 耶 穌 的 手 有 沒 有 區 別? 沒 有! 為 什 麼 沒 有 區 別? 因 為 對 於 一 個 瞎 子 來 說, 手 和 耳 朵 就 是 他 接 觸 世 界, 瞭

SDS 1.3


(baking powder) 1 ( ) ( ) 1 10g g (two level design, D-optimal) 32 1/2 fraction Two Level Fractional Factorial Design D-Optimal D

Microsoft Word - SPSS軟體操作-basic.doc

spss.doc

C/C++ - 字符输入输出和字符确认

epub83-1

tech_atmn_h1h4_E

<4D F736F F F696E74202D DB1D0AE76B77CBEC7ABE4B946B1D0BEC7A4C0A8C928A764A7D3AB69292E >

Microsoft PowerPoint - SAGE 2010

統計課程目錄95

四川省普通高等学校

《儿童少年卫生学》教学大纲

30 ml polystyrene 4 mm ph 0.1 mg blender M -cm D. pulex D. magna 20 L 2 20

CC213

UDC Empirical Researches on Pricing of Corporate Bonds with Macro Factors 厦门大学博硕士论文摘要库

Chapter 24 DC Battery Sizing

个人及环境卫生调查 (登革热及沙士) 主要报告

Microsoft Word - ACI chapter00-1ed.docx

2013 C 1 #include <stdio.h> 2 int main(void) 3 { 4 int cases, i; 5 long long a, b; 6 scanf("%d", &cases); 7 for (i = 0; i < cases; i++) 8 { 9 scanf("%

國家圖書館典藏電子全文

TPM BIOS Infineon TPM Smart TPM Infineon TPM Smart TPM TPM Smart TPM TPM Advanced Mode...8

Python a p p l e b e a r c Fruit Animal a p p l e b e a r c 2-2

Microsoft Word - Front cover_white.doc

Microsoft PowerPoint - spss2-1.ppt

(Microsoft PowerPoint - 25\272\330\262\316\255p\244\350\252k\257\265\247\3361_Ruth.ppt)

712s

840 提示 Excel - Excel -- Excel (=) Excel ch0.xlsx H5 =D5+E5+F5+G5 (=) = - Excel 00

untitled

User’s Manual

Front 2 Polar F11 ( ) : Polar F11 Polar F11 Polar F11 Polar (Keeps U Fit - Own Workout Program) Polar Polar F11 Polar F11 Polar F11 Polar (

LSC操作说明

untitled

Microsoft Word - administrative-law-08.doc

國立中山大學學位論文典藏.PDF

技 巧 5: 避 免 除 以 0 的 運 算 在 做 除 的 運 算 時, 先 檢 查 除 數 的 數 值, 避 免 有 除 以 0 的 情 況 若 運 算 中 除 數 為 0,SAS 會 在 LOG 中 註 記 提 醒 並 將 運 算 結 果 設 定 為 遺 漏 值, 減 慢 程 式 的 執 行

<4D F736F F D20BDD7A4E5A4BAA4E5BB50A5D8BFFD2E646F63>

一 页 眉 页 脚 的 制 作 首 先 介 绍 一 个 概 念 : 节 这 里 的 节 不 同 于 论 文 里 的 章 节, 但 概 念 上 是 相 似 的 节 是 一 段 连 续 的 文 档 块, 同 节 的 页 面 拥 有 同 样 的 边 距 纸 型 或 方 向 打 印 机 纸 张 来 源 页

自动化接口

錄...1 說...2 說 說...5 六 率 POST PAY PREPAY DEPOSIT 更

f2.eps

<4D F736F F D20A8CFA952A6A12DAED1ADB1B8EAAEC62E646F63>

IBM Rational ClearQuest Client for Eclipse 1/ IBM Rational ClearQuest Client for Ecl

When the rejection rule for a test at every level α can be re-written as then xxx is the p-value of the test. xxx < α, If p-value < α, then the test c

SA-DK2-U3Rユーザーズマニュアル

封面-12

4. 下 列 何 者 不 適 合 用 來 描 述 6 年 8 班 的 血 型 分 佈? (A) 長 條 圖 (bar chart) (B) 盒 鬚 圖 (box plot) (C) 圓 餅 圖 (pie chart) (D) 次 數 多 邊 圖 (frequency polygons) 5. 下 表

Text 文字输入功能 , 使用者可自行定义文字 高度, 旋转角度 , 行距 , 字间距离 和 倾斜角度。

Transcription:

如何利用 Stata 進行統計分析 - 基礎篇 慈濟醫學中心 / 研究部王仁宏 /Paul Wang paulwang@tzuchi.com.tw 分機 17651

課程目標 讓同仁能熟悉利用 Stata 進行下列分析 描述性統計 統計量 交叉表 統計圖 推論性統計 相關分析 差異分析 迴歸分析 [ 註 ] 此次課程講義內容皆以 Stata/SE 13 進行示範教學!! Back to basic!!

統計分析的重要性 回顧並審查 NEJM & Nature Medicine 兩大醫學期刊的文章 整理在醫學研究中常用的統計方法與常見的統計缺失 [ 註 ] 回顧 2004 年上半年 Original Articles NEJM*91 & Nat Med*34

醫學研究常用統計方法 80/20 法則 學會 描述統計 ANOVA t 檢定 / 卡方檢定 皮爾森相關 迴歸分析 存活分析就具備九成功力!!

統計軟體比較 2015 年採購 4 套 Stata/SE 13 軟體已安裝於 : 教學部 大愛 7F/ 圖書室 ( 二台 ) 研究部 協力 6F/611R( 一台 ) 醫務部 協力 4F/ 公用電腦 ( 一台 )

不同版本的 Stata 不同版本的 Stata 差異在於可處理資料大小 & 平行運算 最大觀察值數量受限於電腦 RAM 的大小!! 針對一般統計分析需求, 建議購買 Stata/SE!!

Outline Stata 操作環境介紹 基本操作 資料匯入 / 編碼 如何利用 Stata 進行 描述性統計分析 ( 基礎 ) Unit 1. 統計量 交叉表 Unit 2. 統計圖 & 圖形編輯 如何利用 Stata 進行 推論性統計分析 ( 進階 ) Unit 3. 相關分析 Unit 4. 差異分析 Unit 5. 迴歸分析

1. STATA 操作環境介紹

操作視窗 (1/2) 0. 文字 / 圖形工具列 4.Variables 1.Review 2.Results 3.Command

0. 文字 / 圖形工具列 操作視窗 (2/2) 方便使用者採用點選的方式執行指令 1.Review 凡走過必留痕跡 ( 指令集 ) 記錄所有曾執行過的程式或指令 2.Results 分析結果 記錄執行程式的過程與結果 3.Command 一個口令 / 一個動作 即時撰寫及執行程式或指令 4.Variables 同時僅能分析一個資料檔 列出目前分析資料檔中所有變數名稱與屬性

工具列視窗 文字工具列 類似 SPSS 的 Menu Bar 可透過點選方式完成統計分析或繪製統計圖形 圖形工具列 捷徑 Open Print Results Viewer Do-file Editor Data Editor (Browse) Clear morecondition Save Log Begin Graph Data Editor Variables Manager Break

2. 基本操作 -- 資料匯入 / 編碼

範例資料 (lbw1.dta) Hosmer & Lemeshow(2000) 研究影響出生嬰兒低體重因素的資料 資料筆數共 189 筆 資料包含 : 嬰兒出生體重 (bwt) 是否低體重 (<2500g)(low) 媽媽的年齡 (age) 最後一次月經時體重 (lwt) 種族 (race) 抽菸 (smoke) 是否早產 (ptl) 高血壓病史 (ht) 子宮煩躁 (ui) 妊娠第一期看診次數 (ftv)

從 Excel 匯入資料 Step 1. 開啟 Import 功能 File Import Excel spreadsheet Step 2. 選擇 Excel 資料檔 (lbw.xls) 勾選 Import first row as variable names Excel Stata Stata 指令 import excel "D:\Stata\lbw.xls", sheet("sheet1") firstrow

常見資料處理情況 1. 標註各變項的文字說明 Ex: 將 id 標註文字說明為 identification code 2. 定義變數中各數值代表意義 Ex: 是否低體重 (<2500g)(low) 0: No/ 1:Yes 3. 文字變項編碼 Ex: 將 smoke 中 nonsmoker 及 smoker 分別編碼為 1 及 2 4. 重新編碼 Ex: 將 nonsmoker 及 smoker 分別編碼為 0 及 1 5. 連續變項轉成類別變項 Ex: 年齡分組 (1: <30 y/o/ 2: 30 y/o)

狀況 1 & 2 可利用 Data Variables Manager 修改變數 Label 及 Value Label Stata 指令 label variable id identification code label define yesno 0 "No" 1 "Yes" label values low yesno

狀況 1 & 2 可利用 Variables Manager 中 Manage Value Label 功能定義

狀況 3 & 4 1. 文字變項編碼 Ex: 將 smoke 中 nonsmoker 及 smoker 分別編碼為 1 及 2 Stata 指令 encode smoke, generate(smoke1) 2. 重新編碼 Ex: 將 nonsmoker 及 smoker 分別編碼為 0 及 1 Stata 指令 recode smoke1 (1=0) (2=1) label define nysmoke 0 "nonsmoker" 1 "smoker" label values smoke1 nysmoke

狀況 5 連續變項轉成類別變項 Ex: 年齡分組 (1: <30 y/o/ 2: 30 y/o) Stata 指令 summarize age Stata 指令 recode age (min/29=1) (30/max=2), generate(agegr) label variable agegr "age group" label define agr 1 "<30 y/o" 2 ">=30 y/o" label values agegr agr tab1 agegr

如何利用 STATA 進行 PART I. 描述性統計分析?

統計量 集中趨勢 離散趨勢 Mean Median Mode Max/Min Quartile(Q1,Q3) Range Standard Deviation 描述統計 -- 統計量 & 統計圖 目的 : 讓分析者可以在短時間內瞭解資料的分佈狀況與訊息 Histogram Pie Chart Boxplot

描述性統計分析 -- UNIT 1-1. 統計量

集中趨勢量數 vs 差異量數 集中趨勢量數 平均數 中位數 眾數等統計量 差異量數 全距 四分位差 標準差等統計量 A B μ A μ B R A R B

平均數 / 中位數 / 眾數與資料分佈 ( 偏態 ) 的關係 偏態係數 (a) 左偏 (b) 右偏 (c) 對稱 注意 : 偏態的方向描述是極端值方向 平均數中位數眾數 (a) 眾數中位數平均數 (b) 平均數 = 中位 = 眾數 (c)

利用 Stata 計算統計量 (1/2) Stata Statistics Summaries, tables and tests Summary and descriptive statistics Summary Statistics 1 2 1. 選定變項 (ex: age) 2. 勾選 Standard display 或 Display additional statistics

利用 Stata 計算統計量 (2/2) 針對所選取之變項可自動計算出常用之統計量!! Standard display Display additional statistics

描述性統計分析 -- UNIT 1-2. 交叉表 / 列聯表

利用 Stata 統計次數分配 (1/2) Stata Statistics Summaries, tables and tests Frequency tables One-way table 1 2 1. 選定變項 (ex: race) 2. 勾選細項設定 (ex: 納入 missing 呈現 bar chart 等 )

利用 Stata 統計次數分配 (2/2) 針對所選取之類別變項可自動統計出現次數!! Default Stata 指令 tabulate race 或 tab1 race Stata 指令 tabulate race, plot Produce a bar chart

利用 Stata 進行交叉分析 (1/3) Stata Statistics Summaries, tables and tests Frequency tables Two-way table with measures of association 交叉分析利用表格的方式幫助分析者掌握 資料分佈情況 ( 次數 百分比 統計量 ) 快速檢視類別變項間的相關性

利用 Stata 進行交叉分析 (2/3) 設定包括 : 列 欄變項 統計檢定, 比例呈現方式 1 2 3

利用 Stata 進行交叉分析 (3/3) Stata 指令 tabulate race smoke, chi2 exact row 不同種族孕婦吸菸比例有顯著差異 (p-value<0.001*)

描述性統計分析 -- UNIT 2. 統計圖 & 圖形編輯

常見統計圖形 不同類別間之差異 單組資料之分佈 Bar Graph Histogram Pie Chart Boxplot 不同類別間之差異 Line Graph 時間變化趨勢 各類別所佔比例

長條圖 (Bar Graph) Stata Graphics Bar chart 相關設定 1 2 設定包括 : Main Y 軸 Categories X 軸 Title/Legend 等

長條圖 (Bar Graph) Stata Graphics Bar chart 相關設定 1 2 設定 X 軸所需呈現類別組合 圖形 title

長條圖 (Bar Graph) 範例 不同種族 / 抽菸組合下的出生嬰兒平均體重 Stata 指令 graph bar (mean) bwt, over(smoke) over(race) title(birth weight of different smoke/race)

長條圖 (Bar Graph) 範例 不同種族 / 抽菸組合下的出生嬰兒平均體重 Stata 指令 graph bar (mean) bwt, over(smoke) over(race) title(birth weight of different smoke/race) asyvars

直方圖 (Histogram) Stata Graphics Histogram 相關設定 1 2 3 設定包括 : Main 選擇變項 設定組數 Y 軸呈現方式 Density plot/x axis/y axis/title 等

直方圖 (Histogram) Fit 常態分佈曲線 Y axis/x axis/title 設定

直方圖 (Histogram) 範例 繪出研究對象整體的年齡分佈 Stata 指令 histogram age, frequency normal ytitle(count) xtitle(age) title(overall age distribution)

盒形圖 (Box Plot) Stata Graphics Box plot 相關設定 1 設定包括 : Main Y 軸 Categories X 軸 Y axis/title 等

盒形圖 (Box Plot) Stata Graphics Box plot 相關設定 1 2 設定 X 軸所需呈現類別組合 圖形 title

盒形圖 (Box Plot) 範例 不同種族 / 抽菸組合下的出生嬰兒平均體重 Stata 指令 graph box bwt, over(smoke) over(race) title(birth weight of different race/smoke group)

折線圖 (Line Graph) Stata Graphics Twoway graph 相關設定 1 設定包括 : Plots 設定 X Y 軸變項 Y 軸呈現方式 X axis/y axis/title 等

折線圖 (Line Graph) Stata Graphics Twoway graph 相關設定 1 2 3

折線圖 (Line Graph) 範例 繪出依 id 順序的出生體重趨勢變化圖形 Stata 指令 twoway (line bwt id, sort), ytitle(birth weight) xtitle(id sequence) title(trend of birthweight by id sequence)

圓餅圖 (Pie Chart) Stata Graphics Pie chart 相關設定 1 設定包括 : Main 選定類別變項 Title/Legend 等

圓形圖 (Pie Chart) Stata Graphics Pie chart 相關設定 1

圓餅圖 (Pie Chart) 範例 繪出研究對象不同種族所佔比例 Stata 指令 graph pie, over(race) title(pie chart of race)

武林秘笈 Stata 公司網頁提供各類圖形範例程式語法!! http://www.stata.com/support/faqs/graphics/gph/stata-graphs/

常見圖形編輯情況 圖形輸出 儲存成 Stata 圖形檔或其他類型圖檔 圖形編修 單一圖形 加註文字 修改軸距 顏色 線型 複合圖形 合併多個圖形成為同一個圖

圖形輸出 Stata 點選 Graph 視窗 File Save As 輸入檔名及選擇存檔類型 *.gph(stata 圖檔 ) *.png *.tif *.pdf 等 Stata 指令 graph save Graph "D:\Stata\Pie.gph graph export "D:\Stata\Pie.tif", as(tif) replace

開啟圖形編輯器 Stata 點選 Graph 視窗 Edit Start Graph Editor

圖形編修 加註 / 修改

圖形編修 複合圖形 Stata Window Do-file editor New Do-file editor 輸入指令時, 若指令內容過長可加上 /// 做為分隔符號 row() 及 col() 可控制列數和行數 ; xsize() 及 ysize() 控制長寬!! title() 加上圖形標題 ; note() 加上圖形註解

圖形編修 複合圖形

補充說明

資料整理結果 依據不同 race/smoke 組合, 分別計算出對應組合的 平均出生體重 (meanbwt) 體重標準差 (sdbwt) 人數 (n) Error bar (hibwt & lobwt) Mean ± SD 給每種情況一個編號 (smrace) 以利繪圖!!

Do-file 程式語法

Review Stata 操作環境介紹 & 基本操作 如何利用 Stata 進行 描述性統計分析 ( 基礎 ) Unit 1. 統計量 交叉表 Unit 2. 統計圖 & 圖形編輯 如何利用 Stata 進行 推論性統計分析 ( 進階 ) Unit 3. 相關分析 Unit 4. 差異分析 Unit 5. 迴歸分析 下集分曉, 敬請期待!!

資料型態與適用統計方法 欲檢定的變項 / 依變項 (Y) 兩組 欲進行比較的組別數 / 自變項 (X) 類別 三組或以上 獨立樣本相依樣本獨立樣本相依樣本 連續 連續資料欲檢定的情形 : 集中趨勢 (central tendency) 相關分析 常態假設或中央極限定理成立 常態假設或中央極限定理不成立 類別資料 兩個類別 三類以上 Independent t-test Wilcoxon rank-sum test 卡方檢定 (Yate 修正 ) 卡方檢定 Paired t-test Wilcoxon signed-rank test ANOVA Kruskal- Wallis test 欲檢定的情形 : 關聯性 (association) McNemar s test Cochran s Q test 卡方檢定 卡方檢定 Repeated measures ANOVA Friedman test Cochran s Q test Cochran s Q test 皮爾森相關 Linear regression Spearman s correlation Logistic regression Multilnomial/ Ordinal Logistic regression

Reference STATA 基礎操作與統計模型應用 ( 劉彩卿, 2012) An Introduction to Stata for Health Researchers(Svend, 2008)

靜思語 : 知識要用心體會, 才能變成自己的智慧 感謝聆聽 Q & A