G*power 使用教學 Bruce cmshih1001@gmail.com 1
Sample size, power, and effect size
關於 Gpower, 你不能不知道的第一件事! 3
甚麼是算數平均數及加權平均數? n X 1 X i i1 1 3 N 3 3 k freqency fx i i 1 1 3 1 9 1.6 4 N 5 5 1
甚麼是標準差 (σ, S)? 變異數 (σ,s )? X : 1 3 5 + 0 + + μ : 3 所謂的標準差或變異數是一種描述資料分散程度的統計指標 5
n ( X i ) i 1 ( ) ( ) ( ) (1 3) (33) (53) 8 N 3 3.666667 n ( X i ) i1 (1 3) (3 3) (5 3) 8 1.63993 N 3 3 S n ( X i ) i1 (1 3) (3 3) (5 3) 8 N 1 31 4 S n ( X i ) i 1 (1 3) (3 3) (5 3) 8 N 1 31 31 6
變異數的公式簡寫 S n i 1 ( X ) i SS = N 1 N 1 其中, n i1 SS ( X ) i SS : Sum of Squared Deviations from the Mean 7
關於 Gpower, 你不能不知道的第二件事! 8
甚麼是 變異數分析 (ANOVA)? 先思考以下一個例子! 9
怎麼評估好老師? 小馬, 小英經常誇口自己教學一流, 今天學期成績出爐, 請問您要如何評估, 才能突顯好老師的教學成效? 受試者成績老師平均數 學生 1 58 小馬 60 學生 6 小馬 學生 3 68 小英 70 學生 4 7 小英 平均數 65 10
好老師的定義 所謂好老師就是經他教導後, 該班學生的成績或表現會呈現兩種特徵 : 班間差距變大 ( 組間差異,SSb 或 S b) 班內差距變小 ( 組內差異,SSw 或 S w) 11
合併 好老師 的兩個指標 F 班間差距 ( 大 ) 組間差距 ( 大 ) = = 好老師班內差距 ( 小 ) 組內差距 ( 小 ) F S S b w SS d f SS b b w df w 1
ID teacher height 變異數分析思考過程 班內 班內 班內差 班間 班間差 平均 差距 距平方 差距 距平方 1 小馬 58 4 55 5 60 小馬 6 + 4 5 5 3 小英 68 4 +5 5 70 4 小英 7 + 4 +5 5 65 總和 16 100 13
組內 SS w, σ w, MS w 三者區辨 w w w SS w (58 60) (6 60) (68 70) (7 7) 16 Population variance (used in G*power analysis) SS 16 w 4, w w N 4 w w Sample variance (Mean square, MS) (used in ANOVA analysis) SS SS 16 16 MS w w w df N 4 w 8 14
組間 SS b, σ b, MS b 三者區辨 b b b SS (60 65) (70 65) 100 b Population variance (used in G*power analysis) SSb (6065) (7065) (6065) (7065) 50 b 5 N 4 b b 5 K 組 Sample variance (used in ANOVA analysis) SSb SSb 100 100 MS b df k 1 1 1 b 100 15
變異數分析報表意涵 誤差項 SS df MS F p 組間 100 1 100/1=100 100/8=1.5 0.07 組內 16 16/=8 全體 116 3 p值是用來衡量 F 值大小之指標, 此處 p=0.07 表示 F 要大於 1.5 的機率只有 7.%, 已相當接近達顯著的 5% 透過上述分析流程, 可以知道若某位老師的教學表現特別突出時, 則會拉開班級間差距, 且班內差距也會跟著縮小, 那麼 F 值就會變得很大 16
SPSS syntax for 1 way ANOVA Data list free / group score. Begin data 1 58 1 6 68 7 End data. ONEWAY score BY group. 17
SPSS syntax for sample t test Dt Data list free / group score. Begin data 158 16 68 7 End data. T TEST GROUPS=group(1 ) /VARIABLES=score. 18
關於 Gpower, 你不能不知道的第三件事! 19
甚麼是標準分數 (Z score)? 身心障礙及資賦優異學生鑑定標準 本法第四條第一項第一款所稱一般智能優異, 指在記憶 理解 分析 綜合 推理 評鑑等方面較同年齡具有卓越潛能或傑出表現者 ; 其鑑定標準如下 : 智力或綜合性向測驗得分在平均數正一點五個標準差或百分等級九十三以上者 專家學者 指導教師或家長觀察推薦, 並檢附學習特質與表現等具體資料者 0
0.05 0.00 Z X X 70 100 SD 15 Z X X 130 100 SD 15 0.005 0.010 y 0.000 0.015 IQ=70 60 80 100 10 140 x IQ=130 1
衡量顯著性的指標 - 效果量 Effect Size C o h en ' s d m S m 1 S 1 效果量有時被稱為 實質的顯著性 (practical significance) 其中,d 係數是用來估算兩個變數間關聯之強度 可以解釋成兩組分數的分布未重疊之百分比 根據 Cohen(1988) 的定義, 若 d=0. 時, 則有 14.7% 未重疊, 為小效果 ; 若 d=0.5 時, 則有 33.0% 未重疊, 為中效果 ; 若 d=0.8 時, 則有 47.4% 4% 未重疊, 為大效果
要用誰的標準差? m m 1 60 80 100 10 140 160 180 x 3 y 0.000 0.0 0 5 0.010 0.015 0.00 0.05
延續前例 小英 小馬 Mean 70 60 SD.8843.8843 Variance 8 8 m1 m 70 60 10 Cohen ' s d 3.535534 S 8 8 8 1 S 4
Effect Size Calculators http://www.uccs.edu/~faculty/lbecker/ 5
進階問題 根據前面分析可知, 小英與小馬教學表現的差距之顯著性 p值僅有 0.07, 尚未達到.05 的標準 今天若增加調查樣本時, 各組應增加多少人, 可以讓差異達顯著? 一般 power 達到 0.8 時, 就會呈現顯著差異 因此可將 power 設定為 0.8 6
甚麼是 Power? a=0.05.918.95.8.9 3.0 3.1 3. x1 b=0.3594.918.95.8.9 3.0 3.1 3. x 1-b=0.6406.8.9 3.0 3.1 3. x 7 dnorm(x,.9, 0.05) dnorm(x,.9, 0.05) dnorm(x1, 3, 0.05) 0 4 6 8 0 4 6 8 0 4 6 8
啟動 Gpower, 並輸入相關數值 8
計算 Cohen s d 9
設定相關參數並計算結果 30
Non centrality parameter nn 1 33 9 d 3.5355303 3.5355303 4.33013 n1 n 3 3 6 31
效果量另一個衡量指標 Eta square Eta square 一般用來衡量超過兩組以上平均數差異顯著性的效果量指標, 如 ANOVA 其算法有二: b t SS b SS t 3
第一個公式 b t 33
b 第一個公式 t 34
根據 Variance 計算 Eta square (70 65) (60 65) 50 b 5 w (58 60) (6 60) (68 70) (7 70) 16 4 4 4 所以 5 5 4 5 9 b b t b w 0.86069 35
根據 SS 計算 Eta square SSb SSb 100 100 SS SS SS 100 16 116 t b w 0.86069 36
SPSS syntax for Eta square Dt Data list free / group score. Begin data 1 58 16 68 7 End data. UNIANOVA score BY group /PRINT=OPOWER ETASQ DESCRIPTIVE. 37
SPSS 在各組 sample size= 時,Non centrality parameter=1.5 38
根據 Eta square 計算 f 值 根據 Cohen 的觀點,f 也是一個效果量指標, 它與 Eta square 關係緊密, 其判別標準為 : 小效果量 中效果量 大效果量 0.1 0.5 0.4 f b 5 4 w.5 39
Eta square 與 f 值的關係 ( f ) f f f b b w w w t b w ( f w ) w f w w w(1 f ) 1 f f 1 0.86069 以本例來說, f =.5 1 10.86069 40
利用 Gpower 求得所需的 Sample size 41
非中心參數 (Noncentrality parameter) 由於 Gpower 分析結果建議 sample size 可取 6 人 (total N), 因此 NCP=37.5 f N(.5) 6 37.5 此處須留意的是, SPSS 的 NCP 是以各組的 sample size 為單位來計算, 因此若 sample size 各組取 人 (total N=4) 時, 則 NCP=1.5, 但 Gpower 會算成 NCP=5 f n (5) (.5) 15 1.5 4
單因子重複量數變異數分析 43
Example subject red yellow green blue 1 3 3 4 5 6 5 6 6 3 3 3 3 4 3 4 4 7 5 1 3 4 6 3 3 4 7 1 1 8 3 3 4 44
SPSS syntax for 1-way Repeated Measure ANOVA Data List Free / subject red yellow green blue. Begin Data 1 3 3 4 5 6 5 6 6 3 3 3 3 4 3 4 4 7 5 1 3 4 6 3 3 4 7 1 1 8 3 3 4 End Data. GLM red yellow green blue /WSFACTOR=A 4 Polynomial /PRINT=DESCRIPTIVE ETASQ OPOWER. 45
ANOVA table 46
Multivariate Test 47
計算 Eta square 與 f 值 SSb SSb 14.594 0.680 SS SS SS 14.594 8.656 t b w f.68 1 1.68 1.9997 48
G*power Gpower analysis 49
Noncentrality parameter Gpower 的 NCP 計算方式為 : m 4 f N f ( ) N (1.99967) ( ) 3 40.516160 1r 10.5 50
51
可能問題 由於 Gpower 並未清楚詳述 corr among rep measures 如何得出, 因此只能採用 Default=0.5 以下嘗試根據 SPSS 結果反推 corr among rep measures 根據 SPSS 結果得知若要獲得 NCP=35.404 時, 則 cor 必須要代入 0.558587, 5858 且 power 也必須訂在 0.889 時, Gpower 結果才與 SPSS 一致 為什麼? 5
如何回推重複測量的相關係數? 53
G*power Gpower analysis 54
SPSS syntax for corr among rep measures Data list free / lambda f m N. Begin data 35.404 1.99967 4 8 End data. Matrix. get lambda/var=lambda. get f/var=f. get m/var=m. get N/var=N. compute rho=1 (f**)*m*n/lambda. print {rho}/title='corr among rep measures'/clabel=' 相關係數 ','rho'/format=f8.4. End matrix. 55
R syntax for corr among rep measures corr=function(lambda, f, m, N) { } rho=1 (f^)*m*n/lambda list(rho=rho) corr(35.404,1.99967,4,8 ) 56
Matlab syntax for corr among rep measures function corr(lambda, f, m, N) { } 1 (f^)*m*n/lambda corr(35.404,1.99967,4,8 ) 57
Randomly select subjects from groups Begin Data 1 3 3 4 5 6 5 6 6 3 3 3 3 4 3 4 4 7 5 1 3 4 6 3 3 4 7 1 1 8 3 3 4 End Data. USE ALL. COMPUTE filter_$=(uniform(1)<=.37). FILTER BY filter_$. GLM red yellow green blue /WSFACTOR=A 4 Polynomial /PRINT=DESCRIPTIVE ETASQ OPOWER. 58
兩因子變異數分析 ( 獨立樣本 ) 59
ANOVA table SV Df Sum of Sq Mean Sq F Value Pr(F) Factor A 1356.30 678.151 0.777 0.471 (3 levels) l Location 1 106.408 106.488 0.1 0.730 ( levels) A x B 776.154 388.077 0.445 0.646 Residuals 4 0948.9393 87.87 60
G*power Gpower 61
Calculating the effect size of the Interaction A x B using GPOWER 6
Compute required sample size 63
兩因子變異數分析 ( 重複測量 ) 64
SPSS data Data List Free / subject a1b1 a1b a1b3 ab1 ab ab3. Begin Data 1 4 1 3 3 7 11 9 3 9 8 3 8 3 8 4 6 5 4 10 4 9 5 5 6 1 5 6 3 9 3 5 9 End data. GLM a1b1 a1b a1b3 ab1 ab ab3 /WSFACTOR=A A Polynomial B 3 Polynomial /PRINT=DESCRIPTIVE ETASQ OPOWER /WSDESIGN=A B A*B. 65
Measure:ME ASURE_1 Source Type III Sum of Squares df Tests of Within- Subjects Effects Mean Square F Sig. Partial Eta Squared Noncent. Parameter Observed Powera A Sphericity Assumed 4.8 1 4.8 0.783 0.46 0.164 0.783 0.106 Greenhouse-Geisser 4.8 1 4.8 0.783 0.46 0.164 0.783 0.106 Huynh-Feldt 4.8 1 4.8 0.783 0.46 0.164 0.783 0.106 Lower-bound 4.8 1 4.8 0.783 0.46 0.164 0.783 0.106 Error(A) Sphericity Assumed 4.533 4 6.133 Greenhouse-Geisser Gi 4.533 4 6.133 Huynh-Feldt 4.533 4 6.133 Lower-bound 4.533 4 6.133 B Sphericity Assumed 101.4 50.7 14.5 0.00 0.784 9.041 0.981 Greenhouse-Geisser Geisser 101.4 1.178 86.07 14.5 0.013 0.784 17.107 0.869 Huynh-Feldt 101.4 1.379 73.547 14.5 0.008 0.784 0.019 0.916 Lower-bound 101.4 1 101.4 14.5 0.019 0.784 14.5 0.81 Error(B) Sphericity Assumed 7.933 8 3.49 Greenhouse-Geisser 7.933 4.71 5.98 Huynh-Feldt 7.933 5.515 5.065 Lower-bound 7.933 4 6.983 A * B Sphericity Assumed 4. 1.1 5.199 0.036 0.565 10.398 0.658 Greenhouse-Geisser 4. 1.565 6.961 5.199 0.05 0.565 8.138 0.564 Huynh-Feldt Fld 4. 1.11 5.199 0.036036 0.565 10.398 0.658 Lower-bound 4. 1 4. 5.199 0.085 0.565 5.199 0.414 Error(A*B) Sphericity Assumed 3.467 8 4.058 Greenhouse-Geisser 3.467 6.61 5.186 Huynh-Feldt 3.467 8 4.058 Lower-bound 3.467 4 8.117 a. Computed using alpha =.050 66
67
68
Thank you for listening! 69