第三章變異數分析 變異數分析 (ANOVA) 是試驗設計資料的基本統計分析工具, 是以 F-test 來檢測差異的顯著性, 是依據二獨立的樣本變異數之比呈現一 F- 分佈, 將二不同情況下的變異數代入分子及分母, 會得到檢測的 F- 值, 及相對的 p- 值 F- 分佈 設有二常態母體, 變異數分別為 σ 1 2 及 σ 22, 二隨機樣本, 樣本變異數 S 12,S 2 2, 自由度為 v 1 及 v 2, 令 S / 1 / 2 2 1 F 2 2 S2 2, 則 F 為一 F- 分佈, 自由度為 (v 1, v 2 ),F- 分佈的形狀由分子及分母的自由度決定 1-way_2010 1
一因子變異數分析 (1-way ANOVA) 目標 : 比較 m 組均值 ( 母體均值 μ 1,, μ i,, μ m ) 前提 : 各組資料獨立且同質, 誤差獨立, 誤差服從常態分佈 Data : m 組資料, 每組 n 個觀測值 y ij --- 第 i 組資料之第 j 組觀測值 Group 1 i m Avg. y 11 y i1 y m1 y 12 y i2 y m2 y 1n y in y mn 1-way_2010 2
模式 y ij = μ i + ε ij, i= 1,, m, j= 1,, n ε ij 試驗誤差, 假設分佈為 N ( 0, σ 2 ) 註 : 此時假設常態性, 及同質性 假說 H 0 :μ 1 = μ 2 = = μ m H 1 : 差異存在 ( 至少一對 i,j, μ i μ j ) 平方和分解 SST = SS t + SSE 說明 : 整體變化可分解為組間變化及組內變化 變異數, 或稱為均方 MS t = SS t /(m-1) 量測各組間之變化, 當 H 0 為真時, 期望值 = σ 2 MSE = SSE /(N -m) 量測組內之變化 ( 假設各組同質 ), MSE 估計組間共同變異數, σ 2 1-way_2010 3
Q : 欲檢定各組差異時, 用何量作檢定? 檢定量的分佈是什麼? 在什麼情況下差異顯著? 檢定量 F = MS t / MS E 說明 :1. 在 H 0 為真之情況下,F 呈現一 F 分布, 自由度是 (m-1, N-m) 2. 若差異存在,MS t 值偏大, 將產生一較大的 F 值 故在 F 值大時, 傾向於差異顯著 可視為一單尾檢定 檢定法 p-value = P( F- 值 > F ), 當 p-value<α, 組間差異顯著, 或 treatment 之效力顯著 p-value 愈小, 差異愈顯著 說明 :1 treatment 指試驗或取樣各組的處理方法 2 因為是以二變異數之比為檢定標準, 故稱為變異數分析 1-way_2010 4
變異數分析可彙編成一 ANOVA Table 如下 : ANOVA table for 1-way model Source SS df MS F- 值 p- 值 Treatment SSt m-1 MSt F =MSt/MSE Error SSE N-m MSE Total SST N-1 說明 :1 F- 值愈大,p- 值愈小, 差異愈顯著, F- 值的判斷標準是隨著 df 而變, 而 p- 值是一機率值, 與 df 無關, 所以用 p- 值做為是否有顯差比較理想, 通常以 p- 值與 α- 值比較,p- 值 < α, 則各組之間有顯著差異 2 此處 p- 值是 m 組平均值相等的可能機率 1-way_2010 5
例 3.1 比較 A B C 三品種蛋白質含量之差異 (p42) 1 2 3 4 A 7 8 5 4 6 B 9 8 6 5 7 C 10 13 11 10 11 此試驗的處理是品種, 有三個水準 (level), 每組有 4 觀察值 方法 : 1-way ANOVA Source SS df MS F- 值 p- 值 品種 56 2 28 9.69 0.00569 誤差 26 9 2.9 整體 82 11 ANOVA table p-value =.00569 < 0.05, 結論此 3 組蛋白質均值之差異顯著 1-way_2010 6
事實上, 變方分析是二組獨立資料比較的延伸, 可由下列特例作解釋 資料 A: 67,68,69,70,71 資料 B: 70,71,72,73,74 資料 C: 68.5,69.5,70.5,71.5,72.5 資料 D: 71.2,71.6,72,72.4,72.8 資料 E: 69.7,70.1,70.5,70.9,71.3 74 + 73 + +-----+ +-----+ 72 + *--+--* *--+--* +-----+ +-----+ 71 + +-----+ +-----+ *--+--* *--+--* 70 + +-----+ +-----+ +-----+ 69 + *--+--* 68 + +-----+ 67 + ------------+-----------+-----------+-----------+-----------+----------- G A B C D E 1-way_2010 7
檢定 :A vs. B: p-value = 0.017, 差異顯著 B vs. C: p-value = 0.172, 差異不顯著 D vs. E: p-value = 0.0056, 差異顯著 觀察 : A B 二組平均數差異大, 導致 A B 二組差異顯著 ;D E 二組變異數小, 導致 D E 二組差異顯著 由此得到各組資料是否差異顯著, 不僅決定於組間均值的差異大小, 也要看組內資料是否集中 所以 ANOVA 中的 F- 值 = ( 組間變異 )/( 組內變異 ). 對二組比較時,ANOVA 中的 F- 值實際上是 t- 檢定的 t- 值之平方 t X -Y ˆ 平均數之差異標準誤 ( 平均數之差異 ) 2 2 ˆ, t 2 2 1-way_2010 8
比較 A B C 三組之差別 資料 1 1 2 3 4 平均 A 7 3 10 4 6 B 4 10 6 8 7 C 10 14 9 11 11 A B C mean ± SD 6±3.16 7±2.58 11±.2.22 資料 2 1 2 3 4 A 7 8 5 4 6 B 9 8 6 5 7 C 10 13 11 10 11 A B C mean ± SD 6±1.83 7±1.83 11±.1.41 1-way_2010 9
資料 1 與資料 2: 資料圖比較, 三組平均值皆為 6, 7, 11 16 14 12 10 8 6 4 2 0 0 1 2 3 4 16 14 12 10 8 6 4 2 0 0 1 2 3 4 F- 值 =3.49, p-value =.076, 結論此 3 組均值之差異不顯著 (mse=7.19) F- 值 =9.69, p-value =.0057, 結論此 3 組均值之差異顯著 (mse=2.89) 1-way_2010 10
EXCEL EXCEL: 輸入資料 工具 資料分析 單因子變異數分析 (EXCEL 只作變異數分析, 不提供進一步比較, 用於預檢資料 ) 例 : 1-way_2010 ANOVA 11 11
第四章均值比較測驗 進行 ANOVA 得到差異顯著的結果, 表示至少有一對組的均值不等, 有必要作進一步分析確切不等的狀況 分析的方法因著 Treatment 是 quantitative ( 數量型的 ) 或 qualitative ( 特性型的 ) 而不同 特性型的 treatment 一般選擇 (I) 對對比較 (pairwise comparison); 或, (II) 對比量比較 (constrast test) ; 數量型的 treatment 一般選擇 (III) 相關性檢定, 或尋求關係式 ( 迴歸分析 ) 1-way_2010 12
論文範例 1-way_2010 13
I 對對比較 (pairwise comparison) --- 同時對所有可能之對組作差異性的檢定, 虛無假說 如下, 方法有許多, 可任擇 2 ~ 3 法進行 Test H 0 : for all i j a. Fisher s Least significant Difference (LSD) method ( 例 4.1) LSD t MS 1 1 / 2;N m E n i n j ( ) 當 y i. y j. LSD 時, 判斷 μ i 與 μ j 的差異顯著 分界值 本法特點 : 計算簡單, 易於理解, 在差異顯著時, 犯錯的機率偏大 ; 當實驗的組數較多時, 不準性愈高 1-way_2010 14
b. Duncan s Multiple range Test 分界值與序位差有關 D p 當 r y i. ;(p,f ) y j. MS E D / n p h, n h 時, where 判斷 μ i 與 μ j 的差異顯著 m (1/ n i ) (harmonic the order difference of mean) y i. and y j. p-1 特點 : 考慮均值的排序, 對差異顯著要求較高 c. Tukey s HSD Test T 當 y q i. y j. S ; (m,f ) yi. T 時, 分界值 判斷 μ i 與 μ j 的差異顯著 1-way_2010 15
d. Scheffe s test ( 例 4.8) 用於同時檢定所有的線性組合, 比其它方法保守, 通常 用於複合比較 e. The Newman-Keuls Test 類似 Duncan 法 f. Dunnett s test ( 例 4.5) 用於資料中第一組為對照組時, 執行試驗組與對照組的比較 1-way_2010 16
Q: 如何選擇適當的比較方法 常用的方法有 LSD Tukey s HSD Duncan LSD 法 : 判定差異顯著時的錯誤機率較高, 容易分出差異, 組數愈多, 準確性愈差 Scheffe 法 : 錯誤率較低, 是較保守的方法, 不容易分出差異 以下列得到的檢定分界值為例, 比較各方法 (m=4, n i = 4, α=0.05) Bonferron: 分界值 = 8.66 Tukey HSD: 分界值 = 8.24 Duncan: 分界值 = 6.10,6.40,6.59 Fisher LSD: 分界值 = 6.10 Scheffe: 分界值 = 8.97 1-way_2010 17
對對比較 SAS 報表例一 : Tukey's Studentized Range (HSD) Test for y Alpha 0.05 Error Degrees of Freedom 16 Error Mean Square 20.72125 Critical Value of Studentized Range 4.04609 Minimum Significant Difference 8.2368 Means with the same letter are not significantly different. 分界值 字母相同之二組無顯著差異 Tukey Grouping Mean N group A 100.020 5 C B 86.560 5 D C 70.920 5 B C 70.060 5 A 1-way_2010 18
對對比較 SAS 報表例二 : Tukey's Studentized Range (HSD) Test for y 有星號之二組差異顯著 Comparisons significant at the 0.05 level are indicated by ***. group Comparison Difference Between Means Simultaneous 95% Confidence Limits C - D 13.460 5.435 21.485 *** C - B 29.100 21.075 37.125 *** C - A 29.470 21.787 37.153 *** D - C -13.460-21.485-5.435 *** D - B 15.640 7.615 23.665 *** D - A 16.010 8.327 23.693 *** B - C -29.100-37.125-21.075 *** B - D -15.640-23.665-7.615 *** B - A 0.370-7.313 8.053 1-way_2010 19
說明 : 在研究報告中, 常以相同文字表示兩處理均值間差異不顯著, 反之差異顯著, 如下例 : 1-way_2010 20
1-way_2010 21
II. 對比量 (Contrast) 檢定 --- 二個特殊平均值組合的比較 Contrast 定義 : (for balanced data) δ is a contrast of the treatment means, if m ci i, where ci 0. i 1 檢定 H 0 : δ= 0 ( i.e. Σc i μ i = 0 ) F = MSc / MS E, Where ( ciy i. ) MS C SSC /1, SSC 1 n c 2 i 2, If p-value <α,δ 0 is significant. ( 差異顯著 ) 註 : 若 5 組中前 2 組與後 3 組比較,contrast 的係數為 ( 3, 3, -2, -2, -2) 1-way_2010 22
Exp 5 種廣告 ( A, B, C, D, E) 效果的比較 E 是一般廣告,A B 強調價格便宜,C D 強調品質優異 1. 廣告 A, B 與 C, D 之比較,constrast 係數為 (1, 1, -1, -1, 0) 2. 廣告 A, B, C, D 與 E 之比較,constrast 係數為 (1, 1, 1, 1, -4) SPSS 報表 對比 1 2 對比係數 AA 1 2 3 4 5 1 1-1 -1 0 1 1 1 1-4 對比檢定 PRICE 假設變異數相等 對比 1 2 未假設變異數相等 1 2 對比值標準誤 t 自由度顯著性 ( 雙尾 ) 1.1667.1401 8.326 25.000.4200.3133 1.341 25.192 1.1667.1442 8.090 18.031.000.4200.2841 1.478 8.780.174 1-way_2010 23
III Regression Analysis (Chap 18) 對數量型的 treatment, 對對比較的結果有時並無意義, 可以迴歸分析, 尋找一因子對反應值的估計關係式, 此關係式可用來預測反應值, 或估計極值 ; 下為一例 EXC 3.2 劑量對血壓的影響 ¾ q 5mg 10mg 15mg 20mg 98 89 85 86 92 90 90 87 90 88 89 84 93 91 92 83 92 94 93 85 95 92 96 86 數量型的 treatment 1-way_2010 24
SAS 報表 : ANOVA 及對對比較 Source DF Sum of Squares Mean Square F Value Pr > F Model 3 213.6666667 71.2222222 9.87 0.0003 Error 20 144.3333333 7.2166667 Corrected Total 23 358.0000000 Means with the same letter are not significantly different. t Grouping Mean N dosage A 93.333 6 5 A 90.833 6 15 A 90.667 6 10 B 85.167 6 20 有下降趨勢 1-way_2010 25
由 ANOVA 得到 : 劑量對老鼠血壓的影響是顯著的 (p=0.0003), 對對比較結果是劑量為 20 時與其它情況下有顯著差異, 實際上劑量對血壓是一種漸進的影響 ; 由資料分散圖猜測其影響可能是線性的或是二次關係的, 1-way_2010 26
SAS 報表 : Regression Analysis Root MSE 2.86330 R-Square 0.4962 Dependent Mean 90.00000 Adj R-Sq 0.4733 Parameter Estimates Variable Label DF Parameter Estimate Standard Error t Value Pr > t Intercept Intercept 1 96.08333 1.43165 67.11 <.0001 dosage dosage 1-0.48667 0.10455-4.65 0.0001 劑量對血壓的影響是顯著的 1-way_2010 27
經由迴歸分析 (regression analysis) 得到直線關係式為 : 血壓 = 96.1-0.487 ( 劑量 ), R 2 = 0.496 若劑量增加 1 單位, 血壓平均減少 0.487 此關係式可解釋 49.6 % 血壓的變量 1-way_2010 28
第五章資料轉換 使用變異數分析 (ANOVA) 之前提是 : (1) 累加性 -- 處理效應與環境效應間互相獨立 (2) 獨立性 實驗誤差間互相獨立 (3) 同質性(homogeneity) -- 各處理之試驗誤差變異數相同 (4) 常態性 -- 實驗誤差的分佈符合常態分配 接受變異數分析為結果之前, 應先檢查資料是否符合上述前提 (1) 適當設計之試驗, 通常都符合累加性 (2) 利用隨機原則設計的試驗, 可促使誤差滿足獨立性 1-way_2010 29
(3) 變異數同質性檢定 H 0 :σ 1 2 = =σ m 2 變異數同質性檢定的方法有 : Hartley s F-max test (1950) Bartlett s test (1949) Box test Levene test (1960) 當資料分佈是常態時, Bartlett 法是很好的方法, 但是它對分佈型態很敏感, 依據 Conover etc. (1981), Levene 檢定法不受限於資料之分佈, 是較適當的方法 SPSS 提供 Levene 檢定法 ; SAS 提供 Bartlett,Brown-Forsythe 及 Levene 檢定法 1-way_2010 30
例 5.1 三種同質性檢定法結果 (SAS 報表 ) Levene's Test for Homogeneity of germ Variance ANOVA of Squared Deviations from Group Means Source DF Sum of Squares Mean Square F Value Pr > F concent 3 1367.2 455.7 2.38 0.1004 Error 20 3835.3 191.8 Brown and Forsythe's Test for Homogeneity of germ Variance ANOVA of Absolute Deviations from Group Medians Source DF Sum of Squares Mean Square F Value Pr > F concent 3 34.5218 11.5073 2.69 0.0738 Error 20 85.5632 4.2782 Bartlett's Test for Homogeneity of germ Variance Source DF Chi-Square Pr > ChiSq concent 3 9.2077 0.0267 1-way_2010 31
(4) 常態性檢定 --- 檢定誤差是否遵循一常態分佈 H 0 : 誤差呈現一常態分佈 SPSS 提供 Kolmogorov-Smirnov, Shapiro-Wilk 檢定法 ; SAS 提供此二法另加 Cramer-von Mises 及 Anderson-Darling 檢定法 基本上以殘差為檢定對象 殘差 (residual) e ij Y ij Yˆ ij, or, e ij Y ij Y i 殘差,e ij, 可視為觀測的誤差, 用於估計真實誤差若模式適合, 則殘差正確地反映出 ε ij 的特性 例 : 三品種收量表 V1 14 6 11 15 V2 20 22 18 20 V3 22 24 27 19 均值 殘差 11.5 2.5-5.5-0.5 3.5 20 0 2-2 0 23-1 1 4-4 1-way_2010 32
Á ±æ ¼Æ±` ºA SPSS output ( 先得到 residual, 再做資料預檢 ) 常態檢定 Kolmogorov-Smirnov 檢定 a Shapiro-Wilk 常態性檢定 統計量 自由度 顯著性 統計量 自由度 顯著性 RESID.150 30.083.954 30.317 a. Lilliefors 顯著性校正 ª½ è ¹Ï 2 RESID ªº ±` ºA Q-Q ¹Ï 6 1 4 0 2 0 8 ¼Æ -.25 -.13 0.00 -.19 -.06.06.13.19.25.31 ¼Ð Ç t =.16 ¼Æ = 0.00 N = 30.00-1 RESID -2 -.3 -.2 -.1 -.0.1.2.3.4 1-way_2010 33 Æ[ ¹î È
將 e i 標準化得到的值, 稱為 t 化殘差 e * i e i MSE 如果資料未通過常態性檢定, 可以檢查 t 化殘差,t 化殘差得到的值理論上應落在 ±3 之內, ( e i* < 3 ), 若有某筆資料在 ±3 之外, 則此資料為離群值 (outlier), 或異常值, 可檢查資料取得過程是否有疑點 1-way_2010 34
例 : 探討餵食糖尿病腎病變 SD 大鼠富含 polyunsaturated fatty acids (PUFAs) 之飲食, 是否可以進一步改善因腎臟脂肪囤積而引起的糖尿病腎病之病理過程 Statistical analyses Before assessing the different variables, we carried out a Kolmogorov- Smirnov test to check the normal distribution of the variables. Data that fit the normal distribution were compared by 1-way analysis of variance. The Levene test for homogeneity was used to test for equal variance between samples. When equal variance could be assumed, the Bonferroni post hoc test was used to identify significant differences between multiple test groups. When equal variance could not be assumed, the Games-Howell post hoc test was applied. A nonparametric Kruskal-Wallis test with post hoc Mann-Whitney U tests with the Bonferroni inequality was performed on the final body weight, kidney, retroperitoneal fat, plasma TG level, urinary Cr excretion, and renal SREBP-1 mrna data, because it was in contrast with the normality hypothesis. The correlation coefficient was calculated using Spearman rank correlation coefficient. Data (NL and NR group, n = 6; DML group, n = 11; DMR group, n = 10) were presented as means ± SEM. The level of significance was set at P b.05. Analyses were performed using SPSS 11.0 for Microsoft Windows (SPSS, Chicago, Ill). Sample sizes were determined based on power analysis FD 35
[Exc3.1] ( 完整多組比較的分析法 ) A, B, C, D 四大豆品種進行產量比較 (p47) Factor : 品種 Observation : 產量 4 treatments : A, B, C, D (qualitative) 分析步驟 : 1. 整體分析 : 同質性檢定 常態性檢定 1-way ANOVA 2. 因子效應分析 : 對對比較 3. 估計各組平均值 4. 結論 1-way_2010 36
1. 1-way ANOVA (SAS 報表 ) Source DF Sum of Squares Mean Square F Value Pr > F Model 3 39.83000000 13.27666667 23.67 0.0002 Error 8 4.48666667 0.56083333 Corrected Total 11 44.31666667 2. 變異數同質性檢定 差異顯著 Levene's Test for Homogeneity of yield Variance ANOVA of Squared Deviations from Group Means Source DF Sum of Squares Mean Square F Value Pr > F brand 3 1.4276 0.4759 2.45 0.1381 Error 8 1.5525 0.1941 四組資料變異數相同 p- 值大於 0.05 時, 資料符合同質性 1-way_2010 37
3. 檢測常態性 ( 先得到 residual, 再分析 ) Tests for Normality Test Statistic p Value P- 值大於 0.05 時, 資料符合常態假設 Shapiro-Wilk W 0.978866 Pr < W 0.9787 Kolmogorov-Smirnov D 0.124947 Pr > D >0.1500 Cramer-von Mises W-Sq 0.031349 Pr > W-Sq >0.2500 Anderson-Darling A-Sq 0.202274 Pr > A-Sq >0.2500 1-way_2010 38
4. 對對比較 lsd Grouping Mean N brand A 10.2667 3 B B 7.9667 3 A B 6.8333 3 C C 5.2667 3 D A 與 C 無顯著差異, 其餘各組間皆有顯著差異 1-way_2010 39
5. 平均值區間比較圖 1-way_2010 40
總結 1 資料滿足同質性 (Levene s test,p=0.1381) 及常態性 (Shapiro-Wilk test,p=9787) 2 由 ANOVA 得到四品種生產量的差異顯著 (p=0.0002) 3 由 LSD 法檢定出品種 A 與品種 C 之間產量無顯著差異, 其餘 各組間皆有顯著差異 4 品種 B 的產量最高, 品種 D 的產量最低, 各平均產量的估計 及標準誤如下表 : 品種 B A C D mean ± SEM 10.267±0.577 a 7.967±0.503 b 6.833±.0.451 b 5.267±0.206 c 註 : 上標字母不同之各組間在 α=0.05 的水準下均值有顯著差異 1-way_2010 41
[Example] ( 含離群值之例 ) A, B, C 三產品 protein 之比較 Factor : 品種 Observation : protein 3 treatments : A, B, C (qualitative) 三品種 protein A 7 8 5 20 B 9 8 6 5 C 10 13 11 10 1-way_2010 42
1. 1-way ANOVA Source DF S S M S F Value Pr > F Model 2 34.6667 17.3333 1.01 0.4011 Error 9 154.000 17.1111 Total 11 188.6667 2. 變異數同質性檢定 差異不顯著 Levene's Test for Homogeneity of protein Variance ANOVA of Squared Deviations from Group Means Source DF S S M S F Value Pr > F BRAND 2 2818.7 1409.3 2.12 0.1759 Error 9 5979.0 664.3 三組資料變異數相同 1-way_2010 43
3. 檢測常態性 ( 先得到 residual, 再分析 ) P- 值小於 0.05 時, 資 Tests for Normality Test Statistic p Value 料不符合常態假設 Shapiro-Wilk W 0.841167 Pr < W 0.0286 Kolmogorov-Smirnov D 0.213157 Pr > D 0.1346 Cramer-von Mises W-Sq 0.115507 Pr > W-Sq 0.0629 Anderson-Darling A-Sq 0.740192 Pr > A-Sq 0.0405 常態機率圖顯示有一離群資料 1-way_2010 44
4. 對對比較 ANOVA 結論是三組無顯著差異, 不需討論對對比較 此資料得到無顯著差異的結果, 且不滿足常態性,ANOVA 的結果是不足以採信 ; 但知有一離群個案造成無法滿足常態性, 可以對此個案來源檢查, 是記錄有誤, 或確實是一特殊個案, 是否可排除此個案, 只對其它資料比較? 對不滿足常態性的資料, 可改用無母數法, 或是利用轉換的技巧, 將資料換成常態資料後, 再執行 ANOVA 1-way_2010 45
資料轉換 當資料不符合常態性或同質性, 可嘗試採用適當轉換法 ; 轉換需注意實質意義 開方根轉換, 如, 蟲數, 產蛋數 對數轉換 角度轉換 倒數轉換 指數轉換 Y, log(y), 1/Y, Y 1-way_2010 46
變數轉換的影響 線性轉換通常不會改變原資料的分佈型態 次方或對數的轉換會改變分佈的形態 原資料分佈 對數轉換後分佈 1-way_2010 47
無母數 1-way ANOVA 分析法 使用 ANOVA F test 時必須假設母體滿足同質性及常態性, 但 資料不一定符合假設, 此時 ANOVA 分析的結果是受到質疑的, 當面對此問題時, 可採用 Wilcoxon signed-rank test( 二個樣 本時 ) 或 Kurskal-Wallis 檢定 ( 分組類別有三個以上時 ) 等無母數 統計方法 Kruskal-Wallis 檢定法 適用於同時對三個以上母體進行比較 資料不符合常態性或同質性 原理 : 以資料的序位代替資料大小值, 來檢定中位數是否相等 1-way_2010 48
方法 : 1. 將 k 組資料混合排序, 列出序位, R ij ( 遇到數值相同時, 以平均序位取代 ) 2. 計算 :R i. = 第 i 組資料序位之和 3 S 2 1 N 1 檢定量 : H [ R 2 ij 1 S 2 [ N ( N 1) 4 R n 2 i. i 2 ], N ( N 1) 4 4 H- 值遵循卡方分佈 5 H- 值愈大,p- 值愈小, 顯示各組間之差異愈顯著 2 ] 此亦為序位的組內變異與組間變異的比值 1-way_2010 49
例 : 檢定四品種豆子雞蛋白質含量的差異 在無母數法中,H 0 : 4 組中位數相等 例 : 原資料 A B C D 8.5 10.6 6.4 5.4 7.9 9.6 7.3 6.4 7.5 10.6 11.5 4.0 平均 7.97 10.27 8.4 5.27 資料之序位 A B C D 8 10.5 3.5 2 7 9 5 3.5 6 10.5 12 1 和 21 31 20.5 6.5 A 組均值比 C 組小, 未反應實情 A 組序位和比 C 組大, 有反應實情 1-way_2010 50
下例資料由 ANOVA F-test 檢定出差異不顯著, 因為資料非同質, 使用 K-W test 時, 則檢定出差異顯著 A B C 8.5 10.3 6.4 7.9 11.0 7.3 7.5 10.6 13.0 8.2 9.6 7.0 7.8 10.6 7.2 平均 7.98 10.42 8.18 ANOVA F-test: p-value = 0.0623 Bartlett test : p-value= 0.0006 K-W test: p-value = 0.0385 三組均值差異不顯著 變異數差異顯著 三組差異顯著 1-way_2010 51
多組資料比較的統計分析步驟 : 1 作圖 : 各組均值的誤差長條圖 2 變異數分析 : 檢定各組的差異是否顯著 3 前提條件的檢測, 包括同質性及常態性 若無法滿足前提條件, 應使用無母數之變異數檢定 4 差異顯著時 作 multiple comparison ( 如對對比較 ), 或, 以迴歸分析尋找關係 5 針對特殊組合的比較, 執行對比量檢定 6 結論 或稱為 Post hoc 1-way_2010 52
SPSS guide 1 輸入資料: 定義及輸入 : 組別佔一行, 資料佔一行 2 變異數分析: 分析 比較平均數法 單因子變異數分析指定 (1) 依變數, 固定因子 Post Hoc 檢定選項 選一方法 比對 v 描述性統計量 v 同質性檢定 v 平均數圖 3 常態性檢定: 先輸入殘差分析 描述性統計 預檢資料 統計圖 v 常態機率圖附檢定 4 作圖 : 統計圖 誤差長條圖 1-way_2010 53
SAS guide 針對一維的完全隨機設計, 以 1-way ANOVA 分析資料, 其餘的實驗設計資料, 大都使用 Linear model 分析 1 匯入資料 : 檔案 匯入資料 : 組別一行, 測量值一行 2 分析 ANOVA 單因子 ANOVA 工作角色 : 組別為自變數, 測量資料為應變數 檢定 : 選擇檢定等變異性的方法 平均值 : 選擇多重比較的方法, 或欲列印的統計值 標繪圖 : 選擇平均數比較圖 ( 可指定寬度 ) 結果 : 儲存結果 標題 : 1-way_2010 54
SAS guide 3 輸入殘差: 在 excel 資料檔中算出 residual 4 檢測常態性: 描述 分佈分析工作角色 : 殘差為分析變數分佈 : 常態 ( 可改變線條的顏色 ) 標繪圖 : 選擇常態機率圖 ( 可改變背景的顏色 ) 表格 : 只勾選常態性檢定標題 : 5 無母數分析: 分析 ANOVA 無母數單因子 ANOVA 工作角色 : 組別為自變數, 測量資料為應變數分析 : 勾選 Wilcoxon 精準 p 值 : 1-way_2010 55