變異數分析 比較多個母體平均數應用在實驗設計如何分析 15 2

Similar documents
Microsoft PowerPoint - spss2-1.ppt

When the rejection rule for a test at every level α can be re-written as then xxx is the p-value of the test. xxx < α, If p-value < α, then the test c

( ) t ( ) ( ) ( ) ( ) ( ) t-

Microsoft Word - 94_4_stat_handout_07變異數分析.doc

PowerPoint Presentation

Microsoft Word - 94_2_stat_handout08_線性迴歸(考古題).doc

C19 (1)

(baking powder) 1 ( ) ( ) 1 10g g (two level design, D-optimal) 32 1/2 fraction Two Level Fractional Factorial Design D-Optimal D

)

Microsoft Word - p11.doc


spss.doc

(Microsoft Word - 11-\261i\256m\253i.doc)

102_BS

ENGG1410-F Tutorial 6

66 臺 中 教 育 大 學 學 報 : 人 文 藝 術 類 Abstract This study aimed to analyze the implementing outcomes of ability grouping practice for freshman English at a u

<4D F736F F F696E74202D20BDD5AC64B2CEAD702D36C5DCB2A7BCC6A4C0AA52BB5046C0CBA977>

: ( ),,

國家圖書館典藏電子全文

Microsoft Word - 94_4_stat_handout_06假設檢定_考古題.doc

Microsoft Word - A doc

影響未婚同居的因素:以大學生為樣本的問卷調查

Stochastic Processes (XI) Hanjun Zhang School of Mathematics and Computational Science, Xiangtan University 508 YiFu Lou talk 06/

untitled

(Microsoft PowerPoint - 25\272\330\262\316\255p\244\350\252k\257\265\247\3361_Ruth.ppt)

天 主 教 輔 仁 大 學 社 會 學 系 學 士 論 文 小 別 勝 新 婚? 久 別 要 離 婚? 影 響 遠 距 家 庭 婚 姻 感 情 因 素 之 探 討 Separate marital relations are getting better or getting worse? -Exp

PowerPoint 簡報

<4D F736F F D20BDD7A4E5A4BAA4E5BB50A5D8BFFD2E646F63>

壹 緒 論 由 於 作 者 任 教 於 大 專 軍 事 校 院, 依 校 規 規 定 學 生 於 第 八 學 期 必 須 通 過 3000 公 尺 跑 步 測 驗 限 定 14 分 鐘 的 及 格 標 準 始 得 畢 業 ; 因 此 探 討 提 升 中 長 距 離 與 長 距 離 跑 步 能 力 的

% % 34

11第十一章階層線性模式.DOC

211 better than those in the control group, with significant difference between two groups (P < 0.05). The ocular hypertension of patients in the cont

untitled

Microsoft PowerPoint - NCBA_Cattlemens_College_Darrh_B

864 现 代 药 物 与 临 床 Drugs & Clinic 第 31 卷 第 6 期 2016 年 6 月 of apoptosis related factors, decrease the incidence of adverse reactions, which is of great

Microsoft Word - 95_1_stat_handout_04抽樣與抽樣分配.doc

untitled

國家圖書館典藏電子全文

600 现 代 药 物 与 临 床 Drugs & Clinic 第 31 卷 第 5 期 2016 年 5 月 were significantly decreased, but the levels of IL-12 in two groups were significantly increa


天 主 教 輔 仁 大 學 社 會 學 系 學 士 論 文 百 善 孝 為 先? 奉 養 父 母 與 接 受 子 女 奉 養 之 態 度 及 影 響 因 素 : 跨 時 趨 勢 分 析 Changes in attitude toward adult children's responsibilit

敘述統計概論

,!! #! > 1? = 4!! > = 5 4? 2 Α Α!.= = 54? Β. : 2>7 2 1 Χ! # % % ( ) +,. /0, , ) 7. 2

ii

Microsoft Word - ch05note_1210.doc

- I -

<4D F736F F D D31332DA655B0CFB9EAAC49A5AEA8E0B942B0CAB943C0B8BDD2B57BB27BAA70A4C0AA522D2D2DBBB2A46A >

[9] R Ã : (1) x 0 R A(x 0 ) = 1; (2) α [0 1] Ã α = {x A(x) α} = [A α A α ]. A(x) Ã. R R. Ã 1 m x m α x m α > 0; α A(x) = 1 x m m x m +

( ) ( ) ( NSC M )


Microsoft PowerPoint _代工實例-1

168 健 等 木醋对几种小浆果扦插繁殖的影响 第1期 the view of the comprehensive rooting quality, spraying wood vinegar can change rooting situation, and the optimal concent

基礎統計

! Ν! Ν Ν & ] # Α. 7 Α ) Σ ),, Σ 87 ) Ψ ) +Ε 1)Ε Τ 7 4, <) < Ε : ), > 8 7

IP TCP/IP PC OS µclinux MPEG4 Blackfin DSP MPEG4 IP UDP Winsock I/O DirectShow Filter DirectShow MPEG4 µclinux TCP/IP IP COM, DirectShow I

untitled


Outline Speech Signals Processing Dual-Tone Multifrequency Signal Detection 云南大学滇池学院课程 : 数字信号处理 Applications of Digital Signal Processing 2

國家圖書館典藏電子全文

大數據天文學 — 時間序列分析 .2cmMichael Ting-Chang Yang 楊庭彰

Myers Majluf 1984 Lu Putnam R&D R&D R&D R&D

Process Data flow Data store External entity 6-10 Context diagram Level 0 diagram Level 1 diagram Level 2 diagram

ARCLE No.2

Preface This guide is intended to standardize the use of the WeChat brand and ensure the brand's integrity and consistency. The guide applies to all d

2015年4月11日雅思阅读预测机经(新东方版)

®

1269 malondialdehyde (MDA) were significantly decreased, while oxygen partial pressure (PaO 2 ), ph value, superoxide dismutase (SOD) and glutathione

戊 酸 雌 二 醇 片 联 合 宫 颈 注 射 利 多 卡 因 用 于 绝 经 后 妇 女 取 环 的 临 床 效 果 评 价 陆 琴 芬, 等 371 Keywords groups, no removal difficulties and failure, was statistically s

18 A B S 17.44±1() ±6.26( ) 54.23±5.5( ) 6.42±1.51() m 30m t α =.05 ( )AB 1 5 (p>.05)( )AB 1 5 (p<.05)( )A (p>.05)( )B (p<.05)( )A B

<4D F736F F D20A46AA4AFACECA7DEA46ABEC7B1D0AE76ACE3A873AD70B565A6A8AA47B3F8A769A4AFACE >

度 身 體 活 動 量 ; 芬 蘭 幼 兒 呈 現 中 度 身 體 活 動 量 之 比 例 高 於 臺 灣 幼 兒 (5) 幼 兒 在 投 入 度 方 面 亦 達 顯 著 差 異 (χ²=185.35, p <.001), 芬 蘭 與 臺 灣 幼 兒 多 半 表 現 出 中 度 投 入 與 高 度

!! # % & ( )!!! # + %!!! &!!, # ( + #. ) % )/ # & /.

Essential procedures of stereological (morphometric( morphometric) ) study / / / / / / /

欢迎参加 《计量基础知识》培训班


优 雅 女 主 任 艺 高 人 胆 大 记 我 院 妇 科 主 任 主 任 医 师 金 海 红 筅 物 资 供 应 处 高 志 忠 画 面 1: 宫 颈 癌 子 宫 癌, 大 大 小 小 的 妇 科 肿 瘤, 行 宫 腔 镜 手 术 ; 空 旷 的 环 境, 泛 着 白 光 的 无 影 灯, 各 种

PowerPoint Presentation

Transcription:

變異數分析 ( 一 ) Analysis of Variance ( 一 ) 15 1

變異數分析 比較多個母體平均數應用在實驗設計如何分析 15 2

學習目標 1. 比較多母體的平均數 ( 檢定 ) 2. 解說變異數分析的原理 3. 變異數分析 analysis of variance (ANOVA) 4. 單因子的實驗設計 完全隨機設計 (completely randomized design) 隨機完全區集設計 (randomized complete block designs) 5. 無母數方法 Kruskal Wallis rank test 15 3

例題 例一 : 某一產品以三種不同組合方式 (A, B, C) 以探討其組合完成時間 ( 分鐘 ) 是否有差異. 以隨機選取員工分派不同組合方式以完成最後產品, 得下列實驗結果 : 15 4 A 方式 : 15, 18, 19, 21, 23, 26 B 方式 : 17, 18, 24, 20 C 方式 : 13, 10, 16, 11, 9 是否有証據顯示該三種組合方式之完成最後產品之時間不同?

例題 ( 續 ) 例二 : 將商業區分為 4 大類後, 收集 30 家商店本月的業績, 以了解不同分類的業績是否有差異存在 例三 : 隨機選取 200 位一至四年級的學生, 記錄其個人學業總平均成績 比較四個年級學生的學業總平均是否有差異存在 15 5

實驗設計與資料分析 實驗設計 : 由研究者設定設定條件後, 執行實驗以觀察結果是否受該條件之條件之影響 設定條件稱為 處理 方式 (treatments) 同類型處理方式稱為一個 因子 (factor) 每因子內之處理方式亦稱為 水準 (levels) 資料分析 : 利用變異數分析變異數分析檢定不同處理對實驗結果產生的差異或效應 15 6

各種實驗設計 Experimental Designs Completely Randomized Factorial Other One Way ANOVA Two Way ANOVA 15 7

實驗設計專有名詞 1. 實驗單位 (experimental units/subjects) 2. 處理 (treatments): 實驗中所設定或選取之條件 3. 控制因子 (factors): 由數種處理或水準組成 4. 處理效應 (effect): 每一種處理對處理對實驗結果產生之影嚮 5. 觀測結果 (observations) 15 8

實驗設計三原則 1. 隨機 (randomization) 取樣 不同實驗模型, 設計不同隨機方式取得樣本 2. 複製 (replications) 樣本 在相同處理下, 重複實驗以取得的重複樣本 3. 區集 (blocking) 技巧 在不同處理下選取同質性高之實驗單位 實驗中, 僅處理方式不同外, 其它因素無法影嚮實驗結果 15 9

完全隨機設計 (Completely Randomized Design, CRD) 1. 一個實驗中, 在多個不同處理下取得觀測結果, 以比較多個處理效應是否異同 一種處理代表 一個母體 ;實驗結果即為觀測值或樣本值 2. 以 完全隨機完全隨機 方式決定實驗單位的處理方式 先決定各處理所需樣本數後, 再以隨機數字表, 決定每次實驗將使用之處理方式 15 10

CRD 設計方式 1. 和比較多個母體平均數之觀念及分析方法皆相同 一個母體等於一個處理方式 不同母體皆具相同變異情形 (homogeneous) 每一母體下, 重複實驗選取隨機樣本 2. 實驗結果之分析方式可稱為單因子 ( 或 one way)anova 15 11

例題 : 完全隨機設計 因子水準 Treatments) 因子 ( 訓練方式 ) 水準 1 水準 2 水準 3 實驗單位 因變數 21 hrs. 17 hrs. 31 hrs. 27 hrs. 25 hrs. 28 hrs. ( 反應 ) 29 hrs. 20 hrs. 22 hrs. 15 12

完全隨機設計單因子變異數分析 CRD One Way ANOVA 15 13

比較多個母體統計思考方式 1. 比較多個母體之異同 2. 比較多個平均數之異同 3. 評估多個平均數之間平均數之間之變異情形 4. 若變異量趨近於零, 則代表平均數可能相同 (Ho: 平均數全等 ) 5. 若變異量愈大, 則代表至少一個平均數可能不相同 (Ha: 至少一個平均數不等 ) 15 14

CRD 統計理論 1. 模式 (model) : 代表觀測值必須是連續變數 y ij 代表 任何觀測值 = ( 特定母體平均值 + 誤差值 ) y ij = µ j + ε Ij ( 樣本數 i=1,,n j ;母體母體樣本數 j=1,,, c) c = (µ + τ j )+ ε ij 或者 y ij = ( ij 模式中有 c 個參數須要估計 15 15

CRD 統計理論 ( 續一 ) 2. 假設條件 (assumptions) : 各母體的變異數 σ 2 皆相等 (homogeneity) 誤差項為常態機率分配, 期望值為 0 ;誤差值之間獨立 ε ij ~ N(0, σ 2 ), ε ij independent ij σ 2 須要估計 誤差項以上的假設條件, 必須正式以統計量檢定, 或以殘差分析檢查其是否符合 15 16

CRD 統計理論 ( 續二 ) 3. 目的:檢定不同處理對實驗結果的差異或效應 Ho : µ 1 = µ 2 = = µ c 至少有一個 µ j 不同 或者 v.s. Ha : Ho : τ 1 = τ 2 = = τ c = 0 v.s. Ha : 至少有一個 τ j 不同 4. 以變異數分析來檢定 Ho ( 用 F 表, 又稱 F 檢定 ) 15 17

CRD 統計理論 ( 續三 ) (No Treatment Effect) H µ µ µ : = = L = 0 1 2 c H : Not all µ are the same 1 i The Null Hypothesis is True 15 18 µ = µ = µ 1 2 3

CRD 統計理論 ( 續四 ) (Treatment Effect) H µ µ µ : = = L = 0 1 2 c H : Not all µ are the same 1 i The Null Hypothesis is NOT True µ = µ µ 1 2 3 15 19 µ µ µ 1 2 3

變異數分析 (ANOVA) 探討 1. 變異量 變異量 (sum of squares, SS (degrees of freedom, df) 15 20 SS) 和自由度 藉由樣本變異數 s 2 = ( y ij y ) 2 / (n 1) = SS / (n 1) 來了解 分子項 SS 代表數據的變異程度, 必為正值 (>0), SS 愈大表示該組數據之間差異愈大 分母項自由度為樣本數減 1, df = (n 1) s 2 =SS / df 亦稱均方 (mean square, MS) 代表平均變異, 其意義和 SS 相似

變異數分析 (ANOVA) 探討 ( 續一 ) 2. 總變異量 (SSTotal) 先由 a 個母體皆相同 ( 即是 Ho) 時來看, 所有樣本 (N) 觀測值的總變異量 SS (n 1) 為總變異量 SS 的自用度, df=(n 1) 在單因子 ANOVA 中, 總變異量由整體隨機樣本 (n) 的抽樣變異所形成 15 21

變異數分析 (ANOVA) 探討 ( 續二 ) 3. 總變異量的切割 總變異量公式 SSTotal = ( y ij y ) 2, df=(n 1) 總變異量 = 處理間變異量 + 處理內變異量 總變異量 = 母體平均數之間變異量 + 誤差項變異量 上面式子也可以代數公式表示 15 22

變異數分析 (ANOVA) 探討 ( 續三 ) 4. 處理間變異量 (SSBetween) :母體平均數之間變異量, 其自由度 =(c 1) SSBetween = SSB = SS(Trt Trt) = SSModel MS(Trt Trt) = [SS(Trt Trt)] / (c 1) ;均方 (mean of squares) [SS(Trt )]/ σ 2 = [(c 1)MS( 1)MS(Trt Trt)]/ σ 2 為卡方分配 (df=c df=c 1) 若母體平均數之間變異愈大, 則至少有一個平均數不同 15 23

變異數分析探討 ( 續四 ) 5. 處理內變異量 (SSWithin, SSW, SSE) :評估屬於每個母體內或誤差項之變異量 (SS), 其自由度 =(n c) SSE = [SSE1+SSE2+ +SSEc +SSEc] ] / (n c) MSE = MSW = SSE / (n c) MSE 為母體或誤差項變異數 (σ 2 ) 之估計值 SSE / σ 2 為卡方分配 (df=n df=n c) 15 24

變異數分析探討 ( 續五 ) 6. F* = MS(trt trt) ) / MSE 為 F 分配 (df 1 =c 1, df 2 =n c) F* 中分子項 MS(trt trt) 值愈大,F* 愈大 ( 位在 F 曲線右尾 ) 7. F 分配之曲線為向右傾斜, F* 值愈大發生機率愈小. RR 區域在 F 曲線右尾 8. F* 值愈大愈容易落在 RR, 則可拒絕 Ho 15 25

單因子變異數分析 F F 檢定 One Way ANOVA F Test F 15 26

單因子 ANOVA 的不同形 式敘述 1. 一個觀測值只棣屬於觀測值只棣屬於一個一個母體 2. 檢定多個母體的平均數平均數是否均相等或者 3. 檢定多個處理處理的效應效應是否皆相等 4. 一個觀測值只受到一種處理方式的影嚮一種處理方式的影嚮 15 27

合於使用一因子變異數分 析 F F 檢定的情況 1. 常態假設 (normality) 各母體均為常態分配 2. 變異數為同質 (homogeneity homogeneity) 各母體的變異數皆相等 3. 觀測值及誤差項為隨機且獨立的 隨機樣本抽選時亦為獨立 15 28

單因子變異數分析之檢定 假設 H 0 : µ 1 = µ 2 = µ 3 =... = µ c 所有母體平均數均相等 即各處理並無影響 ( 或效應相同 ) H a : 母體平均數並不全等 至少有一母體平均數有差異 處理之間有差異 ( 處理效應不同 ) µ 1 = µ 2 = = µ c 是錯的 f(x) f(x) µ 1 = µ 2 = µ 3 µ 1 = µ 2 µ 3 X X 15 29

看圖了解變異數分析的原理 上下兩組處理間產生相同的變異但上下兩組各母體內變異不同 上下兩組處理間產生不同的變異但上下兩組各母體內變異相同同 A Pop 1 Pop 2 Pop 3 B Pop 1 Pop 2 Pop 3 0 Pop 4 Pop 5 Pop 6 0 Pop 7 Pop 8 Pop 9 0 組內變異不同 15 30 組間變異不同 可能得到母體平均數均相等的結論! 0

使用變異數分析的原理 1. 比較組內變異與組與組間變異的情形以檢定各母體平均數是否相等 2. 以兩個變異數的比率值為檢定基礎 3. 若是組間變異量相當程度大於 > 組內的變異量則得到各母體平均數不可能相等 4. 組間變異量與組內變異量可由總變異量分割而得 總變異量=組間變異量 + 組內變異量 (n 1) = (c 1) + (n c) 15 31

單因子變異數分析 : 總變異量的切割 總變異量 因為組間平均數差異產生的變異量 Sum of squares treatment Sum of squares among Sum of squares between Among groups variation 15 32 因為組內隨機樣本誤差產生的變異量 Sum of squares error Sum of squares within Within groups variation

總變異 SST = ( X X ) 15 33 c j = 1 i = 1 X : the i th observation in group j n n c X j ij : the number of observations in group j = 1 i = 1 j 2 : the total number of observations in all groups : the number of groups = c n j c n X ij ij the over all or grand mean j

總變異量之公式與圖解 SS ( 2 Total ) ( X X ) + ( X ) X 反應, X 2 2 2 = 11 21 + K + X n a X i X 總樣本平均 X 11 15 34 第一組 第二組 第三組

組間 ( 處理與處理之間 ) 之變異量 c = j j j = 1 SSA n ( X X ) 2 MSA = SSA c 1 X j : The sample mean of group j X : The overall or grand mean µ µ i j Variation Due to Differences Among Groups 15 35

組間 ( 處理與處理之間 ) 之變異量 ( ) 2 X X + n ( X X ) 2 + + n ( X ) 2 SSTrt = n K 1 1 2 2 a a X 反應值 (X) X 3 ( 各組的平均值對總平均產生 ) 的差異平方 X 1 X 2 X 第一組 第二組 第三組 15 36

組內 ( 隨機誤差 模型後誤差 ) 變異量 c n j SSW = ( X X ) j = 1 i = 1 ij j 2 MSW = SSW n c X j : The sample mean of group j X : The i th observation in group j ij Summing the variation within each group and then adding over all groups. 15 37 µ j

組內 ( 隨機誤差 模型後誤差 ) 變異量 ( X X ) 2 ( X X ) 2... X X 1 21 1 n a a SSE = + + + a ( ) 11 2 反應, X 個別觀察值相較所屬組平均數差異平方和 X 1 X 2 X 3 15 38 第一組 第二組 第三組

組內 ( 隨機誤差 模型後誤 差 ) 變異量 SSW MSW = n c t Test. ( n 1) S + ( n 1) S + + ( n 1) S = ( n 1) + ( n 1) + + ( n 1) 2 2 2 1 1 2 2 c c 1 2 If more than 2 groups, use F Test. For 2 groups, use t Test. F Test more limited. c (continued) For c = 2, this is the pooled variance in the 15 39 µ j

單因子 ANOVA 的 F 檢定統計 1. 檢定統計 Test statistic F = MS(Trt Trt) / MSE MS(Trt Trt) =SS (Trt Trt) / ν 1 組間變異量除以其自由度的平均 MSE = SSE / ν 2 組內變異量除以其自由度的平均 2. 所對應的自由度 Degrees of freedom ν 1 = c 1 ν 2 = n c c = 組數 ; 母體個數 ( 處理個數 / 水準數 / 群數 / 組數 ) n = 所有的樣本數 ; 總樣本數 15 40

建立 ANOVA 表 Source of Variation 來源 Treatment 組間 ; 處理 Error 誤差 ; 組內 Total 總和 15 41 Degrees Sum of Mean of Squares Square Freedom 平方和均方和 c 1 SSA MSA = SSA/(c 1) n c SSE MSE = SSE/(n c) n 1 SS(Total) = SSA+SSE F MSA/ MSE

F 檢定 統計量之臨界值 若是各處理母體間平均數差異大, 則 F = MST / MSE 1. Reject H 0 Do Not Reject H 0 α 0 F α ( p 1, n p ) F 15 42 總是使用單尾檢定呦 Always One Tail!

例題一:單因子 ANOVA 你是生產管理經理, 欲知道三台機器的產品裝箱平均時間是否有差異 因此你抽選了具相同訓練及經驗的操作員, 並隨機指定至此三台機器 ; 每台五人 並測試得到了下列的裝箱時間 以顯著水準.05, 檢定三台機器的裝箱平均時間平均時間是否有差異? 15 43 Mach1 Mach2 Mach3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40

例題一:單因子 ANOVA Machine1 Machine2 Machine3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40 X X 1 2 3 = 24.93 X = 22.61 = 20.59 X = 22.71 27 26 25 24 23 22 21 20 19 Time in Seconds X 1 X 2 X 3 X 15 44

例題一:單因子 ANOVA Machine1 Machine2 Machine3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40 15 45 ( ) ( ) ( ) SSA = 5 24.93 22.71 + 22.61 22.71 + 20.59 22.71 = 47.164 SSW 2 2 2 = 4.2592 + 3.112 + 3.682 = 11.0532 MSA = SSA /( c 1) = 47.16 / 2 = 23.5820 MSW = SSW /( n c ) = 11.0532 /12 =.9211 X X X X 1 2 3 = = = = 24.93 22.61 20.59 22.71 n c j = = 3 5 n = 15

例題一:建立 ANOVA 表 Source of Variation Treatment (Machines) Degrees of Freedom Sum of Squares Mean Square (Variance) 3 1 = 2 47.1640 23.5820 25.60 Error 15 3 = 12 11.0532.9211 F Total 15 1 = 14 58.2172 15 46 電腦報表 From Computer

例題一: F 檢定平均數相 等 1. H0: H µ 1 = µ 2 = µ 3 2. Ha: H Not all equal 3. α =.05 4. ν 1 = 2 ν 2 = 12 Critical Value(s): 0 3.89 15 47 α =.05 F 5. 在 Ho 下, test statistic: MSA 23.528 F* = = = MSE. 9211 6. Decision: 在 α =.05 下拒絕 H o 25. 6 Conclusion: 有充分證據顯示三台機器裝箱平均時間至少一台不等

利用 EXCEL 求解 Use tools data analysis ANOVA: single factor EXCEL worksheet that performs the one factor ANOVA of the example Microsoft Excel Worksheet 15 48

例題二:單因子 ANOVA 你是銘傳軟體公司的教育訓練主管, 為比較四種不同訓練方式所需平均時間的差異性 隨機抽選了情況相近的 12 位員工, 並測得各時間如下 : 試以顯著水準 α =.05 檢定之 M1 M2 M3 M4 10 11 13 18 9 16 8 23 5 9 9 25 15 49 Alone Group Class

利用 EXCEL 求解 Use tools data analysis ANOVA: single factor EXCEL worksheet that performs the one factor ANOVA of the example Microsoft Excel Worksheet 15 50

例題二:建立 ANOVA 表 Source of Variation Treatment (Methods) Degrees of Freedom Sum of Squares Mean Square (Variance) 4 1 = 3 348 116 11.6 Error 12 4 = 8 80 10 F Total 12 1 = 11 428 15 51

例題二: F 檢定平均數相等 1. H0: H µ 1 = µ 2 = µ 3 = µ 4 2. Ha: H Not all equal 3. α =.05 ν 1 = 3 ν 2 = 8 4. Critical Value(s): 0 4.07 15 52 α =.05 F 5. 在 Ho 之檢定統計值 : MSA F* 116 = = = MSE 10 6. Decision: 116. 在 α =.05 下拒絕 H o Conclusion: 有充分證據顯示四種訓練方式平均時間至少一種有差異

配對平均數的多重比較 Tukey Kramer 多重比較 1. 經 ANOVA 分析後, 拒絕平均數全等的假設 2. 多重比較 (multiple comparisons) 例如 : (µ 1 = µ 2 ) µ 3 3. 常用方法 : Bonferroni, Tukey, Scheffé. f(x) µ 1 = µ 2 µ 3 2 Groupings X 15 53

例題一:單因子 ANOVA ( 續 ) 你是生產管理經理, 欲知道三台機器的產品裝箱平均時間是否有差異 因此三台機器 ; 每台五人 並測試你抽選了具相同訓練及經驗的操作員, 並隨機指定至此得到了下列的裝箱時間 以顯著水準.05, 檢定三台機器的裝箱平均時間平均時間是否有差異? 如果有差異請指出何者機器最佳? Mach1 Mach2 Mach3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40 15 54

Tukey Kramer 多重比較 過程 : 例題一 Machine1 Machine2 Machine3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40 2. Compute critical range: 15 55 1. Compute absolute mean differences: X X X X = 24.93 22.61 = 2.32 1 2 X = 24.93 20.59 = 4.34 1 3 X = 22.61 20.59 = 2.02 2 3 MSW 1 1 Critical Range = Q U ( c, n c ) + = 1.618 2 n j n j ' 3. All of the absolute mean differences are greater. There is a significant difference between each pair of means at 5% level of significance.

隨機完全區集設計 (RCBD) Items are divided into blocks Individual items in different samples are matched Or repeated measurements are taken Reduced within group variation (i.e.: Remove the effect of block before testing) Response of each treatment group is obtained 15 56

隨機完全區集設計 (RCBD) 例題 因子 ( 訓練方法 ) 因子水準 區集大一大二大三 觀察值大一 21 hrs 17 hrs 31 hrs 大二 27 hrs 25 hrs 28 hrs 大三 29 hrs 20 hrs 22 hrs 15 57

隨機完全區集設計 (RCBD) ( 變異分解 ) 處理因子變異 SSA Commonly referred to as: Sum of Squares Among Among Groups Variation + 總變異 SST = 區集因子變異 SSBL Commonly referred to as: Sum of Squares among Block 15 58 + 誤差變異 ( 無法解釋之因素 ) SSE Commonly referred to as: Sum of squares error Sum of squares unexplained

總變異 c 15 59 r j= 1 i = ( ) ij SST = X X r = the number of blocks c = the number of groups or levels 2 ( ) n = the total number of observations n = rc X = the value in the i th block for the j th treatment level X X df ij = i j = = n 1 the mean of all val ues in block i the mean of all values for treatment level j

處理因子之變異 15 60 c j = 1 SSA c 1 ( ) 2 j SSA = r X X X df r X ij i = 1 j = (treatment group means) r = c 1 MSA =

區集因子之變異 15 61 c j = 1 = c = r 1 i r i = 1 ij SSBL r 1 ( ) 2 i SSBL = c X X X df MSBL = X (block means)

誤差之變異 c j= 1 i = 1 df = r 1 c 1 r ( )( ) ( ) ij i j SSE = X X X + X MSE = r SSE 1 c 1 ( )( ) 2 15 62

RCBD 之 F 檢定 H µ µ µ 0 : 1 = 2 = = c No treatment effect H µ 1 j Test Statistic F Degrees of Freedom df1 = c 1 15 63 : Not all are equal = MSA MSE df2 = r 1 c 1 ( )( ) 0 F U Reject α F

RCBD 之變異數分析表 變異來源 自由度 平方和 均方 F 檢定量 處理 c 1 SSA MSA = SSA/(c 1) MSA/ MSE 區集 r 1 SSBL MSBL = SSBL/(r 1) MSBL/ MSE 誤差 總和 15 64 (r 1) (c 1) rc 1 SSE SST MSE = SSE/[(r 1) (c (c 1)]

例題一: RCBD 之 ANOVA 分析 你是生產管理經理, 欲知道三台機器的產品裝箱平均時間是否有差異 因此你抽選了五個不同經驗的操作員, 並隨機超做此三台機器 ; 並測試得到了下列的裝箱時間 以顯著水準.05, 檢定三台機器的裝箱平均時間是否有差異? 如果有差異哪一台機器較佳? 15 65 人 Mach1 Mach2 Mach3 一 25.40 23.40 20.00 二 26.31 21.80 22.20 三 24.10 23.50 19.75 四 23.74 22.75 20.60 五 25.10 21.60 20.40

例題一: RCBD 之計算 Machine1 Machine2 Machine3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40 15 66 ( ) ( ) ( ) SSA = 5 24.93 22.71 + 22.61 22.71 + 20.59 22.71 = 47.164 SSE = 8.4025 MSA = SSA /( c 1) = 47.16 / 2 = 23.5820 2 2 2 ( ) 1 2 3 24.93 22.61 20.59 22.71 MSE = SSE / ( r 1) c 1 = 8.4025 / 8 = 1.0503 X X X X = = = = r c = = 5 3 n = 15

例題一: RCBD 之 ANOVA 分析表 變異來源 自由度 平方和 均方 F Statistic 處理 2 SSA= 47.164 MSA = 23.582 23.582/1.050 3=22.452 區集 4 SSBL= 2.6507 MSBL =.6627.6627/1.0503 =.6039 誤差 總和 15 67 8 14 SSE= 8.4025 SST= 58.2172 MSE = 1.0503

例題一: RCBD 處理因子 水準之檢定 H 0 : µ 1 = µ 2 = µ 3 H 1 : Not All Equal α =.05 df 1 = 2 df 2 = 8 Critical Value(s): 0 4.46 15 68 α = 0.05 F F Test Statistic: = MSA MSE = 23. 582 1.0503 = 22.45 Decision: Reject at α = 0.05 Conclusion: There is evidence that at least one µ i differs from the rest.

RCBD 的 Excel 求解 Tools data analysis ANOVA: two factor without replication Example solution in excel spreadsheet Microsoft Excel Worksheet 15 69

Tukey Kramer 多重比較 程序 : 例題一 Machine1 Machine2 Machine3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40 2. Compute Critical Range: 15 70 1. Compute absolute mean differences: X X X X = 24.93 22.61 = 2.32 1 2 X = 24.93 20.59 = 4.34 1 3 X = 22.61 20.59 = 2.02 2 3 MSE 1.0503 Critical Range = Q (,( 1)( 1 ) = 4.04 = 1.8516 U c r c ) r 5 3. All of the absolute mean differences are greater. There is a significant difference between each pair of means at 5% level of significance.

Tukey Kramer 多重比較 利用 PHStat PHStat c sample c tests Tukey Kramer procedure Example in excel spreadsheet Microsoft Excel Worksheet 15 71

CRD 與 RCBD 之關係 CRD SST=SSA+SSE(CRD) RCBD SST=SSA+SSBL+SSE(RCBD) SSE(CRD)=SSBL+SSE(RCBD) RCBD 將區集因子的變異從 CRD 的誤差變中分解出來 RCBD 的誤差變異永遠比 CRD 為小 15 72

無母數方法 Kruskal Wallis Rank Test Extension of Wilcoxon Rank Sum Test Tests the equality of more than two (c)( population medians Distribution free test procedure Used to analyze completely randomized experimental designs Use χ 2 distribution to approximate if each sample group size n j > 5 df = c 1 15 73

K W W Rank Test 之假設與 穩健性 Assumptions Independent random samples are drawn Continuous dependent variable Data may be ranked both within and among samples Populations have same variability Populations have same shape Robust with regard to last two conditions Use F test in completely randomized designs and when the more stringent assumptions hold 15 74

K W W Rank Test 之方法 Obtain ranks In event of a tie, each of the tied values gets its average rank Add the ranks for data from each of the c groups Square to obtain t 2 j H 15 75 2 c 12 T j = 3( n + 1) n( n + 1) j = 1 n j n = n + n + L+ n 1 2 c

K W W Rank Test 之方法 ( 續 ) (continued) Compute test statistic H 2 c 12 T j = 3( n + 1) n( n + 1) j = 1 n j n = n1 + n2 + L + n c n = j # Of observation in j th sample H may be approximated by chi square distribution with df = c 1 when each n j >5 15 76

K W W Rank Test 之方法 ( 續 ) Critical value for a given α Upper tail Decision rule Reject H 0 : M 1 = M 2 = = m c if test statistic 2 H > χ U 2 χ U Otherwise do not reject H 0 15 77

例題一: K W W Rank Test 你是生產管理經理, 欲知道三台機器的產品裝箱平均時間是否有差異 因此你抽選了具相同訓練及經驗的操作員, 並隨機指定至此三台機器 ; 每台五人 並測試得到了下列的裝箱時間 以顯著水準.05, 檢定三台機器的裝箱平均時間平均時間是否有差異? 15 78 Mach1 Mach2 Mach3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40

例題解 : 第一步求 Ranks Raw Data Machine1 Machine2 Machine3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40 Ranks Machine1 Machine2 Machine3 14 9 2 15 6 7 12 10 1 11 8 4 13 5 3 65 38 17 15 79

例題解 : 第二步求 H 值 H T 2 12 c j = 3( n + 1) n( n + 1) j 1 n = j 12 65 2 38 2 17 2 = + + 3(15 + 1) 15(15 + 1) 5 5 5 = 11.58 15 80

例題解 : 第三步中位數之檢定 H0: : M 1 = M 2 = M 3 H1: : Not all equal α =.05 df = c 1 = 3 1 = 2 Critical Value(s): α =.05 Test Statistic: H = 11.58 Decision: Reject at Conclusion: α =.05 有證據證明三種機器的組裝時間是有差異的. 0 5.991 15 81

K W W Test 利用 PHStat 求解 PHStat c sample c tests Kruskal Wallis rank sum test Example solution in excel spreadsheet Microsoft Excel Worksheet 15 82

結論 1. 描述變異數分析 analysis of variance (ANOVA) 2. 解說變異數分析的原理 3. 比較各種的實驗設計 4. 多母體平均數的比較與檢定 完全隨機設計 Completely randomized design 隨機完全區集設計 randomized complete block design Kruskal Wallis rank test 15 83

關於本課程... 請你靜下來想一想並回答下列問題 : 1. 你此堂課學到的最重要的觀念為何? 2. 是否還有相關問題與疑問? 3. 如何改善今後的學習? 15 84