投影片 1

Similar documents
Microsoft PowerPoint - spss2-1.ppt

Microsoft Word - 94_4_stat_handout_07變異數分析.doc

PowerPoint 簡報

統計分析入門與應用 說明 : a. 獨立樣本 : 兩個來自於獨立, 沒有相關的樣本 b. 成對樣本 : 兩個平均數來自於同一個樣本, 有關係的樣本 7-2 Means 平均數分析 Means 平均數分析是用在不同類別變數組合下, 連續變數在各組的統計量, 例如 : 平均數 中位數 標準差 總合 最小

Microsoft Word - 94_2_stat_handout08_線性迴歸(考古題).doc

( ) t ( ) ( ) ( ) ( ) ( ) t-

1 500 表 1: 各國平均分數

(baking powder) 1 ( ) ( ) 1 10g g (two level design, D-optimal) 32 1/2 fraction Two Level Fractional Factorial Design D-Optimal D

0 0 = 1 0 = 0 1 = = 1 1 = 0 0 = 1

基礎統計

Microsoft PowerPoint - ch08.ppt

: :


Microsoft Word - ACL chapter02-5ed.docx

變異數分析 比較多個母體平均數應用在實驗設計如何分析 15 2

常用的統計檢定方法 依變項 DV 類別變數 自變項 IV 連續變數 連續變數 Type A: t 檢定 變異數分析 Type B: 相關 迴歸分析 類別變數 Type C: 卡方檢定 Type D: 判別分析 羅吉斯迴歸

Microsoft Word - ACI chapter00-1ed.docx

102_BS

C19 (1)

第八章 審計抽樣 本章學習重點 stratified random sampling systematic sampling PPS PPS MUS 8-3 壹抽樣與審計抽樣 audit sampling 100%

When the rejection rule for a test at every level α can be re-written as then xxx is the p-value of the test. xxx < α, If p-value < α, then the test c

.., + +, +, +, +, +, +,! # # % ( % ( / 0!% ( %! %! % # (!) %!%! # (!!# % ) # (!! # )! % +,! ) ) &.. 1. # % 1 ) 2 % 2 1 #% %! ( & # +! %, %. #( # ( 1 (

# % & ) ) & + %,!# & + #. / / & ) 0 / 1! 2

SW cdr



表二 105 年國中教育會考英語科閱讀與聽力答對題數對應整體能力等級加標示對照表 閱讀答 對題數 聽力答對題數 待加強待加強待加強待加強待加強待加強待加強待加強待加強待加強待加強待加強

840 提示 Excel - Excel -- Excel (=) Excel ch0.xlsx H5 =D5+E5+F5+G5 (=) = - Excel 00

)

1

Microsoft Word - _m30.doc

Microsoft Word - 各項統計方法的使用目的及使用時機

Chapter 1 統計學與資料分析簡介

影響未婚同居的因素:以大學生為樣本的問卷調查

縣 94 學年度 上 學期 區 國民中學 Q 年級 R 領域教學計畫表 設計者:

第9章 估計

(Microsoft Word - 11-\261i\256m\253i.doc)

男人的大腦 女人的大腦

Microsoft Word - p11.doc

( ) Wuhan University


臺北醫學大學生物統計研究中心 enews 第 6 期 2015/04 R-web 資料分析應用 : 分析方法 變異數 ( 標準差 ) 檢定 吳佩真副統計分析師 回顧前五期的生統 enews 雲端資料分析暨導引系統 ( R-web, 介紹圖表繪製 平均

二次曲線 人們對於曲線的使用及欣賞 比曲線被視為一種數學題材來探討要早 得多 各種曲線中 在日常生活常接觸的 當然比較容易引起人們的興趣 比如 投擲籃球的路徑是拋物線 盤子的形狀有圓形或橢圓形 雙曲線 是較不常見的 然而根據科學家的研究 彗星的運行軌道是雙曲線的一部 分 我們將拋物線 圓與橢圓 雙曲

連續機率分配

2013年香港高級程度會考成績統計

18 A B S 17.44±1() ±6.26( ) 54.23±5.5( ) 6.42±1.51() m 30m t α =.05 ( )AB 1 5 (p>.05)( )AB 1 5 (p<.05)( )A (p>.05)( )B (p<.05)( )A B

敘述統計概論


第一章  緒論

%! # # % % & # ( ) ( +, & +, +, & +, & +, +, &!

# ( + + # + # 6 +,! + # +! +, + # ( + ) ( + ( + ) + 7! + # + /8 + ) ( +! + #. + ( +, +! + # + # + + ( ! ( + ) ( + ) +, + ( + 9% +! +, + ( +

Microsoft Word - 94_4_stat_handout_06假設檢定_考古題.doc

( ) (1) (2) (3) (4) 2

二 戶外教學的性質

!"# $%& () *+, -./

:

381 課業輔導學習輔導 20 第二節 中學生的學習輔導 Skinner Skinner Skinner Bandura Bandura (381) 學習輔導.indd /5/31 2:44:13 PM

目次 CONTENTS 1 數列與級數 幾何圖形 三角形的基本性質 平行與四邊形

無投影片標題

Microsoft PowerPoint - 第9章 簡單隨機抽樣與抽樣分配.ppt [相容模式]

圖 01-1 PROC UNIVARIATE 的輸出結果 ( 腹膜透析 白蛋白 ) 第 1-1 節重要指令說明 : 1. NORMAL: 在報表中呈現常態檢定的結果 2. CLASS 變項名稱 ( 類別 ): 依照 class 所宣告的類別變項分組呈現資料分析結果 在這個例子中我們將資料分為腹膜透析

Ps22Pdf

14052_公開用.pdf

# 7 % % % < % +!,! %!!

PowerPoint Presentation

基本數學核心能力測驗_行為觀察記錄紙_G2版本

( )... 5 ( ) ( )

,400, ,400, %2.0% ,200, / / , / /

7. 下列何者敘述錯誤? (A) 抽樣分佈 (sampling distribution) 的抽樣樣本數越大, 其分佈之集中趨勢 (central tendency) 越小 (B) 樣本 (sample) 可以告訴我們關於母群體 (population) 的資訊 (C) 參數 (parameter)

untitled

鋼結構在綠建築發展趨勢中之綜合評價

明新科技大學專題研究計畫成果報告編寫須知

untitled

2016 年 地 质 工 程 系 教 学 工 作 安 排 2016 学 年 我 系 将 在 总 结 过 去 工 作 的 基 础 上, 结 合 今 年 学 院 以 抓 质 量 强 内 涵 促 改 革 调 结 构 建 品 牌 细 管 理 重 过 程 为 宗 旨, 以 规 范 管 理 深 化 内 涵 为

实 习 上 下 点 表 格 解 释 和 相 关 纪 律 要 求 : 1 表 格 中 所 有 名 词 都 为 简 称, 包 括 医 院 名 称 四 年 级 五 年 级 各 专 业 名 称 等 所 有 时 间 都 为 学 生 装 好 行 李 出 发 时 间, 请 提 前 0 分 钟 将 行 李 运 到

简报158期.doc

<4D F736F F D203136BCADBBD8D2E4D3EBD1D0BEBF2E646F63>

Transcription:

變異數分析原理說明 檢定三個以上的獨立母體之平均值是否相等時, 可採用變異數分析 (The Analysis of Variance, ANOVA) 因此,ANOVA 是用來當成三個或三個以上的母群體平均數的差異顯著性考驗工具 變異數分析種類繁多, 如下表 :

變異數分析的例子 變異數分析是用來檢定兩個以上平均數是否相等或某個變數是否受某些因子所影響之統計方法 例如 : (1) 不同的行銷策略是否會影響產品之銷售量?( 不同的行銷策略, 其產品之平均銷售量是否相等?) (2) 不同的教育程度與不同的性別對工作滿意度是否有影響?( 不同的教育程度與不同的性別之員工, 其平均之工作滿意度是否相等 )

變異數分析常用之名詞 (1) 實驗單位 (experiment unit): 實驗所衡量的對象 例如 : 產品 員工為其實驗單位 (2) 因子 (factor): 研究者所控制調整的因素 例如 : 行銷策略 教育程度為其因子

變異數分析常用之名詞 (3) 處理方法 (treatment): 因子之各種水準或類別 例如 : 不同的行銷策略 不同的教育程度 不同的性別, 如不同性別中的男 女為兩種不同的處理方法 (4) 依變數 (dependent variable): 實驗單位對不同處理方法的反應變數 例如 : 銷售量 工作滿意度為其依變數

在多樣本比較的情況下, 我們可以進行一連串兩個樣本間平均數之 t-test 的檢定, 如果有四個樣本 ( 從另一個角度來說, 是一個有四個類別之自變項, 如宗教信仰, 則每個類別自為一個 subsample), 則我們可進行六個不同之兩個樣本間的 t-test 如果真是這樣做, 除了非常麻煩外, 最大的缺點是會增加犯 Type I 錯誤之機率 如果每個 t-test 是定在 α=0.05 之水準下進行檢定, 進行一連串這樣的 t-tests 會使犯下至少一次 Type I error 的機會增加 換言之, 即使每一個 t-test 是在 α= 0.05 之水準下進行檢定, 其 Type I error 綜合起來事實上是大於 0.05 換個角度來說,t-test 做多了, 總有一個 t-test 之結果會 reject H 0, 但此 H 0可能為真 用 ANOVA 來分析就可以避免這樣的問題

變異數分析的邏輯 ANOVA 之虛無假設是..., 也就是所 有樣本均是來自同一母群體, 或是各母群體的平均 數之間無差異 更具體的說法是, 每類別或項目之間在某一特質上並無差異 ( 例如 : 不同宗教信仰者 在支持死刑之態度上並無差異 ) 從這 H 0 之形式可 看變異數分析是兩樣本之間 t-test 的延伸 至於說 則為 至少有一類別在某一特質上與其它類別有差異 1 2 3 k H 0 H 1

如果上述之 H 0 為真, 則每類別樣本平均數之差別應不大, 且各樣本之標準差大小差不多 事實上 ANOVA 並不是問不同類別間是否有差異, 而是問這些差異是否大到可以拒絕 H 0 和 H 0 完全相反的情況是各類別之平均數相差極大, 而各類別之標準差很小 換言之, 各類別內之異質性很小, 而類別間異質性很大 在這種情況下, 如果我們將所有樣本合併, 這個合併後之樣本的變異量 (Variance), 主要來自原來樣本和樣本間之差異 換言之, 此合併後樣本之變異或離散之狀況主要源自原來各樣本間之差異 而 H 0 所假設的情況, 是變異量主要是來自原各樣本 ( 類別 ) 內之差異, 而非各樣本間之差異

瞭解上面的敘述後, 就很容易了解 ANOVA 之原理,ANOVA 之檢定是建立在比較各類別 ( 或樣本 ) 間之變異量及各類別內之變異量 與類別內之變異量相比較下, 當類別間之變異量愈大時, 拒絕 H 0 的可能性愈大, 反之, 則愈小 ANOVA 之公式, 即在比較兩種對母群體之變異 2 量 ( ) 之估計值 其一估計值即是建立在各樣本內之變化, 而另一則為各樣本間之變化 這即是 ANOVA(ANalysis Of VAriance) 之名稱的由來

變異數分析的種類 單因子變異數分析 (One-way ANOVA) -- 旨在比較單一種自變項的不同處理方式對某依變項的 影響

雙因子變異數分析 (Two-way ANOVA) -- 考慮兩個因子對依變項可能產生的影響 Ex: 不同教育程度對男女薪資的影響 :

第一類因子為教育程度, 第二類是性別, 因此不僅僅看教育程度對薪資的影響, 更探討教育程度對男生, 對女生的薪資影響 教育程度 性別 國中 高中 大學 3.3 3.6 4.3 男 2.8 3.2 3.9 3.1 3.5 4.1 2.3 2.5 2.6 女 2.2 2.3 3.1 1.9 2.7 2.7

三因子變異數分析 等等 凡是雙因子以上的變異數分析皆通稱為多因子變異數 分析

以下, 就以此例子來讓大家更了解 ANOVA: 某位老師想了解, 講述法, 啟發式教學法, 電腦輔 助教學法對五年級學生的英語成績是否有幫助? 1. 此為單因子變異數分析 : 只探討不同教學法對於 單一群體的英語成績影響 自變項為教學法, 依變項為英語成績

某位老師想了解, 講述法, 啟發式教學法, 電腦輔助教學法對五年級男女學生的英語成績是否有幫助? 1. 此為雙因子變異數分析 : 不僅僅可以比較不同教學法對學生英語成績的影響, 亦加入了對男女生英語成績的比較 在此, 自變項有兩個因子 ( 教學法與性別 ), 而依變項為學生英語成績

單因子變異數分析 完全隨機設計 完全隨機設計 (completely randomized design) 是指研究者將不同的處理方法以隨機方式分派給實驗單位 例如, 若研究不同的教學方法對學生學習成績是否有影響, 則可由 n 個學生為實驗單位, 然後將 n 個學生隨機分派於不同的教學方法, 最後再記錄學生之學習成績 定理 1 k n i i1 j1 k n i 2 2 x ij x xij xi ni xi x i1 j1 k i1 2

單因子變異數分析 完全隨機設計 平方和 SST SSE SSB k ni xij x i1 j1 k n i xij xi i1 j1 k i1 n i x i x 2 2 2 = 總變異 (total sum of squares) = 組內變異 (error sum of squares) = 組間變異 (sum of squares between)

SSW(SSE)(Sum of Squares Within)( 組內離均差平方和 ) 之公式是 2 SSW X i X ) ( k X k 是每類別或組別之平均數 因此, 我們求 SSW 之方法是將各組每一分數減去此組之平均數, 求其平方, 然後加起來, 每組都這麼做後, 要全部加起來即得 SSW

而 SSB (Sum of Squares Between) 之公式為 SSB N k X k X N ( X X ) k 是各組之樣本數是各組之平均是合併樣本之平均數 k 2

知道了 SSW 及 SSB, 我們可以得到兩種母群體之 2 估計值組內估計值 =SSW/dfw,dfw=N-K, 組間估計值 =SSB/dfb, dfb=k-1 N= 全部合併樣本數,K= 組數 的

單因子變異數分析 完全隨機設計 定理 2 若獨立隨機樣本 2 2 (1) E( SSE) ( n - k) k 2 2 (2) E( SSB) ( n -1) ni( i - ) i1 X ~ N(,,) i 1,2,, k, j 1,2,, n, 則 ij i i

單因子變異數分析 完全隨機設計 定理 3 若獨立隨機樣本 2 在成立條件下, H 0 X ~ N(,,) i 1,2,, k, j 1,2,, n, 則 ij i i MSB F0 ~ F( k -1, n - k) MSE

單因子變異數分析 完全隨機設計 由定理 3 得知, 進行變異數分析需滿足以下基本假設條件 : (1) 常態母體 : 各組樣本需取自於常態母體 (2) 變異數具同質性 : 各組母體變異數需假設相等 而變異 數是否具同質性, 可利用樣本變異數檢定之 (3) 獨立性 : 各組樣本彼此獨立

單因子變異數分析 完全隨機設計 單因子變異數分析表 變異來源平方和自由度均方值 f 0 處理方法 隨機誤差 SSB SSE k-1 n-k MSB MSE MSB MSE 總和 SST n-1

而 ANOVA 即在求, 兩估計值間的相對大小, 更具體說是求一個 F ratio F=Mean square between/mean square within =(SSB/dfb)/(SSW/dfw) 如果 F=0, 即表示組間變異數為 0, 即各組平均數相同

變異數分析時之 F 分配 這個 F 值之抽樣分配是隨 dfb 及 dfw 而變化, 其分配之圖形如下 :

變異數計算的捷徑 上述之計算公式為依原理所設計的, 事實上我們有些捷徑可循, 其中 SST 可用下式來算, 此後用 SSB 之公式算出 SSB 後, 以 SST-SSB 即得 SSW 這樣計算可省不少事 2 SST X NX SSW SST SSB 2

ANOVA 檢定的各種侷限 此處所介紹之 ANOVA, 又叫做單因子 ANOVA 或簡單 ANOVA(one-way ANOVA 或 Simple ANOVA), 這是因為我們只考慮一個自變項和一應變項之關係 ANOVA 之應用可延伸到多個自變項與一個應變項之關係, 在此暫不多說 ANOVA 最大的限制是要用等距尺度及各類別之樣本數要接近 其次,ANOVA 只能告訴我們樣本間之差異是否到了顯著水準, 並不能告訴我們何類別或樣本與其它類別或樣本不同

單因子變異數分析 完全隨機設計 例題 1 某市場調查公司欲調查市面上四種品牌之相同口味飲料之平均銷售量是否相同, 於是由每一品牌隨機選定 5 個地區作調查, 得其每個地區一個月之銷售量如下表 ( 單位 : 千箱 ) 品牌 A B C D 26.5 29.0 26.9 30.5 28.7 27.6 28.3 31.2 25.2 25.4 27.8 29.9 29.3 28.3 26.2 28.1 25.3 29.7 25.8 30.3

單因子變異數分析 完全隨機設計 例題 1( 續 ) (1) 請寫出此問題之假設 (2) 請寫出此問題之變異數分析表 (3) 請根據 (2) 之結果, 以 =0.05 檢定此四種品牌飲料之平均銷售量是否相等

單因子變異數分析 完全隨機設計 解 (1) 令表第 i 種品牌銷售量之平均數, 則此問題之假設為 i H: & H: 不全相等 0 A B C D 1 A B C D (2) 每種品牌之樣本平均數 X A X B X C X D及總樣本平均數 如下 : X 1 X A (26.5 28.7 25.2 29.3 25.3) 27 5 1 X B (29.0 27.6 25.4 28.3 29.7) 28 5 1 X C (26.9 28.3 27.8 26.2 25.3) 27 5

解 單因子變異數分析 完全隨機設計 1 X D (30.5 31.2 29.9 28.1 30.3) 30 5 1 X (5 27+5 28+5 27+5 30) 28 20 經計算後可得 SST (26.5-28) (28.7-28) (25.2-28) (29.3-28) 2 2 2 2 (25.3-28) (29.0-28) (27.6-28) (25.4-28) 2 2 2 2 (28.3-28) (29.7-28) (26.9-28) (28.3-28) 2 2 2 2 2 2 2 2 (27.8-28) (26.2-28) (25.8-28) (30.5-28) (31.2-28) (29.9-28) (28.1-28) (30.3-28) 65.28 2 2 2 2

單因子變異數分析 完全隨機設計 解 2 2 2 2 SSB 5 (27-28) 5 (28-28) 5 (27-28) 5 (30-28) 30 SSE SST - SSB 65.28-30 35.28 SSB 之自由度為 4-1=3, 因此 MSB SSB 30 10 k -1 3 SSE 之自由度為 n-k = 20-4 = 16, 因此 由此可得, f0 SSE 35.28 MSE 2.205 n - k 16 MSB 10 4.535 MSE 2.205

單因子變異數分析 完全隨機設計 解 其變異數分析表如下 : 變異來源平方和自由度均方值 f 0 處理方法 30 3 隨機誤差 35.28 16 總和 65.28 19 10 2.205 4.535 MSB (3) 因為 ~ F (3,16), 因此其拒絕域 f0 f0.05 f0 MSE 而檢定值 f 落在拒絕域中, 因此拒絕, 即 0 4.535 3.239 H0 四種不同品牌飲料之平均銷售量有顯著地差異 (3,16) 3.239

單因子變異數分析 完全隨機設計 例題 2 某研究人員想瞭解 A B C 三種不同廠牌 1800c.c. 汽車之耗油率, 於是此研究人員蒐集了資料, 並以完全隨機設計方式蒐集資料並計算得到以下之變異數分析表, 如下表所示 變異來源平方和自由度均方值 f 0 處理方法 20 2?? 隨機誤差 50 27? 總和 70 29

單因子變異數分析 完全隨機設計 例題 2( 續 ) (1) 請完成此變異數分析表 (2) 請以 =0.05 來檢定 H: ( 表第 i 種品牌汽車平 0 A B C i 均每公升汽車可行駛之里程數 ) 是否成立

單因子變異數分析 完全隨機設計 解 (1) 因為所以 SSB 20 MSB 10 MSE k -1 2 MSB 10 f0 5.41 MSE 1.85 因此其完整變異數分析表如下所示 : SSE 50 1.85 n - k 27 變異來源平方和自由度均方值 f 0 處理方法 20 2 隨機誤差 50 27 總和 70 29 10 1.85 5.41

單因子變異數分析 完全隨機設計 解 MSB (2) 因為 ~ F (2, 27), 因此其拒絕域 MSE f f (2,27)=3.35 0 0.05 而檢定值 f 落在拒絕域中, 因此拒絕, 即 0 5.41 3.35 H0 三種品牌 1800c.c. 汽車之耗油率有顯著地差異

變異數分析原理說明 範例 : 某校想要了解不同的教學方法對學生的學習成效是否有所差異, 因而進行一項教學實驗 該校找來三組學生 ( 每組各 5 位同學 ), 施以不同的教學方法 ( 民主式 專制式 放任式 ) 一段時日後施以測驗, 測驗成績如右表所示 試問 : 此三種教學方法之成效是否有所差異?

變異數分析原理說明 總變異可分為兩部分, 即組間變異 ( 處理變異 ) 與組內變異 以本範例來說明, 每位學生測驗成績與總平均差異的來源, 可分為兩大部分 : 一為來自教學方法所造成的差異 ( 組間變異 ); 另一為來自學生個別差異 ( 組內變異 ) 變異數分析的檢定統計量乃用 F 值來進行 :

變異數分析原理說明 假說與檢定 H 0 : 各教學法平均分數皆相等 (μ 1 = μ 2 = μ 3 ) H 1 : 各教學法平均分數不全相等 檢定原理為若 F 值愈大, 表示由於教學法不同所造成之變異值愈顯著, 愈傾向拒絕 H 0 ( 範例一 ) 多重比較之探討 在進行 ANOVA 比較之後, 倘若結果顯示各組平均數間有顯著差異, 則我們希望進一步了解哪一些平均數是不同的 此時各平均數間之比較組合不只一種, 故稱多重比較 (multiple comparision)

範例一 以全校學生成績為例, 探討不同科系之平均數學成績是否有差異 操作 : 1. 點選 Analyze/Compare Means/One-Way ANOVA 2. 程式操作 3. 假說 : H 0 : 各科系數學平均分數皆相等 (μ 1 = μ 2 = μ 3 = μ 4 = μ 5 ) H 1 : 各科系數學平均分數不全相等 4. 分析結果

範例一 程式操作

範例一 分析結果 判斷方法 :p-value=sig.=0.000<0.05, 故拒絕 H 0 結論 : 科系間之平均數學分數有顯著差異 A NOVA 數學能力測驗 Betw een Groups Within G roups Total Sum of S quares df M ean Square F S ig. 15703.89 4 3925.973 8.386.000 105329.9 225 468.133 121033.8 229

多個平均數之多重比較 聯合信賴區間 ( 變異數分析之多重比較 ) 在 k 個母體平均數之多重比較中, 兩母體平均數差 之 1 100% 聯合信賴區間為 i j x i x j x i t α 2a x j n k MSE, n k 1 n i 1 n j 其中 分別為兩母體之樣本平均數且其樣本個數分別為 x i x j t α 2a MSE 1 n i 1 n j ni n j k 及, 且 C,n 表總樣本數 a 2

多個平均數之多重比較 例題 3 承例 2, 若 A B C 三種品牌 1800c.c. 汽車每公升汽油可行駛里程數之樣本平均數分別為 xa 11, xb 12, x C 13 且樣本個數均為 10, 試求 A B C 三種品牌 1800c.c. 汽車平均每公升汽油可行駛之里程數差之 94% 聯合信賴區間

多個平均數之多重比較 解 由已知資料及前面計算得知, x A 11, x 12, x 13; B C k k na nb nc 10; k 3; a C2 C3 3; MSE 1.85 由此可知, A B 之信賴區間為 x A x B t 2a 1 n n k MSE 1112 t 27 11.504 即 A B 之信賴區間為 2.504, 0.504; A 1 n B 0.01 1.85 1 10 1 10

多個平均數之多重比較 解 B C 之信賴區間為 1 1 1112 1.504 11.504 xb xc t n k MSE 2a n B n C 即 B C 之信賴區間為 2.504, 0.504 最後, A C 之信賴區間為 [ 3.504, 0.496] 由此可知, 發現及 之信賴區間均包含 0, 而 A B 之信賴區間未包含 0, 因此 及 並無顯 A C A B B C 著地差異, 而具有顯著地差異者僅有 與 B C A C

變異數分析原理說明 各種多重比較方法之檢定整理如下表 : 範例二

範例二 銜接範例一, 分析各組間之差異情形 操作 : 1. 點選 Analyze/Compare Means/ One-Way ANOVA/Post Hoc 2. 程式操作 3. 分析結果

範例二 程式操作

範例二 分析結果 Dependent V ariable: 數學能力測驗 S cheffe Multiple Compar isons (I) 科系電子系 資訊系 企管系 外文系 法律系 (J) 科系資訊系企管系外文系法律系電子系企管系外文系法律系電子系資訊系外文系法律系電子系資訊系企管系法律系電子系資訊系企管系外文系 M ean Difference 95% C onfidence Interv al (I-J) S td. E rror S ig. Low er Bound Upper Bound 2. 87 4. 71.985-11.76 17. 51 8. 55 4. 64.494-5.84 22. 95 18. 56* 4. 80.006 3. 65 33. 47 21. 58* 4. 78.001 6. 74 36. 42-2.87 4. 71.985-17.51 11. 76 5. 68 4. 29.780-7.64 19. 00 15. 69* 4. 47.017 1. 81 29. 56 18. 71* 4. 44.002 4. 91 32. 51-8.55 4. 64.494-22.95 5. 84-5.68 4. 29.780-19.00 7. 64 10. 01 4. 39.271-3.62 23. 63 13. 03 4. 36.066 -. 51 26. 57-18.56* 4. 80.006-33.47-3.65-15.69* 4. 47.017-29.56-1.81-10.01 4. 39.271-23.63 3. 62 3. 02 4. 54.979-11.07 17. 11-21.58* 4. 78.001-36.42-6.74-18.71* 4. 44.002-32.51-4.91-13.03 4. 36.066-26.57.51-3.02 4. 54.979-17.11 11. 07 *. The mean difference is significant at the.05 level. 結論 : 1. 法律系 外文系與企管系間平均數學成績無顯著差異 2. 企管系 資訊系與電子系間平均數學成績無顯著差異 3. 資訊系與電子系之平均數學成績, 顯著高於法律系與外文系

單因子變異數分析 - 隨機集區設計 當每種處方下的反應變數各有不同特性而非相同分配時, 不能用上一節的作法 要將試驗單位再劃分成許多集區來討論 隨機集區設計 (randomized block design): 先將試驗單位依其特質或屬性歸類於不同的集區 (block), 處方則隨機分派於同一集區內的各個試驗單位, 而且一種處方只用於集區內的一個試驗單位

單因子變異數分析 - 隨機集區設計 定理 4 若為獨立之常態隨機變數, x i 1,2,, b, j 1,2,, k ijk, 且變異數均相等, 而其母體平均數 ijk i 處理方法所造成之離差 ), 則 j ij ( () 分別表集區與 (1) 在 :... 0成立 ( 即處理方法不影響 H0 1 2 k 依變數 ) 之條件下, ~ MSBW F ~ 1 F k 1, k 1 b MSE 1 i j ij

單因子變異數分析 - 隨機集區設計 定理 4( 續 ) (2) 在 H 0 : 1 2... a 0 成立 ( 即不同的集區不影響 依變數 ) 之條件下, ~ MSBW F ~ 2 F b 1, k 1 b MSE 1

單因子變異數分析 - 隨機集區設計 單因子變異數分析表 ( 隨機集區設計 ) 變異來源平方和自由度均方 f 值 處理方法 SSBW k-1 MSBW f 1 MSBW MSE 集區隨機誤差 SSBK SSE b-1 (k-1)(b-1) MSBK MSE f 2 MSBK MSE 總和 SST B(k-1)

單因子變異數分析 - 隨機集區設計 例題 4 下表為 10 位員工操作三部不同機器生產一件相同產品所需之作業時間, 請以 =0.05 檢定 : (1) 不同的機器之平均作業時間是否有顯著地差異? (2) 不同的員工操作機器之平均作業時間是否有顯著地差異?

單因子變異數分析 - 隨機集區設計 例題 4( 續 ) 員工 ( 集區 ) 1 2 3 4 5 6 7 8 9 10 機器 ( 不同處理方法 ) 1 2 3 9.5 8.5 9.3 9.1 9 8.7 8.9 9.1 8.5 9.4 10.5 10 10.2 9.8 9.5 10.3 9.7 10 9.5 10.5 11.2 11 10.7 11.3 10.5 11.5 10.8 10.7 11.3 11 總和 31.2 29.5 30.2 30.2 29 30.5 29.4 29.8 29.3 30.9 總和 100 90 110 300

單因子變異數分析 - 隨機集區設計 解 假設一 : 不同的機器之平均作業時間相等 & H0 H1 H0 : 不成立 假設二 : 不同的員工之平均作業時間相等 & 0 H H1 H0 欲檢定上述假設, 需作以下計算 : 員工 ( 集區 ) 作業時間之平均數 : : 不成立 31.2 29.5 30.2 x1. 10.4, x2. 9.83, x3. 10.07, 3 3 3 30.2 29 30.5 x4. 10.07, x5. 9.67, x6. 10.17, 3 3 3 29.4 29.8 29.3 30.9 x7. 9.8, x8. 9.93, x1. 9.77, x10. 10.3 3 3 3 3

單因子變異數分析 - 隨機集區設計 解 機器 ( 不同處理方法 ) 作業時間之平均數 : 100 90 110 x.1 10, x.2 9, x.3 11, 10 10 10 總平均數 : 300 x 10 30 由此可得 : 10 3 SST SSBK, SSBW 2 ( xij -10) =23.32 i1 j1 10 2 3 ( xi. -10) 1.57 i1, 3 2 10 ( x. j -10) 20 j1 SSE SST - SSBW - SSBK 23.32-20-1.57 1.75

單因子變異數分析 - 隨機集區設計 解 SST SSBW SSBK 及 SSE 之自由度分別如下 : d. f.( SST ) bk -1 30-1 29 d. f.( SSBW ) k -1 3-1 2 d. f.( SSBK ) b 110 1 9 由此可得 d. f.( SSE) ( k -1)( b-1) 18 SSBW 20 SSBK 1.57 MSBW 10, MSBK 0.174 k -1 3 b -1 9 SSE 1.75 MSE 0.097 ( k-1)( b-1) 18, MSBW f 10 103.09 1 MSE 0.097 f 2 MSBK 0.174 1.79 MSE 0.097

單因子變異數分析 - 隨機集區設計 解 變異來源平方和自由度均方 f 值 處理方法 集 其變異數分析表如下 : 區 隨機誤差 20 1.57 1.75 2 9 18 總和 23.32 29 10 0.174 0.097 MSBW MSBK F1 ~ F(2,18), F 2 ~ F(9,18) MSE MSE 以顯著水準 =0.05查表可得其拒絕域分別為 f 3.55 及 f 2.46 1 2 103.09 1.79

單因子變異數分析 - 隨機集區設計 解 然而檢定值 f f2 1.79 2.46 1 103.09 3.55, 而 因此拒絕, 但接受, 即 不同機器之平均作業 H0 0 時間有顯著地差異, 而 不同員工之平均作業時間 無顯著地差異 H

二因子變異數分析 定理 5 若 x 為獨立之常態隨機變數, ijk i 1,2,, a, j 1,2,, b, k 1,2,,n, 且變異數均相等, 其母體平均數 ijk i j ij ( () 分別表第一 因子 第二因子及兩因子交互作用造成之離差 ), 則 (1) 在 H... 0 成立 ( 即第一因子不影響 0 : 1 2 a 依變數 ) 之條件下, MSA MSE i ~ F a 1, ab n 1 j ij

二因子變異數分析 定理 5( 續 ) (2) 在成立 ( 即第二因子不影響 H 0 : 1 2... b 0 依變數 ) 之條件下, MSB MSE ~ F b 1, ab n 1 (3) 在 : 11 12... 1 b a 1 a 2... ab H 0... 成立 ( 即兩因子交互作用不影響依變數 ) 之條件下, MSAB MSE a 1 b 1, abn 1 ~ F

二因子變異數分析

二因子變異數分析 例題 5 某研究者欲調查一特定品牌飲料之銷售量是否受其產品的口味及商店類型的不同影響, 於是對四種不同口味的飲料及三種不同類型的商店作調查, 隨機調查 5 天各不同類型商店之各口味飲料之銷售量, 計算後得其二因子變異數分析表如下 ( 顯著水準為 0.01):

二因子變異數分析 例題 5( 續 ) (1) 求上表之未知數 (a) (b) (c) (d) (e) (f) (2) 請問此資料是否顯示不同的產品口味有顯著地影響此品牌飲料之銷售量? (3) 請問此資料是否顯示不同的商店類型有顯著地影響此品牌飲料之銷售量? (4) 請問此資料是否顯示不同的產品口味及不同商店類型之交互作用有顯著地影響此品牌飲料之銷售量?

解 二因子變異數分析 (1) ( a) SSE SST - SSA - SSB - SSAB 14046-5817-406-3618 4205 ( b)= d. f ( SSE) d. f ( SST ) - d. f ( SSA) - d. f ( SSB) - d. f ( SSAB) 59-3- 2-6 48 SSA 5817 ( c) MSA 1939 d. f.( SSA ) 3 SSB 406 ( d) MSB 203 d. f.( SSB ) 2 MSA 1939 ( e) f1 22.13 MSE 87.6 MSB 203 ( f) f2 2.32 MSE 87.6

二因子變異數分析 解 承上頁, 因此完整之變異數分析表如下 :

解 二因子變異數分析 (2) 因為 F ~ 3,48, 經查表得知, 其拒絕域為 拒絕 (3) 因為 F ~ 2,48, 經查表得知, 其拒絕域為 接受 MSA MSE 1 f { 1 0.01 1 f f (3,48)} { f 4.24} 13 H 0 而 f 1 22. 落在拒絕域, 因此, 即不同的產品口味對產品之銷售量有顯著地影響 MSB 2 f MSE f f (2,48)} { f 5.113} f 2 2. 32 { 2 0.01 2 H 0 : 而不落在拒絕域, 因此 不同類型之商店對產品之銷售量無顯著地影響

解 二因子變異數分析 MSAB 3 f MSE f f (6,48)} { f 3.22} f 3 6. 88 (4) 因為 F ~ 6,48, 經查表得知, 其拒絕域為 { 3 0.01 3 而落在拒絕域, 因此拒 絕, 即不同口味及不同類型商店之交互作用對產品之銷售 H 0 量有顯著地影響

雙因子變異數分析 當我們懷疑某一屬量的依變數可能同時受到兩個屬質自變數影響時, 較正確的分析方法應是採用雙因子變異數分析, 例如 : 如下表想要探討 居住區域 (α i ) 與 性別 (β j ) 對 存款 的影響 性別與居住區域對存款的影響效果稱為主效果 ; 性別與區域是否同時對存款造成不同的效應則為交互效果

雙因子變異數分析 檢定內容 程式操作 分析說明

範例 程式操作

範例 分析說明 由交互效果的檢定結果 ( 下表 ) 可知, 性別與居住區域存在交互效果 F = 5.886 (Sig.=0.003 < 0.05) 因而必須進一步控制某主要效果, 檢定在該主要效果下之交互效果 Dependent V ariable: 存款 S ource C orrected M odel Intercept 性別 居住區域 性別 * 居住區域 E rror Total C orrected Total T ests of Between-Subjects Effects Type III Sum of S quares df M ean Square F S ig. 256426.245 a 5 51285.249 3.346.006 35224134.421 1 35224134.4 2297.884.000 24747.963 1 24747.963 1. 614.205 77864.349 2 38932.175 2. 540.082 180448. 318 2 90224.159 5. 886.003 2958485.991 193 15328.943 40531610.984 199 3214912.236 198 a. R S quared =.080 (A djusted R S quared =.056)

雙因子變異數分析 控制居住區域 針對居住東區客戶 (A1), 探討不同性別下之存款差異 (A1B1 與 A1B2) 亦可使用單因子變異數分析,F = t 2, 與 t 檢定之顯著值相同 操作 : 1. 點選 Data/Select Cases/ 選居住區域 = 1 進行兩樣本 t 檢定 2. 程式操作 3. 分析結果

範例 程式操作

範例 分析結果 Sig. = 0.368 > 0.05, 無法拒絕 H 0 結論 : 東區男性客戶之平均存款與東區女性客戶之平均存款無顯著差異

雙因子變異數分析 控制性別 針對女性客戶 (B1), 探討不同居住區域下之存款差異 (A1B1 A2B1 與 A3B1) 此時使用單因子變異數分析 ( 居住區域分為 3 類 ) Sig. = 0.682 > 0.05, 無法拒絕 H 0 結論 : 女性客戶在不同區域上, 其平均存款無顯著差異

雙因子變異數分析 總結 : 經由上述的雙因子變異數分析, 發現以下幾項現象 平均存款在性別間無顯著差異 ( 亦即, 男性與女性之平均存款無顯著差異 ) 平均存款在居住區域間無顯著差異 ( 亦即, 東區 西區與中區之平均存款無顯著差異 ) 性別與居住區域對平均存款產生交互作用 對居住中區之客戶而言, 女性客戶存款顯著大於男性 ; 對男性客戶而言, 居住在東區與西區客戶, 其存款顯著大於居住中區住戶

結論 變異數分析是用來檢定兩個以上平均數是否相等或某個變數是否受某些因子所影響之統計方法 而其主要概念是將資料之變異依其來源區分幾個不同的部份, 然後再以兩樣本變異數比之抽樣分配 F- 分配為基礎來進行檢定分析 (1) 在完全隨機設計之單因子變異數分析中, 資料之總變異如下 : SST ( 總變異 ) SSB( 組間變異 ) SSE( 組內變異 )

結論 (2) 在隨機集區設計之單因子變異數分析中, 資料之總變異如下 : SST( 總變異 ) SSBW ( 處理方法間之變異 ) SSBK( 集區間之變異 ) SSE( 隨機變異 ) (3) 在二因子變異數分析中, 資料之總變異如下 : SST ( 總變異 ) SSA( 第一因子間之變異 ) SSB( 第二因子間之變異 ) SSAB( 兩因子交互作用之變異 ) SSE( 隨機變異 )