國立臺灣師範大學進修推廣學院 05 調查研究與統計分析課程 Section9 平均數分析與檢定方法 授課教師 : 邱皓政
常用的統計檢定方法 依變項 DV 類別變數 自變項 IV 連續變數 連續變數 Type A: t 檢定 變異數分析 Type B: 相關 迴歸分析 類別變數 Type C: 卡方檢定 Type D: 判別分析 羅吉斯迴歸
0 位大學生網路使用態度調查 編號 Id 性別 gender 年齡 age 居住地 living 網路態度總分 total 男 9.8 租屋 34 男.3 租屋 35 3 男.6 家中 36 4 女. 家中 30 5 女.8 租屋 3 6 女.0 家中 4 7 男 0. 家中 49 8 女.7 學校宿舍 3 9 女 0.4 學校宿舍 35 0 男 9.9 家中 3 女 0.3 學校宿舍 38 男 0.3 家中 39 3 男. 租屋 34 4 女.3 租屋 5 男. 租屋 33 6 女. 租屋 7 7 女.5 租屋 38 8 男 3.6 租屋 30 9 男. 家中 38 0 男.8 家中 3 3
4 性別與居住地在網路態度得分的描述統計量 個數 平均數 標準差 標準誤 性別為 IV 男 35.55 5.4.58 女 9 3.56 6.3.08 居住地為 IV 家中 8 37.00 6.8. 學校宿舍 3 35.00 3.00.73 3 租屋 9 3.44 5.03.68 總和 0 34.0 5.75.9
Part I Difference test of sample means
6 平均數差異考驗之圖解 The Map of Statistical Analysis Y 0 (, ) (, ) t test
7 平均數的統計考驗 意義 探討平均數意義的統計考驗 當樣本組數越多, 平均數的比較就更加複雜 - 當樣本組數為 (K=), 稱為單樣本 ( 母群 ) 平均數考驗, 適用 Z 或 t 考驗 - 當樣本組數為 (K=), 稱為雙樣本 ( 母群 ) 平均數考驗, 適用 Z 或 t 考驗 - 當樣本組數大於等於 3(K 3), 稱為多樣本 ( 母群 ) 平均數考驗, 適用 F 考驗 樣本組數超過 時, 表示存在著一個切割該平均數的類別化自變項 - 自變項的角色 : 將依變項進行分組比較, 進行平均數的差異檢定 - 當樣本平均數距離愈大, 顯示樣本間愈可能存在顯著的差異
8 獨立樣本與相依樣本 不同的平均數可能計算自不同的樣本, 亦有可能計算自同一個樣本的同一群人, 或是具有配對關係的不同樣本 獨立樣本設計 不同平均數來自於獨立沒有關連的不同樣本 根據機率原理, 當不同的平均數來自於不同的獨立樣本, 兩個樣本的抽樣機率亦相互獨立 相依樣本設計 重複量數設計 (repeated measure design): 不同的平均數來自於同一個樣本的同一群人 ( 例如某班學生的期中考與期末考成績 ) 重複測量的結果 配對樣本設計 (matched sample design): 不同的平均數來自具有配對關係的不同樣本 ( 例如夫妻兩人的薪資多寡 ) 樣本抽取的機率是為非獨立 相依的情況
9 單母群平均數考驗 當研究者關心某一個連續變項的平均數, 是否與某個理論值或母群平均數相符合之時, 稱為單母群平均數考驗 例如 0 位大學生的網路使用態度的平均數為 34.0 是否與全國大學生的網路使用態度平均數 30.50 相同 研究假設為樣本平均數與母群體 ( 或理論值 ) 平均數不同, 或 μ μ0 當母群的標準差已知, 抽樣分配的標準誤可依中央極限定理求得, 且無違反常態假設之虞, 可使用 Z 分配來進行檢定 若母群的標準差未知, 則需使用樣本標準差的不偏估計數來推估母群標準差 Z obt n t obt s s n
雙母群平均數考驗 當研究者關心兩個平均數的差異是否存在之時 ( 例如 0 位學生中, 男生的平均網路使用態度為 35.55 分, 是否與女生的 3.56 分相同 ), 是為雙母群平均數考驗的問題, 研究假設 (H) 為樣本一平均數與樣本二平均數具有差異, 或 μ μ 當雙母群平均數考驗所使用的樣本是獨立樣本時, 使用獨立樣本平均數 Z 檢定 母體標準差未知, 且樣本小於 30, 應使用 t 統計量, 進行獨立樣本 t 考驗, 公式如下 : 0 0 0 n n n n Z obt 0 0 n n s s t w obt 0
雙母群平均數考驗 當雙母群平均數考驗所使用的樣本是相依樣本時, 使用相依樣本平均數檢定, 例如 0 位學生參加網路相關課程前後的網路態度平均數的比較 0 0 obt r Z 0 0 obt s rs s s s t
單尾與雙尾考驗 平均數差異考驗在檢驗兩個平均數大於 小於與不等於等不同形式的研究假設 形成有特定方向的考驗或無方向性的考驗兩種不同模式 單尾考驗 (one-tailed test) 當研究者只關心單一一個方向的比較關係時 ( 例如男生的數學成績 優於女生 ), 平均數的考驗僅有一個拒絕區 H0: H: > 與 與分別示男生與女生數學成績的平均數 雙尾檢驗 (two-tailed test) 當研究者並未有特定方向的設定 ( 例如男生的智商與女生的智商有所不同 ), 假設考驗在兩個極端的情況皆有可能發生, 而必須 設定兩個拒絕區 H0: = H: H0: 0( 0) H: 0) 0 ( H0: 0) 0 ( 0 ( 0) H: 0) 0 ( 0 ( 0)
3 虛無假設與雙尾機率示意圖 f( ) f( ) 拒絕區 - c cv cv (a) 雙尾檢定 (b) 單尾檢定 臨界值
4 t 考驗的基本假設 ( 一 ) 常態性假設 雙樣本平均數考驗中, 兩個平均數來自於兩個樣本, 除了樣本本身的抽樣分配需為常態化之外, 兩個平均數的差的抽樣分配也必須符合常態分配的假設 (normality) ( 二 ) 變異數同質性假設 (homogeneity of variance) 平均數差異檢定中, 每一個常態化樣本的平均數要能夠相互比較, 除了需符合常態分配假設外, 必須具有相似的離散狀況, 也就是樣本的變異數必須具有同質性 如果樣本的變異數不同質, 表示兩個樣本在平均數差異之外, 另外存有差異的來源, 致使變異數呈現不同質的情況 變異數同質性假設若不能成立, 會使得平均數的比較存有混淆因素
資料庫 5
6 操作步驟 步驟一 : 輸入資料 所別與成績各為一個變項, 各佔一欄 步驟二 : 選取分析 比較平均數法 獨立樣本 t 檢定 步驟三 : 選擇欲分析的檢定變數 ( 依變數 ) 與分類變數 ( 自變數 ) 步驟四 : 於定義組別中輸入欲進行對比的分類變數之類別 步驟五 : 於選項中輸入信心水準 步驟六 : 按確定執行
7 示範 :t test 男女生的起薪是否有差異? 組別統計量 起薪 性別 平均數的 個數 平均數 標準差 標準誤 58 $0,30.40 $9,.78 $567.7 6 $3,09.97 $,935.60 $99.74 獨立樣本檢定 起薪 假設變異數相等不假設變異數相等 變異數相等的 Levene 檢定 平均數相等的 t 檢定差異的 95% 信賴區間 t 自由度顯著性 ( 雙尾 ) 平均差異標準誤差異下界上界 F 檢定 顯著性 05.969.000.5 47.000 $7,09.43 $646.45 $5,939.6 $8,479.70.987 38.88.000 $7,09.43 $60.4 $6,06.9 $8,39.67
8 獨立樣本 t 檢定結果分析 兩個樣本的起薪平均數各為 030.4 與 309.97, 變異數同質性的 Levene 檢定達顯著 (F=05.969, p<.00), 違反變異數同質性假定, 表示這兩個樣本的離散情形有明顯差別 因此, 必須報告不假設變異數相等的 t 值 而由不假設變異數相等的 t 值與顯著性, 發現考驗結果達顯著, 表示男女生在起薪上有顯著差異 (t (47) =.987,p<.00)
9 學習小驗收 利用 data0.sav 分析性別在網路態度上是否具有差異?
Part II ANOVA (analysis of variance) of multiple sample means
平均數的統計考驗 意義 探討平均數意義的統計考驗 - 當樣本組數大於等於 3(K 3), 稱為多樣本 ( 母群 ) 平均數考驗, 適用 F 考驗當樣本組數越多, 平均數的比較就應以變異數形式進行 平均數的變異 誤差變異 F ˆ ˆ b w MS MS b w SS SS b w df df b w
F ratio 兩個變異數的比值稱為 F 統計量 F b w MS MS b w F 統計量的機率分配為 F 分配 F 值越大, 表示研究者關心的組平均數的分散情形較誤差變異來得大 若大於臨界值, 研究者即可獲得拒絕 H0 的結論 f() ˆ ˆ df=, df=9,9 df=4,6 df=,4 SS SS b w df df b w =F
3 變異數分析摘要表 變異數分析的結果可以整理成摘要表形式 變異來源 SS df MS F 組間 SS b k- SS b /df b MS b /MS w 組內 ( 誤差 ) SS w N-k SS w /df w 全體 SS t N-
4 ANOVA(F test) 操作步驟 步驟一 : 點選分析 比較平均數法 單因子變異數分析 步驟二 : 進入單因子變異數分析對話框, 點選依變項與因子 ( 自變項 ) 移至右側清單內 步驟三 : 選擇所需的附加功能 如選項中的敘述統計 同質性檢驗,Post Hoc 檢定中的事後比較等 步驟四 : 按壓確定執行
5 不同職業別在目前薪資是否有差異? 描述性統計量 目前薪資 職員保全人員管理人員總和 平均數的 95% 信賴區間 個數 平均數 標準差 標準誤 下界 上界 最小值 最大值 363 $7,838.54 $7,567.99 $397. $7,057.40 $8,69.68 $5,750 $80,000 7 $30,938.89 $,4.6 $406.96 $30,0.37 $3,775.40 $4,300 $35,50 84 $63,977.80 $8,44.78 $,990.67 $60,08.44 $67,937.6 $34,40 $35,000 474 $34,49.57 $7,075.66 $784.3 $3,878.40 $35,960.73 $5,750 $35,000 變異數同質性檢定 目前薪資 Levene 統計量 分子自由度 分母自由度 顯著性 59.733 47.000 目前薪資 組間組內總和 變異數分析 平方和 自由度 平均平方和 F 檢定 顯著性 8.944E+0 4.47E+0 434.48.000 4.848E+0 47 09574.379E+ 473
6 依變數 : 目前薪資 Scheffe 法 (I) 職別職員 保全人員 管理人員 (J) 職別保全人員管理人員職員管理人員職員保全人員 *. 在.05 水準上的平均差異很顯著 多重比較 95% 信賴區間 平均差異 (I-J) 標準誤 顯著性 下界 上界 -$3,00.35 $,03.76.30 -$8,069.80 $,869.0 -$36,39.6* $,8.35.000 -$39,55.54 -$33,.98 $3,00.35 $,03.76.30 -$,869.0 $8,069.80 -$33,038.9* $,44.4.000 -$38,550.7 -$7,57.65 $36,39.6* $,8.35.000 $33,.98 $39,55.54 $33,038.9* $,44.4.000 $7,57.65 $38,550.7 70000 60000 50000 40000 目前薪資的平均數 30000 0000 職員 職別 保全人員 管理人員
7 獨立樣本單因子變異數分析之結果分析 由上述的報表可以得知 : 此一獨立樣本單因子變異數分析的三個水準平均數各為 7838.54 30938.89 63977.80,Levene 的變異數同質性檢定達顯著, 表示這三個樣本的離散情形有明顯差別, 違反變異數同質性檢定 (p.s 應無法進行接下來的變異數分析 ) 統計報表顯示, 不同職務別, 在目前薪資上有顯著不同 (F (,47) =434.48,p<.00) 達顯著水準 經事後比較檢驗發現, 管理人員顯著高於保全人員與職員
8 學習小驗收 利用 data0.sav 分析居住地在網路態度上是否具有差異?
9 性別 + 居住地 網路態度得分 個數平均數標準差標準誤 性別為 IV 男 35.55 5.4.58 女 9 3.56 6.3.08 居住地為 IV 家中 8 37.00 6.8. 學校宿舍 3 35.00 3.00.73 3 租屋 9 3.44 5.03.68 總和 0 34.0 5.75.9
30 From one to two factor ANOVA IV DV * Y Y Y One-sample no factor k-sample one factor k-sample for st factor l-sample for nd factor k*l-sample for interaction