(Microsoft Word - Ch 10 1 \260\262\263]\300\313\251w)

Similar documents
Microsoft Word - 94_4_stat_handout_06假設檢定_考古題.doc

(Microsoft Word \262\316\255p\244W\264\301\245\275\303D\256w)

Microsoft Word - 94_2_stat_handout08_線性迴歸(考古題).doc

0 0 = 1 0 = 0 1 = = 1 1 = 0 0 = 1

Microsoft Word - 95_1_stat_handout_04抽樣與抽樣分配.doc

統計分析入門與應用 說明 : a. 獨立樣本 : 兩個來自於獨立, 沒有相關的樣本 b. 成對樣本 : 兩個平均數來自於同一個樣本, 有關係的樣本 7-2 Means 平均數分析 Means 平均數分析是用在不同類別變數組合下, 連續變數在各組的統計量, 例如 : 平均數 中位數 標準差 總合 最小

連續機率分配

Microsoft PowerPoint - 統計學CH11.ppt

臺北醫學大學生物統計研究中心 enews 第 6 期 2015/04 R-web 資料分析應用 : 分析方法 變異數 ( 標準差 ) 檢定 吳佩真副統計分析師 回顧前五期的生統 enews 雲端資料分析暨導引系統 ( R-web, 介紹圖表繪製 平均

第八章 審計抽樣 本章學習重點 stratified random sampling systematic sampling PPS PPS MUS 8-3 壹抽樣與審計抽樣 audit sampling 100%

Microsoft Word - 10-001~020

Microsoft PowerPoint - ch08.ppt

連續機率分配

7. 下列何者敘述錯誤? (A) 抽樣分佈 (sampling distribution) 的抽樣樣本數越大, 其分佈之集中趨勢 (central tendency) 越小 (B) 樣本 (sample) 可以告訴我們關於母群體 (population) 的資訊 (C) 參數 (parameter)

1 500 表 1: 各國平均分數

6-1-1極限的概念

Microsoft PowerPoint - 第11章 統計估計-區間估計.ppt [相容模式]

Microsoft PowerPoint - 第9章 簡單隨機抽樣與抽樣分配.ppt [相容模式]

常用的統計檢定方法 依變項 DV 類別變數 自變項 IV 連續變數 連續變數 Type A: t 檢定 變異數分析 Type B: 相關 迴歸分析 類別變數 Type C: 卡方檢定 Type D: 判別分析 羅吉斯迴歸

When the rejection rule for a test at every level α can be re-written as then xxx is the p-value of the test. xxx < α, If p-value < α, then the test c

Microsoft Word - 94_4_stat_handout_07變異數分析.doc

C19 (1)

.., + +, +, +, +, +, +,! # # % ( % ( / 0!% ( %! %! % # (!) %!%! # (!!# % ) # (!! # )! % +,! ) ) &.. 1. # % 1 ) 2 % 2 1 #% %! ( & # +! %, %. #( # ( 1 (

# % & ) ) & + %,!# & + #. / / & ) 0 / 1! 2

4. 下列何者不適合用來描述 6 年 8 班的血型分佈? (A) 長條圖 (bar chart) (B) 盒鬚圖 (box plot) (C) 圓餅圖 (pie chart) (D) 次數多邊圖 (frequency polygons) 5. 下表為 76 名高血壓住院病人之收縮壓 (SBP) 測量

的目的 的目的在於對統計分析所給定的先驗 假設條件 進行檢定, 以檢驗假設條件的 適當性 此假設條件包含 1. 分配形式的假設 : 例如在假設檢定中的常態分配假設 ; 2. 獨立性的假設 : 例如在兩個母體平均數及變異數假設檢定中的兩母體相互獨立的假設 ;

第四部份

Microsoft Word - 94_4_stat_handout_06假設檢定.doc

:

Microsoft Word - 94_4_stat_handout_10順序資料之假設檢定.doc

Microsoft PowerPoint - spss2-1.ppt

一、選擇題(共35題,佔70%)

Chapter 1 統計學與資料分析簡介

目錄 Wald-Wolfowitz 隨機性檢定 (Run test)... Wilcoxon 符號等級檢定...7 Wilcoxon Rank Sum Test...5 Mann-Whitney 檢定... 符號檢定 (Fisher 檢定法 )...3


第 6. 節 不 定 積 分 的 基 本 公 式 我 們 可 以 把 已 經 知 道 反 導 函 數 之 所 有 函 數 都 視 為 不 定 積 分 的 基 本 公 式 基 本 公 式 涵 蓋 的 範 圍 愈 大, 我 們 求 解 積 分 就 愈 容 易, 但 有 記 憶 不 易 的 情 事 研 讀

Microsoft Word - ACL chapter02-5ed.docx

表二 105 年國中教育會考英語科閱讀與聽力答對題數對應整體能力等級加標示對照表 閱讀答 對題數 聽力答對題數 待加強待加強待加強待加強待加強待加強待加強待加強待加強待加強待加強待加強

戒菸實務個案自助手冊105年Ver.2

Microsoft Word - ACI chapter00-1ed.docx

Microsoft Word - _m30.doc

Chapter 3 Camera Raw Step negative clarity +25 ] P / Step 4 0 ( 下一頁 ) Camera Raw Chapter 3 089

1-4 二 社會工作存在的前提 / 基本假設 Boehm

,.2018, 38,.1 :1, 220 ( ) 140, ;2,,,;3,,,, >180 ( ) >120,,, [10] :,,,,,,,, ( ), [6,11],,,,,, ( ), ( Ⅱ ),,, ( -6),,,,, -,, [2],, [12],, (

μ μ - - β- - μ


男人的大腦 女人的大腦

73 二 課程簡介


%! # # % % & # ( ) ( +, & +, +, & +, & +, +, &!

01.dvi

基本數學核心能力測驗_行為觀察記錄紙_G2版本

第9章 估計


# ( + + # + # 6 +,! + # +! +, + # ( + ) ( + ( + ) + 7! + # + /8 + ) ( +! + #. + ( +, +! + # + # + + ( ! ( + ) ( + ) +, + ( + 9% +! +, + ( +

補充教材 新聞編輯與採訪 Gas Gas 1. topic values 2.enduring values Stempel Stempel Bukalew Buckalew

PowerPoint 簡報

基礎統計

6. 標準常態分配 (SND) 與一般之常態分配 (ND) 何者為真? (A) SND 為對稱, 而 ND 則為偏態 (B) SND 之標準差等於 1, 而 ND 之標準差則大於 0 (C) SND 為間斷資料分布, 而 ND 則為連續資料分布 (D) SND 可以模式化現實世界的現象,, 而 ND

1

: :

CDD全文文件水印保护

CDD全文文件水印保护

CU0594.pdf

Regression Analysis

第3章 資料的描述:數值的測量


11.兩組資料的比較: 針對母體平均數及成功率

t14phip

章節

投影片 1

前言 本章將接續前一章, 利用台灣股市鋼鐵類股指數報酬和大盤報酬為例, 示範估計簡單線性迴歸模型, 並檢定其殘差 檢定的結果發現這個迴歸模型符合迴歸模型所要求之基本假設, 這個模型其實就是在財務計量上常見的的 市場模型 (marke model) 因此本章將接著運用這個模型來說明迴歸係數之性質與相關

中華應用統計學會 015 年第二回資料科學專業能力認證 假設某群體之男 女性人數比例為 :1, 請問男 女性罹患流行性感冒的比例? (A) 男性較女性高 (B) 男性較女性低 (C) 男 女性相當 (D) 本題資訊不足以判斷 6. 下列有關統計圖表之應用, 何者錯誤? (A) 直方圖可用於呈現各種旅

SW cdr

<4D F736F F F696E74202D20B2C43130B3B9C2B2B3E6C048BEF7A9E2BCCBBB50A9E2BCCBA4C0B0742E707074>

840 提示 Excel - Excel -- Excel (=) Excel ch0.xlsx H5 =D5+E5+F5+G5 (=) = - Excel 00

PowerPoint Presentation

55202-er-ch03.doc

实验室诊断专辑

第9章抽樣與抽樣分配

<4D F736F F D20B3E6A4B830312D2D2DBCC6BD75BB50BEE3BCC6AABAA55BB4EEB942BAE22E646F6378>

Ps22Pdf

一、選擇題(共35題,佔70%)

縣 94 學年度 上 學期 區 國民中學 Q 年級 R 領域教學計畫表 設計者:

Random Variables


Microsoft Word - ok翁志文、張佳音...doc

( ) (1) (2) (3) (4) 2

假設檢定問題解決的步驟 Hypothesis Testing Steps 9 2

14052_公開用.pdf

#!! +!,! # &!. / !!, 7!!, & #! % 7! % )

& ( )! +!, # %! ( & &.! / /.

# 7 % % % < % +!,! %!!

五 四 五 說 ( 代 序 ) 李 澤 厚 劉 再 復 I I II IV V VII 第 一 篇 五 四 新 文 化 運 動 批 評 提 綱 附 論 一 中 國 貴 族 精 神 的 命 運 ( 提 綱 )

untitled


Introduction to Statistics

! + +, ) % %.!&!, /! 0! 0 # ( ( # (,, # ( % 1 2 ) (, ( 4! 0 & 2 /, # # ( &

( )... 5 ( ) ( )

2. 下 列 理 解 和 分 析, 不 符 合 原 文 意 思 的 一 项 是 ( ) A. 水 手 在 伦 敦 讲 东 印 度 群 岛 的 所 见 所 闻, 匠 人 在 火 炉 边 讲 自 己 的 人 生 经 历, 他 们 讲 的 故 事 各 有 特 点, 但 同 属 于 传 统 故 事 模 式

Transcription:

Chater 假設檢定 Hyothesis Testig 5 9.~ Elemets of a Statistical Test. 第 8 章我們介紹如何為母體係數 做信賴區 間估計, 研究者抽樣後算出無偏點估計 ɵ, 以點估 計為中心左右再加上估計誤差 b = z α σɵ 就可以得 到信賴區間公式 ɵ ± σ 右圖中橘色線段是 z α ɵ 信賴區間是以樣本資料算出之無偏點無偏點估計 值為中心再加減誤差所得到的線段 每次抽樣都會算出不同 ɵ, 也就會得到不同信賴區間, 故上圖橘色線段位置會隨著各次 抽樣資料而改變 對於某一次抽樣所算出的特定信賴區間, 我們並不知道其中是否包含真正 的母體, 我們只知道對信賴區間公式的信心水準是 α α =.95 的意義是抽樣 次 大約有 95 次橘色信賴區間中都有包含真正的母體 值 第八章我們用國中生身高的例子說明 信賴區間計算方法 研究者隨機抽取 = 位 4 歲學生為樣本, 算出此樣本之平均身高為 σ y = 4 公分, 變異數 s = 36 公分 母體平均數大樣本信賴區間公式為 y ± zα, 代入 σ 9 資料算出信賴區間中心點是 y = 4, 左右延伸的容錯範圍則是 b = zα =.96 = 3.74 由 4 ± 3.74 算出母體平均身高 α.95 = 水準信賴區間是 ( 38 76 45 74).,. 如果我們關心問題是 母體 值到底是多少, 那麼信賴區間提供的答案並不是十分直接 因為我們並不知道母體平均數是否落 ( 38. 76, 45. 74) 區間內 視研究問題需要, 有時我們 需要直接回答 是否是可以假設母體 值等於, 例如教育局長想知道 是否可以假設母體 平均身高 µ = 38 公分, 此種問題就要用假設檢定 hyothesis testig 來分析 下圖畫出以假設 母體值 = ( µ = µ = 38 ) 為中心的分配 如果樣本資料距離此假設值很近, 則接受假設, 若距離很遠則拒絕此假設 以 = µ = 38 為中 心, 左右加上 b = z α σɵ 範圍, 得到綠色 ( b, b) + 區域, 樣本資料如果落綠色區域內, 其值距離假設母體值 = 不遠, 故無法拒絕 = 假設 但是如果樣本資料落在圖中紅色區域內, 表示資料距離 = 的假設母體值很遠, 所以我們應該拒絕 = 假設 假設檢定以 這是雙尾假設檢定的圖形, 紅色的拒絕區域在左右兩邊, 如果算出的樣本值太大或是太小, 都會拒絕 = 假

假設母體值 為中心, 如果樣本資料落在紅色區域, 就拒絕 = 假設, 綠色區 域則接受 還是回到國中生身高例子, 如果想要中間保留 α =.95, 兩邊各砍掉 α =. 5, 則在標準常態 Z 分配上接受區間 (.96,.96), 而若 z >. 96 或 z <. 96 就拒絕 = µ = 38 的假設 我們可以採用和信賴區間同樣的作法, 由 ±.96 對 µ = 38 反標準化來算出拒絕區間的關 鍵值為 y 小於 34.76 以及 y 大於 4.74 然後我們檢查發現樣本平均數 y = 4 落在紅色的 拒絕區間故拒絕 = µ = 38 的假設 但是在做假設檢定時, 我們往往不是在 y 分配上計算拒 絕標準, 而是直接將樣本平均數 y = 4 對假設的 µ = 38 標準化後算出檢定統計量 y µ 4 38 z = = = 4 =. 此檢定統計量落在 Z 分配的拒絕區間, 故結論為樣本資 σ 9. 9 料拒絕 = µ = 38 之假設 請特別注意, 進行假設檢定時, 我們是對假設 值做標準化 以上簡單說明假設檢定的大致概念, 之後會更詳細介紹做檢定的各個步驟 為了避免同學混淆信賴區間與假設檢定兩種分析方法, 我們再將兩種分析方法的圖形並列如下, 請同學比較其差異 假設檢定的基本精神是用反證法來支持理論預測, 其起點是某理論所支持的研究假設 research hyothesis 我們將研究者預期應該會成立結果寫成研究假設, 與研究假設相反的論據則稱為虛無假設 ull hyothesis, 名為 虛無 ull 就是因為這是故意建立起來一個虛構的假想敵 研究者分析樣本資料, 藉著否定虛無假設來支持研究假設, 我們先用下例說明 設 因為要和雙尾信賴區間對照, 所以此處畫雙尾假設檢定的圖 下文會分別介紹右尾 左尾及雙尾假設檢定 只有在計算型二誤差時需要將樣本平均數 y 對 µ 標準化算出拒絕區間的關鍵值, 詳見後文

假設科學家發明治療某種疾病的新藥, 依照理論結果, 科學家的研究假設是新藥品至少 可以治癒 6% 的病患, 也就是治癒率 >.6 與此對立的虛無假設 ull hyothesis 則是 =.6 -- 請注意虛無假設必須寫成等號形式, 以下會說明原因 如果資料不支持虛無假設, 例如隨機抽選的 位病患中治癒率為 =.95, 則研究假設成立之機率極高, 我們就可以得 到以下結論 拒絕虛無假設, 接受研究假設 虛無假設 與 研究假設 兩名詞最能顯示出假設檢定之精神, 但一般更常將 研究 假設 稱為 對立假設 alterative hyothesis 因為 對立假設 名詞使用頻率更高, 故以下 我們也採用, 但是仍請記住對立假設就是研究假設 最普遍的用法是將虛無假設與對立假設 以符號 H 與 H 表示, 我們的教科書則是使用 H 與 H a 符號, 後者的下標用 a 因為英文是 alterative H 符號能更清楚說明 對立 alterative 假設, 但為了配合最廣泛使用的符號, a 所以我們以下會用 H 表示對立假設 故對於藥品治癒率的例子, 我們會寫成虛無假設 H : =.6 與對立假設 H : >.6 再重複假設檢定的基本概念 : 藉著拒絕虛無假設 H 來支持對立假設 H 假設檢定方法是研究者分析樣本資料, 尋求統計證據來支持研究假設 對於藥品治癒率 例子, 假設研究者隨機抽取 5 位患者測試果, 並由樣本資料算出治癒率 =.95, 則我們應 該可以拒絕虛無假設, 並推論對立假設 H : >.6 成立之機率極高 但是如果樣本資料算出 的治癒率 =.7, =.66, =.6, 我們是否仍應該拒絕虛無假設? 以下將用統計理論計算出拒絕 H 的標準何在 假設研究者抽樣 = 人後算出樣本比例 Y = =.73, 以樣 本資料來做假設檢定需進行以下四步驟 :. 寫出虛無假設 H : 上例中 H : =.6. 寫出對立假設 H : 上例中 H : >.6, 此種對立假設數值在虛無假設右方, 稱為右尾 假設檢定 其他兩種可能型態是 : 對立假設數值在虛無假設左方, H : <.6, 是左尾 假設檢定 ; 以及 H :.6 之雙尾假設檢定 我們晚點會講到左尾及雙尾檢定, 現在先 分析 H : >.6 的右尾假設檢定 3. 計算檢定統計量 : 本例中研究主題是母體比例 ( 真實的母體治癒率 ), 故以樣本比例 Y = 做為估計式 如前述, 假設檢定方法是將樣本資料 ɵ = 對虛無假設 = =. 6 資料 - 平均數做標準化來算出檢定統計量, 一般標準化公式是, 現在則是在虛無標準差資料 - H 為真時的平均數假設 H 為真的情況下做標準化, 故公式為 : H 為真時的標準差 3

將資料代入算出此式分子是 =. 73. 6 =. 3 上一章公式告訴我們樣本比例 q 的標準誤是 σɵ = σ =, 請注意當 H 為真時應該用 =.6 的值代入 σ 公式算 q.6.4 出 σ = = =.49 故由樣本資料算出之檢定統計量是 z = = q. 3 =. 653. 49 3 4. 決定拒絕區間 rejectio regio( 簡稱 RR):RR 區間是拒絕 H 的範圍 假設檢定 方法適用於多種不同的母體係數, 故右圖直接以通用符號 及 ɵ 表示母體係數及其估計式 假設檢定的判定基準如下 : 如果 檢定統計量落在 RR 內就拒絕 H, 接受 H 圖. 是 右尾假設檢定, 對立假設為 H : >.6, 樣本資料及檢定統 計量數值越大越支持 H, 越可以拒絕 H, 故拒絕區間在右 假設我們令 α =. 5, 則 Z 分配之機率關鍵值是 z 5 =. 645, 由樣本資料算出之檢定統計量如果大於.645 就落在圖形上紅 色的拒絕區間, 我們就可以拒絕虛無假設 H : =.6 並且支持對立假設 H : >.6 本例資料算出之檢定統計量 z =. 653落在拒絕區間, 故研究結論是拒絕 H 支持 H, 新藥品的治癒率的確高於六成 請注意, 如果虛無假設 H : = 為真, 則無偏估計式 f ɵ 分 配的中心點就是 故上圖. 畫出的正是 H : = 為真時 f ɵ 的分配, 虛無假設必須 寫成等式, 否則我們無法畫出期望值為 的. f ɵ 分配 對於藥品療效的例子, 下圖.3 中以藍色小圈表示由樣本資料算出 的位置 3 請注意信賴區所畫出的是以 值為中心的分配, 故求信賴區間時標準誤是 σ ɵ = q 4

圖.3a 中樣本 很大 ( 例如說 =.88) 落在 RR 內, 故研究結論是拒絕虛無假設 另 一方面, 如果由樣本 值如圖.3b( 例如說 =.63) 落在 RR 之外, 結論則是不拒絕 H 有些課本強調不拒絕 H 不表示接受 H, 只是現在還沒有足夠的證據可以拒絕 H, 但也有人 直接寫成如果 不在 RR 範圍內, 我們就接受 H 對於以上藥品治癒率的例子, 可以寫成拒 絕區間是 RR = { z >. 645}, 而接受區間 (accetace regio, 簡稱 AR) 則是 AR { z. 645} 在正式導出 RR 計算公式前, 我們先定義假設檢定可能犯的錯誤 定義. 型一誤差 Tye I error α 是 H 正確但被拒絕的機率, 型二誤差 Tye II error β 是 H 錯誤但被接受的機率 = 仍然以藥品治癒率為例說明型一誤差 α 之意義, 當 H : =.6 為真時, 研究者還是有可 能抽到一個特殊的樣本而算出此樣本之治癒率為 =.9 這個檢定統計量的值落在 RR 區, 故我們錯誤的拒絕了 H 犯下此中錯誤的機率有多大呢? 凡是落入 RR 區的檢定統計量都會 被拒絕, 所以在虛無假設為真情況下, 研究者錯誤拒絕 H 的機率就是 RR 區的機率 α, 故型 一誤差 α 是錯誤拒絕 H 的機率 α 也稱為檢定的顯著水準 sigificace level 如果把虛無假設 H 想成是我們正在審理的罪犯, 則型一誤差 α 是 誤殺無辜 的機率, 因為 H 明明正確但卻被我們拒絕 而型二誤差 β 則是 H 其實錯誤但卻被我們接受的機率, 故 β 可想成是 誤放有罪 的機率 課本例.~. 用二項分配的例子解釋型一誤差與型二 誤差, 我們省略此部分而是在常態分配架構下說明這兩種誤差 型一誤差 α 可以用上面圖形 解釋, 解釋型二誤差 β 圖形較複雜, 我們晚點再講 虛無假設必定是等式 H : =, 而對立假設則有三種可能. H : >, H 在 H 右方 拒絕區間也在右, 稱為右尾檢定. H : <, H 在 H 左方拒絕區間也在左, 稱為左尾檢定 以及 3. H : 拒絕區間在最左及最右兩側, 稱為雙尾檢定 以下先對大樣本假設檢定逐一 說明.3 Commo Large-Samle Tests. 我們先重複表 8., 再次列出四個常用的大樣本無偏點估計式及其標準誤 : 目標母體係數 樣本數無偏點估計式 ɵ 標準誤 stadard errorσ ɵ. 母體平均數 µ 樣本平均數 Y. 母體比例 樣本比例 Y = σ q 5

3. 兩個母體平均數差異 µ µ 4. 兩個母體比例差異,, Y Y σ σ + q + q 對於上表所列四種母體係數, 都可以用以下四步驟來進行假設檢定 :. 虛無假設 H : = 先假設母體係數值 =, 虛無假設 H 是我們希望推翻論據. 對立假設 H : > 我們想建立的研究假設是 >, 這是理論或資料支持的內容 3. 檢定統計量 : ɵ 對於表 8. 四種母體係數, 我們將無偏點估計式 ɵ 對虛無假設 標準 ɵ 化算出檢定統計量 zɵ = σ ɵ 4. 拒絕區間 : RR ɵ 是無偏估計式, 故當 H : = 為真時 Eɵ =, 也就是 f ɵ 分配的中心點在, 如圖.4 所示 檢定規則是若樣本資料落入紅色的 RR 區, 就拒絕虛無假設 故假設檢定的重點是找出拒絕區間 RR 的關鍵值 檢定之顯著水準為 α, 故在標準常態分配拒絕區間範圍 是 RR = { z > z α } 也可將 z α 對 反標準化, 算出拒絕區間在 ɵ 分配之關鍵值 k = + z α σɵ 故拒絕區間在 ɵ 分配之範圍是 RR = ɵ > + z α σɵ { } 研究者抽樣後算出之檢定統計量如果落在 RR 上, 就會拒絕 H : = 型一誤差 α 是 H 為真卻拒絕 H 的機率, 一般常用 α =. 或.5 或. 作為顯著水準, 而拒絕區間 RR 在 ɵ 分配關鍵值 k 之大小是由型一誤差 α 及 z α 決定 我們在檢定時會將樣本 ɵ 值, 對虛無假設 標準化後算出檢定統計量值, 並觀察其是否落入拒絕區間來得到研究結論 以下試做假設檢 定例題 例.5 497 某公司甲地區經理宣稱 claims 銷售人員每週成交訂單數量平均值超過 5 張, 抽樣 = 36 位銷售人員後算出 y = 7, s = 9 請以 α =.5水準檢定 與估計信賴區間比較, 假設檢定略微複雜一些, 同學可能略有混淆 故請注意就以上題目 敘述內容, 我們首先必須區分出兩類資料 : 一. 樣本資料為 抽樣 = 36 位銷售人員, 算出 y = 7, s = 9, 二. 檢定資料為 : 經理宣稱訂單平均值超過 5 張 檢定資料告訴我們虛無 假設應寫成 H = 5, 並且因為經理宣稱平均值超過 5, 故對立假設為 H > 5 估計 信賴區間時我們只需要樣本資料, 故情況比較單純 而進行假設檢定時同學還必須多做一道 6

手續, 需要依照題目敘述寫出一組成對的虛無假設與對立假設 進行假設檢定時首先必須依照題目敘述寫出成對的虛無假設與對立假設. 虛無假設 : H = 5. 對立假設 : H > 5 y µ 3. 檢定統計量 : 樣本資料 y = 7 對虛無假設 µ = 5標準化後算出檢定統計量 z = = σ y µ = 7 5 = = 4 σ 3 36.5 4. 拒絕區間 : 顯著水準 α =.5右尾假設, 查表得知 z = z = α.5.645, 拒絕區間 RR = { z > z.5 =.645} 樣本資料算出之檢定統計量 z = 4落在 RR 內, 故研究結論為拒絕 H, 接受 H 由本題也可深思假設檢定之意義, 由 = 36 樣本算出之 y = 7, 的確是大於 5 進行檢 並並接受 H 後我們的結論是 y = 7 顯著的大於 (sigificatly larger tha) 5 再對一組不同的樣 本資料進行假設可以更清楚的顯示假設檢定的意義 試想同一公司乙地區經理的樣本資料是 樣本數 = 36, y = 7, s y µ 7 5 = 8 標準化後算出之檢定統計量為 z = = = = σ 9 36.5.33 落在接受區間, 故乙地區我們無法拒絕 H, 也就是乙地區之 y = 7 並沒有顯著的大於 5 假設檢定方法在分析樣本資料後只能做出以下兩種結論中的一種 : 拒絕 H 或是接受 H 例如上題拒絕區間是 RR { z z.5.645} = > =, 算出標準化檢定統量 z = 4落在拒絕區間, 故結 論是拒絕 H 接受 H 但是 拒絕 H 的結論其實並未充分利用抽樣所得到的資料, 另外還 有一種方法可以更細緻的呈現樣本資料意義, 就是計算樣本資料的 值 ( -value, 見課本 53, 55), 我們仍沿用上例架構說明 值之意義及計算方法 試想該公司總經理對甲 乙兩地區各抽樣 36 人, 兩地樣本資料算出之變異數都是 s = 9, 而樣本平均數甲區是 6, 乙區 6.5 如果在兩地區同樣做假設檢定, 用 α =.5水準檢定虛 無假設 H = 5 ; 算出的標準化檢定統計量分別是甲區, 乙區 3 兩者都落在拒絕區間 RR = { z > z.5 =.645} 內, 所以兩地區經理都可以宣稱說 H > 5 為真, 也就是該地區每週 平均成交數量大於 5 但是如下圖顯示, 乙區 y 值較大, 離 H = 5 更遠, 應該拒絕的更強一些, 而假設檢定 並不能顯示出此種差別 值是 H 為真時觀察到如此極端樣本的機率, 正可以顯示出 兩地區的差異 y 7

甲地區 y =6, 標準化後算出檢定統計量 z =, 故甲地區 值 P( z ) = =.8 這表示當 虛無假設為真時, 觀察到至少像甲地區這樣極端樣本值之機率是.8, 也就是圖 5.a 藍色 區域面積 而乙地區 y =6.5, 標準化後算出檢底定統計量 z = 3, 故乙地區 值 = P z 3 =.35 圖.5b 的藍色區域比 5.a 面積更小, 表示虛無假設為真時, 觀察到 乙地區樣本值的機率更小 故 值越小, 表示樣本離虛無假設越遠 如果 值大於顯著水準 α, 表示此樣本值離虛無假設近 到我們應該接受 H 試想總經理在丙地區同樣抽樣 36 人, 算出變異數為 9, 但平均數是 5.4 標準化算出 y µ 5.4 5 z = = =.8落在接受區間, 故丙地區無法拒 σ 3 36 絕虛無假設 H = 5 也可算出丙地區之 值 = P z.8 =.9 當虛無假設為真時, 觀察到至少像丙 地區樣本的機率高達.9 此機率頗高, 當 值 > α 就應該接受 H 型一誤差 α 是進行檢定前就先決定的顯著水準 sigificace level, 而 值是 樣本資料實際達到顯著水準 attaied sigificace level 53 定義.: 值是在 此樣本資料下可以拒絕 H 的最小顯著水準 這是從另一個角度來說明 值之意義, 圖.6 可以幫助瞭解 對於 y = 5.4 的丙地區, 我們必須至少要把顯著水準定為 α =.9 才可以拒 絕 H 下面我們再對母體比例進行假設檢定 例.6 498 某機器製造之商品中若瑕疵品比例超過., 此部機器就必須送廠維修 抽樣 = 件商品後發現有 y = 5 件瑕疵品 請以 α =.水準檢定此部機器是否應送修 此題我們檢定的係數 是母體比例, 無偏估計公式為樣本比例 y = 以本題為例, 我 們可以再度深入說明如何寫出成對的虛無假設與對立假設 例.5 中經理宣稱訂單平均值超 8

過 5, 我們依此敘述寫出虛無假設 H = 5 與對立假設 : H > 5 本題送廠維修關鍵 值是瑕疵品比例超過., 依此關鍵值可以寫出虛無假設為 H : =., 若比例超過. 就必 須送修故對立假設寫成 H : >. 如果同學看到文字敘述不太確定 對立假設 應該怎樣 寫, 可以採用以下判斷標準 : 資料值在 H 右方就進行右尾檢定 ; 資料值在 H 左方就進行左 尾檢定, 也就是依照資料的方向寫對立假設 依本題題意寫出 :. 虛無假設 : H : =.. 對立假設 : H : >. 3. 檢定統計量 : y 5 = = =.5, 對虛無假設標準化後算出 z = = = σ.5...9.5 = =.667.3 4. 拒絕區間 : α =.查表得知 z z..33 = =, α 故拒絕區間是 RR { z z..33} = > = 樣本 資料算出之檢定統計量 z =.667 並不在拒絕區間內, 故結論為不拒絕 H, 故機器目前還不 需要送修, 也可以說 =.5 並沒有顯著的大於. 對照以上二個例題 :.5 檢定關於母體平均數的假設 H = 5, 樣本資料 = 36, σ s y = 7 與 s = 9 中已經包含變異數數值, 我們再利用樣本資料來計算標準誤 σ = Y 而.6 檢定關於母體比例的假設 H : =., 題目提供的樣本資料是 =, y = 5, 5 = =.5, 其中並未直接寫出變異數數值, 而是要在虛無假設為真的情境下計算標 準誤 σ, 公式為 σ ( ) = 請注意假設檢定是用虛無假設的 計算標準誤, 而非樣本資料 對照第八章估計信賴區間時, 我們畫出以樣本資料 =.5 為中心點 的分配, 所以求信賴區間時, 標準誤公式是 σ =, 請同學務必注意此二者的差 異 以上虛無假設與對立假設分別是 H : = 與 H : > 此情況下樣本檢定量越大越支 持 H, 也就越容易拒絕 H, 拒絕區間在右, 稱為右尾檢定 uer-tail test 下面則是另一種情況, 研究者主張對立假設是 H : <, 故樣本檢定量越小越支持 H, 也越容易拒絕 H, 故 拒絕區間在左如圖.7, 稱為左尾檢定 lower-tail test 這兩種 都是單尾檢定 oe-tailed test 9

以下做左尾假設檢定例題 : 某公司經理相信受訓之後工人組裝一件商品耗費時間降到 分鐘以下 他抽樣 = 8 位工人後算出 y = 8, s = 5 請以 α =.5水準檢定 首先根據題 目敘述之假設資料 經理相信受訓後工人組裝時間降到 分鐘以下 寫出虛無假設與對立假 設. 虛無假設 : H =. 對立假設 : H < 3. 檢定統計量 : 樣本資料 y = 8 對虛無假設 µ = 標準化後 y µ y µ z = = = 8 = =. σ σ 5 8.6667 算出 y 4. 拒絕區間 : α =.5查表得知 z = z.5 =.645, 故拒絕 區間是 RR = { z < z.5 =.645} 樣本資料算出之檢定統計 量 z =. 落在接受區間, 故無法拒絕 H 也就是 y = 8 並沒有顯著的小於 α 圖.7a 畫出此題之檢定統計量落在接受區間, 左尾 值 P( z.) = =.5 比 假設檢定的最後一種類型是雙尾檢定, 對立假設 H :, 當研究者對母體係數值 大或小並無先驗看法時進行此種檢定 雙尾檢定的基本形式是 H : =, H :, 下例是對大樣本母體平均數差異做雙尾假設樣本資料比 : 例.7 5 心理學家想檢定男性與女性的反應時間是否不同, 抽樣資料如下 : 男性樣本 = 5, y = 3. 6,s =. 8, 女性樣本 = 5,y = 3. 76,s =. 4 以 α =. 水準做假設檢定 答 : 此題我們檢定的係數 是母體平均數的差異 = µ µ, 無偏估計式是 ɵ = y y, 標準 σ σ 誤則是 σ ɵ = + 首先要寫出虛無假設與對立假設, 題目敘述是 反應時間是否不同 故虛無假設是 H µ = 反應時間相同 如果心理學家認為 男性反應較快, 則 µ < µ, 對立假設應為 H µ < 而如果心理學家認為 女性反應較快, 則 µ > µ, 對立假設 應為 H µ µ : > 但是題目敘述想測試反應時間是否不同, 故進行雙尾檢定, 對立假設是 H µ 本題檢定步驟如下:. 虛無假設 : H µ =. 對立假設 : H µ 3. 檢定統計量 : 樣本估計值為 y y = 3.6 3.76 =.6, 對虛無假設標準化後算出檢定統

y y.6 計量為 z = = = σ.8.4 σ + + 5 5 4. 拒絕區間 : 檢定的顯著水準 α =., 查表得知 α = z.5 =.645, 故拒絕區間是 RR { z z.5.645} z = > = 樣本資料算出之測試統計量 z = 在拒絕區間內, 故結論 為拒絕 H, 也就是男性 女性反應時間並不相同 雙尾檢定的拒絕區間落在左右兩邊, 所以計算 值時也要包含左右兩部分 如圖.8 所示, 拒絕區間是紅色部分 RR = { z > z.5 =.645}, 值則是兩塊藍色區域面積, 值 P ( z ) P ( z ) = = =.455 雖然實際的檢定統計量 z = 只落在最左側, 但是為 了與拒絕區間作對應, 所以 值是 P ( z ) 的兩倍 我們最後再檢定兩個母體比例是否有差異 教育當局想測試 A B 兩區學童數學程度是 否有相同, 資料如下 A 區 5 學童受測及格比率.4,B 區 學童受測, 及格比率.37 請以 α =.水準檢定兩區學童通過數學測試之比例是否有差異?. 虛無假設 : H : =. 對立假設 : H :, 因為題目是問 是否有差異, 故進行雙尾檢定 3. 檢定統計量 : 比例差異之樣本估計式 ɵ = 請注意若 H 為真則 = =, 故必 須用類似 8.8 48 方法, 先計算合併比例 (ooled roortio), 然後再用合併比例來 ˆ + ˆ Y + Y + 74 74 估計標準誤 先求出 ˆ = = = = =.387, 然後才能算出 + + 5 + 45 標準誤 ɵ ˆ ˆ σ = q ( + ).387.63.8 = + = 再將資料標準化, 5 ɵ ( ˆ ˆ ).3 算出檢定統計量 z = = = = 3.775 σɵ ˆ ˆ q.8 + 4. 拒絕區間 : 雙尾 α =.查表得知.5.58 z =, 拒絕區間 RR { z z.5.58} 落在 RR 故結論是兩地區學童通過數學檢定比例有顯著差異 = > = 樣本 z

我們再將三種假設檢定整理如下表 : 檢定類型右尾假設檢定左尾假設檢定雙尾假設檢定 圖形 對立假設 H : > : < : H Z 拒絕區間 RR = { z > z α } RR { z z α } ɵ 拒絕區間 ɵ 關鍵值 RR = ɵ { > k} k z α ɵ H = < RR = { z > z α } RR = ɵ { < k} RR = ɵ { > k} = + σ k = z α σɵ k = ± z α σɵ 請注意是單尾檢定的拒絕區間畫在對立假設的方向 以上都是將 ɵ 對 標準化求出檢定 統計量, 觀察其數值是否落入 Z 分配上的拒絕區間來決定檢定結果 此檢定過程中並不需要 計算以 為中心之 ɵ 分配拒絕區間關鍵 k 值 但是再下面計算型二誤差及檢定力時會用到 k 數值, 故同學必須認真瞭解 作業 :.7,.8,.,.4,.7 學期末時間有限, 以下講解第十章部分內容, 順序 也和課本不同 但會標出頁數方便同學對照 型二誤差 β, 57~59 例.5 以 α =.5水準檢定虛無假設 H = 5 與對立假設 H > 5 抽樣 = 36 y = 7, s = 9 查表得知 z z.5.645 = =, α 拒絕區間 RR { z z.5.645} 後算出 = > = 型一誤差 α 是 錯誤拒絕 H 的機率, 拒絕區間的關鍵值在標準常態 Z 分配是 zα = z 5 =. 645 先看圖.9 上半, 這是 H = 5 為真時估計式 f ( Y ) 的 分配, 算出 RR 關鍵值是 k = + z α σɵ = 5 +.645.5 = 5.85 故抽樣後凡是算出之樣本 y > 5. 85, 我們都會 拒絕 H 圖.9 上半 y > 5. 85 紅色線段是拒絕區間, 而 y 5. 85 則是綠色線段的接受區間 除了型一誤差之外,α 假設檢定還有另一種可能錯誤, 型二誤差 β 是 H 為真, 我們卻錯誤接受 H 機率 假設上例 中真正的母體係數值是 H = 6, 所以我們其實應該拒絕 H 但是假設檢定求出關鍵值 k = 5.85, 故只要抽樣後算出的 y 5. 85, 我們都會錯誤.

的接受 H, 也就犯了型二誤差 圖.9 下方畫出 H = 6 為真時 f ( Y ) 的分配, 綠色線段是 接受 H 區間, 型二誤差是 H 為真我們卻接受 H 的機率, 故型二誤差 β 也就是圖.9 下半分配綠色區域的面積 請注意檢定的對立假設是 H > 5, 但是計算型二誤 差時, 我們必須畫出 H 為真時 f Y 的分配, 所以必須有一個確定的 H = 6 數值 為計算型二誤差 β 值, 我們必須把關鍵值 k = 5.85 對 H 分配標準化 圖.9 下半 是 H = 6 為真時樣本統計量的分配 把型一誤差的關鍵值 k 對 H = 6 做標準化, 算出 k 在 H 分配標準化關鍵值為 z k µ β = = σ 5.85 6 3 36 =.775.5 =.355 型二誤差是 H 為真我們卻接受 H 的機率, 也就是圖.9 下半綠色區域面積, 故型二誤差是 β = P( Z <.355) = P Z >.355 =.3594 計算型二誤差的一般步驟如下 :. 由 α 及 z α 算出 ɵ 分配拒絕區間上型一誤差關鍵值 k k. 用此關鍵值 k 對 H : = 標準化算出 zβ =, 再查表即可得到 β 值 σ 請注意左尾和右尾檢定各自有不同的關鍵值, 並且我們需要一個對立假設 H : = 的數 值才能計算型二誤差 上例中如果我們將對立假設的值改成 H = 7 就會算出不同的型二 誤差 β 值 計算型二誤差時強烈建議畫出 與 的相對位置, 可以幫助瞭解並確保不會 算錯 假設檢定的檢定力 ower 是正確拒絕 H 的機率, 也就是當對立假設 H 為真, 並且我們正確拒絕 H 的機率 ( 見課本 54) 圖. 是圖.9 的下半部, 檢定力是 H 為真且拒絕 H 的機率, 也就是圖中的藍色區域 綠色區域 面積是 β, 故檢定力 = β 正式定義 : 對於虛無假設 H : = 與對立假設 H : =, 型二誤差是 β = P( 接受 H = ) 定力是 ower = P ( 拒絕 H = 為真 ) = β ( ) 例中我們是用 H = 6 來計算 β ( µ = 6) 和檢定力 ower ( µ = 6) 如果改用不同的 µ 值, 型二誤差和檢定力的數 3 為真, 檢 上

值都會改變 同學可以練習用 : 5.8 H µ = 來計算 β ( µ = ) 和檢定力 5.8 ower µ = 5.8 對 於虛無假設 H : =, 如果對立假設 H : = 中的 距離 越近, 檢定力就越小, 兩者關係如圖. 我們最後說明假設檢定與信賴區間之關係 ( 課本 5) 第 8 章介紹母體係數的大樣本信賴區間公式是 ɵ ± σ 例題 8.7 對於 = 64 樣本, 算出 y = 33, s = 56, 要求估計 z α ɵ ( α ) =.9 信賴區間 將 ɵ σ = y 代入公式, 此題之信賴區間是 y ± zα 不知道母體 σ, s 但樣本數夠大故可用樣本 s 代替, 故信賴區間是 y ± zα = 33 ±.645 = 33 ± 3.9, 也 就是 ( 9.7, 36.9 ) 以上過程是在樣本 ɵ 的左右加減 z α 個標準誤 σ ɵ 來建立信賴區間 但是 此過程中的信賴水準是區間估計公式正確包含母體 的機率, 而對於任何一次抽樣後算出的 信賴區間數值範圍, 其實我們並不知道母體 是否被包含在此區間內 假設檢定則提出更直接的問題, 樣本資料是否可以允許我們拒絕 H : =? 如果我們進行雙尾假設檢定, 對立假設 H :, 拒絕區間在 Z 分配是 RR = { z < zα 或是 z > zα }, 在 f ɵ ( ) 則是 RR = ɵ ɵ { < z σ α ɵ或是 > + z σ α ɵ } 拒絕區間的補集可以稱為接受區間 accetace regio AR = { zα z zα }, 將 z = 代入此式內得到接受區間的範圍是 σɵ AR = zα zα σɵ 將括號內不等式整理為 ɵ σ z σ ɵ α ɵ + z σ α ɵ, 就可看出 ɵ 凡是介於 ɵ z σ ɵ ɵ, + z σ ɵ 範圍內的 H 都會被接受, 而 ɵ z σ ɵ ɵ, + z σ ɵ 正是信賴區 ( α α ) 4 ( α α ) 間的範圍, 故所有位於信賴區間範圍內的虛無假設 H 都會被接受, 所以假設檢定與 信賴區間兩種研究方法之間其實有很密切的關係 以上問題的信賴區間是 假設 H = 8 以下驗證 : 9.7, 36.9, 故我們會接受虛無假設 H = 3, 會拒絕虛無 = 64, y = 33, s = 56, 以 α =. 顯著水準進行雙尾假設檢定 : ( 一 ) 虛無假設 H = 3 ( 二 ) 對立假設 H 3 y µ y µ 33 3 ( 三 ) 檢定統計量 : z = = = σ σ 6 64 ( 四 ) 拒絕區間 : z z.5.645 y 3 = =.5 α = =, RR = { z <.645 z >.645} 或是

結論 : 接受 H = 64, y = 33, s = 56, 以 α =. 顯著水準進行雙尾假設檢定 : ( 一 ) 虛無假設 H = 8 ( 二 ) 對立假設 H 8 y µ y µ 33 8 5 ( 三 ) 檢定統計量 : z = = = = =.5 σ σ 6 64 ( 四 ) 拒絕區間 : z z.5.645 結論 : 拒絕 H y α = =, RR = { z <.645 或是 z >.645} 作業 :.8,.,.4,.7,.43,.45,.5 以下是補充教材, 看有沒有時間教?? ( 一 ) 小樣本假設檢定, 小樣本假設檢定的差別是改用 t 分配, 如果檢定兩個母體平均數的差異, 假設 ( 一 ) 兩母體變異數相同, 或是 ( 二 ) 兩母體變異數不同, 估計式 ɵ = Y Y 的標準誤與 t 分配自由度不同 先整理小樣本平均數及其差異之無偏點估計式和標準誤 : 母體係數 點估計 ɵ 標準誤 σ ɵ 說明 µ Y µ µ 變異數相同 µ µ 變異數不同獨立樣本 Y Y Y Y s s + s s + S = 自由度 df = ( Y i Y ) + i ( Yi Y ) i= = + 自由度 df = + s + s 自由度 df = ( s ) ( s ) + 之整數部分 ( 一 ) 小樣本母體平均數檢定 : 我們首先重做例.5, 某公司甲地區經理宣稱銷售人員每週 成交訂單數量平均值超過 5 張, 抽樣 = 位銷售人員後算出 y = 7, s = 9, 請以 α =.5水 準進行小樣本假設檢定 5

寫出成對的虛無假設與對立假設. 虛無假設 : H = 5. 對立假設 : H > 5 y µ 3. 檢定統計量 : 樣本資料 y = 7 對虛無假設 µ = 5標準化後算出檢定統計量 t = = s 7 5 = =.3 3.866 4. 拒絕區間 : 右尾檢定顯著水準 α =.5, 自由度 df = =, 查表得知 t.5 =.796, 拒絕區間 RR { t.796} = > 樣本資料算出之檢定統計量落在 RR 內, 對於此小樣本檢定 研究結論同樣是拒絕 H, 接受 H ( 二 ) 小樣本兩母體平均數差異假設檢定, 假設兩母體變異數相同 方法和大樣本檢定完全 相同, 只是改用自由度 df = + 的 t 分配 ( 二 ) 小樣本兩母體平均數差異假設檢定, 假設兩母體變異數不同 : 信用卡公司有兩類顧客 : 自行申請與電話行銷, 以下是這兩類顧客每月消費金額之相關資料 以 5% 顯著水準檢定是否 自行申請客戶每月消費金額較高? 顧客類別平均月消費金額標準差樣本人數 電話行銷 y =,568 s =356 = 自行申請 y =,967 s =857 = 8 ( 一 ) 虛無假設 H : = µ µ = ( 二 ) 對立假設 H : = µ µ < ( 三 ) 檢定統計量 : 點估計 ɵ s s 356 857 = y y = 399, 標準誤 σ ɵ = + = + = 33.3 8 ɵ 399 t = = =.344 σ 33.3 ɵ s + s ( 四 ) 拒絕區間 : 代入公式 ( s ) ( s ) + t t.5 α = =.86, RR { t.86} =8.934, 故自由度 =8 查表得知 t 分配關鍵值 = < 檢定統計量落在接受區間, 故結論是接受 H, 在.5 顯著水準上, 兩類型客戶平均消費並無顯著差異 ( 二 ) 相關樣本 deedet samles 假設檢定 : 我們仍然是由兩個樣本資料 Y 與 Y 來 判斷兩母體係數 µ 與 µ 是否有顯著差異, 但現在這兩個樣本資料是由成對母體中抽出, 也 就是同一筆資料測量兩次 ( 例如同一位學生的期中考 期末考成績是否有差異, 同一棟房屋 6

由信義或永慶鑑價是否有差異 ), 故可由原來的 Y 與 Y 整理出新的隨機變數 d = Y Y ;d 就 是同一位學生期中考與期末考分數之差異, 或是同一棟房屋信義與永慶鑑價之差異 整理出 此變數後, 我們要檢定的假設就可將虛無假設由 H = µ 改寫為 H : µ d =, 這樣做才符 合抽樣之實驗設計, 並且可使問題簡化 依據虛無假設 µ 與 µ 無差異, 故隨機變數 d 的平 均值是, 變異數 d d s d = 如基本公式, 所以 d 的分配是 d ~ t(, s ) d, 而隨機變數 d 的 分配是 s d t d d ~, 故檢定統計量是 t =, 自由度 df = 請注意隨機變數 d( 差異 ) sd 的標準差是 s d s d ( d d ) =, 而隨機變數 d ( 差異平均數 ) 的標準誤 stadard error 則是 例題 : 以下是 位同學某年賽局期中考與期末考成績, 以 5% 顯著水準, 請問兩次考試成績 是否有顯著差異? 編號 3 4 5 6 7 8 9 期中 6 8 76 63 76 5 7 73 75 66 期末 75 83 73 48 9 9 8 97 6 84 d= 期末 - 期中 5 3-3 -5 4-3 4-3 8 ( 一 ) 虛無假設 H : = d = ( 二 ) 對立假設 H : = d ( 三 ) 檢定統計量 : 先算出 d 的平均值 d =.3, 變異數 d d s d = =36.456, 標準差 d s s 7.789 =7.789 故 d 的標準誤是 d d.3 = =5.65 代入公式得到 t = = =. 489 sd 5.65 ( 四 ) 拒絕區間 : 雙尾檢定自由度 df = = 9 的 t 分配, α =.5 之關鍵值 ±.6, 故拒 RR = t >.6 檢定統計量落在接受區間, 故結論是以.5 顯著水準, 期中與期 絕區間是 { } 末考成績沒有顯著差異 由樣本 t=.489 查表得知 - 值 =.346=.69 也就是當 H 為 真時, 有.69 機率觀察到這樣或是更極端的樣本 ( 三 ) 比較獨立樣本與相關樣本假設檢定 : 相關樣本的變異程度其實比較小, 如果誤 用獨立樣本假設檢定公式, 可能得到錯誤結果 以下例說明 棟房子由兩家房地產公司鑑 價結果如下 : 以 5% 顯著水準, 請問兩公司之鑑價是否有顯著差異? 7

編號 3 4 5 6 7 8 9 S 公司 35 3 4 5 3 3 5 49 B 公司 8 5 9 4 98 3 7 5 45 d=s 公司 -B 公司 7 5 7 7 4-5 3 4 首先我們做正確的相關樣本檢定 ( 一 ) 虛無假設 H : d = ( 二 ) 對立假設 H : d ( d d ) ( 三 ) 檢定統計量 : 先算出 d 的平均值 d =4.6, 變異數 s d = =9.378, 標準差 sd =4.4 故 d 的標準誤是 sd 4.4 d = =.39 代入公式算出檢定統計量 t = = sd 4.6 3.345.39 = ( 四 ) 拒絕區間 : 雙尾檢定自由度 df = = 9 的 t 分配, α =.5 之關鍵值 ±.6, 故拒 RR = t >.6 檢定統計量落在拒絕區間, 故結論是以.5 顯著水準, 兩家公司 絕區間是 { } 的鑑價有顯著差異 由樣本 t=3.345 查表得知 值 =.9, 也就是當 H 為真時, 只有.9 機率觀察到此樣本以及更極端樣本值 但是如果我們沒有體認到這是一個相關樣本問題而用獨立樣本公式做檢定, 結果如下 : ( 一 ) 虛無假設 H µ = ( 二 ) 對立假設 H µ s s b b ( 三 ) 檢定統計量 :S 公司資料算出 y =6.8, s =4.455,B 公司資料算出 y =., s =4.89, 故混合變異數 - s + - s 9 4.455 + 9 4.89 s = = = 6. 5 + - + - y - y 6.8. 4.6 再將此值代入公式得到 t = = = =.75 6.467 s 6.5 + + ( 四 ) 拒絕區間 : 雙尾檢定由 α =.5 找出自由度 df = + =+-=8 之 t 分配的 RR = t >. 檢定統計量落在接受區間, 故結論是以.5 關鍵值是 ±., 故拒絕區間是 { } 顯著水準, 兩家公司的鑑價沒有顯著差異 請注意兩種檢定得到不同結果, 這是因為獨立樣本檢定的標準誤較大 請看相關樣本檢 8

d 4. 6 y - y 定統計量是 t = = = 3. 345, 而獨立樣本檢定統計量則是 : t = s d. 39 s + 6.8. 4.6 = = =.75 此二式分子相同, 只是獨立樣本檢定統計量的分母 6.467 6.5 + 較大 這是因為當資料沒有配對時, 有兩種變異存在 :(). S 公司與 B 公司鑑價不同, 以及 (). 各棟房屋之價值不同, 例如第 4 與第 棟房屋價值較高, 第 5 棟價值較低 ; 獨立樣本檢定統計量公式包含這兩種變異 可是對於配對資料, 我們不再關心第二種差異, 現在只問 S 公司與 B 公司鑑價是否有差異 定義 d = S 公司鑑價 -B 公司鑑價, 請注意 d 資料中並不包含第二種變異, 也就是在分析 d 資料時, 我們只關心第一種變異, 其變異程度較小故標準差由 6.467 降為.39, 但是降低變異程度也需付出代價, 成對母體 t 檢定的自由度只有 9, 而獨立母體 t 檢定的自由度是 8 雖然自由度降低, 但是如果問題的本質是相關樣本, 就應該用成對樣本檢定統計量公式以便得到較準確的檢定結果 四小樣本 用二項式做檢定 *5 年 月, 如果有時間教會發單張講義, 否則就不考 ( 台大統計 E) 年前新北市中和地區成年人抽菸的比例是.3, 欲了解目前中和地區成年 人抽菸比例是否高於 年前之水準, 今由該地區成年人中隨機抽出 8 人而成 個樣本, 令 x 代表樣本中抽菸人數, 現有 A B,C 三人被問及根據上述樣本資料是否認為現在中和地區成 年人抽菸之比例較 年前還高 H : 目前中和地區成年人抽菸比例並未提高, 即 =.3 H : 目前中和地區成年人抽菸比例有提高, 即 >.3 令 A B C 三人之決策方式分別為 : A: 永遠接受 H, B: 當 x 3 時, 則接受 H, C: 永遠拒絕 H 問 :() A B C 三人犯 Tye I error 之機率各為何? () 若 H 為假, 而真正之母體比例 =.6, 求 A B C 三人犯 Tye II error 之機率各 為何? 9