Microsoft PowerPoint - 統計學CH11.ppt

Similar documents
When the rejection rule for a test at every level α can be re-written as then xxx is the p-value of the test. xxx < α, If p-value < α, then the test c

)

0 0 = 1 0 = 0 1 = = 1 1 = 0 0 = 1

統計分析入門與應用 說明 : a. 獨立樣本 : 兩個來自於獨立, 沒有相關的樣本 b. 成對樣本 : 兩個平均數來自於同一個樣本, 有關係的樣本 7-2 Means 平均數分析 Means 平均數分析是用在不同類別變數組合下, 連續變數在各組的統計量, 例如 : 平均數 中位數 標準差 總合 最小

Microsoft Word - 94_4_stat_handout_06假設檢定_考古題.doc

C19 (1)

第八章 審計抽樣 本章學習重點 stratified random sampling systematic sampling PPS PPS MUS 8-3 壹抽樣與審計抽樣 audit sampling 100%

Microsoft Word - ACI chapter00-1ed.docx

臺北醫學大學生物統計研究中心 enews 第 17 期 2017/02 多重檢定問題,false discovery rate (FDR) 與 q 值 王紋璋在統計假設檢定分析過程中, 根據收集的資料我們得到檢定統計量 (test statistic) 之樣本觀察值 ; 然後, 我們計算在虛無假設

Microsoft Word - 94_2_stat_handout08_線性迴歸(考古題).doc

Microsoft PowerPoint - spss2-1.ppt

PowerPoint Presentation

Vol. 15 No. 1 JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY Feb O21 A

二次曲線 人們對於曲線的使用及欣賞 比曲線被視為一種數學題材來探討要早 得多 各種曲線中 在日常生活常接觸的 當然比較容易引起人們的興趣 比如 投擲籃球的路徑是拋物線 盤子的形狀有圓形或橢圓形 雙曲線 是較不常見的 然而根據科學家的研究 彗星的運行軌道是雙曲線的一部 分 我們將拋物線 圓與橢圓 雙曲

Microsoft Word - 95_1_stat_handout_04抽樣與抽樣分配.doc

.., + +, +, +, +, +, +,! # # % ( % ( / 0!% ( %! %! % # (!) %!%! # (!!# % ) # (!! # )! % +,! ) ) &.. 1. # % 1 ) 2 % 2 1 #% %! ( & # +! %, %. #( # ( 1 (

# % & ) ) & + %,!# & + #. / / & ) 0 / 1! 2

Microsoft PowerPoint - ch08.ppt

TA-research-stats.key

Microsoft Word - 10-001~020

連續機率分配

(Microsoft Word \262\316\255p\244W\264\301\245\275\303D\256w)

家装知识(六)

理性真的普遍嗎 注意力的爭奪戰 科學發展 2012 年 12 月,480 期 13

Microsoft Word - _m30.doc

第四部份

1970 新技術的應用 X = 20 + B 13B δ13c X 1 X

專題 : Test for Non-normality:An Intensive Simulation Practice 目的 : 統計學者提出的檢定統計式 (Test Statistic) 通常需要經過大量的模擬, 藉以驗證其分配的假設與 Type I Error 的維持, 並觀察檢定力的高低 本


Microsoft Word - 94_4_stat_handout_07變異數分析.doc

(baking powder) 1 ( ) ( ) 1 10g g (two level design, D-optimal) 32 1/2 fraction Two Level Fractional Factorial Design D-Optimal D

Chinese Journal of Applied Probability and Statistics Vol.25 No.4 Aug (,, ;,, ) (,, ) 应用概率统计 版权所有, Zhang (2002). λ q(t)

(Microsoft Word - Ch 10 1 \260\262\263]\300\313\251w)

投影片 1

Microsoft Word - ACL chapter02-5ed.docx

天 主 教 輔 仁 大 學 社 會 學 系 學 士 論 文 小 別 勝 新 婚? 久 別 要 離 婚? 影 響 遠 距 家 庭 婚 姻 感 情 因 素 之 探 討 Separate marital relations are getting better or getting worse? -Exp

,.2018, 38,.1 :1, 220 ( ) 140, ;2,,,;3,,,, >180 ( ) >120,,, [10] :,,,,,,,, ( ), [6,11],,,,,, ( ), ( Ⅱ ),,, ( -6),,,,, -,, [2],, [12],, (

Microsoft Word - 結案報告.doc

<4D F736F F D B14DA7DEB0AAA6D2AAC0A475AE76312DAAC0B77CA475A740ACE3A873A4E8AA6B>

μ μ - - β- - μ

untitled

Fun Time (1) What happens in memory? 1 i n t i ; 2 s h o r t j ; 3 double k ; 4 char c = a ; 5 i = 3; j = 2; 6 k = i j ; H.-T. Lin (NTU CSIE) Referenc

%! # # % % & # ( ) ( +, & +, +, & +, & +, +, &!

# ( + + # + # 6 +,! + # +! +, + # ( + ) ( + ( + ) + 7! + # + /8 + ) ( +! + #. + ( +, +! + # + # + + ( ! ( + ) ( + ) +, + ( + 9% +! +, + ( +

建築工程品質管理案例研討

封面-12

2005硕士论文模版

spss.doc

穨series019-IA.PDF

Microsoft Word - 98全國大學校長會議

Microsoft PowerPoint _Hypothesis Testing (S9)

男人的大腦 女人的大腦

:

( ) t ( ) ( ) ( ) ( ) ( ) t-


14: 6 不做清單上的事, 並不代表我們就可以隨心所欲 ; 我們不做, 是為了更深一層的原因 同樣, 也沒有人會因不受這些清單的捆綁, 就更能活出 豐盛的生命來 14: 15 8: : 17 在所有十誡中, 第十誡往往是最先遭破壞的一條 22: 37, 39 凡是使我們不能愛神與愛

untitled

貳 肆 公司治理報告 一 組織系統 ( 一 ) 組織結構 ( 二 ) 組織系統圖 14 中華民國 98 年中華郵政年報

[9] R Ã : (1) x 0 R A(x 0 ) = 1; (2) α [0 1] Ã α = {x A(x) α} = [A α A α ]. A(x) Ã. R R. Ã 1 m x m α x m α > 0; α A(x) = 1 x m m x m +

Shanghai International Studies University THE STUDY AND PRACTICE OF SITUATIONAL LANGUAGE TEACHING OF ADVERB AT BEGINNING AND INTERMEDIATE LEVEL A Thes

Wire Wound Ceramic Chip Inductor 繞線式陶瓷晶片大电流電感 HPWS Series for High Frequency HPWS 系列適用於高頻 INTRODUCTION 產品介紹 The HPWS is the chip inductors of a wire w


<4D F736F F D20BDD7A4E5A4BAA4E5BB50A5D8BFFD2E646F63>

Microsoft Word - A doc

UDC Empirical Researches on Pricing of Corporate Bonds with Macro Factors 厦门大学博硕士论文摘要库

4

威 福 髮 藝 店 桃 園 市 蘆 竹 區 中 山 里 福 祿 一 街 48 號 地 下 一 樓 50,000 獨 資 李 依 純 105/04/06 府 經 登 字 第 號 宏 品 餐 飲 桃 園 市 桃 園 區 信 光 里 民

機構職能

國立中山大學學位論文典藏.PDF

08陈会广

.. (,, ),(): ( (,,, (, (,,, (), ( ): (, ), ( ): (,,, (,,, (,,, ),( ): (,,, (, (,,, (,, (, ),(): ~ (, ~ (,, ~ (, ~ (,,, ), ( ), ( ): ( (,, ~ (,, ), ~ (

untitled

專 用 或 主 要 用 於 第 8525 至 8528 節 所 屬 器 具 之 零 件 用 於 衣 服 靴 鞋 帳 蓬 手 提 包 旅 行 用 品 或 其 他 已 製 作 品 之 卑 金 屬 搭 鈕 帶 搭 鈕 之 框 架 帶 扣 帶 扣 搭 鈕 眼 環 眼 及 其

中国药师 年第 卷第 期 C P m V N 左金丸源自元代 丹溪心法 的火方 由黄连和 型在线脱气机 S L A型自动进样器 CTO A型 吴茱萸两味药按照 的比例组成 近年来的现 柱温箱 日本 S m 公司 BPD型电子天平 代药理学研究表明 左金丸具有调节中枢 抑杀幽门 德国赛多利斯集团 BR

CDD全文文件水印保护

CDD全文文件水印保护

摘 要 本 篇 文 章 主 要 是 利 用 1979 年 至 2014 年 台 灣 年 數 據 的 資 料, 檢 視 油 價 對 於 匯 率 的 影 響, 所 採 用 的 檢 定 模 型 為 : 單 根 Johansen 共 整 合 及 VECM 向 量 誤 差 修 正 模 型 而 共 整 合 模

國家圖書館典藏電子全文

的目的 的目的在於對統計分析所給定的先驗 假設條件 進行檢定, 以檢驗假設條件的 適當性 此假設條件包含 1. 分配形式的假設 : 例如在假設檢定中的常態分配假設 ; 2. 獨立性的假設 : 例如在兩個母體平均數及變異數假設檢定中的兩母體相互獨立的假設 ;

840 提示 Excel - Excel -- Excel (=) Excel ch0.xlsx H5 =D5+E5+F5+G5 (=) = - Excel 00

Ph m V N 中国药师 年第 卷第 期 Ch 学基础首先是开放性药物可直接经口 鼻给予 其次是应 连整个产品设计紧凑携带使用方便此外减速网也被认为 答性它富含的感受器和药物受体能对体内外刺激作出应答 是可用于降低药物微粒速度从而减少其惯性嵌顿的一种结 反射从而对调节气道的张力有重要作用 第三是吸

連續機率分配

实验室诊断专辑

2015年4月11日雅思阅读预测机经(新东方版)

投影片 1

期 李 海 青 等 : 生 物 安 全 性 白 藜 芦 醇 合 成 酶 表 达 载 体 的 构 建 及 水 稻 遗 传 转 化 子 植 物 中 作 为 植 物 处 于 恶 劣 环 境 下 或 遭 到 病 原 体 侵 害 时, 植 物 自 身 分 泌 的 一 种 可 抵 御 病 菌 感 染 的 抗 菌

09 F9 128 peer to peer, P2P file transfer protocol bittorrent 10 P2P P2P GNU/ Linux P2P CC 單機版的智慧財產權 vs. 人權戰爭 1980 DVD content


202,., IEC1123 (1991), GB8051 (2002) [4, 5],., IEC1123,, : 1) IEC1123 N t ( ). P 0 = , P 1 = , (α, β) = (0.05, 0.05), N t = [4]. [6

Monetary Policy Regime Shifts under the Zero Lower Bound: An Application of a Stochastic Rational Expectations Equilibrium to a Markov Switching DSGE


Microsoft PowerPoint - 第9章 簡單隨機抽樣與抽樣分配.ppt [相容模式]


Stochastic Processes (XI) Hanjun Zhang School of Mathematics and Computational Science, Xiangtan University 508 YiFu Lou talk 06/

PowerPoint Presentation

( )... 5 ( ) ( )

θ 1 = φ n -n 2 2 n AR n φ i = 0 1 = a t - θ θ m a t-m 3 3 m MA m 1. 2 ρ k = R k /R 0 5 Akaike ρ k 1 AIC = n ln δ 2

14052_公開用.pdf

# 7 % % % < % +!,! %!!

#!! +!,! # &!. / !!, 7!!, & #! % 7! % )

Transcription:

第 章 假設檢定的介紹 LOGO 11.1

統計推論 假設檢定是統計推論的第二個類型 它也有很廣泛的應用 為了解其概念, 我們將從非統計假設檢定開始 第 11 章假設檢定的介紹第 378 頁 Copyright 2010 Cengage Learning 11.2

1.1 假設檢定的非統計應用 刑事審判是假設檢定的非統計的例子 審判中陪審團必須在兩個假設中做決定 虛無假設 (null hypothesis) 為 H 0 : 被告是無罪的 對立 (alternative) 或研究假設 (research hypothesis) 為 H 1 : 被告是有罪的 陪審團並不知道哪一個假設是正確的 他們必須要依據原告和被告兩方提出的證據做決策, either guilty or non-guilty 第 11 章假設檢定的介紹第 379 頁 Copyright 2010 Cengage Learning 11.3

假設檢定的非統計應用 在統計的術語宣判被告有罪 等同於拒絕虛無假設且支持對立假設 (rejecting the null hypothesis in favor of the alternative) 也就是, 陪審團認為有足夠的證據做出被告有罪的結論 ( 有足夠的證據支持對立假設 ) 第 11 章假設檢定的介紹第 379 頁 Copyright 2010 Cengage Learning 11.4

假設檢定的非統計應用 宣判被告無罪如同說 不拒絕虛無假設且不支持對立假設 (not rejecting the null hypothesis in favor of the alternative) 注意 : 陪審團並不是說被告是無罪的, 只能說沒有足夠證據支持對立假設 這是為什麼我們從不說我們支持虛無假設 第 11 章假設檢定的介紹第 379 頁 Copyright 2010 Cengage Learning 11.5

兩種決策錯誤 型 I 錯誤 (Type I error) 發生於當我們拒絕了一個真實的虛無假設 在刑事審判中, 犯型 I 錯誤是當一個無罪的人被陪審團錯誤地宣判有罪 型 II 錯誤 (Type II error) 定義成不拒絕一個錯誤的虛無假設 型 II 錯誤的發生是當一個有罪的被告被宣判無罪釋放 Q: Which error results in more serious consequence? 第 11 章假設檢定的介紹第 379 頁 Copyright 2010 Cengage Learning 11.6

兩種決策錯誤 犯型 I 錯誤的機率被表示成 ( 希臘字母 alpha), 它也被稱為顯著水準 (significance level) 犯型 II 錯誤的機率被表示成 ( 希臘字母 beta) 兩種錯誤的機率 和 是反向相關 試圖降低其中一個將會造成另外一個的增加 第 11 章假設檢定的介紹第 379 頁 Copyright 2010 Cengage Learning 11.7

Notes for decision errors 在我們的刑事審判制度, 型 I 錯誤被視為是比較嚴重的 我們試著避免宣判無罪的人有罪 我們更樂意宣告有罪的人無罪 制度的安排是將犯型 I 錯誤的機率 α 設得很小, 藉由將舉證的重擔放在原告 ( 控方必須證明被告有罪, 辯方無需證明任何事情 ), 且陪審團只有在 證據超過合理的懷疑 時才得以宣判被告有罪 第 11 章假設檢定的介紹第 379 頁 Copyright 2010 Cengage Learning 11.8

Notes for decision errors Sentences from 美國最高法官, Oliver Wendell Holmes 寧可無罪釋放 100 個有罪的人, 也不願誤判一個無罪的人有罪 P(Type I error)=p(type II error)/100 Table 11.1 for the terminologies of HT (p380) 第 11 章假設檢定的介紹第 379 頁 Copyright 2010 Cengage Learning 11.9

假設檢定的重要觀念 1. 有兩個假設, 為虛無假設與對立假設 2. 檢定的程序以假設虛無假設為真開始 3. 過程的目的是要決定是否有足夠的證據去推論對立假設是真的 4. 有兩種可能的決策 : 結論認為有足夠的證據去支持對立假設, i.e., reject H0 結論認為無足夠的證據去支持對立假設, i.e., don t reject H0, but not accept H0 第 11 章假設檢定的介紹第 380 頁 Copyright 2010 Cengage Learning 11.10

假設檢定的重要觀念 5. 任何檢定皆有兩種可能的錯誤 型 I 錯誤 : 拒絕一個真的虛無假設 型 II 錯誤 : 無法拒絕一個錯誤的虛無假設 犯型 I 與型 II 錯誤的機率是 P ( 型 I 錯誤 ) = P ( 型 II 錯誤 ) = 第 11 章假設檢定的介紹第 380 頁 Copyright 2010 Cengage Learning 11.11

假設檢定的概念 (1) 有兩個假設 一個被稱為虛無假設, 另一個被稱為對立或研究假設 通用的符號表示法 : 發音為 H nought H 0 : 虛無假設 H 1 : 對立 或 研究假設 虛無假設 (H 0 ) 總是說明參數是等於對立假設中指定的值 (H 1 ) 第 11 章假設檢定的介紹第 380 頁 Copyright 2010 Cengage Learning 11.12

假設檢定的概念 再次回想範例 10.1 ( 估計電腦前置期間的平均需求量 ), 我們的管理者不想估計平均需求量, 取而代之的是想要知道平均數是否不同於 350 我們可以重新表述需求為虛無假設 : H 0 : µ = 350 所以我們的研究假設為 : H 1 : µ 350 這是我們有興趣去確認的部分... 第 11 章假設檢定的介紹第 380-381 頁 Copyright 2010 Cengage Learning 11.13

假設檢定的概念 (2) 檢定的程序以假設虛無假設為真開始 因此, 在我們有更近一步的統計證據之前, 我們將假設 : H 0 : = 350 ( 假設為真 ) 第 11 章假設檢定的介紹第 380.381 頁 Copyright 2010 Cengage Learning 11.14

假設檢定的概念 (3) 過程的目的是要決定是否有足夠的證據去推論對立假設是真的 也就是說, 是否有足夠的統計資料, 以確定這一假 設是正確的? H 1 :µ 350 這是我們有興趣去確認的部分... 第 11 章假設檢定的介紹第 380 頁 Copyright 2010 Cengage Learning 11.15

假設檢定的概念 (4) 有兩種可能的決策 : 結論認為有足夠的證據去支持對立假設 ( 換句話說 : 拒絕虛無假設並且支持對立假設的 ) 結論認為無足夠的證據去支持對立假設 ( 換句話說 : 不拒絕虛無假設去支持對立 ) 注意 :Never say 我們接受虛無假設 第 11 章假設檢定的介紹第 380 頁 Copyright 2010 Cengage Learning 11.16

假設檢定的概念 完成檢定與假設的敘述之後, 下一個步驟是自母體中隨機抽取樣本並計算檢定統計量 (test statistic) ( 此範例為樣本平均數 ) Test statistic is the rule for making decision on HT. Test statistic is based on the best estimator of the parameter of interest, such as sample mean is the best estimator for the population mean. Criterion for decision: 假如檢定統計量的值與虛無假設所述不一致, 我們拒絕虛無假設並且推論對立假設是真的 ( 反證法, contradiction) 第 11 章假設檢定的介紹第 382 頁 Copyright 2010 Cengage Learning 11.17

假設檢定的概念 例如, 若我們試圖決定平均數是否大於 350, 一個很大的 x 值 ( 譬如,600) 將提供足夠的證據 假如 x 的值接近 350 ( 譬如,355), 我們將說它並沒有提供我們太多推論平均數是大於 350 的證據 第 11 章假設檢定的介紹第 382 頁 Copyright 2010 Cengage Learning 11.18

假設檢定的概念 (5) 任何檢定皆有兩種可能的錯誤 型 I 錯誤的發生是當我們拒絕一個真的虛無假設 型 II 錯誤的發生是當我們無法拒絕一個錯誤的虛無假設 犯型 I 與型 II 錯誤的機率是 : P ( 型 I 錯誤 ) = P ( 型 II 錯誤 ) = α 被稱為顯著水準 (significance level) 第 11 章假設檢定的介紹第 380 頁 Copyright 2010 Cengage Learning 11.19

錯誤的型態 型 I 錯誤 (Type I error) 發生於當我們拒絕了一個真實的虛無假設 型 II 錯誤 (Type II error) 發生於當我們不拒絕一個錯誤的虛無假設 ( 例, 沒有拒絕 H 0, 當它是錯誤的 ) 第 11 章假設檢定的介紹第 379-380 頁表 4.1 Copyright 2010 Cengage Learning 11.20

11.2 在母體標準差已知下, 檢定母體平均數 (one population problem) Copyright 2010 Cengage Learning 11.21

範例 11.1 某百貨公司的經理想要對公司的信用卡顧客發展一套新的收費系統 在全面的財務分析之後, 她判定只有在平均每月帳上金額高於 $170 時, 新系統才會符合成本效益 隨機抽出 400 個每月帳戶為樣本, 帳戶金額的樣本平均數為 $178 (>170) 該經理知道帳戶金額近似於常態分配, 標準差為 $65 Q: 該經理可否從上述資料做出新系統將會符合成本效益的結論? 第 11 章假設檢定的介紹第 383 頁 Copyright 2010 Cengage Learning 11.22

範例 11.1 辨認方法 這個範例處理百貨公司信用卡帳戶的母體 為了下結論說新系統將會符合成本效益, 經理必須證明所有顧客的平均帳戶金額是大於 $170 我們設定對立假設來表達這個狀況 : H 1 : µ > 170 ( 這是我們要確定的 ) 虛無假設可以被表達成 : H 0 : µ = 170 ( 對我們感興趣的參數指定一個單一的數值 ) 第 11 章假設檢定的介紹第 383-384 頁 Copyright 2010 Cengage Learning 11.23

範例 11.1 辨認方法 所以可寫成 : H 0 : µ = 170 ( 假設此項為真 ) H 1 : µ > 170 已知 : n = 400 = 178 σ = 65 接下來該如何推論? 第 11 章假設檢定的介紹第頁 Copyright 2010 Cengage Learning 11.24

檢定方法 計算 第一個被稱為拒絕域法 (rejection region method), 當手動計算時, 通常使用此方法 第二種是 p- 值法 (p-value approach), 一般而言它僅能連結電腦和統計軟體來使用 第 11 章假設檢定的介紹第 384 頁 Copyright 2010 Cengage Learning 11.25

拒絕域 (Rejection Region, RR) 拒絕域是一個數值的範圍, 如果檢定統計量的值落在這個範圍內, 我們會拒絕虛無假設並且支持對立假設的論述 Q: How to find this region or range? Copyright 2010 Cengage Learning 11.26

拒絕域 計算 當樣本平均數的值相對於 170 是很大時, 拒絕虛無假設而支持對立假設似乎很合理 α = P( 型 I 錯誤 ) 第 11 章假設檢定的介紹第 384-385 頁圖 11.1 Copyright 2010 Cengage Learning 11.27

範例 11.1 計算左邊算式的 計算, 並與 µ = 170 做比較 我們需要一個顯著水準 (α) 來計算此項 第 11 章假設檢定的介紹第 385 頁 Copyright 2010 Cengage Learning 11.28

範例 11.1 計算 假設該經理選擇 為 5%, 接下來可得 Z = Z.05 = 1.645 我們現在能夠計算的值 : 由於樣本平均數 (178) 大於我們計算出的值 (175.34), 落入 RR, 我們拒絕虛無假設並支持對立假設, 例如 µ > 170 也就是裝設新系統符合成本效益 第 11 章假設檢定的介紹第 386 頁 Copyright 2010 Cengage Learning 11.29

範例 11.1 X 的抽樣分配 H 0 : = 170 H 1 : > 170 =175.35 =178 拒絕 H 0 並且支持 H 1 為真 第 11 章假設檢定的介紹第 386.387 頁圖 11.2 Copyright 2010 Cengage Learning 11.30

標準化檢定統計量 一個比較簡單的方法是使用標準化檢定統計量 (standardized test statistic): 並且將其結果與 Z 相比較 : ( 拒絕域 : z > Z ) 因為 z = 2.46 大於 1.645(z.05 ), 所以拒絕 H 0 並支持 H 1 第 11 章假設檢定的介紹第 386-387 頁 Copyright 2010 Cengage Learning 11.31

範例 11.1 Z 的抽樣分配 H 0 : = 170 H 1 : > 170 Z.05 =1.645 z = 2.46 拒絕 H 0 並且支持 H 1 為真 第 11 章假設檢定的介紹第 387 頁圖 11.3 Copyright 2010 Cengage Learning 11.32

p- 值 (p-value) Recall RR method requires the specification of the value of α. Motivation for P-value The value of α is not specified in practice. Use the sample data to show the chance for making Type I error without the specification of the value of α. Definition of p-value 一個檢定的 p- 值 (p-value of a test) 是在給定虛無假設為真的條件下, 觀測到一個檢定統計量至少像計算所得數值一樣極端的機率 P-value is a probability for making a type I error, based on the sample data and assumed H0 is true. 第 11 章假設檢定的介紹第 388 頁 Copyright 2010 Cengage Learning 11.33

p- 值 在範例 11.1 中, 觀測到一個樣本平均數至少像已經觀察過的樣本一樣極端的機率 ( 如 :178), 給定的虛無假設 (H 0 : µ = 170) 是否為真? p- 值 第 11 章假設檢定的介紹第 388 頁 Copyright 2010 Cengage Learning 11.34

p- 值 p- 值 = P(Z > 2.46) p- 值 =.0069 z =2.46 第 11 章假設檢定的介紹第 389 頁圖 11.4 Copyright 2010 Cengage Learning 11.35

Possible conclusions from the p- 值 p- 值愈小, 愈多測量證據存在以支持對立假設 : 假如 p- 值小於.01, 有壓倒性的 (overwhelming) 證據支持對立假設是對的 假如 p- 值介於.01 和.05 之間, 有強烈的 (strong) 證據支持對立假設是對的 假如 p- 值介於.05 和.10 之間, 有微弱的 (weak) 證據支持對立假設是對的 假如 p- 值超過.10 時, 沒有證據支持推論對立假設是對的 因為 p- 值為.0069, 所以有壓倒性的證據支持 H 1 : > 170 Table 11.2 shows the other values of the test statistic and the corresponding p-value. 第 11 章假設檢定的介紹第 391 頁 Copyright 2010 Cengage Learning 11.36

描述 p- 值 p =.0069 第 11 章假設檢定的介紹第 391 頁圖 11.6 Copyright 2010 Cengage Learning 11.37

比較 p- 值及顯著水準的選擇值 假如 p- 值小於, 我們判斷 p- 值夠小去拒絕虛無假設 假如 p- 值大於, 我們不拒絕虛無假設 當 p- 值 =.0069 < =.05, 我們拒絕 H 0 且支持 H 1 第 11 章假設檢定的介紹第 391 頁 Copyright 2010 Cengage Learning 11.38

範例 11.1 計算 鍵入或匯入資料到某欄 ( 開啟 Xm11-01) 點選 Add-Ins Data Analysis Plus, 與 Z-Test: Mean 第 11 章假設檢定的介紹第 392 頁 Copyright 2010 Cengage Learning 11.39

範例 11.1 計算 第 11 章假設檢定的介紹第 392 頁 Copyright 2010 Cengage Learning 11.40

詮釋一個檢定的結果 假如我們拒絕虛無假設, 我們下結論說有足夠的統計證據去推論對立假設是真的 假如我們不拒絕虛無假設, 我們下結論說沒有足夠的統計證據去推論對立假設是真的 切記 : 對立假設是結論的焦點 它呈現了我們想要調查與探討的內容 第 11 章假設檢定的介紹第 394 頁 Copyright 2010 Cengage Learning 11.41

開章範例 SSA 信封計畫 聯邦快遞 (FedEx) 寄發票給顧客要求 30 天之內付費 帳單上會列出付款地址, 且期望顧客使用他們自己的信封寄回他們的付款 目前, 付清帳單所需時間的平均數與標準差分別是 24 天與 6 天 財務長 (CFO) 相信附上一個回郵 (stamped selfaddressed, SSA) 信封會縮短付款時間 第 11 章假設檢定的介紹第 378 頁 Copyright 2010 Cengage Learning 11.42

開章範例 SSA 信封計畫 她計算減短 2 天的付款時間以改善現金流量, 將能支付信封與郵票的成本 若更進一步地減短付費時間, 將會產生利潤 為了測試她的想法, 她隨機選取 220 位顧客且隨著發票附上一個回郵信封寄出 收到付款所需的天數被記錄下來 Q: 這位財務長是否能夠下結論說這項計畫是有利潤的? 第 11 章假設檢定的介紹第 378 頁 Copyright 2010 Cengage Learning 11.43

SSA 信封計畫 辨識方法 這項研究的目的是對平均付款時間推導結論 因此, 要被檢定的參數是母體平均數 我們想知道是否存在足夠的統計證據以顯示母體平均數是少於 22 天 因此, 對立假設為 H 1 : μ < 22 虛無假設為 H 0 : μ = 22 第 11 章假設檢定的介紹第 395 頁 Copyright 2010 Cengage Learning 11.44

SSA 信封計畫 辨識方法 檢定統計量為 z x / n 只有當樣本平均數與其導出的檢定統計量的數值夠小的時候, 我們會拒絕虛無假設且支持對立假設 結果, 我們設定的拒絕域位置會在抽樣分配的左尾 我們設定 10% 的顯著水準 第 11 章假設檢定的介紹第 395 頁 Copyright 2010 Cengage Learning 11.45

SSA 信封計畫 計算 拒絕域為 : z z z. 10 1.28 由 Xm11-00 資料, 我們計算出 和 z x xi 220 x / n 4,759 220 21.63 22 6 / 220 21.63.91 p- 值 = P(Z <.91) =.5.3186 =.1814 第 11 章假設檢定的介紹第 395-396 頁 Copyright 2010 Cengage Learning 11.46

SSA 信封計畫 計算 點選 Add-Ins Data Analysis Plus, 與 Z-Estimate: Mean 第 11 章假設檢定的介紹 Copyright 2010 Cengage Learning 11.47

SSA 信封計畫 計算 第 11 章假設檢定的介紹第 396 頁 Copyright 2010 Cengage Learning 11.48

SSA 信封計畫 詮釋 結論 : 沒有充分的證據去推論平均付款時間小於 22 天 沒有足夠的證據去推論這項計畫將會是有利益的 第 11 章假設檢定的介紹第 396 頁 Copyright 2010 Cengage Learning 11.49

單尾與雙尾檢定 (one-tail and two-tail tests) 在範例 11.1 中, 執行的統計檢定被稱為單尾檢定 (one-tail test), 因為拒絕域只位於抽樣分配的單尾 更正確地說, 範例 11.1 是右尾檢定的範例之一 第 11 章假設檢定的介紹第 397 頁 Copyright 2010 Cengage Learning 11.50

雙尾檢定 雙尾檢定被用於當我們想要檢定參數不等於某些值的研究假設 第 11 章假設檢定的介紹 Copyright 2010 Cengage Learning 11.51

範例 11.2 近年來, 數家公司已成立並投入與 AT&T 長途電話的競爭 這些公司全都廣告它們的費率比 AT&T 的低, 也因此它們的帳單將會比較便宜 AT&T 辯稱, 平均而言,AT&T 對顧客的收費與其他公司並沒有差別 假設一個替 AT&T 工作的統計實作者認定該公司的居家客戶每月長途電話帳單的平均數與標準差分別是 $17.09 和 $3.87 第 11 章假設檢定的介紹第 397 頁 Copyright 2010 Cengage Learning 11.52

範例 11.2 他接著隨機抽取了 100 位顧客為樣本, 並使用一個首要競爭者的費率重新計算這些顧客上個月的帳單 假設這個母體的標準差與 AT&T 的相同, 我們能否下結論說在 5% 的顯著水準下, 平均 AT&T 帳單與首要競爭者之間存在著差異? 第 11 章假設檢定的介紹第 397 頁 Copyright 2010 Cengage Learning 11.53

範例 11.2 辨識方法 被檢定的參數是 AT&T 的客戶帳單之母體平均數是基於首要競爭者的費率 在這個問題中, 我們想要知道平均每月長途電話帳單是否不同於 $17.09 所以, 對立假設為 : H 1 : µ 17.09 虛無假設必然為 : H 0 : µ = 17.09 第 11 章假設檢定的介紹第 397-398 頁 Copyright 2010 Cengage Learning 11.54

範例 11.2 辨識方法 拒絕域被設定, 所以當檢定統計量很大或很小的時候, 我們能夠拒絕虛無假設 統計量很 小 統計量很 大 也就是, 我們必須設定一個雙尾拒絕域 (two-tail rejection region) 因為在拒絕域的總面積必須是, 我們將這個機率除以 2 第 11 章假設檢定的介紹第 398 頁 Copyright 2010 Cengage Learning 11.55

範例 11.2 辨識方法 在 5% 的顯著水準之下 (α =.05), 可知 α/2 =.025 因此,z.025 = 1.96 的拒絕域為 z < 1.96 - 或 - z > 1.96 -z.025 0 +z.025 z 第 11 章假設檢定的介紹第 398 頁 Copyright 2010 Cengage Learning 11.56

範例 11.2 計算 從資料 (Xm11-02), 我們可計算出 = 17.55 檢定統計量的值是 : 我們發現 : 因為 z = 1.19 既不大於 1.96 也不小於 1.96, 我們不能拒絕虛無假設且支持 H 1, 即 沒有充足的證據去推論 AT&T 的帳單與競爭者的有差異 第 11 章假設檢定的介紹第 398-399 頁 Copyright 2010 Cengage Learning 11.57

範例 11.2 雙尾檢定的 p- 值 計算 一般而言, 雙尾檢定的 p- 值被計算如下 p- 值 = 2P(Z > z ) 其中 z 是檢定統計量的數值, 而 z 是它的絕對值 在範例 11.2 中, 我們可得知 p- 值 = P(Z < 1.19) + P(Z > 1.19) =.1170 +.1170 =.2340 第 11 章假設檢定的介紹第 398-399 頁 Copyright 2010 Cengage Learning 11.58

範例 11.2 計算 第 11 章假設檢定的介紹 Copyright 2010 Cengage Learning 11.59

範例 11.2 計算 第 11 章假設檢定的介紹第 399 頁 Copyright 2010 Cengage Learning 11.60

雙尾檢定與單尾檢定總整理 單尾檢定 ( 左尾 ) 雙尾檢定 單尾檢定 ( 右尾 ) 第 11 章假設檢定的介紹 Copyright 2010 Cengage Learning 11.61

Hypothesis testing vs. estimation of confidence interval (p400) Copyright 2010 Cengage Learning 11.62

發展對統計觀念的了解 如同信賴區間估計量, 假設檢定是依據樣本統計量的抽樣分配 假設檢定的結果是一個關於樣本統計量的機率陳述 我們假設母體平均數是虛無假設所設定的值 第 11 章假設檢定的介紹第 401 頁 Copyright 2010 Cengage Learning 11.63

發展對統計觀念的了解 我們接著將計算檢定統計量, 和測量當虛無假設為真時觀察到一個如此大 ( 或小 ) 數值的可能性 假如這個機率很小, 我們下結論說 虛無假設為真 的假設不能被證實且我們拒絕它 第 11 章假設檢定的介紹第 401 頁 Copyright 2010 Cengage Learning 11.64

發展對統計觀念的了解 當我們 ( 或電腦 ) 計算檢定統計量的值 我們也測量樣本統計量和參數設定值之間的差異 測量的差異為標準誤 z x / n 第 11 章假設檢定的介紹第 401 頁 Copyright 2010 Cengage Learning 11.65

發展對統計觀念的了解 在範例 11.2 中, 我們發現檢定統計量的值是 z = 1.19 意指樣本平均數比 的參數設定值大 1.19 個標準誤 標準常態機率表告訴我們這個值並不是不可能 因此, 我們不拒絕虛無假設 測量樣本統計量和參數設定值之間相差幾個標準誤的觀念將在本書中繼續使用 第 11 章假設檢定的介紹第 401 頁 Copyright 2010 Cengage Learning 11.66

11.3 計算犯型 II 錯誤的機率 了解型 I 與型 II 錯誤之間的關係非常重要 也就是, 如何計算犯型 II 錯誤的機率以及如何詮釋其結果 回顧範例 11.1 H 0 : µ = 170 H 1 : µ > 170 由於我們的樣本平均數 (178) 比測量值 (175.34) 大, 在 5% 的顯著水準下, 我們拒絕 H 0 且支持 H 1 第 11 章假設檢定的介紹第 405 頁 Copyright 2010 Cengage Learning 11.67

計算犯型 II 錯誤的機率 一個型 II 錯誤發生於當一個錯誤的虛無假設不能被拒絕 在範例 11. 1 中, 如果不是小於 175.34 ( 我們的臨界值 ), 我們將不會拒絕虛無假設 如果我們不拒絕這項虛無假設, 我們將不會裝置新的收費系統 因此, 其發生的機率是型 II 錯誤的機率, 它被定義為 β = P( x < 175.34, 給定虛無假設為錯 ) 第 11 章假設檢定的介紹第 405 頁 Copyright 2010 Cengage Learning 11.68

範例 11.1( 回顧 ) β = P( x < 175.34, 給定虛無假設為錯 ) 虛無假設為錯的情況只告訴我們平均數是不等於 170 如果我們要計算 β, 我們必須為 指定一個數值 假設當平均每月帳上金額是 $180 時, 則新收費系統所節省的錢變得十分具吸引力, 這位經理將後悔沒有裝置新系統 β = P( x < 175.34, 給定 µ = 180), 因此 第 11 章假設檢定的介紹第 405 頁 Copyright 2010 Cengage Learning 11.69

範例 11.1 ( 回顧 ) 原先的假說 新的假設 β = P(X < 175.34, 給定 µ = 180) 第 11 章假設檢定的介紹第 405.406 頁圖 11.9 Copyright 2010 Cengage Learning 11.70

改變對 的影響 降低顯著水準, 增加 的值, 並且反之亦然 在範例 11.1. 中使用 1% 的顯著水準取代 5% 步驟 1: 拒絕域 : z z z. 01 2.33 x x 170 z / n 65/ 400 x 177.57 2.33 第 11 章假設檢定的介紹第 406 頁 Copyright 2010 Cengage Learning 11.71

改變對 的影響 步驟 2: 型 II 錯誤的機率是 P(x 177.57 180) x 177.57 180 P / n 65 / 400 P.75 z.2266 第 11 章假設檢定的介紹第 406 頁 Copyright 2010 Cengage Learning 11.72

改變對 的影響 顯著水準 減少, 增加 的值, 並且反之亦然 再次細看此圖 我們向右移動拒絕域的臨界值 ( 減少 ) 表示在第二個圖的曲線下方有一個更大的面積 ( 反之亦然 ) 第 11 章假設檢定的介紹第 406.407 頁圖 11.9 & 圖 11.10 Copyright 2010 Cengage Learning 11.73

判斷檢定 一個統計的假設檢定有效地被顯著水準 ( ) 與樣本大小 (n) 所定義, 二者皆由統計實作人員所選定 如果我們相信型 II 錯誤的成本比較高, 而此機率太大, 我們有兩種方法降低這個機率 增加 α 的值 和 / 或 增加樣本大小 n 第 11 章假設檢定的介紹第 407 頁 Copyright 2010 Cengage Learning 11.74

判斷檢定 例如, 在範例 11.1 中, 假設我們將樣本大小 n 由 400 增加到 1000 步驟 1: 拒絕域 z z z. 05 1.645 x x 170 z / n 65/ 1,000 x 173.38 1.645 第 11 章假設檢定的介紹第 407-408 頁 Copyright 2010 Cengage Learning 11.75

判斷檢定 步驟 2: 型 II 錯誤的機率是 P ( x 173.38 180) x 173.38 180 P / n 65/ 1,000 P z 3.22 0 ( 近似值 ) 第 11 章假設檢定的介紹第 408 頁 Copyright 2010 Cengage Learning 11.76

比較 在 n = 400 與 n = 1,000 藉著增加樣本大小, 我們降低了型 II 錯誤的機率 比較 在 n = 400 與 n = 1,000 n=400 n=1,000 175.35 173.38 第 11 章假設檢定的介紹第 406.408 頁圖 11.9 & 圖 11.11 Copyright 2010 Cengage Learning 11.77

發展對統計概念的了解 以 n = 400 與 n = 1,000 計算型 II 錯誤的機率說明了一個極為重要的概念 藉著增加樣本大小, 我們降低了型 II 錯誤的機率 藉著降低型 II 錯誤的機率, 我們使得這類的錯誤較少發生 因此, 就長期而言, 較大的樣本容許我們製訂較佳的決策 此一發現正中應用統計分析的核心, 並且印證了本書的第一句話, 統計學是從資料取得資訊的一種方法 第 11 章假設檢定的介紹第 409 頁 Copyright 2010 Cengage Learning 11.78

發展對統計概念的了解 貫穿本書, 我們介紹各種在會計 財務 行銷 作業管理 人力資源與經濟學上的統計應用方法 在所有這類的應用中, 統計實作人員必須做決策, 它涉及到如何將資料轉換為資訊 越多的資訊, 就會有越好的決策 缺乏資訊, 則決策必須基於猜測 直覺與運氣 一位有名的統計學家 W. Edwards Deming 曾經說過 : 缺乏資料, 你只是另一個具有意見的人 第 11 章假設檢定的介紹第 409 頁 Copyright 2010 Cengage Learning 11.79

檢定的檢定力 (power of test) 另一種表達檢定執行好壞的方法是報告它的檢定力 (power): 當虛無假設為假時, 檢定引導我們拒絕虛無假設的機率 一個檢定的檢定力是 1 - 在一個特定的狀況下, 當有一個以上的檢定可以被執行時, 我們自然會偏好使用一個正確頻率比較高的檢定 如果 ( 給定相同的對立假設 樣本大小與顯著水準 ) 一個檢定的檢定力高於第二個檢定, 則說第一個檢定比第二個更具效率 第 11 章假設檢定的介紹第 409 頁 Copyright 2010 Cengage Learning 11.80

操作特性曲線 (Operating characteristic curve, OC curve) To compute the probability of type II error, we need to specify the significance level, sample size, and the value of population mean in H1. OC curve is a tool for recording these specified values Table 11.12 (p410): β vs. μ Table 11.13 (p411): β vs. μ under different sample sizes. Copyright 2010 Cengage Learning 11.81

11.4 後續學習 統計實作人員經常採用的統計方法 定義 計算 詮釋 測量最困難的部分 ( 在現實生活中或是期末考時 ) 是辨認正確的方法 第 11 章假設檢定的介紹第 414-415 頁 Copyright 2010 Cengage Learning 11.82

後續學習 許多因素可用來辨認正確的方法, 但是其中兩個因素特別的重要 : 1. 資料的類型 區間 順序和名目 2. 問題的目的 第 11 章假設檢定的介紹第 415 頁 Copyright 2010 Cengage Learning 11.83

問題的目的 1. 描述一個母體 2. 比較兩個母體 3. 比較兩個或更多母體 4. 分析兩個變數的關係 5. 分析兩個或更多變數的關係 第 11 章假設檢定的介紹第 415-416 頁 Copyright 2010 Cengage Learning 11.84

表 11.3 統計推論的導覽 : 介紹每一種方法的章節 第 11 章假設檢定的介紹第表 11.3 頁 Copyright 2010 Cengage Learning 11.85

公式推導 1. 各種因素決定我們感興趣的參數 ( 例 : 母體平均數 ) 2. 每一個參數有其 最佳 估計量 ( 統計 )( 如樣本平均數 x 3. 統計學有抽樣分配 x z / n 4. 這個公式表示抽樣分配通常是檢定統計的公式 5. 使用一點點的代數, 我們就能從抽樣分配導出信賴區間估計量 x z / 2 n 第 11 章假設檢定的介紹第 417 頁 Copyright 2010 Cengage Learning 11.86