Chapter 假設檢定 - Chapter 假設檢定. 假設檢定之概念 統計推論中之假設檢定 (testing hypothesis), 是對母體中某些參數之可能值為對或錯之假設或敘述, 利用抽樣的様本資料或實驗結果, 再透過機率原理作出拒絕或不拒絕該假設之過程, 亦稱之為顯著性檢定 (testing of significance) 一 基本觀念 在假設檢定中有二種假設要判斷, 其中一種假設稱之為虛無假設 (null hypothesis), 而另一種則稱為對立或對抗假設 (alternative hypothesis) 茲將其意義定義如下 定義 在統計假設檢定中, 欲否定的假設稱之為虛無假設, 其為一種暫時性的假設, 通常以 H 表示 ; 而否定虛無假設而被認為對的假設, 稱之為對立假設, 以 H 或 H a 表示 一般在定義 中的假設檢定中, 又可依其所討論假設中參數的可能數值多寡, 而將其分為簡單假設 (simple hypothesis) 與複合假設 (composite hypothesis) 兩大類 ( 見圖 -)
-2 統計學 ( 下 ) 定義 2 簡單假設是指虛無假設與對立假設中皆只含有一個參數的特定數值的假設 ; 而所謂複合假設, 是指虛無假設與對立假設中, 參數的假設所含數值並不只一個數值的假設 例如, H p =.5 ; H p =.2 或 H θ = ; H θ = 5 皆屬於簡單假設, 其實簡單假設亦可指為能完全確定某機率分配之假設 一般而言若一個假設並非簡單假設, 即表示其為複合假設, 例如 H µ = 8 ; H µ 8 假設檢定 簡單假設 H θ = θ ; H θ = θ 複合假設 單尾對立假設 右尾對立假設檢定 左尾對立假設檢定 H H H H θ = θ ; H θ > θ θ θ ; H θ > θ θ = θ ; H θ < θ θ θ ; H θ < θ 雙尾對立假設 H θ = θ ; H θ θ 圖 - 假設檢定之型態在圖 - 中, 可發現單尾對立假設 (one-tailed test) 又分為 H θ > θ 及 H θ < θ兩種 通常對立假設 H 在右端者 ( 即 H θ > θ), 稱之為右尾對立假設檢定, 簡稱為右尾檢定 (right-tailed test); 相反的, 當對立假設 H 在左端者 ( 即 H θ < θ), 稱之為左尾對立假設檢定, 簡稱為左尾檢定 (left-tailed test); 而對立假設 H 在雙邊者 ( 即 H θ θ), 稱之為雙尾檢定 (two-tailed test) 定義 3 拒絕域 (reject region) 或稱之為危險域 (critical region) 是指其為樣本空間中某些數值的集合, 而且會導致否定虛無假設的集合, 常以 C 或 CR 表示之
Chapter 假設檢定 -3 二 兩種類別誤差及風險 誤差的類別 假設檢定是由抽出的樣本資料去判斷 H 及 H 兩種假設之真偽, 但由於抽樣可能造成樣本偏差, 而導致作出錯誤決策, 此錯誤之決策有兩種, 分別稱之為型 Ⅰ 誤差 (type I error) 及型 Ⅱ 誤差 (type II error), 見圖 -2 檢定結果 真實情況 H 不真 H 為真 H 為真 ) ( 定義 4 不拒絕 H 正確結論型 Ⅱ 誤差 拒絕 H 型 Ⅰ 誤差正確結論 圖 -2 兩種誤差之觀念 當虛無假設 H 為真時, 此檢定的結果卻拒絕虛無假設, 稱之為型 Ⅰ 誤差 ; 而當虛無假設 H 不真 ( 或 H 為真 ) 時, 此檢定之結果卻不拒絕虛無假設, 稱之為型 Ⅱ 誤差 誤差的機率 在定義 4 中所敘述的兩種誤差, 其發生機率稱之為風險, 其中型 Ⅰ 誤差之機率稱為 α 風險, 而型 Ⅱ 誤差之機率稱為 β 風險 今將其分別定義如下 定義 5 型 Ⅰ 誤差發生的機率以 α 表示, 稱之為 α 風險, 其機率的表示為 α = P( 拒絕 H H 為真 ) = P( 落入 C中 H 為真 )
-4 統計學 ( 下 ) 而型 Ⅱ 誤差發生的機率以 β 表示, 稱之為 β 風險, 其機率的表示為 β = P( 不拒絕 H H 為真 ) = P( 未落入 C中 H 為真 ) 定義 6 在所有型 Ⅰ 誤差機率中, 發生機率最大者稱為顯著水準 (level of significance), 又稱之為檢定的大小 (size of test), 它是在檢定中可容忍的最大型 Ⅰ 誤差機率, 通常以 α 表示 茲舉數例來說明定義 5 之觀念及其機率的計算 在母體為常態分配 N ( µ, σ 2 ) 的假設下, 請回答下列有關型一誤差 (type I error) 與型二誤差 (type II error) 的問題單邊檢定 (one-sided test) H µ 25 H µ > 25 樣本數 n = 8, 標準差 σ = 8, 決策規則 (decision rule) 是 如果 X 27.56, 接受 H ( µ 25) ; 如果 X > 27.56, 拒絕 H 試問 若 µ = 24, 根據上述決策規則, 犯型一誤差之機率為何? 若 µ = 25, 根據上述決策規則, 犯型一誤差之機率為何? 若 µ = 29, 根據上述決策規則, 犯型二誤差之機率為何? ( 交大管科 元智資管 ) X µ 27.56 24 α = PX ( > 27.56 µ = 24) = P > σ n 8 8 = PZ ( >.78) =.375
X µ 27.56 25 α = PX ( > 27.56 µ = 25) = P > σ n 8 8 = PZ ( >.28) =.3 X µ 27.56 29 β = PX ( 27.56 µ = 29) = P σ n 8 8 = PZ (.72) =.2358 2 Chapter 假設檢定 -5 An urn contains chips. An unknown number of the chips are white; the others are red. We wish to test H exactly half the chips are white versus H more than half the chips are white. We draw, without replacement, three chips and reject H if two or more are white. Find the type I error rate. Find type II error rate when the urn is 7% white. (98 交大管科 2%) 令 θ 為白色籌碼個數, 則 H θ = ; H θ > 5 5 令隨機變數 X 表示抽出白色個數, 且 C = { X X 2}, 故 5 5 5 5 2 3 α = P(I) = P( X 2 θ = 5) = + =.5 3 3 7 3 7 3 3 2 β = P(II) = P( X < 2 θ = 7) = + =.833 3 3
-6 統計學 ( 下 ) 3 Suppose the p.d.f. of a random variable x is f( x) / c, where x c. We are to test the null hypothesis H c versus the 2 alternative hypothesis H c 3. If we draw an observation of x and reject H if the drawn x 3/5, then What is the probability of committing type Ⅰ error? What is the probability of committing type Ⅱ error? 3 因危險域 C X X, 故型 Ⅰ 誤差機率為 5 3 2 x 7 P X c 2 3 dx 5 5 2 2 型 Ⅱ 誤差機率為 3 3 x P 3 5 X c dx 5 3 3 5 2 3 5 3 5 (3 中央財金 2%) 定義 7 在品質管制內容中, 一般所謂生產者風險及消費者風險之意義如下 生產者風險 (producer s risk) 即表示生產者所生產的產品多數為良 品, 但經抽樣檢驗後卻誤判為不良品, 因而被拒收的機率, 稱之為生產者風險, 以 表示 消費者風險 (consumer s risk) 即表示生產者所生產的產品大多數為不良品, 但經抽樣檢驗後卻誤判為良品, 因而被接受的機率, 稱之為消費者風險, 以 表示
4 Chapter 假設檢定 -7 Suppose we receive a shipment of 2 items. If our AQL (Acceptable Quality Level) =.2, LTPD (Lot Tolerance Percent Defective) =.5, and our sampling plan is (sample size n = 25, the number of defectives is or less, we accept the shipment). Compute the producer s risk and consumer s risk. ( 政大企管 2%) 設隨機變數 X 表示抽中不良品之個數, 且 X 接受該批產品 生產者風險為 α = PX ( > p=.2) = 25 消費者風險為 4 96 x 25 x 2 25 x 25 x (.2) (.98) =.886 x β = PX ( p=.5) = 5 9 x 25 x 2 25 25 (.5) x (.95) 25 x =.6424 x A book dealer received a lot of,5 books from a printer. The dealer plans to sample 2 books and use single-sample acceptance sampling to reach a decision about the lot. If more than one book is defective, the dealer will reject the lot. Suppose the printer is fairly certain that only 3% of the books are defective. What is the
-8 統計學 ( 下 ) producer s risk? Suppose 2% of the lot of books is defective and that this rate would be too high for the dealer to accept. What is the dealer s risk in using this acceptance sampling? (98 中山財管 4%) 令隨機變數 X 表示不良品個數, 且危險域為 C { X X }, 故生產者風險為 45 455 x 2 x PX ( p.3) x 5 2 2 x 2 x (.3) (.97).486 x x 消費者風險, 為 8 32 x 2 x PX ( p.2) x 5 2 2 2 (.2) x (.88) x.5686 x x 三 檢定力函數及作業特性函數 檢定力函數 檢定力函數 (power function) 及作業特性函數 (operating characteristic function) 在假設檢定中, 分別指拒絕 H 及不拒絕 H 的機率, 它可將兩種誤差機率作整合, 並藉此二種函數作為討論假設檢定的基礎, 茲將其定義如下
Chapter 假設檢定 -9 定義 8 檢定虛無假設 H 及對立假設 H 的檢定力函數, 是指抽樣後樣本資料所計算之統計量值落入危險域 C 之機率 換句話說, 檢定力函數乃是指在不同參數下, 拒絕虛無假設之機率, 常以 PF( θ ) 或 K( θ ) 表示, 即 K( θ ) = P ( 拒絕 H θ ) = P ( 落入 C 中 θ ) 而此檢定力函數之圖形稱為檢定力曲線 (power curve) Remark 在定義 8 中, 可將檢定力函數寫為 αθ ( ), 當 θ H K( θ ) = βθ ( ), 當 θ H 其中 β ( θ ) 稱為在 θ H時, 該點下之檢定力 (power) 所謂檢定力是指在 H 為真 ( θ H ) 下, 此檢定之決策規則 C 能查覺虛無假設 H 為錯誤之能力, 亦即 β = P( Θ ˆ C θ H ) 6 茲以例題 為例 試寫出此檢定之檢定力函數, 並繪檢定力曲線 若樣本數 n 不變, 而危險域改為 = { > 27} C X X, 試問此曲線如何變動 ( 不用計算 ), 請約略繪在同一圖中 若危險域不變, 將 n 變大, 試問曲線如何變動? 檢定力函數為 K( µ ) = P( X > 27.56 µ ) 27.56 µ 27.56 µ = P Z > = P Z > 8 8 2
- 統計學 ( 下 ) 今將 µ 在 24, 25, 26, 27, 28, 29, 3, 3 各點之值分別計算於下表中 µ µ z = 27.56 2 K( µ ) = P( Z > z ) 24.78.375 25.28.3 26.78.277 27.28.3897 28.22.587 29.72.7642 3.22.8888 3.72.9573 故知檢定力曲線 ( 實線部分 ) 為 K(µ).9.8.7.6.5.4.3.2. c 2 24 25 26 27 28 29 3 3 若危險域改為 C { X X 27} = >, 則 K ( µ ) 變大, 因此檢定力曲線上 移至在上圖虛線部分 C = X X > 27.56 不變, 而樣本數 n 變大, 則檢定力曲 線為下圖虛線部分 若危險域 { } c l µ
Chapter 假設檢定 - K(µ).9.8.7.6.5.4.3.2. c 2 24 25 26 27 28 29 3 3 27.56 c l µ Remark 由例題 6 可知下列結論 在 n 固定下, 危險域 C 變大則 α 風險變大, 但 β 風險變小, 而危險域 C 變小則 α 變小, 但 β 變大, 且 α + β 顯著水準發生在虛無假設 H 中等號部分 若要同時減少 α,β 時, 可增加樣本數 7 In testing H µ = 2 versus H a µ > 2 with α =.5, based on a sample of n = 3, the sample mean and standard deviation were given as x = 23 and s = 5. What would you expect to happen if the power curve moves from curve A to curve B? and what would be the stories if it moves from C to D? A B C µ D µ ( 清大工工 )
-2 統計學 ( 下 ) 當圖形由 A 移動到 B, 則表示危險域的範圍變小 當圖形由 C 移動到 D, 則表示樣本數增加 作業特性函數 在定義 8 中是計算拒絕虛無假設的機率, 今若將拒絕的機率改為不拒絕虛無假設的機率時, 則此函數即稱為作業特性函數, 其圖形和檢定力曲線圖形剛好相反, 稱之為作業特性曲線 (operating characteristic curve) 定義 9 檢定虛無假設 H 及對立假設 H 的作業特性函數, 是指樣本所計算出來之統計量值未落入危險域 C 之值, 亦即在不同 θ 值下, 不拒絕 H 之機率, 常以 OC( θ ) 表示, 即 OC( θ ) = P ( 不拒絕 H θ ) = P ( 未落入 C 中 θ ) 而作業特性函數之圖形稱之為作業特性曲線 (OC curve) Remark 在定義 9 中, 可將作業特性函數寫為 αθ ( ), θ H OC( θ ) = βθ ( ), θ H 在定義 8 及 9 之檢定力曲線及作業特性曲線中, 若僅將 α 及 β 兩部分畫出之曲線, 即稱為錯誤曲線 (error curve) 8 請繪例題 6 之作業特性曲線及錯誤曲線
Chapter 假設檢定 -3 因作業特性函數為 OC( µ ) = P( X 27.56 µ ) X µ 27.56 µ = P σ n 8 8 27.56 µ = P Z 2 且在不同 µ 之下之機率值計算如下, 即 故知作業特性曲線為 OC(µ).9.8.7.6.5.4.3.2. 且錯誤曲線為 µ µ z = 27.56 2 OC( µ ) = P( Z z) 24.78.9625 25.28.8997 26.78.7823 27.28.63 28.22.429 29.72.2358 3.22.2 3.72.427 24 25 26 27 28 29 3 3 µ
-4 統計學 ( 下 ).9.8.7.6.5.4.3.2. 24 25 26 27 28 29 3 3 µ 9 A manufacturing firm evaluates incoming components using the single sampling plan. The single sampling plan has a lot of size N =,, a sample size n=, and an acceptance number c = 2. Construct the operating characteristic curve using six points p =.,.2,.3,.4,.5 and.6. ( 政大企管 25%) 令隨機變數 X 表示抽中不良品個數, 且 X 2 時接受該批產品, 因此作業特性函數為 p p 2 x x OC( p) = P( X 2 P = p) = 2 2 x p x x ( p) e p ( p) x x! 又在不同參數值 p 之下, 其機率分別為 e OC(.) =.92 2 x x! 2 x 2 2 e OC(.2) =.677 x!
Chapter 假設檢定 -5 2 x 3 3 e OC(.3) =.423 x! 2 x 4 4 e OC(.4) =.238 x! 2 x 5 5 e OC(.5) =.25 x! 2 x 6 6 e OC(.6) =.62 x! 故知作業特性曲線為 OC(P).9.8.7.6.5.4.3.2...2.3.4.5.6 P 四 檢定步驟及檢定之危險域 檢定之步驟 通常完成一個假設檢定之過程可依下列步驟 建立虛無假設 H 及對立假設 H 選擇適當之顯著水準 α 找出此檢定之統計量及危險域 利用樣本資料計算統計量之值 作結論 ; 若 之結果落入危險域則拒絕 H, 否則不拒絕 H
-6 統計學 ( 下 ) Remark 要如何建立虛無假設及對立假設要看問題而定, 通常可將下列之假設放至 H 欲否定之敘述或含有等號之敘述 在檢定認錯後, 將嚴重性較大者放 H 危險域之尋找 假設檢定中最重要的就是尋找此檢定之統計量與危險域 由於在 n 固定下危險域之大小會影響兩種誤差機率之變動, 因此尋找危險域是以控制較嚴重之 α 風險為目標, 也就是要尋找一個危險域使得其型 Ⅰ 誤差發生機率不超過可容忍風險 α, 又能使 β 風險達到最小 Remark 找危險域 C 之原則為先滿足 P(I) = P( Θ ˆ C θ H) α, 再滿足 min P(II) = min P( Θ ˆ C θ H ) List the five basic procedures in performing a hypothesis test! ( 輔大管理 %) 見上述檢定之五個步驟.2 單一母體平均數 µ 之檢定問題 一 µ 之檢定 以常態分配處理 利用常態分配解決 µ 之檢定問題的條件 若母體分配未知, 但樣本數 n > 3 時, 可利用常態分配處理, 且若