抽樣與抽樣分配 學習目標 第 9 章抽樣與抽樣分配 () 瞭誤差及抽樣誤差之概念 () 瞭影響抽樣誤差之主要因素 (3) 瞭隨機抽樣之概念 (4) 瞭隨機抽樣方法 (5) 瞭抽樣分配之概念 (6) 瞭中央極限定理之概念與應用 /37 /37 大綱 9. 抽樣方法 (/6) 9. 抽樣方法 9. 抽樣分配 9.3 樣本平均數之抽樣分配 9.4 兩樣本平均數差之抽樣分配 9.5 樣本變異數之抽樣分配 9.6 t- 分配 9.7 F- 分配 9.8 結論 誤差 非抽樣誤差 抽樣誤差 在蒐集資料之過程中, 因筆誤 打字錯誤 問卷設計不良 訪問者態度 技巧的差別 受訪者未回卷等一些非抽樣步驟因素造成資料處理錯誤所引起之誤差 由於抽樣方法 抽樣之樣本大小 樣本統計量的選擇方式等因素造成樣本統計量與母體參數之差異 3/37 4/37
9. 抽樣方法 (/6) ( 一 ) 非隨機抽樣法 (o-radom samplig) 統計調查時抽取之樣本並不是依照機率模式設計去抽取, 而是根據個人的意志如自己的專長 知識 研究的目的或考慮資料取得的方便性來選取樣本的方法 ( 二 ) 隨機抽樣法 (radom samplig) 若抽樣之過程符合下列三個條件, 則稱此抽樣方法為隨機抽樣法 : () 母體中之任何一個資料均有被抽出的可能性 () 任一組樣本被抽取之機率均可計算得知 (3) 任一組樣本被抽取之過程均為獨立 5/37 9. 抽樣方法 (3/6) 隨機樣本若 R. V. X, X X 彼此獨立且具有相同之機率分配, 則稱 X X,, 為一組大小為 之隨機樣本, X 以下我們介紹四種常用之隨機抽樣方法 () 簡單隨機抽樣法 (simple radom samplig): 母體中所有可能的樣本, 其被抽出的機率均相等的抽樣方法 一般常用抽籤法及亂數表法兩種方式 抽籤法 : 將母體資料加以編號, 並將號碼放入箱內, 再由箱內抽出所需之樣本 亂數表法 : 依據亂數表的號碼抽取樣本 而亂數表的構成是利用隨機抽取的數字, 然後將抽取的數字依序排列成一隨機數字表 6/37 9. 抽樣方法 (4/6) 9. 抽樣方法 (5/6) () 系統抽樣法 (systematic samplig): 需將母體個數為 N 的資料依序由 至 N 加以編號, 並給定一個抽樣間隔 k, 由編號 至 k 的資料中隨機抽取第一個樣本, 然後再依第一個樣本資料之編號, 每加 k 個單位取一個樣本, 直到編號超過母體個數為止 ; 或每隔 k 個單位時間抽取一個樣本, 直到抽取所需之樣本為止 (3) 分層隨機抽樣 (stratified radom samplig): 將母體按其差異性分為若干個次群體 ( 稱之為層 (stratum), 使得任兩個次群體的交集為空集合, 且所有次群體的聯集為整個母體, 然後在各層中依其母體的比例以簡單隨機抽樣法抽出各層之隨機樣本, 最後將各層之隨機樣本合併起來, 即為一組 分層隨機樣本 7/37 8/37
9. 抽樣方法 (6/6) 9. 抽樣分配 (4) 集群抽樣 (cluster samplig): 將母體依其相似性分成若干的次群體 ( 稱為集群 (cluster)), 使得任兩個次群體的交集為空集合, 且所有次群體的聯集為整個母體, 然後利用簡單隨機抽樣抽出若干集群, 最後再對所抽出的集群 全面調查 定義樣本統計量之機率分配稱之為 抽樣分配 (samplig distributio) 9/37 0/37 9.3 樣本平均數之抽樣分配 (/6) 9.3 樣本平均數之抽樣分配 (/6) ( 一 ) 常態母體 若隨機樣本 X, X,, X 取自於一具有常態分配 N( μ, ) 之母體, 則 R. V. X ~ N( μ, ), i=,,,, 此時 X i 之機率分配可由以下定理得知 定理 9- 若 X, X X 為一組大小為 之隨機樣本 且 R. V. X ~ N( μ, ),i =,,,, i 則 RV.. Y = a X ax a X ~ N aiμ, ai i= i= 定理 9- 若樣本資料 X, X X 取自於一具有常態分配 N( μ, ) 之母體, 則 RV.. X ~ N μ, X 的期望值與變異數, 可直接計算如下 : E( X ) = E( ( X X X ) ) = ( μ ) = μ Var( X ) = Var( ( X X X ) ) = ( ) = /37 /37 3
9.3 樣本平均數之抽樣分配 (3/6) 9.3 樣本平均數之抽樣分配 (4/6) 例題 9. 假設某公司產品重量呈現常態分配, 且其平均重量為 45 公斤, 標準差為 4 公斤 請問, () 隨機抽出 件產品, 重量大於 50 公斤的機率為何? () 隨機抽出 5 件產品為樣本, 其平均重量大於 50 公斤之機率為何? () 令 X 表抽樣所得之產品重量, 則 R. V. X ~ N (45,6 ) 由此可知, 重量大於 50 公斤之機率為 50 45 P( X > 50) = P( Z > ) = P( Z >.5) = 0.056 4 3/37 () 令 X, X X 5 為所抽出之 5 件產品重量, 由假設得知, R. V. X ~ N(45,6) 且 X i, X X 彼此互相獨立, 由定理 9- 得知 6 R. V. X = ( X X X5) ~N 45, 5 因此, 50 45 P( X > 50) = P( Z > ) = P( Z > 6.5) = 0 4 5 4/37 9.3 樣本平均數之抽樣分配 (5/6) 9.3 樣本平均數之抽樣分配 (6/6) 定理 9-3 中央極限定理 定理 9-4 若一組隨機樣本 X, X X 取自於平均數為 μ, 變異 數為 之母體, 且其樣本平均數 X = ( X X X), 則當 時, R. V. Z = ~ N( 0,) 若一離散型隨機變數 X 具有二項分配且 R.V. X ~ b(,p) 當, 則 R. V. ~ N(0,), 其中 μ = p且 = p( p) 5/37 例題 9. 已知某罐裝飲料熱量之平均數 μ=05( 卡 ), 標準差 =4 ( 卡 ) 今隨機抽取 00 瓶此罐裝飲料做檢驗 試問, 此 00 瓶罐裝飲料平均熱量至少 06 卡熱量的機率為何? X 05 利用中央極限定理, R. V. Z = N(0,) 4 00 06 05 因此, P( X 06) = P Z = (.5) 4 00 P Z = P( Z <.5) 0.9938 = 0.006 6/37 4
9.4 兩樣本平均數差之抽樣分配 (/5) 9.4 兩樣本平均數差之抽樣分配 (/5) ( 一 ) 成對樣本當成對樣本之觀測值為 令 {( X, Y ),( X, Y ),,( X, Y )}, 則 D = X Y, i =, i i i R. V. X Y之抽樣分配即為 R. V. D 之抽樣分配, 其中 X = Xi, Y = Y i, D = Di 因此在成對樣 i= i= i= 本條件下, 兩樣本平均數差之抽樣分配可視為單一樣本平均數之抽樣分配 7/37 ( 二 ) 獨立樣本 () 兩母體均為常態分配 由定理 9- 得知 RV.. X ~ N( μ, ) 且 RV.. Y ~ N( μ, ) m 由於 X Y 為兩個常態分配之線性組合, 根據定理 9-, 其平均數與變異數如下 : E( X Y ) = E( X ) E( Y ) = μ μ Var( X Y ) = Var( X ) Var( Y ) = m 由此可知, RV.. X Y ~ N( μ μ,,) m X Y ( μ μ) RV.. Z = ~ m N (0,) 8/37 9.4 兩樣本平均數差之抽樣分配 (3/5) 9.4 兩樣本平均數差之抽樣分配 (4/5) () 兩樣本均為大樣本由中央極限定理得知, 當 且 m, 則 RV.. X ~ N( μ, ) 且 RV.. Y ~ N( μ, ) m 如前所述, RV.. X Y ~ N( μ μ, ) 即 m X Y ( μ μ) RV.. Z = ~ m N (0,) 9/37 例題 9.3 假設有兩條獨立之生產線, 已知兩生產線產品之平均重量分別為 6.5 公克及 6 公克, 標準差分別為 0.9 公克及 0.8 公克, 今隨機由兩生產線分別抽出 36 件及 49 件產品為樣本 請問第一組樣本平均數大於第二組樣本平均數 公克之機率為何? 令 X Y 分別表兩組樣本之平均重量, 則 R. V. X 近似於 N(6.5, 0.8), R. V. Y 近似於 N(6, 0.64) 由此得知 ( X Y ) (6.5 6) R. V. Z = N (0 0.8 0.64 36 49, ) 0/37 5
9.4 兩樣本平均數差之抽樣分配 (5/5) 9.5 樣本變異數之抽樣分配 (/3) 第一組樣本平均數大於第二組樣本平均數 公克之機率為 P( X Y ) = P Z P ( Z.65) = P( Z <.65) 0.9960 = 0.004 (6.5 0.8 36 6) 0.64 49 定理 9-5 假設一組隨機樣本 之母體, 則 卡方分配之臨界值 ( ) S R. V χ α r ( ) 取自一常態分配 X, X,, X N( μ, ) ~ χ ( ) χ α r 若 R. V. X ~ χ ( r), 以 χ ( r ) 來表示隨機變數 X 大於 ( ) α 之機率為 α, 則 P( X χ α ( r)) = α /37 /37 9.5 樣本變異數之抽樣分配 (/3) 9.5 樣本變異數之抽樣分配 (3/3) 例題 9.4 試求出 χ (5) 0.95 及 (5) χ 0.05 利用附表之卡方分配之臨界值表得知, χ 0. 95(5) 表選擇 α = 0.95, v = 5所對應之值, 即 χ0. 95(5) =.455 χ 0. 05(5) 表選擇 α = 0.05, v = 5所對應之值, 即 χ0. 05(5) =.0705 3/37 例題 9.5 某家電公司宣稱其所生產之產品穩定性高 : 產品長度之標準差 毫米 今隨機抽取此公司所製造之產品 0 件作測量, 請在此公司宣稱為真之條件下, 計算此 0 件產品標準差介於中間 95% 機率之範圍為何? ( 假設母體具有常態分配 ) ( 0 ) S 假設此公司宣稱 = 為真時, χ = ~ χ (9) 由此可得有 95% 的機率 9S 介於 χ 0.975(9) 與 χ 0.05 (9) 之間, 即 χ 經查表可得.7004 9S 9.08 0.975(9) χ = 9S χ0.05(9) 抽樣所得之樣本標準差為.5, 因此 9S =0.5 不落在此範圍之內, 由此可知假設錯誤, 即此公司所製造之產品標準差並非 毫米 4/37 6
9.6 t- 分配 (/5) 9.6 t- 分配 (/5) t- 分配 令 Z 為具有標準常態分配之隨機變數且 V 為具有自由度為 v 的卡方分配之隨機變數 若 Z V 為互相獨立, 則稱 Z R. V. T = V v 為具有自由度 v 之 t- 分配或 Studet t- 分配, 一般以 R.V.T~t(v) 表之 其機率密度函數為 v v Γ t f ( t) =, < t < v Γ v πv 5/37 定理 9-6 若 X X,, 為取自於常態母體之隨機樣本,, 且 X, S 分別為此樣本之平均數與變異數, 則 RV.. T = ~ t( ) S t- 分配具有以下特性 : ( ) X () 若 R. V. T ~ t v, 則 P( t ( v) < T < t ( v)) = α () P( T < t ( v)) = P( T > t ( v)), 即 t ( v) = t ( v) α α α α α α 6/37 9.6 t- 分配 (3/5) 9.6 t- 分配 (4/5) 例題 9.6 假設隨機變數 T 具有自由度為 0 之 t - 分配, () 求 P(T>.8)=? () 求 k 使得 P(T>k)=0.0? (3) 求 k 使得 P(-k<T<k)=0.95? () 由附表之 t - 分配之臨界值表得知, 當自由度 d.f.=v=0, α = 0.05 時, t0.05(0) =.8, 即 PT ( >.8) = 0.05 () 當自由度 d.f.=v=0, α = 0.0 時, t0.0(0) =.764, 即 PT ( >.764) = 0.0 因此,k =.764 (3) 由 t- 分配之對稱性得知,0.95 = P(- k < T < k) = - P( T > k) PT ( > k) = 0.05, k=.8 例題 9.7 假設某廠牌行動電話之重量呈現常態分配, 今此廠商宣稱其平均重量為 78 公克, 標準差 4 公克, 倘若隨機抽取此廠牌行動電話 0 支, 請問此 0 支行動電話平均重量介於中間 95% 機率之範圍為何? 在母體為常態, 未知條件下, ~ t S X 78 假設此廠商宣稱 μ = 78公克為真時, T = ~ t () 9 4 0 查表得知 7/37 8/37 ( ) 7
9.6 t- 分配 (5/5) 9.7 F- 分配 (/4) 由此可得有 95% 的機率 T 介於 t 0.05 (9) 與 t 0.05 (9) 之間, 即 X 78 t0.05( 9) = t0.975(9) t0. 05(9) 4 0 經查表可得 X 78.6.6 4 0 X 78 80 78 而抽樣所得結果 X, 即 = =. 58 4 0 4 0 落在 -.6 至.6 之中, 因此我們有理由相信此廠商之宣稱 9/37 F- 分配 令 U V 分別為具有自由度 u 及 v 之卡方分配的隨機變數且 U V 互相獨立, 則稱隨機變數 U / u W = 具有自由度 V / v ( u, v) 之 F- 分配 一般以 R. V. W ~ F( u, v) 表之, 其機率 密度函數為 f ( x) u u u v u Γ x v, 0 < x < = u v u v u Γ Γ x v 30/37 9.7 F- 分配 (/4) 9.7 F- 分配 (3/4) 定理 9-7 定理 9-8 若 R. V. X ~ F ( u, v), 則 R. V. ~ F ( v, u ) X S S 令 分別表兩常態母體之變異數且 分 別表取自於此兩母體之樣本變異數且其樣本個數分別 為 及 m, 則 S W = S / / 具有自由度 (, m ) 之 F- 分配 例題 9.8 若 R.V.X~F(3,9), 求 k 使得 P X > k ) = 0.05 即求 f (3,9) 由附表之 F- 分配之臨界值表得知, ( 0.05 由此可得 v =3,v =9 所對應之位置,f 0.05 (3,9)=3.866, 即 k = f (3, 0.05 9) = 3.866 3/37 3/37 8
9.7 F- 分配 (4/4) 9.8 結論 (/4) 定理 9-9 f ( v, v ) α = f ( v, v ) 例題 9.9 若 R.V.X~F(3,9), 求 k 使得 P( X > k ) = 0.99 k = f0.99(3, 9) = = = 0.0366 f (9, 3) 7.345 0.0 α 單一樣本平均數之抽樣分配 : ( 一 ) 母體為常態 已知 RV.. X ~ N( μ, ) 或 RV.. Z = ~ N(0,) ( 二 ) 母體為常態 未知 RV.. T = ~ t( ) s 33/37 34/37 9.8 結論 (/4) 9.8 結論 (3/4) ( 三 ) 大樣本 已知 RV.. X N( μ, ) 或 ( 四 ) 大樣本 未知 s R. V. X N( μ, ) 或 R. V. Z = N(0,) R. V. Z = N(0,) s 兩樣本平均數之抽樣分配 : () 成對樣本 : 抽樣分配可視為單一樣本平均數之抽樣分配, 其結果同上述之單一樣本平均數之抽樣分配 () 獨立樣本 : 當變異數已知時, 若兩母體均為常態分配或大樣本時, ( X Y ) ( μ μ) RV.. X Y ~ N( μ μ, ) 或 RV.. Z = ~ N(0,) m m 35/37 36/37 9
9.8 結論 (4/4) 樣本變異數之抽樣分配 : 單一樣本變異數之抽樣分配或是兩樣本變異數比之抽樣分配均需假設在常態母體條件下進行 : () 單一樣本變異數之抽樣分配為 ( ) S R. V. χ = ~ χ ( ) () 兩樣本變異數比之抽樣分配為. S RV. F = ~ F m S (, ) 37/37 0