10 學習目的 1. 瞭解抽樣的意義以及抽樣的重要性. 瞭解抽樣誤差與非機率誤差 3. 知悉樣本大小 抽樣成本和抽樣誤差的關係 4. 瞭解 5. 瞭解樣本統計量 : 樣本平均數 樣本比例的的形狀及其平均數 變異數的計算 6. 瞭解及其應用 7. 瞭解其他抽樣方法 8. 利用 Ecel 來做抽樣 本章結構 抽樣的重要性抽樣誤差與非抽樣誤差抽樣成本與抽樣誤差抽樣單位與抽樣底冊 的方法的實施方法 母體分配抽樣誤差與非抽樣誤差樣本平均數的平均數與變異數 常態母體樣本平均數的 樣本平均數的應用 其他 樣本比例的 母體比例與樣本比例 樣本比例的平均數與變異數 樣本比例的情形 樣本比例的應用 Ece l 的使用 抽樣的重要性 人們在研究某些問題或現象時, 有時並不直接探討母體, 而係經由對樣本的研究分析, 以獲致某些樣本統計量, 然後再利用這些樣本統計量去推測母體的參數, 主要是因為 : 有限的資源, 毀壞性的實驗, 概念性的母體, 無法全部觀察, 樣本較母體小, 在資料搜集與整理時較容易且較精確 統計推論係利用樣本統計量去推論母體的特質, 而樣本是否具有代表性會受抽樣方法的影響, 因此抽樣方法非常重要 相 0.4 對 0.35 次數 0.3 0.5 0. 0.15 0.1 0.05 0 圖 10.1 等待看牙時間 ( 母體 0 10 0 30 40 50 60 候診時間 1-1 圖 10. 等待看牙時間 ( 樣本 1 10.3 等待看牙時間 ( 樣本 抽樣誤差抽樣誤差是樣本統計量與相對應的母體參數間的差異 此種差異來自抽樣過程的機遇 (chace, 抽樣方法及推論方法的不同 非抽樣誤差 非抽樣誤差主要來自調查時的執行與事後在記錄 整理資料時所發生的錯誤 1
圖 10.4 抽樣誤差與非抽樣誤差 圖 10.5 資料搜集成本與抽樣誤差 樣本統計量非抽樣誤差 估計誤差 母體參數 抽樣誤差 成本 ( 最小成本 抽樣總成本 E 蒐集樣本成本 時資的料疏整失理 抽樣方法 推論方法 樣本數 0 最適樣本數 抽樣誤差成本 樣本數 抽樣單位與抽樣底冊 抽樣單位是抽樣母體中的一個母體元素或一祖母體元素 抽樣底冊是抽樣單位的名冊或一覽表 的意義是抽樣母體中所有可能被抽出的樣本組被抽出的機率均相等的抽樣方法 的實施方式 抽籤式 以亂數表抽取樣本 用電腦做隨機抽樣 表 10.1 亂數表 圖 10.6 數列對話方塊 1 3 4 5 6 7 8 9 10 1 684 7709 3937 389 9545 060 3904 503 6590 8769 037 7574 8607 150 4776 0944 4946 1519 4834 810 3 1336 8960 19 713 967 46 6070 7664 7690 3873 4 6840 3016 3991 858 1813 001 3781 8635 086 393 5 5577 745 9477 794 738 08 7876 6379 9014 6845 6 3495 3500 9497 8688 7764 0017 11 5816 8840 8573 7 5163 517 5955 786 098 3563 7783 1575 7738 9146 8 3746 5767 5137 3846 9113 3394 517 3745 574 575 9 0596 6736 473 7665 89 6933 6510 0093 4091 4567 10 6553 467 4071 353 0593 3874 5368 595 6303 69
圖 10.7 隨機抽樣對話方塊 圖 10.8 亂數產生器對話方塊 母體參數母體參數是描述母體資料特性的統計測量數, 一般簡稱為參數或母數 參數是我們想要獲取的, 是統計的核心 樣本統計量樣本統計量為樣本的實數函數 樣本統計量為隨機樣本的函數, 而隨機樣本是由 個隨機變數 ( 1,, L 所組成的, 故樣本統計量亦為一隨機變數, 其機率分配稱為 母體分配 母體分配是母體元素的機率分配 表 10. 展示小姐月薪的次數分配 表 10.3 展示小姐月薪的母體機率分配 3
0.50 f ( 0.40 0.30 0.0 圖 10.9 展示小姐月薪的母體機率分配 = 6, =.757 設母體為隨機變數, 其機率分配為 f (, 若自母體中簡單隨機抽取 個元素為一組樣本, 表為 ( 1,,...,, 若令 = i i= 1, 則 為樣本平均數 其機率分配表為 f (, 稱為 0.10 0.00 4 6 8 30 圖 10.10 表 10.4 樣本平均數的機率分配 所有可能樣本 所有樣本平均數 母體 N 抽樣 1 S1 : S 1 : : S : 1 : C Ν 1= = Ν C = 圖 10.11 展示小姐月薪的抽樣 表 10.5 展示小姐月薪的樣本平均數 4
表 10.6 展示小姐的月薪的 圖 10.1 展示小姐的月薪圖 f ( 0.50 0.40 E ( = 6, V ( = 1.668 0.30 0.0 0.10 0.00 4 5 6 7 8 的平均數與變異數 的平均數與變異數稱為 的平均數與變異 數 以符號 或 E ( 及 或 V ( 分別表示 的平均數 的平均數等於母體平均數, 即 E ( = = 樣本平均數的平均數與變異數 無限母體樣本平均數的變異數 ( 與標準差 ( = V ( = = 有限母體抽出不放回樣本平均數的變異數 ( 與標準差 ( N = V ( = N 1 = V ( = N N 1 樣本平均數的形狀 常態母體 的若母體為常態分配, 平均數為, 標準差為, 則不論樣本數為何, 樣本平均數 的亦為常態分配, 其平均數和標準差分別為 : =, = ( 非常態母體 的 無論母體為何種分配, 自母體簡單隨機抽取 個為一組樣本, 若樣本數 夠大 ( 一般認為 30, 則會趨近於常態分配, 即 : ~ N(, ( 非常態母體 的 無論母體為何種分配, 自母體簡單隨機抽取 個為一組樣本, 若樣本數 夠大 ( 一般認為 30, 則會趨近於常態分配, 即 : ~ N (, 5
. 母體分配 圖 10.13 母體分配 =5 圖 10.13 ( 續 =5 =10 =10 圖 10.13 ( 續 =30 =30 樣本平均數的形狀 應用的注意事項 一般而言, 不論母體為何種分配, 當 30 時, 漸趨於常態分配 可適用於樣本統計量為隨機樣本 ( 1,, L, 線性函數的情況 =50 =50 若母體為非常態分配雖是大樣本, 則其不是常態分配, 而是近似常態分配 僅適用於大樣本 u 樣本比例的 表 10.7 的 樣本母體分配大樣本母體為常態分配 ( 30 ~ N(, 母體非常態分配 ~ N(, 小樣本母體為常態分配 ( < 30 ~ N(, 母體非常態分配 的分配決定於母體分配 註 : 若母體為有限母體, 且 N > 005., N 則 V( = N 1 若母體為有限母體, 且 / N > 005,. 則 不一定為常態分配, 因 ( 1, L, 不獨立 圖 10.14 點二項分配 6
圖 10.15 樣本平均數的抽樣 表 10.8 100 組樣本平均數 樣本比例的 表 10.9 母體比例 p = K / N N: 母體個數,K: 母體中 A 類別的個數 樣本比例 k i= 1 pˆ = = 樣本比例的平均數 E( pˆ p = p = ˆ i 樣本比例的 樣本比例的 樣本比例的變異數與標準差 無限母體 V ( pˆ p = = ˆ p ˆ = pˆ = 有限母體 pq pq pq N V ( pˆ = pˆ = N 1 p ˆ = pq N N 1 大樣本 ( p > 5 及 q > 5 樣本比例的 依據, 當大樣本時, pˆ 的會趨近常態分配 : pq pˆ ~ N ( p, 小樣本樣本比例的 無限母體 有限母體 ( / N 0. 05 pq p ˆ ~ 二項分配 ( p, p ˆ ~ 超幾何分配 ( p, pq N N 1 7
分層抽樣 分層抽樣 分層抽樣的意義分層抽樣是將母體依其特性或依與調查目的有關的性質分成幾個類或組, 母體中的每一個個體或元素都屬於其中的一層, 而且是唯一的一層 分層之後再從各層中簡單隨機抽取樣本 圖 10.16 分層抽樣方法 - 比例抽樣 第一層第二層第 K 層 1 k 樣本 部落抽樣 部落抽樣 部落抽樣的意義 圖 10.17 部落抽樣法 部落抽樣是先將母體中相鄰的某些群體劃分為 個不同的部落 (cluster, 母體中的每一個元素均屬於其中的一個部落, 且是唯一的一個部落 然後再從這些部落中隨機抽取部落, 並對抽出的部落進行普查的抽樣方法, 又稱集團抽樣 第一部落 第二部落 母體 第 K 部落 樣本 隨機抽取 系統抽樣 系統抽樣 系統抽樣的意義 系統抽樣法是自母體自然隨機排列的資料中, 每隔一定間隔選取一個樣本, 直至抽滿 個樣本為止 圖 10.18 系統抽樣法 母體 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 17 18...k (k+1 (k+...n 6 1 18 樣本 8
系統抽樣 分段抽樣 圖 10.19 系統抽樣對話方塊 分段抽樣的意義分段抽樣法是將母體按照某些特性或某種分類標準分為數個部落或層別, 先由這些部落或層別中抽出幾個部落或層別, 此為第一段 然後再由已經抽出的部落或層別, 依特性或分類標準再抽出部落或層別, 此為第二階段, 如此依序為之, 最後再依隨機或系統或其它方法抽出樣本 分段抽樣 分段抽樣 圖 10.0 分段抽樣法 失業率的抽樣調查 母體 抽樣? 寄送名冊? 縣市實地? 訪查初審 調查表回收複審? 電腦人工檢誤? 母體推計? 統計分析? 結果發布 ( 日 ( 每月下 ( 次月初 : 部落抽樣或分層抽樣 ( 每年 ( 每半年 旬 : 縣市電 主計處不 一次 一次 話控制抽 定期控制 查 抽查 部落抽樣或分層抽樣 樣本 非機率抽樣法 判斷抽樣法統計人員或調查研究人員根據自己的專長 知識 研究的目的來選取代表性的樣本, 此種抽樣方法稱為判斷抽樣法, 又稱為目的抽樣法 方便抽樣法方便抽樣法是調查研究人員以現有的或方便取得的方式來抽取樣本的方法 表 10.10 全家便利超商顧客的消費金額抽樣 9
表 10.11 下午和晚上顧客消費金額 10