第八章 抽樣
第一節 抽樣的涵義 一 樣本與母群二 調查與普查三 抽樣的定義與目的四 抽樣的步驟 可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 抽樣可分成機率抽樣 (probability sampling) 與非機率抽樣 (nonprobability sampling) 二種 機率抽樣步驟 : ( 一 ) 確定母群的範圍 ( 二 ) 備妥抽樣架構 ( 三 ) 決定樣本大小 ( 四 ) 選擇適切的抽樣方法
抽樣的基本概念 抽樣是從較大團體 ( 抽樣母群體 ) 中選擇部分個體 ( 樣本 ) 的過程, 並作為估計或預測此一較大團體的事實 情況或結果的基礎
抽樣的概念 抽樣母體群 樣本 計算樣本統計量
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 一 基本概念 1. 母體 (population) 2. 基本單位 3. 樣本 (sample) 所要研究的對象, 它是具有某種共同特性所組成的一個群體 可以人或一群事物, 如某工廠出產的產品 指母體中的個別份子, 根據抽樣調查目的而決定, 不受抽樣設計之影響, 一項調查可以有兩種以上的基本單位 母體的一部份, 必需具有代表性 4. 母數 (parameter) 又稱為參數, 代表母體某一屬性 (atttribute) 或變數的數值, 如母體的平均數和標準差
一 基本概念 可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 5. 統計值 (statistic) 又稱估計值 (estimate), 係根據樣本資料求得, 用以估計母數的數值 6. 抽樣構架指抽樣過程中可供選擇之所有單位的名冊 (sampling frame) 7. 抽樣偏差 (sampling bias) 8. 抽樣誤差 (sampling error) 抽樣有時會有抽到或抽不到某些具有特殊特徵之基本單位的傾向 指樣本中包含某些特殊的基本單位, 因而破壞了樣本的代表性 其原因有二 : 一是抽樣偏差 ; 二是運氣
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 二 抽樣構架 Yates 五項評估抽樣構架的標準 : 1. 足夠 : 包括調查所需的母體 2. 完整 : 包括母體中所有單位 3. 不重複 : 基本單位不應在同一構架中重複出現 4. 正確 : 樣本單位必須力求正確 5. 便利 : 抽樣構架應易於取得 易於使用, 且可配合抽樣目的作適當調整
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 三 抽樣原因 1. 經濟 2. 時效 3. 無法普查 ( 難以接觸 ) 4. 毀滅性之避免
四 抽樣程序 可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 界定母體 ( 特徵 / 屬性 ) 確定抽樣構架 ( 名單 / 索引 ) 選擇抽樣方法 : 機率 / 非機率 決定樣本大小 ( 抽樣誤差之容忍度 ) 選出樣單位 收集樣本資料 評估抽樣結果
抽樣方法 可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 一 非隨機抽樣法 1 方便抽樣法 2 判斷抽樣法二 隨機抽樣法 1 簡單隨機抽樣法(simple random sampling) 2 分層抽樣法(stratified sampling) 3 群落抽樣法(clustered sampling) 4 系統抽樣法(systematic sampling)
抽樣的型態 隨機 / 機率抽樣非隨機 / 機率抽樣混合抽樣 定額抽樣 系統抽樣 簡單隨機抽樣 分層隨機抽樣 叢集抽樣 立意抽樣 偶遇抽樣 分層比例抽樣 單一階段 滾雪球抽樣 分層非比例抽樣 雙階段 多階段
貳 機率抽樣 可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 種類方法 / 過程適用情形 / 考慮因素 / 例子優 / 缺點 簡單隨機抽樣 (simple random sampling) 1. 摸彩法 2. 亂數法 適用情形 1. 母體小 2. 令人滿意的母體名冊 3. 單位成本不受距離影響 4. 除母體名冊外, 無其他訊息 1. 成本高 2. 母體名冊不易取得 3. 統計效率 系統抽樣 / 準隨機抽樣 (systematic or quasi-random) 1. 將樣本單位編號, 並計算樣區間 (N/n) 2. 從 1 到 N/n 號碼隨機選出一號碼作為第一個樣本單位 3. 將第一個樣單位加上樣區間即為第二個樣單位, 直到樣本數夠為止 例子如 : 母體為 2000 家零售店, 樣本大小為 100 家商店, 則樣本區間為 20, 假設從 1~20 中抽出 03, 則樣本單位為 3, 23, 43,. 當樣本單位之排列, 對, 所要研究之特徵而言, 為隨機的, 則結果將非常接近 簡單隨機抽樣
貳 機率抽樣 可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 種類方法 / 過程適用情形 / 考慮因素 / 例子優 / 缺點 分層抽樣 ( stratified ) 1. 將母體分成互斥之若干組 2. 再從各層中隨機抽取預計之單位數為樣本 考慮因素 1. 分層基礎 ( 層人樣本單位儘量同質 ; 各層平均差異儘量擴大 ) 2. 分層數目 ( 估計單一母數 6) 3. 等比例 ( 可避免各層抽過多或過少, 進而減低抽樣誤差 ) 或不等例樣本 ( 層內變異較大者抽較多 ; 變異較小者抽較少 ) 1. 可靠性高 2. 利於比較 ( 因各層分別獨立抽樣 ) 集群抽樣 ( cluster ) 1. 將母體分成互斥之若干組 2. 隨機抽一群或幾群作為樣本群 3. 把抽出之樣本群的所有單位都當作樣本 : 一階段集群抽樣 反之, 如果各群中隨機抽部份作樣本, 稱為兩階段集群抽樣 1. 只有部份群或層被選中, 分層抽樣時所有層至少有一樣本單位被選中 2. 一階段集群係在被選中之群或層進行普查 ; 而分層則對被選中之層選部份為樣本 3. 分層抽樣 目的在減少抽樣偏差 ; 集群抽樣則在減低抽樣成本 1. 經濟省事 2. 簡單易行 3. 易發生抽樣偏差
貳 機率抽樣 可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 種類方法 / 過程適用情形 / 考慮因素 / 例子優 / 缺點 地區抽樣 1. 一階段地區抽樣 an/n( 街道 ) b. 然後在各樣本區中進行普查 2. 二階段地區抽樣 a.n/n( 街道 ) b. 然後在各樣本區中抽選部份家庭為樣本單位 適用時機 : 當母體名冊没有或不齊時
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 參 非機率抽樣 為一種在抽樣時無法得知每一單位被選為樣本之機率為何之 抽樣方法 常用之非機率抽樣方法有下列五種 : 1. 便利抽樣 (convenience sampling) 2. 判斷抽樣 (judgment sampling) 3. 配額抽樣 (quota sampling) 4. 逐次抽樣 (sequential sampling) 5. 雪球抽樣 (snowball sampling)
參 非機率抽樣 可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 常用非機率抽樣方法之比較 抽樣方法 1. 便利抽樣 (convenience sampling) 2. 判斷抽樣 (judgment sampling) 3. 配額抽樣 (quota sampling) 抽樣過程或重點 樣本的選擇只考慮接近或衡量的便利性 又稱立意抽樣 (purposive sampling) 抽樣設計者根據判斷來選擇樣本 1. 選擇控制特徵 ; 並分為數個子母體 2. 決定各子母體的樣本大小 3. 選擇樣本單位 : 指定配額 ( 與分層抽樣時 : 樣本單位係以隨機自各子母體 ( 分層 ) 抽選不同 ) 適用情形例子優 / 缺點 問卷之預試 1. 母體的構成單位極不相似 2. 且樣本較少 當樣本和母體特徵分配没有顯著差異時適用之 Call in 節目 1. 試銷地區的選擇 2. 探索性研究 : 專家的選擇 可以選擇兩個以上之特徵 : 如家庭大小 / 家庭所得 優 : 省錢省事缺 : 抽樣偏差大 缺 : 易發生抽樣偏差 缺 : 1. 受訪者較易傾向訪問員較易接近的人 ( 朋友 同事社團成員 ) 2. 無法依抽樣原理決定樣本大小及抽樣誤差
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 簡單隨機抽樣法 母體中的任一元素被選中的機率均相同的抽樣方法 如何達到隨機的抽樣呢? 1 抽籤法 2 亂數表法 3 電腦隨機數字法
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo
第二節 樣本大小與誤差 可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 一 母數之估計標準差的觀點 標準差 = X²- ( X)²/N N 估計標準差 = X²- ( X)²/N N - 1 二 平均數分配之標準誤的觀點
三 抽樣誤差率的觀點 可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 在 95% 的信賴水準下, 一般研究都用下述公式來估計抽樣誤差率 抽樣誤差率 = 1 N N: 樣本大小 另有抽樣方法學者 ( 儲全滋, 民 81) 將此種誤差稱之為統計誤差, 並歸納出其種類有三 : 抽樣設計的誤差, 源之於母群定義的不當 不當的抽樣調查之資料代表母群
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 第三節 簡單隨機抽樣 一 抽籤法 抽籤法可分成二種 : 置還抽樣 (sampling with replacement) 非置還抽樣 (sampling without replacement) 二 利用亂數表法 利用亂數表抽樣的步驟 : 依據抽樣架構, 對每個抽樣單位加以編號 依隨機的方式決定抽樣的亂數表之頁數及起點 決定查表的行進順序或走向 依抽樣架構的個數決定所要之數字的位數 進行樣本抽取
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 第四節 系統隨機抽樣 系統隨機抽樣步驟 : 1) 確定抽樣架構的範圍 2) 決定樣本大小 3) 計算抽樣組距 ( 即每間隔幾個抽取一個 ) 4) 用隨機的方法決定組距的抽樣起點 5) 從起點開始, 每間隔一組距開始抽樣, 一直抽至額滿為止
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 第五節 分層隨機抽樣 分層隨機抽樣有六個步驟可遵循 : 分析並決定母群的層 蒐集抽樣架構及各層之元素個數的數據資料 計算各層的元素比率 決定樣本大小 計算各層的抽樣個數 選擇適宜的抽樣法進行抽樣
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 分層抽樣法 若抽樣的母體結構較複雜, 且母體所含的特質分散於各階層時, 在抽樣前, 我們最好先將母體分為數個層級, 並依各層級所佔母體的比例多少來隨機抽取樣本, 此種方法稱為分層抽樣 特性 : 層內差異小, 層與層之間差異大 目的 : 提高精確度
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 分層抽樣法圖解 層 1 隨機抽樣 樣本 層 2 層 k
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 群落抽樣法 群落抽樣是將母體分成 n 個群落, 先對這 n 個群落進行抽樣, 抽出 k 個群來之後, 再由 k 群中, 進行普查 特性 : 群落內差異大, 群落與群落之間差異小 目的 : 節省經費
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 群落抽樣法圖解 群 1 隨機抽取 k 群 普查 樣本 群 2 群 1 群 n 群 k
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 第六節 非機率抽樣 非機率抽樣 (nonprobability sampling), 是泛指不依機率原則所進行的抽樣行為 常見的型態有 : 1) 偶然抽樣 2) 目的抽樣 3) 配額抽樣
非隨機 / 非機率抽樣設計 定額抽樣 偶遇抽樣 立意抽樣 滾雪球抽樣
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo 系統抽樣法 系統抽樣是將母體的元素排序後, 每隔一定間隔選取一樣本, 直至選滿為止 例如 : 氣溫每隔一小時量一次測量河川污染程度每隔 50 公尺取樣一次等 注意 : 若為週期性的資料, 在選取資料時, 應避免落入其週期
混合抽樣 系統抽樣設計
抽樣的原則 在大多數的抽樣案例中, 在樣本的統計量與母群體的真實母數間通常都有差異存在, 而其主要的原因是由於樣本所選擇的個體不同所造成 樣本的大小越大, 則鎖估計的母群體母數便越正確 所欲研究的母群體變相其差異越大, 則樣本統計量與母群體平均數間的差異越大
影響樣本推論的因素 樣本大小 抽樣母群體變異的範圍
選擇樣本的目標 在一定的樣本大小下, 儘量能夠增加估計的精確性即再樣本選擇時能避免偏誤 偏誤可能再下列情況發生 : 1. 以非隨機的方法來抽樣 2. 抽樣架構 ---- 即抽樣名冊未正確且完整的涵蓋所有的抽樣母體群 3. 抽樣母體群的某一部分無法掌握或拒絕合作
隨機 / 機率抽樣設計 隨機 : 代表母群體中的每一個抽樣單位 被抽取的機率都是相等且獨立的 獨立 : 意謂著在抽樣的過程中, 抽選一個抽樣單位, 並不區要依賴抽選出其他抽樣單位 : 也就是每一個抽樣單位互不影響彼此是否被抽出
抽選隨機樣本的方法 籤筒 電腦程式抽樣 亂數表抽樣
抽選隨機樣本的不同系統 不置回抽樣 置回抽樣
樣本大小的計算 你想在什麼程度的信心水準下考驗研究 結果 發現或假設? 你想估計母群體參數正確到什麼程度? 關於研究母群體主要的研究變項, 其估 計的變異程度為何?
可於投影片母片模式中, 在此自行輸入單位名稱或置入 Logo