信賴區間與信心水準的解讀 建國中學 林信安老師
1-3-4 信賴區間與信心水準的解讀 民調的解讀 大眾媒體經常報導民調的結果, 而民調的問題多半為是非題 : 對某位候選人支持或不支持, 對某位行政首長滿意或不滿意, 要不要投票給某位候選人等等 下面的文字是某民調公司對行政院長施政的滿意度調查 : 滿意度 3 成 9 本次調查是以台灣地區住宅電話簿為抽樣清冊, 並以電話的後四碼進行隨機抽樣 共成功訪問 1068 位台灣地區 20 歲以上民眾 在 95% 的信心水準下, 抽樣誤差為正負 3.0 百分點 上面的文字除了說明某民調公司的抽樣的母體與抽樣的方法外, 對於行政院長施政滿意度結果的呈現應該如何來解讀呢? 我們提出以下兩問題 : 問題一 : 95% 的信心水準 和 抽樣誤差正負幾個百分點 這兩句話總是與民調的結論並陳, 它們代表什麼意義呢? 問題二 : 電話只訪問了 1068 人, 相對台灣地區一千六百萬的成年民眾, 這 1068 人具有代表性嗎? 首先我們先解讀文字中的各項涵義 : (a 滿意度 3 成 9 在本次調查中, 母體是台灣地區 20 歲以上的民眾, 樣本則是成功訪問的 1068 人, 滿意度 3 成 9 表示在 1068 位受訪者中, 約有 39% 的人表示滿意 ( 即約有 423 人回答滿意 (b 抽樣誤差正負 3.0 百分點 將 39% 分別加減 3.0%, 可得到區間 [0.39 0.03,0.39+0.03]=[0.36,0.42], 假設全台成年民眾經過普查, 真正的滿意度是 p( 也就是真正的滿意度為 p, 那麼這次的調查估計 p 的值可能會落在 0.36 到 0.42 的範圍內 而這裡我們樣本中滿意的比例 39% 來推估母體滿意比例 p 可能落在那個區間 統計上把這個區間稱為信賴區間 信賴區間 :[ 估計值 最大誤差, 估計值 + 最大誤差 ] (c 95% 的信心水準 在這次調查中, 母體真正的滿意比例 p 是不可知的, 而抽樣都會有誤差, 我們並不能保證真正的比例 p 一定會在我們所推估的區間內, 而 95% 的信心水準的意思是指 : 如果我們重複抽樣很多次, 每次都會得到一個信賴區間, 那麼這麼多的信賴區間 1
中, 約有 95% 的區間會涵蓋真正的 p 值 因此根據 (a(b(c 的解讀, 對於這份民調的結果我們有了初略的了解 : 民調中的滿意度是被抽樣訪問者的滿意度, 將它加上正負誤差, 就可以得到一個信賴區間, 而我們有 95% 的信心說, 真正的滿意度會落在我們所得出的區間中 結論 : (1 信賴區間 :[ 估計值 最大誤差, 估計值 + 最大誤差 ] (2 95% 的信心水準的意思是指 : 如果我們重複抽樣很多次, 每次都會得到一個信賴區間, 那麼這麼多的信賴區間中, 約有 95% 的區間會涵蓋真正的 p 值 例題 1 某報對於台北市市長施政滿意程度進行民調, 民調結果如下 : 滿意度為六成三, 本次民調共成功訪問 900 位台北市 20 歲以上的成年民眾, 在 95% 的信心水準下, 抽樣誤差為正負 3.2 百分點 (1 這項民調的母體是什麼? 樣本數為多少? (2 受訪民眾中對市長施政滿意約有多少人? (3 算出這次調查的信賴區間? 計算信賴區間 以前面行政院長的施政滿意度為例, 抽樣的 個人中, 用 pˆ 表示樣本中滿意的比例, 即 pˆ 樣本中滿意的人數 =, 假設全台成年民眾經過普查, 真正的滿意度是 p, 那麼 pˆ 會剛好是 p 樣本數 嗎? 可能不會那麼準, 用同樣的方法抽樣得到的 pˆ 也許是 0.43 或是 0.35, 抽樣結果 pˆ 隨著樣本而改變, 因此可以將 pˆ 視為一個隨機試驗的隨機變數 對於上述的抽樣調查, 可以用抽球來當成模型, 如下表所示 : 袋中抽取球袋中有 N 個球袋中 r 個是紅球 (r<n,n r 個非紅球從袋中每次任取一球, 取後不放回共取 次 次取球取得紅球的比例 民意調查母體有 N 個人母體中滿意行政院長有 r 個人抽出 個樣本樣本中滿意的比例 pˆ 2
根據 1-2 中的說明, 可以得知以下結論 : 設袋中有 N 個球, 其中 r 個是紅球 (r<<n,n r 個非紅球, 從中每次任取一球, 共取 次, 令隨機變數 X 表示取得紅球的次數 : 若每次取後不放回, 且 r, 都很小, 則 X 的分布近似參數 (, r N r N 的二項分布 一般的民意調查, 樣本數 都會遠小於母體數 N, 因此抽樣可以視為上述的抽球 因此樣本滿意的比例 pˆ 可以視為二項分布 B(,p 中成功的比率根據前面的討論 : 設隨機變數 X B(,p, 隨機變數 pˆ ( 樣本滿意的比例 表示成功的比率 ( pˆ = X, 即 pˆ 的期望值 E( pˆ =p, 標準差 pˆ = p 由中央極限定理, 當 愈大時, pˆ 的標準化後的分布和標準常態分布愈接近 故可以得到 P( ( pˆ p p(1 p 2 0.95, ( pˆ p p(1 p 2 pˆ p 2 p 2 p p +2 p 即 P (p^-2 p <p<p^+2 p ~0.95, 事實上, 母體真正的滿意度 p 是未知的, 但是當 夠大時, pˆ 與 p 相當接近, 可以用 pˆ 取代 p 中的 p, 所得的區間 [ pˆ 2, pˆ +2 ] 稱為 95% 信賴區間, 其中 p^ 為樣本比率, 同樣由經驗法則也可得到 68%,99.7% 的區間 區間 [ pˆ, pˆ + ] 稱為 68% 的信賴區間 區間 [ pˆ 3, pˆ +3 ] 稱為 99.7% 的信賴區間 3
結論 : 在一個大母體中, 其成員具有某種特質的比例為 p, 若從母體中隨機抽取 個樣本 ( 必須夠大, 令 pˆ 代表該樣本中擁有此特質的比例, 則區間 [ pˆ 2, pˆ +2 ] 稱為 p 的一個 95% 的信賴區間 或 在 95% 信心水準下的信賴區間 而 2 稱為 95% 信心水準之下的抽樣誤差 同理, 區間 [ pˆ, pˆ + ] [ pˆ 3, pˆ +3 ] 亦可稱為 68% 的信賴區間 與 99.7% 的信賴區間 例題 2 某次選舉候選人兩名應選 1 名, 民調公司做支持度調查成功訪問了 1070 個合格選民, 其中 642 人表示支持甲候選人, (1 此次民調支持甲候選人的比例為多少? (2 在 95% 的信心水準下, 此次民調的誤差約為多少? (3 請寫出此次民調 95% 的信賴區間 [ 解法 ]: 642 (1 0. 6 1070 0.6 (1 0.6 (2 2 0.02995, 誤差約為 3% 1070 (3 此次民調 95% 的信賴區間約為 [0.6-0.03, 0.6+0.03] 即在 95% 的信心水準下, 甲候選人的支持度約在 [0.57, 0.63] 區間內 例題 3 一個試驗想估計一枚銅板出現正面的比率 p 落在哪個範圍? 丟銅板 32 次, 用本書亂數表的第一列來模擬 : 亂數表第一列號碼分別為 :5646 9713 5457 6316 2470 1589 3537 4856 上面每一個數字 k 代表丟一枚銅板出現正面或反面, 其規則如下 : 號碼 0 ~ 4 表丟出反面, 即 x i =0;5 ~ 9 表丟出正面, 即 x i =1 試求此銅板出現正面比率 p 的 : (1 95% 信賴區間 (2 99.7% 信賴區間 (3 68% 信賴區間 4
[ 解法 ]: 32 次試驗中有 19 個正面,13 個反面, 所以此銅板出現正面的比率 p 估計為 p^= 19 32 ~0.5938 標準差估計為 p^ ( 1-p^ = 0.5938 ( 1-0.5938 ~0.4911 p^ ( 1-p^ (1 95% 信心水準的抽樣誤差為 e=2 ~2 因此, 此銅板出現正面比率 p 的 95% 信賴區間為 0.4911 32 ~0.1736 p^-e,p^+e = 0.5938-0.1736,0.5938+0.1736 = 0.4202,0.7674 p^ ( 1-p^ (2 99.7% 信心水準的抽樣誤差為 e=3 =3 0.4911 32 因此, 此銅板出現正面比率 p 的 99.7% 信賴區間是 ~0.2605 p^-e,p^+e = 0.5938-0.2605,0.5938+0.2605 = 0.3333,0.8543 (3 68% 信心水準的抽樣誤差為 e= p^ ( 1-p^ 因此, 此銅板出現正面比率 p 的 68% 信賴區間為 = 0.4911 32 ~0.0868 p^-e,p^+e = 0.5938-0.0868,0.5938+0.0868 = 0.5070,0.6806 對於上例中丟銅板的試驗, 如果重複做 100 次丟銅板試驗, 每回試驗都是丟銅板 32 次, 得到 100 個樣本正面比率 p^, 算出 100 個母體比率 p 的 95% 信賴區間 所謂 母體比率 p 的 95% 信心水準 粗略的說就是在這算出的 100 個信賴區間中, 大約有 95 個區間會包含母體比率 p, 大約有 5 個不包含 p 丟 32 次銅板 100 回所得 95% 信賴區間 如例題 8 我們只做一次試驗, 丟銅板 32 次得到 p^= 19 32 ~0.5938, 算出 95% 信賴區間 0.4202,0.7674, 此區間確實涵蓋母體比率 p=0.5, 上圖中共有 93 個區間涵蓋母體比率 0.5, 此涵蓋率 93% 與理論的信心水準 95% 很接近 5
例題 4 [2009 學科能力測驗 ] 某廠商委託民調機構在甲 乙兩地調查聽過某項產品的居民佔當地居民之百分比 ( 以下簡稱為 知名度 結果如下: 在 95% 信心水準之下, 該產品在甲 乙兩地的知名度之信賴區間分別為 [ 0.50, 0.58 ] [ 0.08, 0.16 ] 試問下列哪些選項是正確的? (1 甲地本次的參訪者中, 54% 的人聽過該產品 (2 此次民調在乙地的參訪人數少於在甲地的參訪人數 (3 此次調查結果可解讀為 : 甲地全體居民中有一半以上的人聽過該產品的機率大於 95% (4 若在乙地以同樣方式進行多次民調, 所得知名度有 95% 的機會落在區間 [ 0.08, 0.16 ] (5 經密集廣告宣傳後, 在乙地再次進行民調, 並增加參訪人數達原人數的四倍, 則在 95% 信心水準之下該產品的知名度之信賴區間寬度會減半 ( 即 0.04 [ 解法 ]: 1 (1 信賴區間為 [ pˆ e, pˆ e], 故 pˆ 為 0.50 及 0.58 的中點, 即 p ˆ (0.50 0.58 0. 54 2 這表示有 54% 的參訪者聽過該產品 (1 真 0.54 0.46 0.12 0.88 (2 在 95% 信心水準之下, 兩地參訪者人數的估計值分別為 甲 2 乙, 2 (0.02 (0.02 顯然前者大於後者 (2 真 (3 95% 的信心水準是指同樣做了多次的調查, 每次調查都會得到一個信賴區間, 大約有 95% 的信賴區間會蓋住真正的知名度 (4 所謂 95% 的信心水準是指同樣做了多次的調查, 每次調查都會得到一個信賴區間, 大約有 95% 的信賴區間會蓋住真正的知名度 p 而非 p 有 95% 的機率在區間 [ 0.08, 0.16] 中 (4 不真 pˆ (1 (5 在重作民調時, 固然以最大抽象誤差公式可得 e, 讓我們覺得最大誤差為 1.96 (1 e 的一半 但是, 再次抽樣時, 改變了, pˆ 也會不同, 所以新的信賴 區間未必會縮為原有信賴區間的一半 ( 可能變大, 也可能縮小 (5 不真 練習 1 某次選舉候選人兩名應選 1 名, 民調公司做支持度調查成功訪問 100 個合格選民, 其中 60 人表示支持甲候選人, (1 此次民調支持甲候選人的比例為多少? (2 在 95% 的信心水準下, 此次民調的誤差約為多少? (3 請寫出此次民調 95% 的信賴區間 As:(1 0.6;(2 誤差約為 9.8%;(3 此次民調 95% 的信賴區間約為 [0.502, 0.698] 區間 練習 2 袋中有紅球 藍球各若干個, 小安每次從袋中拿一球看完顏色後又放入袋中, 共拿 50 次, 結果有 20 次拿出紅球, 求袋中紅球所佔比例 p 的 95% 信賴區間 6
As:[0.26144, 0.53856] 練習 3 由生產線隨機抽樣 400 個產品, 得到樣本不良率為 8%, 求 (1 不良率 p 的 95% 信賴區間 (2 不良率 p 的 99.7% 信賴區間 (3 不良率 p 的 68% 信賴區間 As:(1[0.0529,0.1071] (2[0.03932,0.12068] (3[0.06644,0.09356] 練習 4 某廠商委託民調機構在甲地調查聽過該品牌洗面乳的居民占當地居民之百分比 ( 以下簡稱為 知名度 結果在 95% 信心水準下, 該品牌洗面乳在甲地的知名度之信賴區間為 [0.608,0.672] 試問此次民調中 (1 該品牌的洗面乳在甲地的知名度為多少? (2 抽樣誤差為多少? (3 共成功訪問了多少位甲地民眾, 其中有多少人聽過該產品? As:(10.64 (20.032 (3900 人,576 人 練習 5 某民調公司做食品接受度的抽樣調查, 在 95% 的信心水準下, 樣本中對該食品的接受度為 60%, (1 若抽樣誤差為 4%, 則共抽樣多少人? (2 若抽樣誤差為 2%, 則共抽樣多少人? As:(1600 人 (22400 人 練習 6 消保官抽測市售泡麵 576 包, 公布有 36% 的泡麵每包含鈉量超過成人每日建議量 試問此項調查的信心水準為多少時, 其抽樣誤差為 2 個百分點 As:68% 7
樣本數的決定 一般而言, 調查人數愈多, 成本愈高, 估計也愈準確, 調查人數多寡要考慮到成本與估計的準確性 像是選舉期間候選人做民意調查, 想知道自己與對手的得票率約為多少, 不過在考慮成本與民調準確性下, 候選人希望能在開票前就可以預估自己的得票率, 以便調整選舉策略, 那麼得票率的民意調查要調查多少人才合適呢? 從前面信賴區間的意義中, 可以得知某次民調如果有效樣本有 位, 可以由這 位樣本可以求出得票率 p 的抽樣誤差及信賴區間 反之, 如果要控制得票率 p 的估計誤差在 e 內 ( 即最大誤差為 e 時, 需要調查多少樣本呢? 這樣的問題稱為樣本數的決定 當樣本數愈多時, 則資料愈有代表性, 抽樣誤差愈小 ; 但是樣本數愈多, 成本愈高, 因此必須在精確與成本之間曲得平衡 在 95% 信心水準之下, 如何控制估計誤差在 e 內時, 需要調查多少樣本呢? 4 (1 (1 如果得到 pˆ 的估計, 則由 e=2, 可求得 = e 2 (2 但是如果沒得到 pˆ 的資訊時, 可以用較保守的方式來估計 : pˆ (1 0.5, e=2 2 0.5 也就是說當最大誤差為 e 時, 則樣本數約需要 ( 1 e 2 補充說明 : = 1, 得總數 ( 1 e 2 (a 事實上根據常態分配表, 較精確的說法 95% 的資料落在區間 [ x 1.96s, x +1.96s] 內, 所以 95% 的信心水準的最大誤差有 e 1.96 0.5, 所需的樣本數 ( 1.96 0.5 e 2 例如 :e=0.03, 則由上式可得樣本數約需 ( 1.96 0.5 0.03 2 1068 1.96 0.9 0.1 (b 如果 p 離 0.5 很遠, 則抽樣樣本數可以改為 ( e 2 例題 5 一項調查想了解大台北地區高中生家中擁有 Wii 的學生比例, 民調公司想在 95% 的信心水準下, 公佈誤差為 3 %, 試問這次民調至少需要多少成功的樣本? As:1112 個 [ 解法 ]: 因為 pˆ (1 0.5, e=2 2 0.5 = 1 (1 e 2 1112 8
例題 6 為了驗證一枚古代硬幣是否為勻稱的硬幣, 某人做了多次的投擲試驗, 並發表推論的結果如下 : 我們有 95% 的信心認為此硬幣出現正面的機率是 37% 到 43% 之間 試求此實驗中, 共投擲了幾次硬幣? 其中幾次出現正面? [ 解法 ]: 設共投擲了 次 因為 95% 信賴區間為 [0.37, 0.43], 所以樣本出現正面的機率 pˆ =0.4, 正負誤差 3%, 因此 2 0.4(1 0.4 =0.03 =1067 練習 7 某銀行於中秋節發行賞月樂透彩, 並宣稱中獎率為 36%( 發行 100 萬張, 計有 36 萬個獎項 若想推論這個數據是否屬實, 在 95% 的信心水準及抽樣誤差正負 4 個百分點的條件下, 應隨機採樣多少張樣本? As:576 練習 8 某研究調查發現 : 有 95% 的信心認為中學生近視比例在 55% 到 65% 之間, 試求 : (1 此研究約調查了個樣本 (2 樣本中大約有人近視 As:(1384 (2230 9