Microsoft PowerPoint - CH11決定樣本的大小.ppt

Similar documents
抽樣調查是觀測研究當中很重要的一種

Microsoft Word - 95_1_stat_handout_04抽樣與抽樣分配.doc

Microsoft PowerPoint - 第9章 簡單隨機抽樣與抽樣分配.ppt [相容模式]

第三單元 平面座標與直線的斜率

PowerPoint Presentation

理性真的普遍嗎 注意力的爭奪戰 科學發展 2012 年 12 月,480 期 13

連續機率分配

Microsoft Word - 94_2_stat_handout08_線性迴歸(考古題).doc

第9章 估計


<4D F736F F D20B2C43535B3E6A4B8A9E2BCCBBB50B2CEAD70B1C0BDD72E646F63>

Microsoft Word - ACL chapter02-5ed.docx

Microsoft Word - 94_4_stat_handout_06假設檢定_考古題.doc

附 件 :2015 年 度 普 通 高 等 学 校 本 科 专 业 备 案 和 审 批 结 果 教 育 部 2016 年 2 月 16 日 抄 送 : 国 家 发 展 改 革 委 财 政 部 国 家 卫 生 计 生 委 国 家 中 医 药 管 理 局 部 内 发 送 : 有 关 部 领 导, 办 公

現在人類獲取地球內部訊息的方法, 是從可能影響我們身家性命安全的地震, 用數學模型把地震資料轉換成地震波速度, 進而獲得地底物質密度與深度的關係 地下世界知多少 km/s g/cm 3 P Gpa km S P S 3,000 3,000 ak K 透視地底 Percy Bridgma

100人預試問卷初稿

Microsoft Word - CS-981.doc

生命的價值 聖嚴法師與單國璽樞機主教 吳若權 陶喆的對話 生命的價值 時間 : 二 二年九月二十二日 地點 : 台灣大學綜合體育館 主持人 : 劉麗惠 ( 電視台主播 ) 對談人 : 聖嚴法師 ( 法鼓山創辦人 ) 單國璽樞機主教 ( 天主教 台灣地區主教團主席 ) 吳若權 ( 作家 ) 陶 ( )

Microsoft PowerPoint - B9-2.pptx

第9章抽樣與抽樣分配

投影片 1

第 13 章

63 Equifax Experian TransUnion FICO 3 FICO FICO 620 叁 次級房貸歷史淵源 一 次級房貸市場快速擴張的主因 ,

<4D F736F F D20B0AAA4A4B14DC3442DAB48BFE0B0CFB6A1BB50AB48A4DFA4F4B7C72E646F63>

人為疏失 人與人之間的溝通合作, 往往是事故的最終防線, 若能發揮團隊合作的功能, 則比較能克服其他因素所造成的危害

連續機率分配


<4D F736F F D20312D332D34AB48BFE0B0CFB6A1BB50AB48A4DFA4F4B7C7AABAB8D1C5AA2E646F6378>

投影片 1

前言 人類的歷史, 因 一個簡單的思維 而改變! 1776 Thomas Paine COMMON SENSE

¦ÛµM¬ì²Ä3¦¸²Õ¨÷-¾Ç´ú¤ºŁ¶«Êٱ.prn, page Normalize ( <4D F736F F D20A6DBB54DACECB2C433A6B8B2D5A8F72DBEC7B4FAA4BAADB6ABCAADB12E646F63> )

你很難不去注意到她

_BK07.ps, page Preflight ( _BK07.indd )

攜手拼出圓滿的幸福 2

Microsoft PowerPoint - 第11章 統計估計-區間估計.ppt [相容模式]

統計分析入門與應用 說明 : a. 獨立樣本 : 兩個來自於獨立, 沒有相關的樣本 b. 成對樣本 : 兩個平均數來自於同一個樣本, 有關係的樣本 7-2 Means 平均數分析 Means 平均數分析是用在不同類別變數組合下, 連續變數在各組的統計量, 例如 : 平均數 中位數 標準差 總合 最小

<3131A4EB5FA4DFAFD1AD5DAE452E696E6464>

老年性生理學和老年的性生活 老 和 第四年齡 概念 有不一致, 讀者可自參考, 本書不再多引

第一章  緒論

Microsoft Word - ok翁志文、張佳音...doc

第八章 審計抽樣 本章學習重點 stratified random sampling systematic sampling PPS PPS MUS 8-3 壹抽樣與審計抽樣 audit sampling 100%


DIY香草植物乾燥

Microsoft PowerPoint - Ch05

愛滋實務與治理的政治 - 綜合論壇 以及面對這一連串以 責任 為架構衍生出來的愛滋政策如何造就了台灣現在的愛滋處境

本章大綱 解剖學與生理學的定義人體組成的層次身體系統介紹恆定 正回饋 負回饋恆定正回饋機轉負回饋機轉解剖語言解剖學姿勢身體剖面體腔背側體腔腹側體腔腹部四象限分法與九分法四象限分法九分法 學習目標 1. 能了解解剖學和生理學的定義及範圍 2. 能了解人體組成的各個階層 3. 能了解人體的基本結構 4.

行政法概要 本章學習重點 本章大綱 第一節行政作用之概念 第二節行政作用之分類 一 行政程序法 第三節行政作用法之範圍 第四節行政作用之私法 行為 二 行政罰法三 行政執行法一 源起二 類型 第五節行政作用中的非 權力行為 一 類型 二 事實行為 第六節行政作用之內部 行為 一 行政規則

CU0594.pdf


縣 94 學年度 上 學期 區 國民中學 Q 年級 R 領域教學計畫表 設計者:

Microsoft Word - _m30.doc


臺灣重要經濟變動指標

0 0 = 1 0 = 0 1 = = 1 1 = 0 0 = 1

第七章行政工作 7.1 預算 法律依據 預算收入 94

<B8D5C5AAA5BB2E706466>

皈依三寶的意義 一 為何要皈依三寶?

<4D F736F F D20A4BDA640BDC3A5CDAED6A4DFBDD2B57BAFE0A44FB4FAC5E72DA5CDAAABB2CEAD70B8D5C344A4BDA FA7B9BD5AAAA9>

目次 CONTENTS 2 1 乘法公式與多項式 二次方根與畢氏定理 因式分解 一元二次方程式

3 QE3 時 評 ~0.25% Quantitative Easing, QE FED QE 1 3 FED QE1 QE2 QE3 貳 美國推出 QE3 之動機意涵與過去 2 次 QE 措施之主要差異 FED QE MBS

目次 3 ONTNTS 1 相似形 上 國民中學數學第五冊習作 表示為仿會考或特招題 1-1 比例線段 3 1- 相似多邊形 相似三角形的應用 圓形 -1 點 線 圓 4 - 圓心角 圓周角與弦切角 外心 內心與重心 3-1 推理證明 三角形與多

14: 6 不做清單上的事, 並不代表我們就可以隨心所欲 ; 我們不做, 是為了更深一層的原因 同樣, 也沒有人會因不受這些清單的捆綁, 就更能活出 豐盛的生命來 14: 15 8: : 17 在所有十誡中, 第十誡往往是最先遭破壞的一條 22: 37, 39 凡是使我們不能愛神與愛

範本檔

Microsoft Word - ACI chapter00-1ed.docx

90 二 村落維生機能活動的調查 (1) (2) (3) 4. 5.

三期四期執行報告.PDF

CO 2 以鄰為壑的台灣建築產業

Microsoft Word - Tridentine NL_C.docx

¾ú¥v¬ì²Ä8¦¸-«ü¦Ò«Êٱ.prn, page Normalize ( <4D F736F F D20BEFAA576ACECB2C438A6B82DABFCA6D2ABCAADB12E646F63> )

基礎統計

untitled

untitled

第一章、公司治理、內部控制與內部稽核的意義

佛化家庭手冊 佛化家庭 一 淨化人間, 必定要淨化社會 二 淨化人間的著力點, 是從淨化家庭開始

SW cdr

男人的大腦 女人的大腦

untitled


地產基金運作報告

專題研究 大陸中央與地方關係改革現狀與問題 政治學研究 毛澤東思想研究 台聲. 新視角

Middle East Respiratory Syndrome Coronavirus, MERS-CoV WHO Qatar 2013 MERS MERS 耗費巨大的社會成本 MERS V

untitled

Transcription:

第十一章 決定樣本的大小 中興大學行銷系 黃文仙 本章大綱 1. 樣本大小的規則. 以接近信賴區間決定樣本大小 3. 樣本大小的公式 4. 決定樣本大小時的實務考量 5. 決定樣本大小的其他方法 6. 兩種樣本大小的特殊決定情況 1

前言 樣本選擇的方法會影響樣本代表性 樣本大小並不能判斷代表性, 但會影響到樣本結果的正確性 樣本正確性 (sample accuracy) 是指隨機樣本的統計值與母體值的接近程度 3 樣本大小和樣本正確性的規則 (1/3) 1. 唯有普查的樣本能夠完全正確. 機率樣本總是會有些不正確 ( 樣本誤差 ) 3. 機率樣本越大越正確 ( 較少樣本誤差 ) 4. 機率樣本的正確性 ( 誤差 ) 可以用簡單的公式來計算, 以正負多少百分比來表示 4

樣本大小和樣本正確性的規則 (/3) 5. 對於調查中的任何結果, 如果用同樣的機率樣本大小再次調查, 將會發現同樣的結果 ( 介於原始結果的正負多少個百分比之內 ) 6. 幾乎在所有的個案中, 機率樣本的正確性 ( 樣本誤差 ) 都與母體的大小無關 5 樣本大小和樣本正確性的規則 (3/3) 7. 機率樣本的大小可以只占母體規模的微小比率, 但仍可以非常正確 ( 較少樣本誤差 ) 8. 機率樣本的大小取決於顧客想要的正確性 ( 可接受的樣本誤差 ) 和蒐集該樣本大小所需要的成本 6 3

以接近信賴區間決定樣本大小 決定樣本大小最正確的值為接近信賴區間 (confidence interval approach) 其應用正確性 ( 樣本誤差 ) 變異性 (variability) 和信賴區間的概念, 創造出 正確 的樣本大小 它在理論上是最正確的方法, 所以被大多數的調查公司和行銷研究人員採用 7 調查的兩種誤差 抽樣誤差 樣本選擇方法 樣本大小 調查調查總誤差 非抽樣誤差 資料處理誤差 受訪者誤差 樣本選擇誤差 無反應誤差 反應誤差 訪問員誤差 8 4

樣本規模與樣本誤差的關係 9 樣本誤差公式 機率樣本的正確性 ( 誤差 ) 可以用簡單的公式來計算, 以正負多少百分比來表示 得到樣本誤差圖, 該公式為 : 常數 p 和 q 是? 樣本大小 10 5

樣本誤差公式 以上的樣本誤差公式只適用於名目資料或是分類型分類型的資料 11 p 和 q: 變異性的概念 當有多種不同的回答時, 結果具有大的變異 變異性定義為受訪者間對一特定問題回答相異的程度 如果在回應尺度上, 大多數的受訪者都是回答相同的答案, 因為其回應為高度相似, 所以分配的變異較少, 如果回答出多種答案, 則變異性較大 1 6

p 和 q: 變異性的概念 以 Domino 披薩為例, 說明 p 和 q 是什麼 : p = 說 會的百分比 q = 100% p, 說 不會的百分比 p=50% 且 q=50% 的樣本誤差公式 ± 500 13 p 和 q: 變異性的概念 使用名目資料 ( 即 是 否 ), 我們可以用長條圖將變異性概念化 最高的變異性是 50-50 百分比 重點 : 當母體成員間的差異較大時, 應該抽取較多的樣本, 以達到正確性 14 7

信賴區間的概念 對於調查中的任何結果, 如果用同樣的機率樣本大小再次調查, 將會發現同樣的結果 ( 介於原始結果的正負多少個百分比之內 ), 此規則是根據信賴區間 (confidence interval) 的概念 信賴區間為一個範圍, 其端點定義了對某問題的特定回應比率 15 信賴區間的概念 如果在總統大選之前,TVBS 民調結果告訴我們說 : 有 37% 選民支持馬英九, 3% 支持蔡英文 ; 在 95% 信心水準下, 抽樣誤差在 ±3.1 個百分點以內 16 8

信賴區間的概念 我們有 95% 信心, 支持馬英九的選民比例, 在 (.339,.401) 範圍內, 而支持蔡英文的選民比例, 在 (.199,.61) 範圍內 括弧內的數字是分別用 37% 和 3% 加減 3.1% 得來的, 而這兩個範圍, 就是我們要討論的信賴區間 (confidence interval) 17 信賴區間的概念 : 詐騙電話 假設我們想知道全台灣成年人當中, 有多少百分比接到過詐騙電話 我們沒法子問到全台灣的成年人, 因此只能抽樣本來做調查, 抽樣調查的目的, 就是要根據樣本的數據來對母體做結論 18 9

信賴區間的概念 : 詐騙電話 民國 93 年 4 月, 聯合報就做了這樣一項調查, 得到的結果是 : 過去一年來, 高達六成七受訪者表示曾親自接到詐騙電話 另外還有 : 調查於四月十九日至四月二十日進行, 成功訪問了九百一十二位成年民眾, ; 在百分之九十五的信心水準下, 抽樣誤差在正負三點二個百分點以內 調查是以台灣地區住宅電話為母體作尾數兩位隨機抽樣 ( 見 93 年 4 月 日聯合報 ) 19 信賴區間的概念 : 詐騙電話 在受訪民眾中 接到過詐騙電話的比例, 是 67% 母體比例( 全台灣成年人當中 接到過詐騙電話的百分比 ) 也會是 67% 嗎? 通常是不會, 因為我們知道樣本結果通常不會和母體的真正比例一模一樣 我們只能說, 全台灣成年人當中 接到過詐騙電話的百分比, 大約 是 67% 而信賴區間把這個 大約 具體化了 0 10

信賴區間的概念 : 詐騙電話 所以,95% 信賴區間是從樣本數據計算出來的一個區間, 保證在所有樣本當中, 有 95% 會把真正的母體參數包含在區間之中 把案例中的 67% 分別加減報導中提到的抽樣誤差 3.%, 所得到的區間 (.638,.70) 就是對於母體比例 p 的 95% 信賴區間 1 信賴區間的概念 : 詐騙電話 95% 的確實意義是這樣的 : 如果我們重新抽一個同樣大小的樣本 (91 人 ), 樣本中接到過詐騙電話的百分比還會是 67% 嗎? 多半不會, 因為樣本的組成份子會改變, 我們假設這次得到的樣本比例是 69.5% 好了, 加減 3.% 就得到 (.663,.77); 如果再重抽一次, 假設得到 65%, 區間就變成 (.618,.68); 11

信賴區間的概念 : 詐騙電話 假設我們如此這般一直重複下去, 得到無數的區間, 則在這些區間當中, 有 95% 會把真正的母體比例, 也就是 p( 全台灣成年人當中 接到過詐騙電話的百分比 ), 包含在區間裡面 3 信賴區間的概念 : 詐騙電話 民調實際得到的區間 (.638,.70) 有沒有把 p 包含在裡面呢? 這只有老天爺知道 但是因為包含 p 的區間佔所有區間的 95%, 所以這個區間包含 p 的機會是頗大的, 如果這是事實的話, 代表真正的 p 就介於.638 和.70 之間 如果運氣不好, 這個區間正好屬於不包含 p 的 5%, 則代表真正的 p 不是大於.70 就是小於.638 4 1

信賴區間的概念 信賴區間是根據統計中常見的常態或鐘形曲線 1.96 倍的標準差定義了曲線分布的端點 5 信賴區間的概念 根據中央極限定理 (central limit theorem), 我們可以使用常態曲線 不管母體分布的形態為何, 重製的樣本分布 (n 至少 =30 ) 會長得像常態曲線 中央極限定理讓我們得以使用常態曲線的邏輯 6 13

信賴區間的概念 如果重複調查很多次 ( 或許 1,000 次 ), 可以預期結果落在一個已知的範圍 基於此, 我們有 95% 確信真實的母體比率會落在這個範圍 7 信賴區間的概念 p=50% q=50% 且 n=100 時的樣本誤差公式 : ± 500 100 = ±9.8% 8 14

信賴區間的公式 信賴區間 = p ± 樣本誤差 此範例中 95% 信賴區間的限制為 50% ± 9.8%, 即為 40.% 和 59.8% 亦即: 50% 的樣本會在下一次訂披薩時訂購 Domino, 真實的母體比率會介於 40.% 和 59.8% 之間, 即使重作 1,000 次調查,95% 的發現也都會位於這個範圍 9 信賴區間的概念 下圖示範樣本大小如何影響理論上抽樣分布的形狀, 以及信賴區間的範圍 n = 100 n = 500 n = 1000 30 15

樣本大小的公式 標準樣本大小公式 : 31 練習題 使用本章所提供的公式, 及精確性 ( 允許誤差 )±5%, 計算下列適合的樣本數 : 30% 的變異,95% 的信賴水準 (pq) n= z e 1.96 (30 x70) = 5 3.84 x 100 = 5 8064 = 5 = 3.6 (33) 3 16

練習題 使用本章所提供的公式, 及精確性 ( 允許誤差 )±5%, 計算下列適合的樣本數 : 60% 的變異,99% 的信賴水準 (pq) n = z e. 58 (60 x 40) = 5 6.66 x 400 = 5 15,984 = 5 = 639.4 (639) 33 決定樣本大小時的實務考量 如何估計母體的變異性? 當使用百分比的標準樣本大小公式時, 有兩種選擇 : 1. 預期最壞的情況 : 最壞的情況或最大的變異百分率為 50%/50%, 此為最保守的假計. 估計真實的變異 (variability): 研究人員也會試著去估計 p, 而非直接採取最壞的情況 34 17

決定樣本大小時的實務考量 如何決定可接受樣本誤差的量? 1. 研究人員應該幫助經理制定決策 經理願意容忍多少誤差?. 慣例是 ± 5% 3. 越重視決策, 樣本誤差的數字越小 35 決定樣本大小時的實務考量 如何決定信賴水準? 1. 研究人員應該幫助經理制定決策 信賴水準越高, 樣本規模越大. 行銷研究中傳統都是使用 95% 的標準信賴區間, 其 z 值為 1.96 3. 越重視決策, 經理越可能要求更高的信賴水準 99% 的信賴水準, 其 z 值為.58 36 18

決定樣本大小的其他方法 1 3 4 獨斷 百分率經驗法則 樣本大小慣例樣本大小規格統計分析需求樣本大小規格樣本大小規格的成本基礎 37 決定樣本大小的其他方法 1 獨斷 百分率經驗法則 樣本大小 獨斷法為關於樣本大小的 百分率經驗法則 獨斷樣本大小雖然簡單且容易使用, 但卻不具效率與經濟性 38 19

決定樣本大小的其他方法 慣例樣本大小規格 慣例法遵循一些 慣例, 或是一些數字, 那些數字被認為會是正確的樣本大小 使用慣例樣本大小會造成樣本太大或太小 慣例樣本大小忽略了目前調查的特殊狀況 39 決定樣本大小的其他方法 3 統計分析需求樣本大小規格 研究人員有時會進行特定類型的資料分析, 以判斷樣本大小 40 0

決定樣本大小的其他方法 4 樣本大小規格的成本基礎 所有可負擔法 不是基於調查產生的資訊價值來決定樣本大小, 而是由預算來決定樣本數, 且這個方法也沒有考慮到樣本的正確性 41 兩種樣本大小的特殊決定情況 1 小母體抽樣 非機率抽樣時的樣本大小 4 1

兩種樣本大小的特殊決定情況 1 小母體抽樣 小母體 : 樣本數大於總母體大小的 5% 限定倍數 (finite multiplier): 對樣本大小公式進行調整 進行小母體研究時, 適當運用限定倍數可以減少樣本大小, 並節省成本 43 兩種樣本大小的特殊決定情況 1 小母體抽樣 小母體的樣本大小公式 : 小母體樣本 n N - n N - 1 44

兩種樣本大小的特殊決定情況 1 小母體抽樣 若使用 1,000 家公司為母體 假設想知道有多少比率的公司對於當地醫院所提供的物資濫用勸告計畫感興趣, 在不確定變異, 決定採用最壞的情況 (50-50), 使用 95% 信賴水準, 結果的正確性為 ±5% 45 兩種樣本大小的特殊決定情況 1 小母體抽樣 計算如下 : (pq) n= z e 1.96 (50 x 50) = 5 3.84 x 500 = 5 9600 = 5 = 384 46 3

兩種樣本大小的特殊決定情況 1 小母體抽樣 因應小母體的情況, 使用限定倍數來調整樣本大小 : N - n 小母體樣本 n N - 1 減少樣本大小 81% 384 = 303 1000-384 1000-1 47 兩種樣本大小的特殊決定情況 非機率抽樣時的樣本大小 當使用非機率抽樣時, 決定樣本大小的唯一合理方式是權衡樣本所帶來的利益 價值和蒐集資訊所花的成本 48 4

資料來源 Alvin C. Burns and Ronald F. Bush (009), Marketing Research, 6th edition, Pearson. 淡江大學數學系鄭惟厚教授 什麼是信賴區間 : http://www.google.com.tw/url?sa=t&source=web &cd=1&ved=0cbkqfjaa&url=http%3a%f% Fmathcenter.ck.tp.edu.tw%FResources%FCtr l%fepaper%fepaperopenfilex.ashx%3fauto Key%3D11&ei=IvXBTfuYPIO8vgPU4m_BA& usg=afqjcnemwnizoaesljhszp5zncsutjio A 49 5