3 第一章機率與統計 -4 抽樣與統計推論 基礎觀念 抽樣與統計 對應課本 P.4. 統計的意義 : 統計乃是在面對不確定的情況下,藉由蒐集 整理 陳示 分析 解釋數據資料,並可由樣本推論母體,導出有效的結論,進而做成明智決策的一種科學方法.. 母體與樣本 : () 母體 : 對某一問題,研究所涉及的所有 對象 所成的集合,稱為母群體或母體. () 樣本 : 由母體中所選出的一個部分集合,就稱為樣本. 3. 抽樣 : 由母體中抽出樣本的所有過程,就稱為抽樣. 4. 統計資料的基本要件 : () 統計是一門科學的問題,它必須從 足夠多 的統計資料中方能找出研究對象的通則. () 統計資料的蒐集必須是客觀而周延的,否則統計結果必有偏差,因而導致錯誤的統計推論. 5. 普查與抽查 : 依照調查的對象可以分成普查及抽查兩種. () 普查 : 對母體中所有對象進行調查,例如 : 人口普查 工商普查 等等. 優點 : 可以獲得完整且可靠的資料. 缺點 : 花費太多的人力 物力及時間. () 抽查 : 對母體中部分對象進行調查,例如 : 民意調查 電話訪查 等等. 優點 : 較省時 省力 省錢. 缺點 : 抽樣方法的好壞容易影響結論的可靠性. 範例 母體與樣本練習 為檢驗全校師生 800 人的 B 型肝炎帶原者分 布情形,從全校 800 人之中抽檢 50 人,則這項抽 檢中,試求 : () 母體 ; 母體數. () 樣本 ; 樣本數. () 母體是全校師生 800 人 ; 母體數 N 800. () 樣本是被抽檢的 50 人 ; 樣本數 50. 某高中全校學生共 500 人,為了解學生身高 體 重的情況,任意抽樣 00 位學生來調查,試求 : () 母體 ; 母體數. () 樣本 ; 樣本數. () 母體是全校學生 500 人,母體數 N 500. () 樣本是被抽出的 00 位學生,樣本數 00.
-4 抽樣與統計推論 33 類題下列選項哪些為正確的? () 資料調查的方法依調查的對象是否是整體而分為普查及抽查兩種 () 普查較耗時耗力 (3) 普查的成本較抽查為高 (4) 對於燈泡的使用時數,適合用普查 (5) 利用普查所得的資料一定比抽查所得的資料正確可靠. ()()(3)(5) 基礎觀念 簡單隨機抽樣 對應課本 P.4. 簡單隨機抽樣 : 抽樣時不摻入人為因素,而且母體中每一個對象被抽中的機會均等,常用的方 法有 : () 製作籤條抽籤 : 將母體中的各基本個體加以編號由 至 號,再將 個號碼寫在相同的 張卡片上,然後將 張卡片澈底攪亂,再隨機抽出欲抽查的張數. () 利用隨機號碼表 : 先將母體中的個體編列號碼,接著再由隨機號碼表 ( 如下表 ) 中抽取號 碼,由抽出的號碼得一編號相同的個體作為樣本. 隨機號碼表 306 89 573 3968 5606 5084 8947 3897 636 780 04 43 0649 8085 5053 47 6598 5044 9040 5 3 6597 0 668 5060 8656 6733 6364 7649 87 438 4 7965 654 5645 643 7658 6903 99 5740 784 850 5 7695 6937 0406 8894 044 835 9797 785 5905 9539 6 560 785 8464 6789 3938 497 65 0407 939 3 7 96 055 0539 888 7478 7565 558 577 544 876 8 48 483 43 5445 4854 957 958 58 464 3634 9 3666 564 4539 56 7849 750 547 0756 06 033 0 6543 6799 7454 905 6689 946 574 9386 0304 7945 9975 6080 743 375 9377 695 659 887 8994 553 4866 0956 7545 773 8085 4948 8 9583 445 7065 3 839 7068 6694 568 37 586 037 660 9585 33 4 87 99 3386 3443 0434 4586 450 4 604 0937 5 330 90 8785 838 99 7089 309 674 468 705 6 96 95 4764 9070 6356 99 40 068 9 09 7 358 705 33 459 950 486 0830 847 60 7046 8 587 907 7 6494 8973 3545 6967 8490 564 98 9 34 634 60 379 565 0538 4676 064 0584 7996 0 403 4497 7390 8503 839 436 80 94 4368 459 (3) 使用電腦隨機數 : 當母體數值資料相當龐大時,製作籤條抽籤或使用隨機號碼表都是非常 繁重的工作.拜科技之賜,現今常利用電腦作隨機抽樣,較為簡便可行.
34 第一章機率與統計
-4 抽樣與統計推論 35 對應課本 P.45 例 3 範例 簡單隨機抽樣練習 高三甲班共有學生 40 人,第一次段考數學成績 如下 : ( 單位 : 分 ) 編號 3 4 5 6 7 8 9 0 成績 75 40 36 63 9 84 67 3 40 35 編號 3 4 5 6 7 8 9 0 成績 85 9 60 75 66 7 3 43 74 65 編號 3 4 5 6 7 8 9 30 成績 00 8 55 38 47 90 93 65 33 編號 3 3 33 34 35 36 37 38 39 40 成績 84 75 69 7 0 3 80 45 39 90 隨機號碼表 98 0394 6553 74 335 640 938 437 809 5 830 6508 0359 384 0793 49 6 480 656 880 試利用隨機號碼表的第 3 列與第 4 列,由左而右 選取 5 位同學,試求 : () 5 位同學的編號. () 5 位同學的平均成績. () 選出的編號依序為 3,05,,4,37. () 選出同學的成績分別為 3 號 55 分, 5 號 9 分, 號 8 分, 4 號 75 分, 37 號 80 分, 其平均成績為 (55 9 8 75 80) 5 66 ( 分 ). 某班有 40 位同學,依照編號列出其體重如下表 : ( 單位 : 公斤 ) 編號 3 4 5 6 7 8 9 0 體重 39 48 57 54 69 4 90 47 65 7 編號 3 4 5 6 7 8 9 0 體重 83 4 5 57 49 78 48 44 53 5 編號 3 4 5 6 7 8 9 30 體重 6 67 54 7 39 55 40 6 8 50 編號 3 3 33 34 35 36 37 38 39 40 體重 8 74 38 6 57 46 49 63 53 60 隨機號碼表 98 0396 558 909 53 9037 407 096 675 9587 0 380 855 477 059 436 89 033 436 5533 6640 535 8733 486 7657 試從隨機號碼表的第 3 列第 3 個數開始,由左而 右每次取 個 位數組,選取 6 位同學,試求 : () 6 位同學的編號. () 6 位同學的平均體重. () 選出的編號依序為,38,0,6,9,03. () 選出同學的體重分別為 號 4 公斤, 38 號 63 公 斤, 0 號 5 公斤, 6 號 78 公斤, 9 號 8 公斤, 3 號 57 公斤, 其平均體重為 (4 63 5 78 8 57) 6 6 ( 公斤 ). 類題利用所附的隨機號碼表第八 九行,第一列開始,模擬同時投擲甲 乙兩個均勻銅板 0 次,其中第八行出現 0 到 4 時,表甲銅板出現正面, 5 到 9 為反面,第九行出現偶數表乙銅板出現正面,奇數為反面,試問恰出現 正面及 反面的情形共有多少次? 5 次 隨機號碼表 98 0396 558 90 0 380 855 4773 6640 535 8733 480 979 9834 93 0697 839 390 7698 8808 5 897 594 8943 085 484 6860 789 458 0057 7554 677 393 750 79 3060 55 938 468 093 55 938 680 743 633 389 5949 488
36 第一章機率與統計 基礎觀念 3 用常態分布估計二項分布 對應課本 P.46. 前言 : 投擲一枚均勻的硬幣,出現正面為成功的試驗,出現反面則為失敗的試驗,其成功與失 敗的機率皆為,若連續投擲 6 次硬幣,設隨機變數 表示出現成功的次數,其機率函數為 6 k 6 k f ( k) C k ( ) ( ),其中 k 0,,,, 6,如下表: 正面數 機率 p 正面數 機率 p 0 0.000053 6 9 440 0.745605 6 6 0.00044 6 0 8008 0.94 6 0 4368 0.0083 0.0666504 6 6 3 560 80 0.0085449 0.07770 6 6 4 80 560 0.07770 3 0.0085449 6 6 5 4368 0 0.0666504 4 0.0083 6 6 6 8008 6 0.94 5 0.00044 6 6 7 440 0.745605 6 6 6 0.000053 8 870 0.963806 6 則隨機變數 的機率分布圖如下 : 我們發現,隨機變數 的機率分布圖為一個左右對稱的圖形,且當我們投擲的次數夠多的時候,圖形會很接近一個平滑且左右對稱的鐘形曲線,我們稱它為常態分布曲線.. 常態分布 : 若連續隨機變數,其機率密度函數為 f ( x) e ( x ), x 為實數,則稱為常態 分布,又稱為 高斯分布.其中 為圓周率 ( 3.45 ), e 為自然對數的底數 ( e.78 ), 與 分別為變數 的平均數與標準差.
-4 抽樣與統計推論 37 3. 常態分布與常態分布曲線的性質 : () 常態分布隨機變數 的機率密度函數 y f ( x) 的圖形是一條單峰且左右對稱的平滑鐘形曲線 ( 如圖 ( 一 )). () 常態分布曲線呈對稱的圖形,所以平均數 中位數與眾數全落在曲線的中間位置,即尖峰點位置 ( 如圖 ( 二 )). (3) 常態分布曲線中必有兩個變向點,而這兩個變向點的位置就在距離平均數兩側各一個標準差的地方,所以常態分布曲線的位置及形狀決定於平均數及標準差的大小 ( 如圖 ( 三 )). 圖 ( 一 ) 圖 ( 二 ) 圖 ( 三 ) 平均數相同,標準差不同的常態分布曲線,它們的中心位置及對稱軸相同,但標準差較小的曲線其圖形較陡 較窄,即表示數值較集中 ( 如圖 ( 四 )). 平均數不同,標準差相同的常態分布曲線,它們的形狀相同,但由平均數決定圖形的中心位置 ( 如圖 ( 五 )). 圖 ( 四 ) 圖 ( 五 ) (4) 常態分布曲線下的面積為,當 a b 時,常態分布曲線下的面 積就表示隨機變數 發生在 a 與 b 之間的比例 ( 如圖 ( 六 )). (5) 常態分布為一連續分布,其變數 在任一點 a 的曲線下面積皆為 0,即 P( a) 0,所以事件 a 與事件 a 發生的機 率相等,即 P( a) P( a),此與離散型的機率分布不同( 如 圖 ( 七 )). 4. 常態分布的重要規則 : 右圖 ( 八 ) 為一常態分布曲線圖,其平均數為,標準差為,則 : () 約有 68% 的變數 落在距平均數左右各一個標準 差的範圍內,即 P( ) 0.68. () 約有 95% 的變數 落在距平均數左右兩個標準差 的範圍內,即 P( ) 0.95. (3) 約有 99.7% 的變數 落在距平均數左右三個標準差 的範圍內,即 P( 3 3 ) 0.997. 圖 ( 八 ) 圖 ( 六 ) 圖 ( 七 )
38 第一章機率與統計 對應課本 P.5 例 6 範例 3 常態分布估計二項分布練習 3 喜歡打球的豪哥投進三分球的命中率為 0.36, 今豪哥在三分線外連續投 00 球,若隨機變數 表其投進的球數,試估計其成功比率落 00 在下列各區間中的機率 : () 0.3 0.408. 00 () 0.64 0.456. 00 00, p 0.36 () 0.3 0.36 0.048 p, 0.408 0.36 0.048 p, 以常態分布估計 00 右一個標準差內的機率約 68%. 0.36( 0.36) 0.048. 00 的值落在平均數 p 左 () 0.64 0.36 0.096 0.36 0.048 p, 0.456 0.36 0.096 0.36 0.048 p, 以常態分布估計 00 右兩個標準差內的機率約 95%. 的值落在平均數 p 左 一顆不均勻的骰子其出現 6 點的機率為 4,今連 續投擲 300 次骰子,隨機變數 表出現 6 點的次 數,試估計其成功比率 的機率 : () 0.5 0.75. 300 () 0.0 0.30. 300 300, p 4 300 () 0.5 0.5 0.05 p, 0.75 0.5 0.05 p, 以常態分布估計 300 落在下列各區間中 ( ) 4 4 0.05. 300 的值落在平均數 p 左右一個標準差內的機率約 68%. () 0.0 0.5 0.05 0.5 0.05 p, 0.30 0.5 0.05 0.5 0.05 p, 以常態分布估計 300 的值落在平均數 p 左右兩個標準差內的機率約 95%.
-4 抽樣與統計推論 39 類題重複一項白努利試驗 900 次,假設每次成功的機率為 0.64,若總計成功 次,試估計成功 68% 比率落在 0.64 與 0.656 之間的機率. 900
40 第一章機率與統計 對應課本 P.6 觀念題 3 範例 4 常態分布曲線練習 4 三個變數,, 3 的常態分布圖形分別為 y f ( x ), y f x 些為正確? ( ), y f ( x3),則下列選項哪 () 的標準差最大 () 的標準差最大 (3) 3 的標準差最大 (4) 的平均數最大 (5) 三者的平均數相等. f ( x ), f ( x ) 與 f ( x ) 的中心位置相同, 3,, 的平均數相等, 3 又 f ( x ) 的圖形較分散, 標準差最大, 3 3 故選 (3)(5). 已知 與 Y 為兩常態分布的隨機變數,其平均 數分別為 與 Y,標準差為 與 Y Y 且 Y,若,則下列選項哪些為正確? () 曲線與 Y 曲線的中心位置相同 () 曲 線與 Y 曲線的中心位置不同 (3) 曲線比 Y 曲線的形狀較陡 較窄 (4) Y 曲線比 曲線的 形狀較陡 較窄 (5) 兩圖形無法比較. Y 又 Y 故選 ()(4)., 曲線與 Y 曲線的中心位置相同,, Y 曲線較 曲線的形狀較陡 較窄,
-4 抽樣與統計推論 4 類題設 為常態分布的隨機變數,其平均數為 60,標準差為 3,則下列各選項何者正確? ()()(3)(4) () 平均數決定常態分布曲線的位置 () 標準差決定常態分布曲線的陡峭程度 (3) P(57 63) P(57 63) (4) P( 57) P( 63) (5) P( 60). 對應課本 P.49 隨堂練習 範例 5 68 95 99.7 的常態規律練習 5 某校高一共有 600 人,第一次段考數學成績呈常態分布,平均成績為 68 分,標準差為 8 分,請概估 : () 此次段考數學成績低於 60 分的學生約有多少人? () 小宇考 84 分,在全一年級學生中大約排第幾名? () 平均成績 68 分,標準差 8 分,且成績呈常態分布, 60 分以下或 76 分以上者占 3% 60 分以下占 6%,而 600 6% 96( 人 ),即不及格學生約有 96 人. () 84 分以上者約占.5% 600.5% 5, 小宇考 84 分約排在第 5 名左右. 某校高三有 00 位學生,第一次模擬考的數學平均成績為 7 分,標準差為 6 分,且成績分布呈常態分布,試問 : () 本次模擬考約有多少人成績不及格? () 婷婷考 78 分,在全三年級學生中大約排第幾名? () 平均成績為 7 分,標準差 6 分,且成績呈常態分布, 在 60 分以下或 84 分以上者約占 5%,即 60 分以下者約占.5%, 而 00.5% 30 ( 人 ),即約有 30 人成績不及格. () 在 66 分以下或 78 分以上者約占 3%, 在 78 分以上者約占 6%,而 00 6% 9 ( 人 ),故婷婷考 78 分約排在第 9 名左右.
4 第一章機率與統計 類題某地區中,健康男生與肺結核男生的體溫 ( 攝氏溫度 ) 統計如下表 : 健康男生 肺結核男生 平均溫度 36.9 37.5 標準差 0.8 0.56 假設兩組體溫都呈常態分布,試回答下列各問題 : () 求健康男生體溫在 36.6 到 37.8 之間在健康男生中所占的百分比. () 以平均溫度為中心,求包含 95% 的肺結核男生體溫的範圍約為何? () 約 68% ()36.38 到 38.6 之間 基礎觀念 4 標準常態分布 對應課本 P.49
-4 抽樣與統計推論 43. 前言 : 常態分布中的參數為平均數 與標準差,當 與 不同 時,會使得常態曲線的位置與形狀不同,所以在相同的區間 [ a, b] 內,常態分布不同,其發生的機率亦不同,故有標準化的必要.. 標準常態分布 : 平均數為 0,標準差為 的常態分布,就稱為標準 常態分布,若常態隨機變數 的平均數為,標準差為,則變數 Z 也是常態隨機變數, 且 Z 的平均數為 E( Z ) E( ) E( ) 0, Z 的標準差為 Z,即 Z 為標準常態分布的隨機變數. 3. 標準常態分布 Z 的機率表 : 標準常態分布 Z 的機率表 ( 0 Z 的機率 ) 機率 機率 機率 機率 0.0 0.0000.0 0.343.0 0.477 3.0 0.4987 0. 0.0398. 0.3643. 0.48 3. 0.4990 0. 0.0793. 0.3849. 0.486 3. 0.4993 0.3 0.79.3 0.403.3 0.4893 3.3 0.4995 0.4 0.554.4 0.49.4 0.498 3.4 0.4997 0.5 0.95.5 0.433.5 0.4938 3.5 0.4998 0.6 0.57.6 0.445.6 0.4953 3.6 0.4998 0.7 0.580.7 0.4554.7 0.4965 3.7 0.4999 0.8 0.88.8 0.464.8 0.4974 3.8 0.4999 0.9 0.359.9 0.473.9 0.498 3.9 0.5000 4. 中央極值定理 : 由平均數為,標準差為 的母體中,重複隨機的抽取大小均為 的獨立樣本, 而每抽取一個樣本便求得一個平均數,當樣本數 很大時,這些樣本平均數的平均數正好 就是母體的平均數,又其樣本平均數的標準差為,例如: 清水高中高一共有 550 位同學, 第一次段考數學平均分數 7 分,標準差 9 分,若我們從 550 位同學中隨機抽取 36 位同 學的成績作為樣本,可以求得一平均數,再重新抽取 36 位同學的成績作為樣本,又可以求得一 平均數,如此重複抽樣,則我們可以得到許多的樣本平均數,而這些樣本平均數之平均數將會 9 非常接近 7 分,但這些樣本平均數的標準差為.5 36 分,又不論原本母體的各分數之次數 分配為何,這些樣本平均數將非常接近於常態分布.
44 第一章機率與統計 對應課本 P.50 例 5 範例 6 標準常態分布練習 6 設隨機變數 為平均數 68,標準差 6 的 常態分布.試利用 基礎觀念 中的標準常態分 布 Z 的機率表,求出下列各事件的機率. () P(68 74). () P( 80). (3) P( 77). 已知 68, 6, 68 令變數 Z,則: 6 68 68 74 68 () P(68 74) P( Z ) 6 6 () P( 80) P(0 Z ) 0.343. 80 68 P( Z ) P( Z ) 6 P( Z 0) P(0 Z ) 0.5 0.477 0.977. 77 68 (3) P( 77) P( Z ) P( Z.5) 6 P( Z.5) [ P( Z 0) P(0 Z.5)] (0.5 0.433) 0.0668. 設隨機變數 為常態分布,且平均數 75,標 準差 5,試利用 基礎觀念 中的標準常態 分布 Z 的機率表,求出下列各事件的機率. () P(70 80). () P( 85). (3) P( 90). 已知 75, 5, 75 令變數 Z,則: 5 70 75 80 75 () P(70 80) P( Z ) 5 5 P( Z ) P(0 Z ) 0.343 0.686. 85 75 () P( 85) P( Z ) P( Z ) 5 P( Z 0) P(0 Z ) 0.5 0.477 0.977. 90 75 (3) P( 90) P( Z ) P( Z 3) 5 P( Z 3) [ P( Z 0) P(0 Z 3)] (0.5 0.4987) 0.003. 類題連續投擲一公正的骰子 5 次,以 表 5 次中 點出現次數的比率,試求 : () 的標準差. () 若小宇連續投擲 5 次骰子,希望與 距離 個標準差以內,則小宇投擲 5 次骰子 最少需出現幾次 點? 最多出現幾次 點? () 30 () 3 次, 9 次 基礎觀念 5 信賴區間與信心水準 對應課本 P.5. 信賴區間與信心水準 : 報章 媒體經常利用民調來反映一般民眾對某些公共政策支持或反對的程度,對某位行政首長施政的滿意或不滿意程度,對某位候選人支持或不支持的程度,.例如 : 下面是某報社針對某位政治人物 從政生涯 表現的滿意度調查 : 四成九民眾滿意,二成八不滿意,本次調查以臺灣地區住宅電話為母體作尾數兩位隨機抽樣,成功
-4 抽樣與統計推論 45 訪問了 93 位成年人,在 95% 的信心水準下,抽樣誤差在正負 3. 個百分點以內 (96 年 4 月 ),在這項調查中 : () 所謂 抽樣誤差在正負 3. 個百分點 的意義 : 將 49% 分別加減 3.%,可以得一區間為 [0.49 0.03, 0.49 0.03] [0.458, 0.5],即表示臺灣的成年人中滿意此政治人物的 從 政生涯 表現的真正滿意度 p 值,可能會介於 45.8% 與 5.% 之間,而對於區間 [0.458, 0.5] 就稱為本次調查的信賴區間, 0.458 及 0.5 稱為信賴界限. () 所謂 95% 的信心水準 的意義 : 除非我們對全臺灣的成年人做全面的普查,否則母體真 正的滿意度 p 值是不可能得知的,而任何一次的抽樣都會有誤差,所以我們並不能保證真 正的滿意度 p 值一定會介於我們所推估的信賴區間之中,而所謂 95% 的信心水準 即表 示 : 如果我們對母體抽樣 00 次,而每一次抽樣結果都會得到一個信賴區間,那麼這 00 個信賴區間中,約有 95 個會涵蓋母體真正的 p 值.. 設一枚不均勻的銅板出現正面的機率 p ( 未知 ),今欲重複投擲 次,若隨機變數 表出現正 面的次數,變數 p 表 次投擲中出現正面次數的比例,即 p,當 足夠大時,變數 p 近似於 p( p) p p 常態分布,其平均數 p,標準差,而變數 Z 為標準常態分布,由標準常 態分布表,我們可以得知 P(0 Z.96) 0.475,亦即 P( Z.96) 0.95,也就是 P( p p.96 ) 0.95.為了方便運算,通常我們取 P( p p ) 0.95, 所以對變數 p 而言,有 95% 的機會會落在 p 的範圍之間,也可以記為 [ p, p ], p( p) 但真正的參數 p 值是未知的,則 也是未知的,經統計學專家運算得知,可以用 p 值 p ( p ) 取代未知的 p 值,就是可以為標準差,所以 [ p, p ] p( p ) [ p, p( p) p ] 就稱為本次調查在 95% 的信心水準下的信賴區間. 3. 仿照上述第 點的說法,我們可以得知 : () 由一個成功比例為 p( 未知 ) 的母體中隨機取出 個樣本點,其中 足夠大,若這個樣本中 的成功比例為 p,則在 68% 的信心水準下的信賴區間為 ( ) ( ) [ p p, p p p p ]. () 由一個成功比例為 p( 未知 ) 的母體中隨機取出 個樣本點,其中 足夠大,若這個樣本中 的成功比例為 p,則在 99.7% 的信心水準下的信賴區間為 ( ) ( ) [ 3 p p, 3 p p p p ]. 4. 在一定的信心水準下,樣本數愈大,則信賴區間就愈小,但樣本數成倍數增加時,信賴區間並不 會成倍數減少,因為當樣本不斷增加時,區間估計的準確性到一定程度會增加得很慢,而決定 樣本大小和抽樣的成本有很大的關係.
46 第一章機率與統計 p( p) 5. 估計所需的樣本大小 : 標準差中,將 p 定為 0.5 時,可以得到 p( p) 的最大值為 0.5,若我們先決定抽樣的誤差值 e 後便可以推算出應抽取的樣本數. 6. 當抽取的樣本數一定下,則調查的信心水準愈大時,信賴區間的範圍就愈大.
-4 抽樣與統計推論 47 範例 7 信賴區間及信心水準的解讀練習 7 某民調公司對行政院長施政滿意度的調查 : 滿意度 4 成 4,本次調查成功訪問了 050 位臺灣地區 0 歲以上民眾,在 95% 的信心水準下,抽樣誤差為正負 3 個百分點,試問 : () 本次調查的母體是什麼? 樣本數為多少? () 受訪者中對行政院長施政滿意者有多少人? (3) 本次調查的信賴區間為何? () 母體為臺灣地區 0 歲以上的民眾,樣本數為 050. () 受訪者中對行政院長施政滿意者有 050 44% 46 ( 人 ). (3) 信賴區間為 [0.44 0.03, 0.44 0.03] [0.4, 0.47]. 某大城市為了解市民對治安的滿意程度,今以隨機抽樣成功訪問了 50 位 8 歲以上的市民,其中有 35 位市民表示滿意,在 95% 的信心水準下,抽樣誤差.5 個百分點.試問 : () 本次調查的母體是什麼? 樣本數為多少? () 本次調查的滿意度為多少? (3) 本次調查的信賴區間為何? () 母體為該市 8 歲以上的所有市民,樣本數為 50. 35 () 本次調查的滿意度為 00 6 50 % %. (3) 信賴區間為 [0.6 0.05, 0.6 0.05] [0.35, 0.85]. 類題某校班聯會調查全校學生對 制服樣式 滿意程度,共成功的訪問了 960 位同學,滿意度為六成五,在 95% 的信心水準下,抽樣誤差為正負 3. 個百分點,試問 : () 本次調查的母體是什麼? 樣本數為多少? () 受訪者中對學校制服樣式滿意者有多少人? (3) 本次調查的信賴區間為何?
48 第一章機率與統計 () 全體學生, 960 () 64 人 (3)[0.69, 0.68] 對應課本 P.54 例 7 範例 8 信賴區間練習 8 某報對臺北市市長選情做候選人支持度的調查,成功訪問了 8 位合格選民,其中有 69 人表示支持甲候選人,試問 : () 甲候選人的支持比例為何? () 在 68% 的信心水準下,本次調查的信賴區間為何? (3) 在 95% 的信心水準下,本次調查的信賴區間為何? () 甲候選人的支持比例 69 p 00 % 54 %. 8 () 在 68% 的信心水準下,誤差範圍為 p ( p ) 0.54 ( 0.54) 0.04, 8 本次調查的信賴區間為 [0.54 0.04, 0.54 0.04] [0.56, 0.554]. (3) 在 95% 的信心水準下,誤差範圍為 p ( p ) 0.54 ( 0.54) 0.08, 8 本次調查的信賴區間為 [0.54 0.08, 0.54 0.08] [0.5, 0.568]. 在一選舉中,甲候選人的競選總部電話訪問了 900 位合格選民,其中有 576 人表示支持甲候選 人,試問 : () 甲候選人的支持比例為何? () 在 95% 的信心水準下,本次調查的信賴區間 為何? (3) 在 99.7% 的信心水準下,本次調查的信賴區 間為何? () 甲候選人的支持比例 576 p 00 % 64 %. 900 () 在 95% 的信心水準下,誤差範圍為 p ( p ) 0.64 ( 0.64) 0.03, 900 本次調查的信賴區間為 [0.64 0.03, 0.64 0.03] [0.608, 0.67]. (3) 在 99.7% 的信心水準下,誤差範圍為 p ( p ) 0.64 ( 0.64) 3 3 0.048, 900 本次調查的信賴區間為 [0.64 0.048, 0.64 0.048] [0.59, 0.688]. 類題一家大報對政府某一公共工程作民意調查,共電話查訪了 600 家附近的住戶,其中有 348 家持反對意見,試問 : () 附近的住戶反對此項公共工程的比例為何?
-4 抽樣與統計推論 49 () 在 68% 的信心水準下,本次調查的信賴區間為何? (3) 在 95% 的信心水準下,本次調查的信賴區間為何? () 58% ()[0.56, 0.60] (3)[0.54, 0.6] 範例 9 有效樣本數的求法練習 9 有一手機製造商宣稱其公司的產品在市場占 有率為 8%,若想要推論這個數據是否屬實,在 95% 的信心水準及抽查誤差為正負 3 個百分點 的條件下,應隨機採樣多少個有效的樣本? 市場占有率 p 0.8,在 95% 的信心水準下, 0.8 ( 0.8) 正負誤差為 0.03 0.8 0.7 896, 0.05 故應隨機抽訪 896 個有效樣本. 在一市中心廣場抽查訪問有關新聞資訊主要 來源時,發現有 36% 的人說是電視新聞.若想推 論這個數據是否屬實,在 95% 的信心水準及抽 樣誤差為正負 3. 個百分點的條件下,應隨機抽 訪多少人? 來自電視新聞的比率 p 0.36,在 95% 的信心水準 0.36 ( 0.36) 下,正負誤差為 0.03 0.36 0.64 900, 0.06 故應隨機抽訪 900 人.
50 第一章機率與統計 類題在一項新產品的市場調查中,製造商發現有 36% 的顧客會喜歡此項新產品,若在 95% 的信心水準及抽樣誤差為 3 個百分點的條件下,本次調查應至少隨機有效採樣多少位顧客? 04 位 範例 0 求樣本數練習 0 在一選舉中,甲候選人的辦事處抽訪 位選民 後,希望在 95% 的信心水準下,估計全體選民支 持比例 p 的抽樣誤差不超過正負 3. 個百分點, 則 至少須多大? p( p) 0.03 p( p) 0.06 p( p) 0.06 [ ( p ) ], 0.06 4 當 p 代入時, 976.6, 0.06 4 故至少應抽訪 977 人. 某家八卦雜誌欲了解其在市場占有率的情況, 乃決定進行市場調查.若該雜誌社希望在 95% 的信心水準下,樣本比例 p 與母體比例 p 的誤 差不超過 個百分點,則選取的樣本至少應多 大? p( p) 0.0, 令 p ( ) 代入,得 0.0 500, 0.0 故至少應選取的樣本數為 500 人.
-4 抽樣與統計推論 5 類題某食品製造公司欲了解其市場占有率,乃在市場上進行抽樣調查,若該公司希望在 99.7 % 的信心水準下,樣本比例 p 與母體比例 p 的誤差不超過 3.5 個百分點,則選取的樣本至少有多少人? 837 人
5 第一章機率與統計 一 基礎題. 某班 30 位同學依照座號列出其體重如下表 : ( 單位 : 公斤 ) 座號 3 4 5 6 7 8 9 0 體重 77 90 60 5 46 56 44 58 93 48 座號 3 4 5 6 7 8 9 0 體重 5 54 70 50 55 6 7 50 53 7 座號 3 4 5 6 7 8 9 30 體重 53 88 9 4 84 59 63 59 53 47 隨機號碼表 98 0396 558 909 54 0 380 855 477 059 6640 535 8733 486 7657 979 9834 93 069 786 試利用隨機號碼表的第,3 兩列,由第 行開始選取 5 位同學,則其平均體重為 64. 公斤.. 某班 50 位同學段考成績算術平均數為 70 分,標準差為 5 分,若成績呈常態分布,試求 : () 成績在 65~75( 分 ) 之間約有 34 人. () 成績在 70~80( 分 ) 之間約有 4 人. 3. 魏氏兒童智力量表是一種普遍使用的 IQ 測驗,其 IQ 分布約為平均數 00,標準差 5 的常態分 布,若 IQ 測驗超過兩個標準差的兒童就稱為資賦優異兒童.試利用 68 95 99.7 的規則,計算出 000 個國小五年級學生中,約有 5 位資賦優異兒童. 4. 投擲一均勻的硬幣 4 次,若變數 表出現正面的次數,而 為 的期望值, 為 的標準差,試 求 : () P( ) () P( 3 ) 7 8. 6. 5. 設隨機變數 為平均數 75,標準差 5 的常態分布,試求 : () P(75 80) 0.343. () P( 90) 0.9987. (3) P( 85) 0.08. 6. 自全校學生中抽取 00 人,其中患近視者有 64 人.試求 : () 在 68% 的信心水準下,本次調查的信賴區間為 [0.59, 0.688]. () 在 95% 的信心水準下,本次調查的信賴區間為 [0.544, 0.736].
-4 抽樣與統計推論 53 7. 某校班聯會為了解學生對學校舉辦的營養午餐之滿意程度,發現在 95% 的信心水準下,約有 70 % 到 76% 的學生滿意學校的營養午餐,試問 : () 本次調查抽樣 876 人. () 本次調查中滿意學校營養午餐的學生約有 639 人. 8. 某一公司針對員工對 公司福利 滿意調查中,所得的結果在 95% 的信心水準下的信賴區間 為 [0.58, 0.58],則在 68% 的信心水準下的信賴區間為 [0.534, 0.566]. 9. 在一選舉中,某民調中心想調查甲候選人的支持度,所得的結果在 95% 的信心水準下,誤差範圍 在正負 3 個百分點內,為達到這個誤差範圍,至少應抽樣調查 人. 0. 取一枚硬幣投擲 000 次,其中得到 480 次正面,則此硬幣出現正面的機率 p 在 95% 的信心水準 下的信賴區間為 [0.448, 0.5]. 二 進階題. 某升學補習班的招生廣告上號稱 本班的應屆高三生,約有 6 成 4 的同學考取國立大學,且有 95% 的信心水準,其誤差在正負 3 個百分點以內.若想要推論這個數據是否屬實,應成功抽訪 04 個有效樣本.. 一糖果製造商有一部機器生產的包裝產品,其重量呈常態分布,平均重量為 00 公克,標準差為 公克.但品管單位要求的規格為 99 3公克,超過規格為不合格,則在目前的機器設備下,不合 格的比例為 0.85. 3. 數據 呈常態分布,令其介於 與 k 的機率為 p,其中 為平均數, 為標準差, k 為一正實 數,附表如下 : k 0.5.0.5.0.5 3.0 p 0.95 0.343 0.433 0.477 0.4938 0.4987
54 第一章機率與統計設某次企業徵才考試成績呈常態分布,平均數 6.5分,標準差 5分,已知有 0000 人應考,且成績合格標準訂為 70 分,則此次考試合格的人數大約有 668 人.
-4 抽樣與統計推論 55 (4)(5). 某高中共有 0 個班級,每班各有 40 位學生,其中男生 5 人,女生 5 人.若從全校 800 人中以簡單隨機抽樣抽出 80 人,試問下列哪些選項是正確的?( 多選 ) () 每班至少會有一人被抽中 () 抽出來的男生人數一定比女生人數多 (3) 已知小文是男生,小美是女生,則小文被抽中的機率大於小美被抽中的機率 (4) 若學生甲和學生乙在同一班,學生丙在另外一班,則甲 乙兩人同時被抽中的機率跟甲 丙兩人同時被抽中的機率一樣 (5) 學生 A 和學生 B 是兄弟,他們同時被抽中 的機率小於 00. 97 學測 ()(). 某廠商委託民調機構在甲 乙兩地調查聽過某項產品的居民占當地居民之百分比 ( 以下簡稱為 知名度 ).結果如下: 在 95% 信心水準之下,該產品在甲 乙兩地的知名度之信賴區間分別為 [0.50, 0.58],[0.08, 0.6].試問下列哪些選項是正確的? ( 多選 ) () 甲地本次的參訪者中, 54% 的人聽過該產品 () 此次民調在乙地的參訪人數少於在甲地的參訪人數 (3) 此次調查結果可解讀為 : 甲地全體居民中有一半以上的人聽過該產品的機率大於 95% (4) 若在乙地以同樣方式進行多次民調,所得知名度有 95% 的機會落在區間 [0.08, 0.6] (5) 經密集廣告宣傳後,在乙地再次進行民調,並增加參訪人數達原人數的四倍,則在 95% 信心水準之下該產品的知名度之信賴區間寬度會減半 ( 即 0.04). 98 學測
56 第一章機率與統計 ()(4) 3. 想要了解臺灣的公民對某議題支持的程度所作的抽樣調查,依性別區分,所得結果如下表 : 女性公民男性公民贊成此議題的比例 p 0.5 0.59 p 的標準差 p ( p ) 0.0 0.04 請問從此次抽樣結果可以得到下列哪些推論?( 多選 ) () 全臺灣男性公民贊成此議題的比例大於女性公民贊成此議題的比例 () 在 95 % 的信心水準之下,全臺灣女性公民贊成此議題之比例的信賴區間為 [0.48, 0.56] ( 計算到小數點後第二位,以下四捨五入 ) (3) 此次抽樣的女性公民數少於男性公民數 (4) 如果不區分性別,此次抽樣贊成此議題的比例 p 介於 0.5 與 0.59 之間 (5) 如果不區分性別,此次抽樣 p( p ) p 的標準差介於 0.0 與 0.04 之間. 99 學測 () 4. 甲 乙兩校有一樣多的學生參加數學能力測驗,兩校學生測驗成績的分布都很接 近常態分布,其中甲校學生的平均分數為 60 分,標準差為 0 分 ; 乙校學生的平均 分數為 65 分,標準差為 5 分.若用粗線表示甲校學生成績分布曲線 ; 細線表示乙校 學生成績分布曲線,則下列哪一個分布圖較為正確? () () (3) (4) (5) 0 學測