第五章機率分配 授課教師 : 2011.02.18 更新 1
本章重點 認識隨機變數 瞭解期望值與變異數的定義與意義 認識二項分配與常態分配的各種性質 瞭解標準常態分配如何查表與其應用 2
大綱 隨機變數與機率分配 機率分配的重要參數 二項分配 百努力試驗 常態分配 標準常態分配 3
5-1 隨機變數與機率分配 並非所有的事件發生機率都是定值 機率也是一個變數 在本節中將介紹隨機變數與其對應的機率分配 4
5.1.1 隨機變數的意義 隨機變數 定義於樣本空間的實數函數, 一般可解釋為樣本出像的分類標準, 也可視作一個樣本空間的總代表 例如用變數 X 來表示隨機從前程大學中抽出 100 人的性別 用變數 Y 來表示這 100 人中的血型 此處 X Y 即代表樣本出像的分類標準 5
若 X 表示性別, 那麼可用 x=1 表示男生, x=2 表示女生 Y 表示血型, 那麼 y=1 表示 A 型血, y=2 表 B 型血, y=3 表 O 型血, y=4 表 AB 型血 6
隨機變數的種類 離散型隨機變數 離散型隨機變數最大的特性是 可數 可以一筆一筆資料逐項進行計數 例如隨機抽出 100 人中男性的人數 連續型隨機變數 連續型隨機變數最大的特性是 不可數 不能夠一筆一筆的將資料逐項進行計數 例如 : 連續發生兩次地震所需時間 7
例 1 隨機抽樣 100 人記錄這 100 人的性別 居住地 ( 北 中 南 ) 家庭背景 ( 雙親 單親 他人扶養 ) 以及出生月份 請你以隨機變數的方式來描述這些變數與其對應的變量 8
5.1.2 機率分配 指值某個隨機變數各變量所對應的機率 隨機變數與其機率分配的對應關為一對一對應或多對一對應 9
機率分配表示法 機率分配表 x 0 1 2 3 f(x) 1/8 3/8 3/8 1/8 機率函數 f ( x) 1, x = 0,3 8 = 3, x = 1,2 8 10
機率分配圖 11
例 2 同時投擲四枚硬幣, 假設隨機變數 X 表示出現人頭像的硬幣數, 試求隨機變數 X 的機率分配 請你分別使用機率分配表 機率分配圖 與機率函數三種方式表示 (3) 機率函數 12
5-2 機率分配的重要參數 想要描述一組資料的分佈情形, 最重要的兩個參數分別為平均數與變異數 常態分配, 只要知道平均數與標準差, 整個機率函數的圖形就可以描繪出來 13
5.2.1 期望值 期望值其實就是平均數 期望值的定義為 E( x) = xf ( x) x 期望值等於隨機變數值與對應機率乘積的總和 14
例 3 詢問全班 16 位修高等統計學的學生, 從住處到學校需花費時間為何, 假設隨機變數 X 為學生回答之花費時間 ( 單位 : 分鐘 ), 將調查所得到的資料製作成機率分配表如下所示 : 求隨機變數 X 的期望值 ( 即求學生到校平均花費時間 ) 3 1 5 3 1 E( x) = xf ( x) = 5 + 10 + 20 + 40 + 45 = 20 16 4 16 16 16 x 15
例 4 某人向保險公司投保 1 千萬的意外險, 保費一年 4000 元 根據契約書的規定, 若被保險人在保險期間意外死亡, 保險公司需理賠 1 千萬元 已知此人一年內發生意外死亡的機率為 10-10, 試求保險公司獲利的期望值多少元? 16
5.2.2 變異數與標準差 變異數的定義 2 2 Var( x) = E[( x E( x)) ] = E( x ) E( x) E 這個符號具有下列性質 表任意的式子 E( = ) f ( x) 標準差的定義 標準差則等於變異數開根號 [ ] 2 17
例 5 承例題 3, 求隨機變數 X 的變異數與標準差 ( 即求到校花費時間的變異數與標準差 ) 18
5-3 二項分配 凡是調查的結果只有兩種情況 成功或失敗 ; 是或否 ; 對或錯.. 等, 都屬於二項分配 19
5.3.1 二項試驗 二項試驗必須滿足下列四個條件 重複進行 n 次相同的試驗 每一次試驗皆僅有兩種結果 成功或失敗 每一次試驗, 成功與失敗的機率永遠固定不變, 且成功機率加失敗機率等於 1 每一次試驗均為獨立事件 20
例 6 請舉出至少 3 個二項試驗的例子 第一個例子是 : 生 10 位小孩 小孩子的性別只有男女兩種情況, 且重複相同的試驗, 生男生女的機率永遠固定都是 0.5, 相加等於 1, 同時滿足獨立事件 第二個例子是 : 買樂透 10 期且每期只買一張 樂透只有中獎 ( 不考慮獎項 ) 或不中獎兩種情況, 且重複相同的試驗, 中獎與不中獎的機率永遠固定不變, 兩者機率和等於 1, 同時滿足獨立事件 第三個例子是 : 從 0 到 9 十個數字中, 任選一個數字, 連續選 10 次, 選出數字 1 選出的數字只有兩種情況, 1 或不是 1, 且重複相同的試驗, 選出 1 的機率永遠等於 0.1, 不是 1 的機率等於 0.9, 相加等於 1, 同時滿足獨立事件 21
5.2.3 二項分配 進行二項試驗, 所得到的機率函數 二項分配的機率函數 f n x n x ( x) = Cx p q, x = 0,1,2,, n 其中 p 為成功機率, q 為失敗機率 22
例 7 假設某保險業務員向客戶推銷保險, 成功的機率永遠固定等於 0.2 現在他連續向 6 個人推銷保險, 請問這 6 個人恰有 4 個人向他買保險的機率為何? 23
5.3.3 二項分配的期望值與變異數 期望值 E( x) = np 變異數 V ( x) = npq 24
例 8 已知某袋中共有 10 個球, 其中有 8 個黑球 2 個白球 現在隨機從這個袋中任取 4 球, 試分別求取出黑球與白球的期望值個數與變異數 25
5.3.4 二項分配圖形的製作 用一個實際例子來說明 26
例 9 n x n x 已知二項分配的機率函數為 f x) = C p q, 令 n=10,p=0.3, 請用 Excel 做出二項分配的圖形 Excel 指令說明 n COMBIN(n, r) : 等於組合公式 ( x, x = 0,1,2,, n C r Excel 指令說明 BINOMDIST( 成功次數, 試驗次數, 成功機率, 邏輯值 ) : 邏輯值 =FALSE 傳回機率函數值 ; 邏輯值 =TRUE 傳回累積分配函數值 10 3 7 例如 : BINOMDIST(3,10,0.3,FALSE) (0.3) (0.7) 打開檔案 5-3- 4 = C 3 27
5.3.5 二項分配圖形的性質 下列圖形為試驗次數 n=10, 在不同成功機率下的二項分配 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10 0.3 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10 0.3 0.25 0.2 0.15 0.1 0.05 0 成功機率 p=0.1 0 1 2 3 4 5 6 7 8 9 10 成功機率 p=0.5 成功機率 p=0.3 0.3 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10 成功機率 p=0.7 28
0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10 成功機率 p=0.9 成功機率 0.5 時圖形為對稱分配, 成功機率小於 0.5 時, 圖形為左偏分配, 大於 0.5 時圖形為右偏分配 29
下列圖形為成功機率固定 p=0.1 的條件下, 不同試驗次數的二項分配 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 1 2 3 4 5 6 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10 n=5 n=10 0.3 0.25 0.25 0.2 0.2 0.15 0.1 0.15 0.1 0.05 0.05 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 n=20 n=30 30
0.25 0.2 0.15 0.1 0.05 0 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 0.2 0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0 2 4 6 8 101214161820222426283032343638404244464850 n=40 n=50 試驗次數增加, 二項分配的圖形會趨近於對稱分配 31
5-4 百努力試驗 百努力試驗 (Bernoulli trial) 是二項試驗的一個特例 進行二項試驗時, 不論成功或失敗, 只做一次時, 就稱為百努力試驗 也有人稱為點二項試驗 32
百努力分配的機率函數 期望值 變異數 f x C p q x 1 x 1 x ( ) = x, = 0,1 E( x) = p Var( x) = pq 33
5-5 常態分配 常態分配在人文社會學的研究中扮演十分重要的角色 只要求出平均數與標準差, 那麼整個分配的圖形就可以畫出來 因此在人文社會學的研究中平均數與標準差 ( 或變異數 ) 是最重要的兩個統計量 34
5.5.1 常態分配的簡介 常態分配的機率函數曲線稱為常態曲線 常態分配之機率函數 1 x µ ( ) 2 1 2 σ f ( x) = e, < x < 2πσ 為母體平均數, 為母體標準差 記作 : X 2 ~ N ( µ, σ ) 35
5.5.2 常態曲線的繪製 繪製常態曲線必須給定母體平均數與母體變異數的數值, 然後再利用描點的方式畫出 36
例 10 已知常態分配機率函數為 現假設母體平 1 x µ ( ) 2 1 2 σ f ( x) = e, < x < 2πσ 均數 =10, 母體變異數 2=2, 試利用 Excel 繪製常態曲線 打開檔案 5-5-2 常態曲線的繪製 37
5.3.3 常態曲線的特性 曲線下方與 x 軸所圍面積等於 1 對稱於直線 x= µ 由 開始向左向右各一個標準差之處為常態曲線的兩個反曲點 以 x 軸為漸近線 常態分配曲線為單峰對稱分配, 平均數 中位數 眾數三個數值相等 38
39
5.5.4 常態分配機率的求法 採用面積的方式來定義機率大小 b 1 x µ ( ) 2 1 2 σ P( a x b) = e dx 2πσ a 40
下列式子所求出來的答案是相同的 P( a x b) = P( a x < b) = P( a < x b) = P( a < x < b) 41
例 11 已知前程大學一共有 1 萬名學生, 已知學生的身高服從常態分配, 全體平均身高為 172 公分, 標準差 5 公分 請你估計前程大學學生的身高在 165-175 公分大約有幾人? 42
5-6 標準常態分配 沒有學過數值分析的人而言, 想要計算常態分配的機率值, 幾乎是不可能的事情 為了讓非數學背景的人也能夠順利求出常態分配的機率值, 數學家想到透過查表的方式 43
常態分配的查表法是利用積分技巧中的變數變換法, 讓所有的常態分配都能對應到相同的積分函數, 如此便可以用單一的表查出所有的常態分配機率值 44
1 x µ ( ) 2 1 2 σ f ( x) = e, < x < 2πσ z = x µ σ 標準常態分配 1 2 1 z 2 f ( z) = e, < z < 2π 45
5.6.1 標準常態分配的特性 標準常態分配的平均數等於 0, 標準差為 1 46
5.6.2 標準常態分配的查表 P( z 1.23) = 0.1093 z = 0.1093 1.23 47
例 12 試利用標準常態分配表求下列各小題之機率 : (1) P(z>1.13) (2) P(z<2.06) (3) P(z>-1) (4) P(z<-1.96) (5) P(-1<z<2.14) 48
49
(1) a = 1.74 (2) a = 1.35 50
(3) a = 0.63 (4) a = 0.75 (5) a = 1.96 (6) a = 1.645 51
5.6.3 標準常態分配的應用 解題步驟 列式 ( 或畫圖 ) P( a x b) 標準化 查表 a µ b µ P( z ) σ σ 52
例 14 每年台灣地區都會舉辦大學聯考, 許多考生對於自己的落點十分關心, 因為能夠的預測落點的話, 可以當作選填自願的參考 已知某次大學聯考一共有 15 萬名考生, 已知均標 ( 全體平均數 ) 等於 300 分, 標準差 20 分 假設全體考生的成績分配為常態分配, 某人考了 338 分, 請問這位考生的分數落在前百分之多少? 順便請你幫他預估大約有多少考生的分數超越他? 53
例 15 一般購買產品都有保固期, 對消費者來說保固期越長越好, 但對製造商而言不希望有太多的產品在保固期內做免費的維修, 因此如何定保固期是一門很大的學問 前程汽車股份有限公司是一家全球化的汽車製造商, 根據他們自己內部的資料統計, 他們所製造的汽車平均壽命 20 年, 標準差 10 年, 而且汽車的壽命服從常態分配 前程汽車公司於保固期內會免費修理任何的毛病, 如果前程汽車公司對賣出的汽車只願意免費修理 5%, 請問保固期應該定多久? 54