Microsoft PowerPoint - Ch05 - PDF Free Download

品質管理 - 現代化觀念與實務應用 Quality Management-Contemporary Concepts and Practical Applications 鄭春生著 Chapter 5 應用於品質管制與改善之統計方法

學習要點透過本課程, 將可了解 : 1. 統計學之基本概念 2. 各種機率分配之理論和應用 3. 各種抽樣分配之理論和應用 4. 估計和假設檢定 5. 統計軟體之應用 2

統計學概論統計學是有關數據蒐集分類列表分析和根據數據或資訊做推論之一門科學, 可概分為以下兩種 : 敘述統計 (descriptive statistics) 根據蒐集到之資訊來描述一群事物推論統計 (inferential statistics) 根據樣本 (sample) 中之資訊來獲得母體 (population) 之重要結論 3

敘述統計一組數據必須加以描述, 才能讓他人了解其特性一組數據之變化情形, 除了可以用圖形法來表示外, 數量化之描述亦可以提供有用之情報常用的數據量化表示法有 : 描述集中趨勢 : 平均數 (mean) 中位數 (median) 眾數 (mode) 描述變異程度 : 變異數 (variance) 標準差 (standard deviation) 全距 (range) 4

敘述統計平均數假設 X 1,X 2,...,X n 為樣本中之觀測值, 樣本數據之集中趨勢可由樣本平均數來衡量, 樣本平均數定義為母體平均數是將母體中之所有數據加總後, 除以母體大小 N, 可表示為 5

敘述統計中位數中位數亦可用來衡量數據之集中趨勢中位數是指數據由小至大排列後, 位於中間之觀測值若數據個數為偶數, 則中間兩數值之平均數為中位數眾數眾數是指一組數據中, 發生次數最多之數值變異數樣本變異數 S 2 為 : 母體變異數 σ 2 為 : 6

敘述統計標準差標準差為變異數之平方根, 亦即母體標準差為全距全距可定義為一組數據中之最大值 (L) 與最小值 (S) 之差異量, 可表示為 R=L-S 7

機率分配群體中之數據值可以用機率分配來描述機率分配為一數學模式, 用來描述一個隨機變數 ( 以符號 X 表示 ) 之所有可能值 ( 稱為變量, 以 x 表示 ) 之出現機率機率分配可分成連續和不連續兩種連續分配若一變數是以連續尺度來量測, 而且其變量可為某一特定區間內之任意值時, 則其機率分配為連續例如產品之內外徑尺寸不連續分配若變數只能為某些特定值, 例如 x=0,1,2, 則稱其機率分配為不連續或離散 (discrete) 例如一件產品上之不合格點數之分配為不連續分配 8

機率分配不連續機率分配, 其隨機變數 X 等於否特定值 x 之機率為 : P{ X x} p( x) 對於連續機率分配, 隨機變數落於 a,b 兩數值所界定區域之機率為 : P { a X b} f ( x) dx f(x) 稱為機率密度函數 (probability density function, pdf) b a 9

機率分配累積分配函數 (cumulative distribution function, cdf) 係指隨機變數小於或等於某一個特定值 x 之機率對於連續型分配, 累積分配函數可定義為 : x F ( x) P{ X x} f ( u) du 對於離散型分配, 累積分配函數可定義為 : F ( x) P{ X x} p( x ) x x i i 10

超幾何分配在大小為 N 之有限群體中, 有 D 件屬於第一類,N-D 件為第二類今從群體中以不投返 (without replacement) 之方式隨機抽取 n 件樣本, 其中有 X 件屬於第一類, 則 X 為超幾何分配隨機變數, 其機率結集函數為超幾何分配之平均數和變異數分別為 11

Example 1 一批 25 件電晶體中包含 3 件不合格品, 今隨機抽取 5 件, 試計算發現 2 件不合格品之機率 Answer: D 3, N 25, n 5, 3 22 2 3 P{ X 2} 25 5 x 2 0.087 12

二項分配二項分配白努利試驗 (Bernoulli trials) 是指在含有連續 n 項獨立試驗之過程中, 每一項試驗之結果分為成功或失敗兩種情況若每次試驗中, 成功之機率 P 為固定, 則在 n 次白努利試驗中, 發現 x 次成功之機率可寫成上述機率函數稱為二項分配 (binomial distribution) 二項分配之平均數和變異數分別為 13

二項分配 Refer to Page. 151 圖 5-4 顯示 n 固定時,p 值改變對二項分配形狀之影響隨著 p 從 0 增加到 0.5 或 1 減少到 0.5 時, 分配會愈加對稱圖 5-5 顯示 p 固定時, 改變 n 值對二項分配形狀的影響, 隨著 n 增加, 分配愈加對稱 14

Example 2 某製造程序之不合格率為 5%, 今自製程中隨機抽取 20 件產品檢查, 試根據課本附表, 求取出現 2 件不合格品之機率 Answer: 兩件不合格品單點機率 =2 件累積機率 -1 件累積機率 P{ X 2} P{ X 2} P{ X 1} 0.925 0.736 0.189 15

Example 3 假設某電子零件之不合格率為 0.1, 今從生產線隨機抽取 20 件零件檢查, 請計算最多發現 2 件不合格品之機率為何? Answer: 即發現 0 1 2 件之累積機率值 P{ X 2} 2 20 (0.1) x0 x 0.677 x (0.9) 20x 16

卜瓦松分配卜瓦松分配 (Poisson distribution) 之機率結集函數可寫成其中 λ>0, λ 為平均數卜瓦松分配之平均數和變異數相等, 亦即 17

卜瓦松分配圖 5-7 顯示不同 λ 值之卜瓦松分配, 隨著 λ 增加, 卜瓦松分配更加對稱在品質管理中, 卜瓦松分配之典型應用係用以描述產品不合格數模式 (Chapter 8) 18

Example 4 某印刷電路板 (printed circuit board, PCB) 之平均不合格數為 λ=3, 今隨機抽取一件檢查, 是根據本書之附表, 求至少發現 4 個不合格數之機率? Answer: P{ X 4} 1 P{ X 3} 1 0.647 0.353 19

Example 5 在 20 m 2 之地毯中, 平均可以發現 4 個不合格點, 今檢驗 40 m 2 之地毯, 試計算發現 2 個不合格數之機率為何? Answer: 4(40 / 20) 8 亦可 4 / 20 0.2 0.2 40 8 P{ X 2} e 8 6 2! 2 0.011( 亦可查表得知 ) 20

巴斯卡分配 (skip) 假設在一連串的獨立試驗中, 每次成功的機率為 P, 令 X 代表第 r 次為成功的試驗, 則 X 為巴斯卡 (Pascal) 隨機變數, 其機率分配為 : 其中 r 為正整數巴斯卡分配之平均數和變異數 21

常態分配若 X 為常態 (normal) 隨機變數, 則 x 的機率密度函數為常態分配 (normal distribution) 之參數為平均數 μ 和變異數 σ 2, 其中常態分配一般以符號表示, 代表 x 服從平均數為 μ, 變異數為 σ 2 之常態分配 22

常態分配圖 5-9 為常態分配下, 數據之分布情形由圖可看出有 68.26% 之群體會落在所界定之範圍內落在 99.73% 內之機率有 95.46%, 而落在內之機率為 23

標準常態分配標準常態分配定義為其中, 代表標準常態分配之累積分配函數, 可由本書附表 4 查得上述轉換一般稱為標準化 (standardization), 用來將之隨機變數轉換成之隨機變數 24

Example 6 某項金屬物品之強度符合 N(210,25) 其規格要求強度至少 200 pst, 試求此項產品符合規格之機率 Answer: 設 X 為產品之強度, 合格率為 P{ X 200} 1 P{ X 200} 200 210 1 5 1 ( 2) 0.97725 再計算 1-P{Z -2} ( 查表 ) 之機率,refer to 圖 5-10 25

Example 7 某金屬物品之抗張強度為 N(50, 4), 試計算抗張強度低於 46 磅之機率與高於 52 磅之機率 Answer: 設 X 為產品之抗張強度 46 50 P{ X 46} P{ Z } ( 2) 0.02275 2 52 50 P{ X 52} 1 P{ Z } 1 (1) 0.15866 2 0.02275 0.15866 0.18141 26

Example 8 產品之外徑為 N(10.1, 0.01), 規格設為 10±0.3 英吋, 請回答以下問題 : a) 計算不合格品機率 b) 若調整機器參數, 可將產品外徑平均數調為 10.0 英寸, 試計算此時之合格率 27

Example 8 - answer 設隨機變數 X 為產品之外徑, 合格品之機率為 : ( a) P{9.7 10.3 10.1 9.7 10.1 0.1 0.1 0.97725 0 0.97725 X 10.3} 不合格率 : 1 0.97725 ( b) 將平均值調整為 10.0英寸, 則合格率為不合格率 : 1 0.9973 P{ X 0.02275 0.0027 10.3} P{ X 9.7} 10.3 10.0 9.7 10.0 P{9.7 X 10.3} 0.1 0.1 (3.00) ( 3.00) 0.9973 28

指數分配 (skip) 指數分配 (exponential distribution) 通常應用於可靠度分析, 用來描述產品失效時間指數隨機變數之機率密度函數為其中為一常數指數分配之平均數和變異數分別為 29

伽瑪分配 (skip) 伽瑪 (gamma) 隨機變數之機率分配定義如下伽瑪分配可寫成 : 其中形狀參數 (shape parameter)r>0, 尺度參數 (scale parameter) 稱為伽瑪函數 (gamma function), 定義為若 r 為正整數則伽瑪分配之平均數與變異數分別為 30

韋伯分配 (skip) 韋伯分配 (Weibull distribution) 可定義為參數 δ 稱為位置參數 (location parameter), 其範圍為稱為尺度參數, 稱為形狀參數韋伯分配之平均數與變異數分別為 31

卡方分配 (skip) 假設 n 個獨立之隨機變數為 X 1,X 2,...X n, 其平均數分別為 μ 1,μ 2,...,μ n, 變異數為令則 χ 2 為自由度 v=n 之卡方分配, 其機率分配為卡方分配之平均數與變異數分別為 32

t 分配若 X 和分別為獨立之標準常態和自由度為 k 之卡方隨機變數則隨機變數為自由度等於 k 之 t 分配, 以符號 t k 表示若自之母體隨機抽取樣本大小為 n 之樣本, 則將符合之分配 33

F 分配 (skip) 若和為兩個獨立之卡方隨機變數, 自由度分別為 u 及 v, 則若今自第一個母體抽取樣本大小為 n 1 之隨機樣本, 計算出變異數為, 另自第二個母體隨機抽取樣本大小為 n 2 之隨機樣本, 變異數為, 則將符合之分配 34

抽樣分配由母體中抽取樣本, 根據樣本資料計算獲得之樣本各種特徵值稱為統計量統計量之機率分配稱為抽樣分配 (sampling distribution) 假設 X 為具有平均數 μ 和變異數 σ 2 之常態分配若 X 1,X 2,...X n 為樣本大小等於 n 之隨機樣本, 當樣本大小 n 很大時, 則樣本平均數將符合之分配, 此稱為中央極限定理 ( central limit theorem) 35

估計推論統計中之估計可分為兩種 : 點估計 (point estimation) 利用樣本資料求得一估計值, 用以表示未知參數的方法點估計量 (point estimator) 是指能夠產生單一數值, 做為未知參數之估計值的統計量區間估計 (interval estimation) 區間估計是尋找由兩個端點 U 和 L, 所定義之區間, 使得參數落在此區間內之機率具有某種水準, 亦即其中稱為信賴水準 (level of confidence) 36

信賴區間, 變異數已知或未知母體平均數之信賴區間, 變異數已知 : 假設隨機變數 X 之平均數 μ 為未知, 變異數已知為 σ 2 自樣本大小為 n 之樣本中, 估計得到樣本平均數為 X 則母體平均數 μ 之 100(1-α)% 之信賴區間為 : X z / 2 X z / 2 n n 常態分配母體平均數, 變異數未知 : 隨機變數 X 之平均數 μ 與變異數 σ 2 均為未知今估計得知樣本平均數 X, 樣本標準差為 S, 則平均數之 100(1-α)% 信賴區間為 : X t n X / 2, n1 / 2, n1 z n 37

Example 15 某種變壓器之輸出電壓之標準差為 10V, 由 50 個觀測值獲得輸出電壓之平均值為 119V 試建立輸出電壓平均數之 95% 信賴區間 Answer: n=50,σ=10, x =119, 故信賴區間為 10 119 1.96 119 1.96 50 116.23 121.77 10 50 38

Example 16 包裝用箱之爆裂強度為一重要品質特性, 根據過去經驗, 爆裂強度之分配為常態分配, 但平均數與變異數均未知由樣本大小 n=20 之樣本中, 算出樣本平均數為 60.48psi, 樣本標準差為 2.56psi, 試計算爆裂強度之左尾 95% 信賴區間 Answer: 查表 (t 分配 )t 0.05,19 =1.729, 左尾信賴區間為 2.56 60.48 1.729 20 59.29 psi 39

假設檢定假設檢定是指根據機率理論, 由樣本資料來驗證對母體參數之假設是否成立之統計方法統計假設 (statistical hypothesis) 是對機率分配之參數值所做之陳述在假設檢定中有兩種不同之假設, 分別為虛無假設 (null hypothesis)h o 和對立假設(alternative hypothesis )H a 虛無假設為測試環境之陳述, 而對立假設則是想要證明之部份的陳述 40

假設檢定之步驟假設檢定之過程包含下列步驟 : 1. 決定 H o 及 H a 2. 決定合適之檢定統計量 (test statistic) 假設檢定是根據樣本中之資訊來進行用來作假設檢定之樣本統計量稱為檢定統計量一般是用點估計值之正規化值 ( normalized value) 或標準化值 (standardized value) 作為檢定統計量檢定統計量之型式是根據所要檢定之參數來決定 3. 根據樣本大小 n, 由母體抽取一組隨機樣本, 計算檢定統計量之值檢定統計量之公式依檢定參數而定 4. 根據選取之顯著水準, 做出拒絕或不拒絕 H o 之決策若檢定統計量落在拒絕區域, 則拒絕 H o, 否則不能拒絕 H o (fail to reject H o ) ( 註 : 一般稱為不能拒絕 H o, 而非接受 H o ) 41

假設檢定假設檢定中存在兩種錯誤, 分別稱為型 I (type I error) 和型 II 誤差 (type II error) 在驗收抽樣計畫中, α 稱為生產者風險 (producer's risk) β 稱為消費者風險 (consumer's risk) 42

假設檢定 43

假設檢定 44

假設檢定 45

假設檢定 46

型 II 誤差與檢定力以雙尾之平均數檢定來說明型 II 誤差和檢定力之計算假設虛無和對立假設為假設母體變異數 σ 2 為已知, 檢定統計量為在 H o 成立之情況下,Z 之分配為 N(0,1) 若真實之平均數為, 則檢定統計量之分配為 47

型 II 誤差與檢定力型 II 誤差以數學式表示可定義為圖 5-24 顯示雙尾平均數檢定之型 II 誤差 48

型 II 誤差與檢定力圖 5-25 為 α=0.05 之下, 雙尾平均數檢定之操作特性曲線圖 (operating characteristic curve, OC 曲線 ) 49