品質管理 - 現代化觀念與實務應用 Quality Management-Contemporary Concepts and Practical Applications 鄭春生 著 Chapter 5 應用於品質管制與改善之 統計方法
學習要點 透過本課程, 將可了解 : 1. 統計學之基本概念 2. 各種機率分配之理論和應用 3. 各種抽樣分配之理論和應用 4. 估計和假設檢定 5. 統計軟體之應用 2
統計學概論 統計學是有關數據蒐集 分類 列表 分析和根據數據或資訊做推論之一門科學, 可概分為以下兩種 : 敘述統計 (descriptive statistics) 根據蒐集到之資訊來描述一群事物 推論統計 (inferential statistics) 根據樣本 (sample) 中之資訊來獲得母體 (population) 之重要結論 3
敘述統計 一組數據必須加以描述, 才能讓他人了解其特性 一組數據之變化情形, 除了可以用圖形法來表示外, 數量化之描述亦可以提供有用之情報 常用的數據量化表示法有 : 描述集中趨勢 : 平均數 (mean) 中位數 (median) 眾數 (mode) 描述變異程度 : 變異數 (variance) 標準差 (standard deviation) 全距 (range) 4
敘述統計 平均數 假設 X 1,X 2,...,X n 為樣本中之觀測值, 樣本數據之集中趨勢可由樣本平均數來衡量, 樣本平均數定義為 母體平均數是將母體中之所有數據加總後, 除以母體大小 N, 可表示為 5
敘述統計 中位數 中位數亦可用來衡量數據之集中趨勢 中位數是指數據由小至大排列後, 位於中間之觀測值 若數據個數為偶數, 則中間兩數值之平均數為中位數 眾數 眾數是指一組數據中, 發生次數最多之數值 變異數 樣本變異數 S 2 為 : 母體變異數 σ 2 為 : 6
敘述統計 標準差 標準差為變異數之平方根, 亦即 母體標準差為 全距 全距可定義為一組數據中之最大值 (L) 與最小值 (S) 之差異量, 可表示為 R=L-S 7
機率分配 群體中之數據值可以用機率分配來描述 機率分配為一數學模式, 用來描述一個隨機變數 ( 以符號 X 表示 ) 之所有可能值 ( 稱為變量, 以 x 表示 ) 之出現機率 機率分配可分成連續和不連續兩種 連續分配若一變數是以連續尺度來量測, 而且其變量可為某一特定區間內之任意值時, 則其機率分配為連續 例如產品之內 外徑尺寸 不連續分配若變數只能為某些特定值, 例如 x=0,1,2, 則稱其機率分配為不連續或離散 (discrete) 例如一件產品上之不合格點數之分配為不連續分配 8
機率分配 不連續機率分配, 其隨機變數 X 等於否特定值 x 之機率為 : P{ X x} p( x) 對於連續機率分配, 隨機變數落於 a,b 兩數值所界定區域之機率為 : P { a X b} f ( x) dx f(x) 稱為機率密度函數 (probability density function, pdf) b a 9
機率分配 累積分配函數 (cumulative distribution function, cdf) 係指隨機變數小於或等於某一個特定值 x 之機率 對於連續型分配, 累積分配函數可定義為 : x F ( x) P{ X x} f ( u) du 對於離散型分配, 累積分配函數可定義為 : F ( x) P{ X x} p( x ) x x i i 10
超幾何分配 在大小為 N 之有限群體中, 有 D 件屬於第一類,N-D 件為第二類 今從群體中以不投返 (without replacement) 之方式隨機抽取 n 件樣本, 其中有 X 件屬於第一類, 則 X 為超幾何分配隨機變數, 其機率結集函數為 超幾何分配之平均數和變異數分別為 11
Example 1 一批 25 件電晶體中包含 3 件不合格品, 今隨機抽取 5 件, 試計算發現 2 件不合格品之機率 Answer: D 3, N 25, n 5, 3 22 2 3 P{ X 2} 25 5 x 2 0.087 12
二項分配 二項分配 白努利試驗 (Bernoulli trials) 是指在含有連續 n 項獨立試驗之過程中, 每一項試驗之結果分為成功或失敗兩種情況 若每次試驗中, 成功之機率 P 為固定, 則在 n 次白努利試驗中, 發現 x 次成功之機率可寫成 上述機率函數稱為二項分配 (binomial distribution) 二項分配之平均數和變異數分別為 13
二項分配 Refer to Page. 151 圖 5-4 顯示 n 固定時,p 值改變對二項分配形狀之影響 隨著 p 從 0 增加到 0.5 或 1 減少到 0.5 時, 分配會愈加對稱 圖 5-5 顯示 p 固定時, 改變 n 值對二項分配形狀的影響, 隨著 n 增加, 分配愈加對稱 14
Example 2 某製造程序之不合格率為 5%, 今自製程中隨機抽取 20 件產品檢查, 試根據課本附表, 求取出現 2 件不合格品之機率 Answer: 兩件不合格品單點機率 =2 件累積機率 -1 件累積機率 P{ X 2} P{ X 2} P{ X 1} 0.925 0.736 0.189 15
Example 3 假設某電子零件之不合格率為 0.1, 今從生產線隨機抽取 20 件零件檢查, 請計算最多發現 2 件不合格品之機率為何? Answer: 即發現 0 1 2 件之累積機率值 P{ X 2} 2 20 (0.1) x0 x 0.677 x (0.9) 20x 16
卜瓦松分配 卜瓦松分配 (Poisson distribution) 之機率結集函數可寫成 其中 λ>0, λ 為平均數 卜瓦松分配之平均數和變異數相等, 亦即 17
卜瓦松分配 圖 5-7 顯示不同 λ 值之卜瓦松分配, 隨著 λ 增加, 卜瓦松分配更加對稱 在品質管理中, 卜瓦松分配之典型應用係用以描述產品不合格數模式 (Chapter 8) 18
Example 4 某印刷電路板 (printed circuit board, PCB) 之平均不合格數為 λ=3, 今隨機抽取一件檢查, 是根據本書之附表, 求至少發現 4 個不合格數之機率? Answer: P{ X 4} 1 P{ X 3} 1 0.647 0.353 19
Example 5 在 20 m 2 之地毯中, 平均可以發現 4 個不合格點, 今檢驗 40 m 2 之地毯, 試計算發現 2 個不合格數之機率為何? Answer: 4(40 / 20) 8 亦可 4 / 20 0.2 0.2 40 8 P{ X 2} e 8 6 2! 2 0.011( 亦可查表得知 ) 20
巴斯卡分配 (skip) 假設在一連串的獨立試驗中, 每次成功的機率為 P, 令 X 代表第 r 次為成功的試驗, 則 X 為巴斯卡 (Pascal) 隨機變數, 其機率分配為 : 其中 r 為正整數 巴斯卡分配之平均數和變異數 21
常態分配 若 X 為常態 (normal) 隨機變數, 則 x 的機率密度函數為 常態分配 (normal distribution) 之參數為平均數 μ 和變異數 σ 2, 其中 常態分配一般以符號表示, 代表 x 服從平均數為 μ, 變異數為 σ 2 之常態分配 22
常態分配 圖 5-9 為常態分配下, 數據之分布情形 由圖可看出有 68.26% 之群體會落在所界定之範圍內 落在 99.73% 內之機率有 95.46%, 而落在 內之機率為 23
標準常態分配 標準常態分配定義為 其中, 代表標準常態分配 之累積分配函數, 可由 本書附表 4 查得 上述轉換一般稱為標準化 (standardization), 用來將之隨機變數轉換成之隨機變數 24
Example 6 某項金屬物品之強度符合 N(210,25) 其規格要求強度至少 200 pst, 試求此項產品符合規格之機率 Answer: 設 X 為產品之強度, 合格率為 P{ X 200} 1 P{ X 200} 200 210 1 5 1 ( 2) 0.97725 再計算 1-P{Z -2} ( 查表 ) 之機率,refer to 圖 5-10 25
Example 7 某金屬物品之抗張強度為 N(50, 4), 試計算抗張強度低於 46 磅之機率與高於 52 磅之機率 Answer: 設 X 為產品之抗張強度 46 50 P{ X 46} P{ Z } ( 2) 0.02275 2 52 50 P{ X 52} 1 P{ Z } 1 (1) 0.15866 2 0.02275 0.15866 0.18141 26
Example 8 產品之外徑為 N(10.1, 0.01), 規格設為 10±0.3 英吋, 請回答以下問題 : a) 計算不合格品機率 b) 若調整機器參數, 可將產品外徑平均數調為 10.0 英寸, 試計算此時之合格率 27
Example 8 - answer 設隨機變數 X 為產品之外徑, 合格品之機率為 : ( a) P{9.7 10.3 10.1 9.7 10.1 0.1 0.1 0.97725 0 0.97725 X 10.3} 不合格率 : 1 0.97725 ( b) 將平均值調整為 10.0英寸, 則合格率為 不合格率 : 1 0.9973 P{ X 0.02275 0.0027 10.3} P{ X 9.7} 10.3 10.0 9.7 10.0 P{9.7 X 10.3} 0.1 0.1 (3.00) ( 3.00) 0.9973 28
指數分配 (skip) 指數分配 (exponential distribution) 通常應用於可靠度分析, 用來描述產品失效時間 指數隨機變數之機率密度函數為 其中 為一常數 指數分配之平均數和變異數分別為 29
伽瑪分配 (skip) 伽瑪 (gamma) 隨機變數之機率分配定義如下 伽瑪分配可寫成 : 其中形狀參數 (shape parameter)r>0, 尺度參數 (scale parameter) 稱為伽瑪函數 (gamma function), 定義為若 r 為正整數則 伽瑪分配之平均數與變異數分別為 30
韋伯分配 (skip) 韋伯分配 (Weibull distribution) 可定義為 參數 δ 稱為位置參數 (location parameter), 其範圍為稱為尺度參數, 稱為形狀參數 韋伯分配之平均數與變異數分別為 31
卡方分配 (skip) 假設 n 個獨立之隨機變數為 X 1,X 2,...X n, 其平均數分別為 μ 1,μ 2,...,μ n, 變異數為 令 則 χ 2 為自由度 v=n 之卡方分配, 其機率分配為 卡方分配之平均數與變異數分別為 32
t 分配 若 X 和分別為獨立之標準常態和自由度為 k 之卡方隨機變數 則隨機變數 為自由度等於 k 之 t 分配, 以符號 t k 表示 若自 之母體隨機抽取樣本大小為 n 之樣本, 則 將符合 之分配 33
F 分配 (skip) 若 和 為兩個獨立之卡方隨機變數, 自由度分別為 u 及 v, 則 若 今自第一個母體抽取樣本大小為 n 1 之隨機樣本, 計算出變異數為, 另自第二個母體隨機抽取樣本大小為 n 2 之隨機樣本, 變異數為, 則 將符合 之分配 34
抽樣分配 由母體中抽取樣本, 根據樣本資料計算獲得之樣本各種特徵值稱為統計量 統計量之機率分配稱為抽樣分配 (sampling distribution) 假設 X 為具有平均數 μ 和變異數 σ 2 之常態分配 若 X 1,X 2,...X n 為樣本大小等於 n 之隨機樣本, 當樣本大小 n 很大時, 則樣本平均數將符合之分配, 此稱為中央極限定理 ( central limit theorem) 35
估計 推論統計中之估計可分為兩種 : 點估計 (point estimation) 利用樣本資料求得一估計值, 用以表示未知參數的方法 點估計量 (point estimator) 是指能夠產生單一數值, 做為未知參數之估計值的統計量 區間估計 (interval estimation) 區間估計是尋找由兩個端點 U 和 L, 所定義之區間, 使得參數落在此區間內之機率具有某種水準, 亦即 其中 稱為信賴水準 (level of confidence) 36
信賴區間, 變異數已知或未知 母體平均數之信賴區間, 變異數已知 : 假設隨機變數 X 之平均數 μ 為未知, 變異數已知為 σ 2 自樣本大小為 n 之樣本中, 估計得到樣本平均數為 X 則母體平均數 μ 之 100(1-α)% 之信賴區間為 : X z / 2 X z / 2 n n 常態分配母體平均數, 變異數未知 : 隨機變數 X 之平均數 μ 與變異數 σ 2 均為未知 今估計得知樣本平均數 X, 樣本標準差為 S, 則平均數之 100(1-α)% 信賴區間為 : X t n X / 2, n1 / 2, n1 z n 37
Example 15 某種變壓器之輸出電壓之標準差為 10V, 由 50 個觀測值獲得輸出電壓之平均值為 119V 試建立輸出電壓平均數之 95% 信賴區間 Answer: n=50,σ=10, x =119, 故信賴區間為 10 119 1.96 119 1.96 50 116.23 121.77 10 50 38
Example 16 包裝用箱之爆裂強度為一重要品質特性, 根據過去經驗, 爆裂強度之分配為常態分配, 但平均數與變異數均未知 由樣本大小 n=20 之樣本中, 算出樣本平均數為 60.48psi, 樣本標準差為 2.56psi, 試計算爆裂強度之左尾 95% 信賴區間 Answer: 查表 (t 分配 )t 0.05,19 =1.729, 左尾信賴區間為 2.56 60.48 1.729 20 59.29 psi 39
假設檢定 假設檢定是指根據機率理論, 由樣本資料來驗證對母體參數之假設是否成立之統計方法 統計假設 (statistical hypothesis) 是對機率分配之參數值所做之陳述 在假設檢定中有兩種不同之假設, 分別為虛無假設 (null hypothesis)h o 和對立假設(alternative hypothesis )H a 虛無假設為測試環境之陳述, 而對立假設則是想要證明之部份的陳述 40
假設檢定之步驟 假設檢定之過程包含下列步驟 : 1. 決定 H o 及 H a 2. 決定合適之檢定統計量 (test statistic) 假設檢定是根據樣本中之資訊來進行 用來作假設檢定之樣本統計量稱為檢定統計量 一般是用點估計值之正規化值 ( normalized value) 或標準化值 (standardized value) 作為檢定統計量 檢定統計量之型式是根據所要檢定之參數來決定 3. 根據樣本大小 n, 由母體抽取一組隨機樣本, 計算檢定統計量之值 檢定統計量之公式依檢定參數而定 4. 根據選取之顯著水準, 做出拒絕或不拒絕 H o 之決策 若檢定統計量落在拒絕區域, 則拒絕 H o, 否則不能拒絕 H o (fail to reject H o ) ( 註 : 一般稱為不能拒絕 H o, 而非接受 H o ) 41
假設檢定 假設檢定中存在兩種錯誤, 分別稱為型 I (type I error) 和型 II 誤差 (type II error) 在驗收抽樣計畫中, α 稱為生產者風險 (producer's risk) β 稱為消費者風險 (consumer's risk) 42
假設檢定 43
假設檢定 44
假設檢定 45
假設檢定 46
型 II 誤差與檢定力 以雙尾之平均數檢定來說明型 II 誤差和檢定力之計算 假設虛無和對立假設為 假設母體變異數 σ 2 為已知, 檢定統計量為 在 H o 成立之情況下,Z 之分配為 N(0,1) 若真實之平均數為, 則檢定統計量之分配為 47
型 II 誤差與檢定力 型 II 誤差以數學式表示可定義為 圖 5-24 顯示雙尾平均數檢定之型 II 誤差 48
型 II 誤差與檢定力 圖 5-25 為 α=0.05 之下, 雙尾平均數檢定之操作特性曲線 圖 (operating characteristic curve, OC 曲線 ) 49