目錄 Wald-Wolfowitz 隨機性檢定 (Run test)... Wilcoxon 符號等級檢定...7 Wilcoxon Rank Sum Test...5 Mann-Whitney 檢定... 符號檢定 (Fisher 檢定法 ) PDF Free Download

Gretl 無母數操作手冊中原大學國際經營與貿易學系 Chung Yuan Christian University

目錄 Wald-Wolfowitz 隨機性檢定 (Run test)... Wilcoxon 符號等級檢定...7 Wilcoxon Rank Sum Test...5 Mann-Whitney 檢定... 符號檢定 (Fisher 檢定法 )...3

[ 蘇思蓓 ] Wald-Wolfowitz 連串檢定 (Run test) 一觀念 : 在統計推論方法中, 資料是否具有隨機性是非常重要的條件, 若樣本為隨機樣本, 則樣本觀測值之任一種排列之發生機率相同, 因此統計推論才會有效率二應用情況 : 樣本觀察值的出現是否呈現隨機的迴歸分析之殘差項是否為隨機的變異數分析, 來自每個常態母體之樣本資料是否具有隨機獨立性三實際案例 : 案例 : 三十題是非題的答案如下 : 是非是是非是是是非是是非是非是非是是非是是非是非非是是非非, 以上答案的安排是否具有隨機性? 案例 : 一段期間股市股價漲跌幅狀況 : 漲漲跌跌漲跌跌漲跌漲跌漲跌跌漲跌漲漲跌跌漲跌跌跌漲漲, 以上股價漲跌情況是否具有隨機性? 四假設檢定建立 : H O : 樣本資料具有隨機性

[ 蘇思蓓 ] H : 樣本資料不具有隨機性五檢定作法 : Run test 是將樣本資料分成兩個部分, 例如將資料分成 G( 良品 ) 與 D( 不良品 ), 然後將相同符號之序列稱為串 ( 或連 ), 然後以總串數 R 當作為檢定統計量六決策規則 : 若資料為小樣本 : 當觀察值 ( n <, n <), 查表頇用 Wald-Wolfowitz two-sample runs- test table,reject H 當 R lower tail or R upper tail 若資料為大樣本 : 當觀察值 ( n >, n >), 則可改用常態來近似 R~N( U R, R ) nn U R = E( R) + n n = Var ( R) R n n ( n n (n n n ) ( n n n ) ) Z RE( R) VarR ( ) 七 Gretl 操作過程 : 以案例為例三十題是非題的答案如下 : 是非是是非是是是非是是非是非是非是是非是是非是非非是是非非, 以上答案的安排是

[ 蘇思蓓 ] 否具有隨機性?(α =.5) 步驟 : 將資料整理成 excel 檔, 用數字符號來表示, 是 = 否 = 步驟 : 進入 gretl 程式, 開啟檔案開啟資料檔匯入資料 3

[ 蘇思蓓 ] 資料匯入後, 點選檔案名稱 data 即可看到匯入的檔案步驟 3: 4

[ 蘇思蓓 ] 點選工具無母數檢定點選確定步驟 4: 即可顯示檢定結果, 因 p- 值.745383>α =.5, 故不拒絕 H 即表示無證據顯示答案不具有隨機性 5

[ 蘇思蓓 ] 變數 'data' 的連數 (number of runs) (R) = 在獨立 ( 隨機性 ) 的虛無假設下, R 服從常態分配 N(5.4,.57949) z-score =.7839, 雙尾 p- 值 :.745383 6

[ 黃美婷 ] Wilcoxon 符號等級檢定一觀念 : 符號等級檢定的使用時機和符號檢定相同, 都為檢定單一母體或成對母體分配是否相同, 與符號檢定不同的地方為符號檢定只考慮正負號而己, 但符號等級和檢定同時考慮觀察值差異的正負符號及大小, 且較符號檢定更具檢定力二檢定作法 : () 求算 D = X-, 並刪除 D 為者, 使有效樣本大小為 n () 排定 D 的等級, 如有兩個或兩個以上相同者, 先將 D 給予順序等級, 再求其平均數作代表 (3) 求算 D 之正負等級和分別為 R(+) R(-) 三決策規則 : 小樣本 : 檢定統計量為 R = min ( R +, R - ), 在樣本數 <9, 在 Gretl 會判別為小樣本雙尾檢定 - 當 R Rα / 時, 則拒絕 H Rα / 為臨界值單尾檢定 - 當 R Rα 時, 則拒絕 H Rα 為臨界值大樣本 : R 分配會趨近於常態分配, 平均數及變異數的計算如下 n( n) E ( R) 4 n( n )(n ) V ( R) 4 7

[ 黃美婷 ] 統計量 : Z n( n ) R 4 n( n )(n ) 4 雙尾檢定 - 當 Z Zα / 時, 則拒絕 H Zα / 為臨界值單尾檢定 - 當 Z Zα 時, 則拒絕 H Zα 為臨界值四 Gretl 操作過程 : 例題 - 喬光貿易公司的經理想知道所有人薪資的中位數是否為.5 萬元, 公司隨機抽取十個職員, 資料如下 : H : 員工薪資中位數 =.5 萬元 H : 員工薪資中位數.5 萬元工人 3 4 5 6 7 8 9 薪資 ( 萬元 ).5.8.3.5 3. 4.8 5. 5. 5.8 6. 步驟 : 將資料 key 進 Excel 檔案中, 因為 Gretl 只能選擇 office3 的檔案, 所以請記得轉檔 Wage: 為樣本的薪資 ;N : 為中位數 8

[ 黃美婷 ] 步驟 : 匯入資料檔案開啟資料檔匯入資料 Excel ( 選擇你的檔案 ) 選好檔案後, 會跳出下面的視窗, 選擇你的詴算表後確定 9

[ 黃美婷 ] 因為沒有日期, 所以會跳出這個視窗, 按否即可繼續操作請確認變數位

[ 黃美婷 ] 步驟 3: 工具無母數檢定步驟 4: 選擇 Wilcoxon 符號等級檢定, 顯示細節先不勾選

[ 黃美婷 ] 由上述結果顯示 : 因為為雙尾檢定, 雙尾 P-value =.97, 在顯著水準 α = 5% 下,P-value>α, 故未落入拒絕域, 無法拒絕 H, 因此我們可以說喬光貿易職員的薪資中位數為.5 萬元

[ 黃美婷 ] 回到步驟 4, 比較顯示細節勾選的結果有何差別若勾選顯示細節的選項, 結果會顯示 D 值以及符號等級的排序 3

[ 黃美婷 ] 比較符號檢定結果和 Wilcoxon 符號等級有何不同在紅框的部份, 為符號檢定左尾的 P 值, 因為例題為雙尾檢定, 所以必頇將 P 值 *, 即 P-value =.5396* =.58, 在顯著水準 α = 5% 下,P-value>α, 故未落入拒絕域, 無法拒絕 H, 結論與 Wilcoxon 符號等級和檢定相同, 因此我們可以說喬光貿易職員的薪資中位數為.5 萬元 4

[ 張哲維 ] Wilcoxon Rank Sum Test 一觀念 : 本檢定適用於, 在兩獨立母體分配未知, 並為小樣本 (n<3) 的情況下, 欲檢定兩獨立樣本是否相等, 或兩樣本間是否具有顯著差異值得注意的是, 在以上情況下, 若該樣本數大於等於時, 可藉由計算推倒, 得知其分配將趨近於常態, 可使用特定公式, 搭配常態分配臨界值表, 判定其假設檢定 ; 若樣本數小於, 則使用秩和加總的方法, 配合 Wilcoxon 表, 再判定其假設檢定二實際案例 : 案例 ( 小樣本 ): 假設汽車消費雜誌為調查消費者對 Benz 與 BMW 兩款車的使用滿意度, 隨機自 Benz 車主中抽出 9 名, 自 BMW 車主中抽中名, 詢問省油舒適售後服務等問題, 經綜合得到下列分數車主 3 4 5 6 7 8 9 Benz 7.7 9. 7.5 9.5 7.9 9.6 7.7 9. BMW 7.5 7.4 7.. 9. 9.4 7.3 7.6 7.8 9.3 5

[ 張哲維 ] 案例 ( 大樣本 ): 兩位評審委員對個參加選美的候選人進行評分, 其評分係依主觀偏好給予 ~ 分 ; 而評分結果如下表 : 候選人 3 4 5 6 7 8 9 評審員 A 5 6 7 9 7 9 6 9 9 評審員 B 4 7 5 8 5 5 6 8 5 4 詴以 Wilcoxon Rank Sum 來檢定兩位評審員之評分是否有顯著差異? 三假設檢定建立 : 案例 ( 小樣本 ): H O : 兩款車的車主使用滿意度相同 H : 兩款車的車主使用滿意度不用案例 ( 大樣本 ): H O : 兩位評審員所給的分數相近 H : 兩位評審員所給的分數不相近 6

[ 張哲維 ] 四決策規則 : 若資料為小樣本 : 當觀察值 ( n <, n <), 查表頇用 Wilcoxon Rank Sum Test table 檢定統計量 W (Sum of Ranks, Sample ) = W Reject H at. 5,if W WL (lower tail ) or W WU (upper tail ) 若資料為大樣本 : 當觀察值 ( n >, n >), 則可改用常態來近似 W E W n n n n n n n Var W W EW Z Var W Reject H at. 5,if 雙尾 : Z Z or d. f, Z Z d. f, 單尾 : Z Z d. f, or Z Z d. f, 五 Gretl 操作過程 : 案例 ( 小樣本 ): 步驟 : 在匯入資料後, 點選左上角工具無母數檢定 7

[ 張哲維 ] 步驟 : 選取 Wilcoxon rank sum test 若勾選顯示細節, 則將列出兩變數的秩與其排名確認無誤後, 點選確定 8

[ 張哲維 ] 步驟 3: 由步驟按確定後, 即可顯示結果. 將兩母體所抽之樣本資料混和. 給予排序 3. 選定樣本數較少 ( 樣本數不同 ); 選定第一變數 ( 若樣本數相同 ) 4. 將其所有等級和相加 5. 以 W 表其檢定統計量, 並查表判斷 n 9

[ 張哲維 ] 案例 ( 大樣本 ): 由步驟按確定後, 即可顯示結果因兩樣本數皆大於等於, 因此視為大樣本藉由公式, 可得期望值與變異數, 將其標準化後, 即可求出其 P-Value

[ 左惟中 ] Mann-Whitney 檢定一觀念 : Mann-Whitney 檢定與等級和檢定相同, 用來檢定兩母體是否相同或是兩獨立隨機樣本是否來自相同母體,Mann-Whitney 檢定最大的不同點在於其檢定統計量是採用 U 檢定量, 而若當兩母體或是兩獨立隨機樣本為大樣本時 (n> n>), 其統計量 U 的抽樣分配會近似常態分配二實際案例 : 案例 ( 小樣本 ): 假設隨機取自兩個不同地區的居民所得之獨立樣本, 並依序排序如下表 : 詴問兩地區平均所得是否相同? 南部地區北部地區 6,, 9, 7,, 3, N=4 N=6

[ 左惟中 ] 案例 ( 大樣本 ): 隨機由兩母體抽取 N= 及 N=5 的樣本如下甲母體 : 9 5.6 5.6 5.. 6.9 4.6 4.8 6.5 6. 5. 7. 5. 8.7 6. 8.9 5.4. 3.3 乙母體 :.. 3.5. 8..3 9. 7. 4. 5.8 3.6 3. 8.8.5.5 三假設檢定建立 : 案例 ( 小樣本 ): H : 平均所得相同 H : 平均所得不相同案例 ( 大樣本 ): H : 兩母體來自相同分配 H : 兩母體來自不相同分配若資料為小樣本 : () 先將所有樣本給予等及排列 () 求出兩樣本等級和分別命名為 W W (3) 接者求出 Mann-Whitney 的 U 統計量 U nn n ( n ) W U nn n ( n ) W

[ 左惟中 ] U 與 U 值中取最小值並與 U 值做比較, 當 U 值小於 U, 則拒絕 H 若資料為大樣本 : 當觀察值 ( n >, n >), 則可改用常態來近似 E( u) u nn Var( u) u n n( n n ) 期拒絕域為上限為 c u z. u 下限為 c u z. u c: 拒絕域上限值 c : 拒絕域下限值 Reject H at. 5,if 雙尾 : z z z 單尾 : zz or z z 四 Gretl 操作過程 : 以案例 ( 小樣本 ) 為例假設隨機取自兩個不同地區的居民所得之獨立樣本, 並依序排序如下表 : 詴問兩地區平均所得是否相同? 3

[ 左惟中 ] 南部地區北部地區 6,, 9, 7,, 3, N=4 N=6 步驟開取 Gretl 軟體點選工具選取建立新資料檔 4

[ 左惟中 ] 步驟 : 選取樣本數為四選取資料類型為 Cross-Sectional 向前點選開始輸入資料輸入變數名稱為 Southern 5

[ 左惟中 ] 步驟 3: 數入資料數入完資料後點選勾勾步驟 4: 接著按右鍵選擇產生新變數輸入檔名為 Northern 操作與前者相同 6

[ 左惟中 ] 步驟 5: 選取工具無母數檢定結果求得 U 統計值為 6, 故位在接受域, 不拒絕虛無假設, 故其南北薪資無異 7

[ 左惟中 ] A 為南部樣本 B 為北部樣本各水準下之拒絕域五推論實證 : 由於 Gretl 軟體中並沒有 Mann-Whitnry U test, 而 M-W-U test 與 WILCOX 等級和檢定相似, 故在此我們利用 Gretl 操作 WILCOX 的等級和檢定, 並在這裡時寄做數學的演練推論數學演算如下 : U nn n n ) W ( 4(4 ) 4*6 ) 8 6 u u (4)(6) w 4.96 上限為 : c u z. u.96 * 4.96.9 8

[ 左惟中 ] 下限為 : c z..96*4.96. 8 u u 9

[ 陳選光 ] 符號檢定 (Fisher 檢定法 ) 一觀念 : 符號檢定法是利用一般極熟悉的二項分配或是常態分配來處理, 限制條件少, 簡單而易懂二應用情況 : 如果樣本來自的母體具有中位數, 且樣本的抽取式隨機的, 符號檢定法可用於檢定母體中位數 η 是否為特定值三實際案例 : 案例 : 由生產線上一定點按時取出產品測量, 測得 68,76,693,76,74,65,636,647, 653,64,676,686,668,689,668 克, 其中位數 η 是否仍然為以往的紀錄 68 克呢? 案例隨機抽取 5 人參加心理測驗, 得一刺激後的脈搏次數為 99,,9,94,35,8, 7,,9,4,7,9,7,5,5, 詴問此種測詴之中位數 η 是否仍為每分鐘 7 次? 四假設檢定建立 : H : 中位數是特定值 H : 中位數不是特定值 3

[ 陳選光 ] 五檢定作法 : 符號檢定除了想要檢定的資料之外, 必頇將特定值也排列成一列, 與檢定的資料排成互相成對六決策規則 : () 令 D 為樣本內各資料與特定值之差, 即 D X 則 D 之符號為正或為負機會相等, 機會均為 () 令 S 為正號或負號中出現較少者的次數, 即 S Min 號個數, 號個數 S 可視其為在 n 次二項詴驗獨立事件中成功次數, 所以 S 的分配為成功機率 p =.5 的二項分配若資料為小樣本 : 當樣本甚小時 (n 3), 呈現二項分配, 令顯著水準 α 雙尾檢定時 : s n s s n = 機率值 <, 則拒絕 H : 單尾檢定時 : s n s s 若資料為大樣本 : n = 機率值 <, 則拒絕 H : 或 H : 3

[ 陳選光 ] 當樣本甚大時 (n 3), 二項分配趨近於常態分配, 標準化之後, 即 : Z S n n 4 雙尾檢定時, 當 Z < Z, 則拒絕 H : ; 單尾檢定時, 當 Z < Z, 則拒絕 H : 或 H : 七 Gretl 操作過程 : 以案例為例由生產線上一定點按時取出產品測量, 測得 68,76,693,76,74,65,636,647, 653,64,676,686,668,689,668 克, 其中位數 η 是否仍然為以往的紀錄 68 克呢? 步驟 : 將資料整理成 Excel 檔, 而且必頇為 3 版本, 否則 Gretl 將無法讀取,X 為樣本資料, M 為特定值的中位數如下圖 : 3

[ 陳選光 ] 步驟 : 進入 gretl 程式, 開啟檔案開啟資料檔匯入資料選擇你存放資料的 Excel 檔案, 然後找到你的資料並打開打開之後, 你可以看見你的檔案名稱 X 與 m, 點選檔案, 將會顯示各個檔案詳細的資料 33

[ 陳選光 ] 步驟 3: 點選工具無母數檢定點選確定之後會跳出一個視窗, 選擇符號檢定 34

[ 陳選光 ] 在 Gretl 中, 是以變數去對變數作檢定, 所以變數選原資料, 變數選特定值步驟 4: 即可顯示檢定結果, 因為 P 值.5 > α / =.5 ( 雙尾 ) 故不拒絕 H, 表示中位數仍然有可能為 68 克 35

參考書目中文書目. 林惠玲陳正昌,( 應用統計學 ), 雙葉書廊有限公司. 顏月珠,( 無母數統計方法 ), 萬達印刷有限公司 3. 程大器,( 統計學 ), 高點文化事業有限公司 36