Gretl 無母數操作手冊 中原大學國際經營與貿易學系 Chung Yuan Christian University
目錄 Wald-Wolfowitz 隨機性檢定 (Run test)... Wilcoxon 符號等級檢定...7 Wilcoxon Rank Sum Test...5 Mann-Whitney 檢定... 符號檢定 (Fisher 檢定法 )...3
[ 蘇思蓓 ] Wald-Wolfowitz 連串檢定 (Run test) 一 觀念 : 在統計推論方法中, 資料是否具有隨機性是非常重要的條件, 若樣本為隨機樣本, 則樣 本觀測值之任一種排列之發生機率相同, 因此統計推論才會有效率 二 應用情況 : 樣本觀察值的出現是否呈現隨機的 迴歸分析之殘差項是否為隨機的 變異數分析, 來自每個常態母體之樣本資料是否具有隨機獨立性 三 實際案例 : 案例 : 三十題是非題的答案如下 : 是非是是非是是是非是是非是非是非是是非是是非是非非是是非非, 以上答案的安排是 否具有隨機性? 案例 : 一段期間股市股價漲跌幅狀況 : 漲漲跌跌漲跌跌漲跌漲跌漲跌跌漲跌漲漲跌跌漲跌跌跌漲漲, 以上股價漲跌情況是否 具有隨機性? 四 假設檢定建立 : H O : 樣本資料具有隨機性
[ 蘇思蓓 ] H : 樣本資料不具有隨機性 五 檢定作法 : Run test 是將樣本資料分成兩個部分, 例如將資料分成 G( 良品 ) 與 D( 不良品 ), 然後將相同 符號之序列稱為串 ( 或連 ), 然後以總串數 R 當作為檢定統計量 六 決策規則 : 若資料為小樣本 : 當觀察值 ( n <, n <), 查表頇用 Wald-Wolfowitz two-sample runs- test table,reject H 當 R lower tail or R upper tail 若資料為大樣本 : 當觀察值 ( n >, n >), 則可改用常態來近似 R~N( U R, R ) nn U R = E( R) + n n = Var ( R) R n n ( n n (n n n ) ( n n n ) ) Z RE( R) VarR ( ) 七 Gretl 操作過程 : 以案例 為例 三十題是非題的答案如下 : 是非是是非是是是非是是非是非是非是是非是是非是非非是是非非, 以上答案的安排是
[ 蘇思蓓 ] 否具有隨機性?(α =.5) 步驟 : 將資料整理成 excel 檔, 用數字符號來表示, 是 = 否 = 步驟 : 進入 gretl 程式, 開啟檔案 開啟資料檔 匯入資料 3
[ 蘇思蓓 ] 資料匯入後, 點選檔案名稱 data 即可看到匯入的檔案 步驟 3: 4
[ 蘇思蓓 ] 點選工具 無母數檢定 點選確定 步驟 4: 即可顯示檢定結果, 因 p- 值.745383>α =.5, 故不拒絕 H 即表示無證據顯示答案不具有隨機性 5
[ 蘇思蓓 ] 變數 'data' 的連數 (number of runs) (R) = 在獨立 ( 隨機性 ) 的虛無假設下, R 服從常態分配 N(5.4,.57949) z-score =.7839, 雙尾 p- 值 :.745383 6
[ 黃美婷 ] Wilcoxon 符號等級檢定 一 觀念 : 符號等級檢定的使用時機和符號檢定相同, 都為檢定單一母體或成對母體分配是否相 同, 與符號檢定不同的地方為符號檢定只考慮正負號而己, 但符號等級和檢定同時考慮 觀察值差異的正負符號及大小, 且較符號檢定更具檢定力 二 檢定作法 : () 求算 D = X-, 並刪除 D 為 者, 使有效樣本大小為 n () 排定 D 的等級, 如有兩個或兩個以上相同者, 先將 D 給予順序等級, 再求其 平均數作代表 (3) 求算 D 之正 負等級和分別為 R(+) R(-) 三 決策規則 : 小樣本 : 檢定統計量為 R = min ( R +, R - ), 在樣本數 <9, 在 Gretl 會判別為小樣本 雙尾檢定 - 當 R Rα / 時, 則拒絕 H Rα / 為臨界值 單尾檢定 - 當 R Rα 時, 則拒絕 H Rα 為臨界值 大樣本 : R 分配會趨近於常態分配, 平均數及變異數的計算如下 n( n) E ( R) 4 n( n )(n ) V ( R) 4 7
[ 黃美婷 ] 統計量 : Z n( n ) R 4 n( n )(n ) 4 雙尾檢定 - 當 Z Zα / 時, 則拒絕 H Zα / 為臨界值 單尾檢定 - 當 Z Zα 時, 則拒絕 H Zα 為臨界值 四 Gretl 操作過程 : 例題 - 喬光貿易公司的經理想知道所有人薪資的中位數是否為.5 萬元, 公司隨機抽取 十個職員, 資料如下 : H : 員工薪資中位數 =.5 萬元 H : 員工薪資中位數.5 萬元 工人 3 4 5 6 7 8 9 薪資 ( 萬元 ).5.8.3.5 3. 4.8 5. 5. 5.8 6. 步驟 : 將資料 key 進 Excel 檔案中, 因為 Gretl 只能選擇 office3 的檔案, 所以請記得轉檔 Wage: 為樣本的薪資 ;N : 為中位數 8
[ 黃美婷 ] 步驟 : 匯入資料 檔案 開啟資料檔 匯入資料 Excel ( 選擇你的檔案 ) 選好檔案後, 會跳出下面的視窗, 選擇你的詴算表後 確定 9
[ 黃美婷 ] 因為沒有日期, 所以會跳出這個視窗, 按否即可繼續操作 請確認 變數位
[ 黃美婷 ] 步驟 3: 工具 無母數檢定 步驟 4: 選擇 Wilcoxon 符號等級檢定, 顯示細節先不勾選
[ 黃美婷 ] 由上述結果顯示 : 因為為雙尾檢定, 雙尾 P-value =.97, 在顯著水準 α = 5% 下,P-value>α, 故未落入拒 絕域, 無法拒絕 H, 因此我們可以說喬光貿易職員的薪資中位數為.5 萬元
[ 黃美婷 ] 回到步驟 4, 比較顯示細節勾選的結果有何差別 若勾選顯示細節的選項, 結果會顯示 D 值以及符號等級的排序 3
[ 黃美婷 ] 比較符號檢定結果和 Wilcoxon 符號等級有何不同 在紅框的部份, 為符號檢定左尾的 P 值, 因為例題為雙尾檢定, 所以必頇將 P 值 *, 即 P-value =.5396* =.58, 在顯著水準 α = 5% 下,P-value>α, 故未落入拒絕域, 無法拒絕 H, 結論與 Wilcoxon 符號等級和檢定相同, 因此我們可以說喬光貿易職員的薪資中位數為.5 萬元 4
[ 張哲維 ] Wilcoxon Rank Sum Test 一 觀念 : 本檢定適用於, 在兩獨立母體分配未知, 並為小樣本 (n<3) 的情況下, 欲檢定兩獨立 樣本是否相等, 或兩樣本間是否具有顯著差異 值得注意的是, 在以上情況下, 若該樣 本數大於等於 時, 可藉由計算推倒, 得知其分配將趨近於常態, 可使用特定公式, 搭 配常態分配臨界值表, 判定其假設檢定 ; 若樣本數小於, 則使用秩和加總的方法, 配 合 Wilcoxon 表, 再判定其假設檢定 二 實際案例 : 案例 ( 小樣本 ): 假設汽車消費雜誌為調查消費者對 Benz 與 BMW 兩款車的使用滿意度, 隨機自 Benz 車 主中抽出 9 名, 自 BMW 車主中抽中 名, 詢問省油 舒適 售後服務等問題, 經綜 合得到下列分數 車主 3 4 5 6 7 8 9 Benz 7.7 9. 7.5 9.5 7.9 9.6 7.7 9. BMW 7.5 7.4 7.. 9. 9.4 7.3 7.6 7.8 9.3 5
[ 張哲維 ] 案例 ( 大樣本 ): 兩位評審委員對 個參加選美的候選人進行評分, 其評分係依主觀偏好給予 ~ 分 ; 而評分結果如下表 : 候選人 3 4 5 6 7 8 9 評審員 A 5 6 7 9 7 9 6 9 9 評審員 B 4 7 5 8 5 5 6 8 5 4 詴以 Wilcoxon Rank Sum 來檢定兩位評審員之評分是否有顯著差異? 三 假設檢定建立 : 案例 ( 小樣本 ): H O : 兩款車的車主使用滿意度相同 H : 兩款車的車主使用滿意度不用 案例 ( 大樣本 ): H O : 兩位評審員所給的分數相近 H : 兩位評審員所給的分數不相近 6
[ 張哲維 ] 四 決策規則 : 若資料為小樣本 : 當觀察值 ( n <, n <), 查表頇用 Wilcoxon Rank Sum Test table 檢定統計量 W (Sum of Ranks, Sample ) = W Reject H at. 5,if W WL (lower tail ) or W WU (upper tail ) 若資料為大樣本 : 當觀察值 ( n >, n >), 則可改用常態來近似 W E W n n n n n n n Var W W EW Z Var W Reject H at. 5,if 雙尾 : Z Z or d. f, Z Z d. f, 單尾 : Z Z d. f, or Z Z d. f, 五 Gretl 操作過程 : 案例 ( 小樣本 ): 步驟 : 在匯入資料後, 點選左上角 工具 無母數檢定 7
[ 張哲維 ] 步驟 : 選取 Wilcoxon rank sum test 若勾選 顯示細節, 則將列出兩變數的秩與其 排名 確認無誤後, 點選 確定 8
[ 張哲維 ] 步驟 3: 由步驟 按確定後, 即可顯示結果. 將兩母體所抽之樣本資料混和. 給予排序 3. 選定樣本數較少 ( 樣本數不同 ); 選定第一變數 ( 若樣本數相同 ) 4. 將其所有等級和相加 5. 以 W 表其檢定統計量, 並查表判斷 n 9
[ 張哲維 ] 案例 ( 大樣本 ): 由步驟 按確定後, 即可顯示結果 因兩樣本數皆大於 等於, 因此視為 大樣本 藉由公式, 可得期望值與 變異數, 將其標準化後, 即可求出其 P-Value
[ 左惟中 ] Mann-Whitney 檢定 一 觀念 : Mann-Whitney 檢定與等級和檢定相同, 用來檢定兩母體是否相同或是兩獨立隨機樣本 是否來自相同母體,Mann-Whitney 檢定最大的不同點在於其檢定統計量是採用 U 檢定 量, 而若當兩母體或是兩獨立隨機樣本為大樣本時 (n> n>), 其統計量 U 的抽 樣分配會近似常態分配 二 實際案例 : 案例 ( 小樣本 ): 假設隨機取自兩個不同地區的居民所得之獨立樣本, 並依序排序如下表 : 詴問兩地區平均所得是否相同? 南部地區 北部地區 6,, 9, 7,, 3, N=4 N=6
[ 左惟中 ] 案例 ( 大樣本 ): 隨機由兩母體抽取 N= 及 N=5 的樣本如下 甲母體 : 9 5.6 5.6 5.. 6.9 4.6 4.8 6.5 6. 5. 7. 5. 8.7 6. 8.9 5.4. 3.3 乙母體 :.. 3.5. 8..3 9. 7. 4. 5.8 3.6 3. 8.8.5.5 三 假設檢定建立 : 案例 ( 小樣本 ): H : 平均所得相同 H : 平均所得不相同 案例 ( 大樣本 ): H : 兩母體來自相同分配 H : 兩母體來自不相同分配 若資料為小樣本 : () 先將所有樣本給予等及排列 () 求出兩樣本等級和分別命名為 W W (3) 接者求出 Mann-Whitney 的 U 統計量 U nn n ( n ) W U nn n ( n ) W
[ 左惟中 ] U 與 U 值中取最小值並與 U 值做比較, 當 U 值小於 U, 則拒絕 H 若資料為大樣本 : 當觀察值 ( n >, n >), 則可改用常態來近似 E( u) u nn Var( u) u n n( n n ) 期拒絕域為 上限為 c u z. u 下限為 c u z. u c: 拒絕域上限值 c : 拒絕域下限值 Reject H at. 5,if 雙尾 : z z z 單尾 : zz or z z 四 Gretl 操作過程 : 以案例 ( 小樣本 ) 為例 假設隨機取自兩個不同地區的居民所得之獨立樣本, 並依序排序如下表 : 詴問兩地區平均所得是否相同? 3
[ 左惟中 ] 南部地區 北部地區 6,, 9, 7,, 3, N=4 N=6 步驟 開取 Gretl 軟體 點選工具 選取建立新資料檔 4
[ 左惟中 ] 步驟 : 選取樣本數為四 選取資料類型為 Cross-Sectional 向前 點選開始輸入資料 輸入變 數名稱為 Southern 5
[ 左惟中 ] 步驟 3: 數入資料 數入完資料後點選勾勾 步驟 4: 接著按右鍵選擇產生新變數 輸入檔名為 Northern 操作與前者相同 6
[ 左惟中 ] 步驟 5: 選取工具 無母數檢定 結果求得 U 統計值為 6, 故位在接受域, 不拒絕虛無假設, 故其南北薪資無異 7
[ 左惟中 ] A 為南部樣本 B 為北部樣本 各水準下之拒絕域 五 推論實證 : 由於 Gretl 軟體中並沒有 Mann-Whitnry U test, 而 M-W-U test 與 WILCOX 等級和檢定相 似, 故在此我們利用 Gretl 操作 WILCOX 的等級和檢定, 並在這裡時寄做數學的演練推論 數學演算如下 : U nn n n ) W ( 4(4 ) 4*6 ) 8 6 u u (4)(6) w 4.96 上限為 : c u z. u.96 * 4.96.9 8
[ 左惟中 ] 下限為 : c z..96*4.96. 8 u u 9
[ 陳選光 ] 符號檢定 (Fisher 檢定法 ) 一 觀念 : 符號檢定法是利用一般極熟悉的二項分配或是常態分配來處理, 限制條件少, 簡單而易 懂 二 應用情況 : 如果樣本來自的母體具有中位數, 且樣本的抽取式隨機的, 符號檢定法可用於檢定母 體中位數 η 是否為特定值 三 實際案例 : 案例 : 由生產線上一定點按時取出產品測量, 測得 68,76,693,76,74,65,636,647, 653,64,676,686,668,689,668 克, 其中位數 η 是否仍然為以往的紀錄 68 克呢? 案例 隨機抽取 5 人參加心理測驗, 得一刺激後的脈搏次數為 99,,9,94,35,8, 7,,9,4,7,9,7,5,5, 詴問此種測詴之中位數 η 是否仍為每 分鐘 7 次? 四 假設檢定建立 : H : 中位數 是特定值 H : 中位數 不是特定值 3
[ 陳選光 ] 五 檢定作法 : 符號檢定除了想要檢定的資料之外, 必頇將特定值也排列成一列, 與檢定的資料排成互 相成對 六 決策規則 : () 令 D 為樣本內各資料與特定值之差, 即 D X 則 D 之符號為正或為負機會相等, 機會均為 () 令 S 為正號或負號中出現較少者的次數, 即 S Min 號個數, 號個數 S 可視其為在 n 次二項詴驗獨立事件中成功次數, 所以 S 的分配為成功機率 p =.5 的 二項分配 若資料為小樣本 : 當樣本甚小時 (n 3), 呈現二項分配, 令顯著水準 α 雙尾檢定時 : s n s s n = 機率值 <, 則拒絕 H : 單尾檢定時 : s n s s 若資料為大樣本 : n = 機率值 <, 則拒絕 H : 或 H : 3
[ 陳選光 ] 當樣本甚大時 (n 3), 二項分配趨近於常態分配, 標準化之後, 即 : Z S n n 4 雙尾檢定時, 當 Z < Z, 則拒絕 H : ; 單尾檢定時, 當 Z < Z, 則拒絕 H : 或 H : 七 Gretl 操作過程 : 以案例 為例 由生產線上一定點按時取出產品測量, 測得 68,76,693,76,74,65,636,647, 653,64,676,686,668,689,668 克, 其中位數 η 是否仍然為以往的紀錄 68 克呢? 步驟 : 將資料整理成 Excel 檔, 而且必頇為 3 版本, 否則 Gretl 將無法讀取,X 為樣本資料, M 為特定值的中位數 如下圖 : 3
[ 陳選光 ] 步驟 : 進入 gretl 程式, 開啟檔案 開啟資料檔 匯入資料 選擇你存放資料的 Excel 檔案, 然後找到你的資料並打開打開之後, 你可以看見你的檔 案名稱 X 與 m, 點選檔案, 將會顯示各個檔案詳細的資料 33
[ 陳選光 ] 步驟 3: 點選工具 無母數檢定 點選確定 之後會跳出一個視窗, 選擇符號檢定 34
[ 陳選光 ] 在 Gretl 中, 是以變數 去對變數 作檢定, 所以變數 選原資料, 變數 選特定值 步驟 4: 即可顯示檢定結果, 因為 P 值.5 > α / =.5 ( 雙尾 ) 故不拒 絕 H, 表示中位數仍然有可能為 68 克 35
參考書目 中文書目. 林惠玲 陳正昌,( 應用統計學 ), 雙葉書廊有限公司. 顏月珠,( 無母數統計方法 ), 萬達印刷有限公司 3. 程大器,( 統計學 ), 高點文化事業有限公司 36