Chapter

Similar documents
PowerPoint 簡報

Microsoft Word - 94_2_stat_handout08_線性迴歸(考古題).doc

0 0 = 1 0 = 0 1 = = 1 1 = 0 0 = 1

的目的 的目的在於對統計分析所給定的先驗 假設條件 進行檢定, 以檢驗假設條件的 適當性 此假設條件包含 1. 分配形式的假設 : 例如在假設檢定中的常態分配假設 ; 2. 獨立性的假設 : 例如在兩個母體平均數及變異數假設檢定中的兩母體相互獨立的假設 ;

: Previous Next First Last Back Forward 1

Microsoft PowerPoint - spss2-1.ppt

Microsoft Word - 95_1_stat_handout_04抽樣與抽樣分配.doc

統計分析入門與應用 說明 : a. 獨立樣本 : 兩個來自於獨立, 沒有相關的樣本 b. 成對樣本 : 兩個平均數來自於同一個樣本, 有關係的樣本 7-2 Means 平均數分析 Means 平均數分析是用在不同類別變數組合下, 連續變數在各組的統計量, 例如 : 平均數 中位數 標準差 總合 最小

840 提示 Excel - Excel -- Excel (=) Excel ch0.xlsx H5 =D5+E5+F5+G5 (=) = - Excel 00

When the rejection rule for a test at every level α can be re-written as then xxx is the p-value of the test. xxx < α, If p-value < α, then the test c

%! # # % % & # ( ) ( +, & +, +, & +, & +, +, &!

Microsoft Word - ACI chapter00-1ed.docx

# ( + + # + # 6 +,! + # +! +, + # ( + ) ( + ( + ) + 7! + # + /8 + ) ( +! + #. + ( +, +! + # + # + + ( ! ( + ) ( + ) +, + ( + 9% +! +, + ( +

C19 (1)

認識 SAS

男人的大腦 女人的大腦

Microsoft Word - 94_4_stat_handout_06假設檢定_考古題.doc

二次曲線 人們對於曲線的使用及欣賞 比曲線被視為一種數學題材來探討要早 得多 各種曲線中 在日常生活常接觸的 當然比較容易引起人們的興趣 比如 投擲籃球的路徑是拋物線 盤子的形狀有圓形或橢圓形 雙曲線 是較不常見的 然而根據科學家的研究 彗星的運行軌道是雙曲線的一部 分 我們將拋物線 圓與橢圓 雙曲


1


目 录

4

:

381 課業輔導學習輔導 20 第二節 中學生的學習輔導 Skinner Skinner Skinner Bandura Bandura (381) 學習輔導.indd /5/31 2:44:13 PM

臺北醫學大學生物統計研究中心 enews 第 17 期 2017/02 多重檢定問題,false discovery rate (FDR) 與 q 值 王紋璋在統計假設檢定分析過程中, 根據收集的資料我們得到檢定統計量 (test statistic) 之樣本觀察值 ; 然後, 我們計算在虛無假設

Microsoft Word - ACL chapter02-5ed.docx

Microsoft PowerPoint - 統計學CH11.ppt

! + +, ) % %.!&!, /! 0! 0 # ( ( # (,, # ( % 1 2 ) (, ( 4! 0 & 2 /, # # ( &


地 理 志 鏡 止 煞, 來 達 到 安 宅 的 效 果 4. 門 神 符 紙 : 於 門 板 繪 製 門 神, 作 為 宅 第 的 守 護, 民 宅 所 使 用 的 門 神 題 材, 多 為 天 官 賜 福 或 文 武 官 員 符 紙 是 以 畫 了 符 咒 的 紙 懸 掛 室 內, 或 加 框

%% &% %% %% %% % () (! #! %!!!!!!!%! # %& ( % & ) +, # (.. /,) %& 0

從道德主體的興發論孔子的文學批評理論

第一章.FIT)

大 綱 最 有 利 標 目 的 及 類 型 最 有 利 標 之 辦 理 方 式 準 用 最 有 利 標 取 最 有 利 標 精 神 最 有 利 標 之 類 型 及 其 相 關 規 定 適 用 最 有 利 標 準 用 最 有 利 標 及 取 最 有 利 標 精 神 作 業 程 序 及 實 務 分 析


Microsoft PowerPoint - ch08.ppt

二 戶外教學的性質

科目 : 統計學分析與應用 一 統計學概論 共 25 題單選題, 佔 50% 1. 若資料之相對次數呈現對稱的圖形, 請問下列敘述何者為真? (A) 平均數接近 0 (B) 中位數接近 0 (C) 平均數與眾數非常相近 (D) 平均數與中位數非常相近 2. 下列有關紀錄資料的變數, 性別 出生地 婚

基本數學核心能力測驗_行為觀察記錄紙_G2版本


第十二章 新文化與新思潮

中國大陸輔助警察制度的問題與法制化研究 以 蘇州市警務輔助人員管理辦法 為例 專題研究 壹 前言 一 文職雇員

Chapter 4 Random Variables and Probability Functions

(Microsoft Word \262\316\255p\244W\264\301\245\275\303D\256w)

untitled

14052_公開用.pdf

# 7 % % % < % +!,! %!!

#!! +!,! # &!. / !!, 7!!, & #! % 7! % )

& ( )! +!, # %! ( & &.! / /.

表 决, 审 议 程 序 符 合 有 关 法 律 法 规 和 本 公 司 章 程 的 规 定 3 本 议 案 尚 需 提 交 股 东 大 会 审 议, 与 该 等 交 易 有 利 害 关 系 的 关 联 股 东 将 放 弃 在 股 东 大 会 上 对 相 关 议 案 的 投 票 权 ( 二 ) 公

<4D F736F F D20B9F0D5FEB0ECB7A2A3A A3A93532BAC52E646F63>

103_02.xls

<313032A655A874B2D5B3CCA743BFFDA8FABCD0B7C7AAED2E786C73>

柳州历史上的今天内文改版式.FIT)

生 產 準 備 您 接 近 生 產 之 注 意 事 項 : 備 妥 住 院 用 物, 勿 遠 行 ( 生 產 用 物 包 ) 最 好 有 人 在 家 陪 伴, 或 和 陪 產 者 保 持 連 繫, 有 任 何 狀 況 可 立 即 趕 到 可 做 家 事 散 步 蹲 下 等 運 動, 以 不 太 累

省十二届人大常委会

Q8. 公 營 事 業 機 構 之 公 務 員 兼 具 勞 工 身 分 者, 於 97 年 3 月 19 日 以 前, 原 選 擇 參 加 勞 保, 調 任 其 他 公 營 事 業 機 構 時, 應 改 參 加 公 保 所 謂 調 任 其 他 公 營 事 業 機 構 之 判 別 依 據 ( 或 標

学生工作部处2010年工作总结

天人炁功行入與感應經驗分享

YYW1.nps

穨邱秀玲綜合展望報告.PDF

untitled

決議、附帶決議及注意事項

( )... 5 ( ) ( )

untitled

2016 年 地 质 工 程 系 教 学 工 作 安 排 2016 学 年 我 系 将 在 总 结 过 去 工 作 的 基 础 上, 结 合 今 年 学 院 以 抓 质 量 强 内 涵 促 改 革 调 结 构 建 品 牌 细 管 理 重 过 程 为 宗 旨, 以 规 范 管 理 深 化 内 涵 为

<4D F736F F D203136BCADBBD8D2E4D3EBD1D0BEBF2E646F63>

萧山中学课程建设方案.doc


Microsoft Word - 9pinggb_A4.doc

Microsoft Word - 9pinggb_A4-f4.doc

理 论 探 索 事 业 单 位 改 革 的 五 点 思 考 余 路 [ 摘 要 ] 事 业 单 位 改 革 是 中 国 改 革 的 重 要 环 节, 其 影 响 力 和 难 度 不 亚 于 国 有 企 业 改 革 本 文 着 重 围 绕 推 进 事 业 单 位 改 革 应 考 虑 的 五 个 方 面

日 本 位 于 亚 洲 东 部, 太 平 洋 西 北 角, 是 我 国 东 方 的 一 个 岛 国 在 洪 积 世 ( 注 1) 的 大 部 分 时 期 内, 日 本 与 大 陆 相 连 大 约 在 洪 积 世 晚 期 至 冲 积 世 ( 注 2) 初 期, 日 本 各 地 发 生 海 进, 出 现

2深化教育教学改革、创新人才培养模式


Microsoft Word - 9pinggb_let.doc

实 习 上 下 点 表 格 解 释 和 相 关 纪 律 要 求 : 1 表 格 中 所 有 名 词 都 为 简 称, 包 括 医 院 名 称 四 年 级 五 年 级 各 专 业 名 称 等 所 有 时 间 都 为 学 生 装 好 行 李 出 发 时 间, 请 提 前 0 分 钟 将 行 李 运 到

3 基 金 杠 杆 从 分 级 基 金 的 概 念, 我 们 知 道 了 分 级 基 金 的 A 份 额 是 每 年 获 得 固 定 收 益 的 稳 健 份 额,B 份 额 是 具 有 杠 杆 效 应 的 激 进 份 额 分 级 基 金 中 的 杠 杆 一 般 有 三 类 : 份 额 杠 杆 =(A

简报158期.doc

Microsoft Word - 9pingb5_let.doc

退休權益.ppt [相容模式]

Microsoft Word - 1.《國文》試題評析.doc

Ps22Pdf

$%%& ()*+, %&, %-&&%%,. $ %,, $,, & /$- 0(1 $%%& %& 234 %-%, 5&%6&633 & 3%%, 3-%, %643 -%%% :::; 7<9; %-%, 3$%$ :::;

# $# #!# # # # # # # %# # # &# # # # #! "

zt

現在人類獲取地球內部訊息的方法, 是從可能影響我們身家性命安全的地震, 用數學模型把地震資料轉換成地震波速度, 進而獲得地底物質密度與深度的關係 地下世界知多少 km/s g/cm 3 P Gpa km S P S 3,000 3,000 ak K 透視地底 Percy Bridgma

Random Variables

04/ / /

Microsoft Word - 2B802內文.doc

東區校園中法治教育種子師資教學研習營

Microsoft Word - 1HF12序.doc

Microsoft Word - 讀報看科普─人體篇_橫_.doc

鍟嗗搧瑙傚療鈥㈤挗鏉

席 远 杨 一 人 了, 正 当 她 开 枪 时 却 发 现 子 弹 没 了 该 死, 只 能 赤 手 空 拳 了 洛 水 云 与 席 远 杨 交 起 手 来, 洛 水 云 出 手 招 招 致 命 想 那 席 远 杨 也 不 是 泛 泛 之 辈, 很 快 掌 握 了 洛 水 云 出 招 路 数 看

閱 讀 素 材 V.S 分 組 方 式 的 差 異 化 教 學 工 具 表 班 級 :( ) 閱 讀 素 材 V.S 分 組 方 式 獨 立 閱 讀 夥 伴 閱 讀 ( 同 質 性 ) 夥 伴 閱 讀 ( 異 質 性 ) 友 善 陪 伴 虛 心 受 教 國 語 日 報 新 聞 生 活 文 藝 兒 童

Microsoft Word - _m30.doc



Transcription:

Chapter 12 卡方檢定 李水彬 Chien Hsin University of Science and Technology 2014.02

Outline 1 簡介 2 適合度檢定實例一 : 薪資所得的分配檢定實例二 : 颱風警報的分配檢定 3 獨立性檢定 實例三 : 學生曠課與上網時數的獨立性檢定 4 齊一性檢定實例四 : 請討論本校各學院學生滿意度是否有差異? 練習 : 請討論本校各年級學生滿意度是否有差異?

簡介 1 處理類別資料個人特徵 : 性別, 血型, 產品喜好 : 汽車廠牌喜好, 手機廠牌喜好, 意見觀點 : 滿意度, 抱怨類型等等 2 統計發生的次數單項統計 : 有幾個男生, O 型有多少人, IPhone, Samsung, htc 的持有人數交互項統計 : 男生且打工的人數, 愛打籃球又喜歡喝咖啡的人數等等

簡介 Table: 健行科技大學打工同學的次數分配表 打工 沒有打工 合計 人數 182 202 384 百分比 47.4 52.6 1.00 我們令 p 代表母體比例 通常會有以下兩類問題 : 請估計本校打工同學的比例 請問本校打工和沒有打工同學的比例是否相當

簡介 打工同學的樣本比例為 47.4% 因為樣本比例是母體比例一個很好的估計方式, 因此, 我們估計本校打工同學的比例即為 ˆp = 47.4% 可以用信賴區間 (confidence interval) 表現估計的精確度 本校打工同學比例之 95% 信賴區間為 0.474 ± 0.05

簡介 虛無假設與對立假設 : 檢定統計量為 H 0 : p = 0.5 vs H 1 : p 0.5 (1) Z = 0.474 0.5 0.5 0.5 384 = 1.019 (2)

簡介 拒絕域 (α = 0.05) 為 C = {Z > 1.96 或 Z < 1.96} 結論 : 因為 Z = 1.019, 故無法拒絕 H 0, 因此我們可以假設本校打工和非打工同學之比例是相當的

簡介 Table: 台灣地區各血型分布百分比 A B AB O 百分比 26.5% 24.8% 6.2% 42.5% Table: 本校學學生各血型分布百分比 A B AB O 合計 人數 80 74 48 176 378 百分比 21.2% 19.6% 12.7% 46.5% 100% 本校 O 型學生之比例 (p O ) 是否與台灣地區 O 型民眾之比例相當?

簡介 兩個假設 H 0 : p O = 42.5% vs H 1 : p O 42.5% (3) 也可以問 A 型的比例 (p A ) 是否與台灣地區 A 型民眾比例相當? 即 H 0 : p A = 26.5% vs H 1 : p A 26.5% (4)

簡介 全面性比較的問題而不是某一種血型的比例, 本校學生之血型分佈是否與台灣民眾的血型分佈相當? 即 H 0 : p A = 26.5%; p B = 24.8%; p AB = 6.2%; p O = 42.5% (5) H 1 : p A 26.5% 或 p B 24.8% 或 p AB 6.2% 或 p O 42.5% (6)

簡介 適合度檢定 適合度之意旨為某種給定的分配是否 合適 於代表研究對象的分配 本校同學的血型比例 ( 未知 ) 是否與他們所處更大的群體 台灣 有所不同? 我們同學的血型分布情形有無特殊性, 特殊性是一種相對的講法, 他是與更大的群體 ( 已知 ), 更一般性的狀況比較的結果 卡方檢定可以用來說明這種期待的特殊性是否存在

簡介 獨立性檢定兩個或是以上的類別變數是否有關聯的問題 重男輕女的現象是否存在, 個別家庭的父母或是長輩間或許存在, 或許無, 或者相反 這種價值觀會反應在人的行為模式上, 行為模式是價值觀的具體表現 我們是可以藉由觀察一些社會現象暸解一部分的內涵, 但非全部的解釋 嘗試做這樣的命題 因為重男輕女的觀念下, 本校女同學打工的比例高於男同學 這樣推論說明把性別與打工這兩個類別變數存在關聯性

簡介 打工與否是否與性別有關? M: 男生事件, W : 打工事件 p M = P (M) 代表本校男生的比例, p W = P (W ) 代表本校打工的比例 P (M W ) 代表本校男同學且打工的比例

簡介 假設打工與否與性別無關, 其意就是 W 事件發生與否與 M 事件發生無關, 即 P (M W ) = P (M)P (W ) = p M p W (7)

簡介 如何驗証式是否真的成立, 仍須用相對次數的觀點解決 Table: 本校男女生打工情形之列聯表 男 女 合計 打工 125 57 182 沒有打工 117 85 202 合計 242 142 384

簡介 齊一性檢定 1 卡方檢定還可以用檢定不同群體間的分佈是否相同的問題 Example 本校共四個學院, 每一個學院為一個子母體, 我們可以討論學生對未來的信心程度在學院間無差異, 某個學院的學生對未來可能比較有信心, 或者有學院的學生對未來信心偏弱

簡介 Table: 本校各學院學生對未來信心調查之列聯表 有信心 普通 沒信心 合計 管理 35 43 34 112 工 30 38 9 87 商 20 48 18 86 電資 35 43 21 99 合計 130 172 82 384

適合度檢定 適合度檢定適合度定是用來探討一個類別變數的次數分配是否與一個已知且群體範圍更大的母體分配相同, 或者與一個假設性或理想性的機率分配是否相同 ( 這類為隨機變數的分配假設檢定 ) 將台灣民眾的血型分配就是一個已知且比健行科技大學學生更大的群體, 我們的學生是台灣民眾的一部份 探討本校學生的血型分配是否與台灣民眾的血型分配相同的卡方檢定, 即為適合度檢定

適合度檢定 H 0 : 本校學生的血型分配與台灣民眾的血型分配相同 當 H 0 為真時, 樣本資料所呈現的次數分配會如何? 根據古典機率法則, 假設群體中每一個被抽中的機率相同, 這 n 個對象分屬這 m 個類別, 若假設它們的比例為 H 0 : p i = p 0,i, i = 1,, m (8)

適合度檢定 在 H 0 下, 期望次數為 E i = n p 0,i, i = 1,, m (9) 讓 O i, i = 1,, m 代表實際觀察的結果, 如果 H 0 為真, 則每一個 O i 應該與期望次數接近, 即 E i O i, i = 1,, m 都應接近 0

適合度檢定 (O i E i ) 2 χ 2 (1) (10) E i 卡方檢定統計量為 m χ 2 (O i E i ) 2 0 = χ 2 (m k) (11) E i i=1 其中 k 為限制式的數目

適合度檢定 假設一個群體依其屬性可以分成 m 個類別 ( 例如, 血型有 m = 4 類 ), 每一個類別的比例分別為 p 1,, p m (12) 因為比例總和為 1, 所以, 必須加入條件 m p m = p 1 + + p m = 1 (13) i=1

適合度檢定 拒絕域的型態為 C = { χ 2 0 > c } (14) 這裡必須注意, 卡方檢定只有右尾型式, 沒有左尾和雙尾的拒絕域 在控制顯著水準 α 下, 上式 c = χ 2 α(m k)

適合度檢定 適合度卡方檢定的步驟摘要如下 : STEP1 兩個假設 ( 只寫虛無假設 ) STEP2 檢定統計量 首先, 根據虛無假設計算每一個儲存格的期望次數, 若有期望次數低於 5, 須考慮合併儲存格, 將屬性相近的儲存格予以合併 接著, 計算式 (11) 的卡方檢定統計量 STEP3 拒絕域 根據顯著水準 α, 查出 χ 2 α(m k) 之值, 令拒絕域為 C = { χ 2 0 > χ 2 α(m k) } STEP4 結論 清楚說明檢定後的決策

適合度檢定 Example 請問本校學生之血型分佈與台灣民眾血型分佈是否有差異? STEP1: 兩個假設 ( 只寫虛無假設 ) { pa = 26.5%; p H 0 : B = 24.8%; p AB = 6.2%; p O = 42.5%

適合度檢定 STEP2: 檢定統計量計算期望次數 Table: 台灣地區各血型分布百分比 A B AB O 合計 百分比 26.5% 24.8% 6.2% 42.5% 100% 期望次數 100.2 93.7 23.4 160.7 378 觀察值 80 74 48 176 378

適合度檢定 計算檢定統計量 χ 2 0 = (O i E i ) 2 E i (80 100.2)2 (74 93.7)2 = 100.2 + 93.7 (48 23.4)2 (176 160.7)2 + 23.4 + 160.7 = 100.2 20.22 + 19.72 93.7 + 24.62 23.4 + 160.7 15.32 = 71.46

適合度檢定 STEP3: 拒絕域 (α = 0.05) 查表 χ 2 0.05(4 1) = 7.8147 拒絕域 C = { χ 2 > 7.8147 } STEP4: 因為 χ 2 0 = 71.46 落在拒絕域 C 中, 故拒絕 H 0, 即證據足以證實本校學生的血型分佈與台灣民眾的血型分佈不同

適合度檢定 實例一 : 薪資所得的分配檢定在第十章估計和第十一章假設檢定中, 通常需要假設母體的分配是常態的, 但是母體是否真為常態, 或者可以接受是常態的假設 適合度檢定提供一個判定常態假設的方法 例如, 調查本系 50 位畢業四年內校友的薪資, 假設校友的薪資的分配為常態, 請問如何驗證此一假設是否為真?

適合度檢定 實例一 : 薪資所得的分配檢定

適合度檢定 實例一 : 薪資所得的分配檢定 Table: 校友的薪資 ( 月薪, 萬 ) 2.9 3.8 3.3 4.3 4.1 5.4 4.0 5.3 4.5 2.3 3.1 4.4 3.9 4.2 4.6 3.6 4.2 3.8 4.8 5.7 4.0 3.4 2.7 6.3 2.9 4.6 3.4 2.5 5.2 4.6 4.2 2.3 3.1 5.0 3.3 3.4 3.2 2.8 3.9 4.5 3.6 2.4 2.6 5.4 5.3 5.5 3.6 5.4 4.3 5.0

適合度檢定 實例一 : 薪資所得的分配檢定 圖 : 本系 50 位畢業四年內校友的薪資的莖葉圖

適合度檢定 實例一 : 薪資所得的分配檢定對於這組資料, 我們的問題是 H 0 : 薪資資料分配為 N ( 4.0, 1.0 2) H 1 : 薪資資料分配不是 N ( 4.0, 1.0 2) (15) 最大值為 6.3 萬, 最小值 2.3 萬, 平均值為 4.012 萬, 標準差為 0.998 萬 是否可以檢定上述假設呢?

適合度檢定 實例一 : 薪資所得的分配檢定 圖 : N (4.0, 1.0 2 ) 的機率分配曲線圖

適合度檢定 實例一 : 薪資所得的分配檢定參考史塔克基法則 (sturge s rule), 組數 k 與樣本數 n 的關係如下 : k = 1 + 3.32log 10 n (16) 且至少分成 5 段 ; 例如, n = 50, 所以, k = 1 + 3.32log 10 50 = 6.6, 取 k = 7 每一段期望次數至少有 5 個觀察值

適合度檢定實例一 : 薪資所得的分配檢定 h > R k = 4.0 = 0.58 (17) 7 故取 h = 0.6 我們可得如下的次數分配表

適合度檢定 實例一 : 薪資所得的分配檢定 Table: 校友的薪資的次數分配表 範圍 次數 累積次數 相對次數 相對累積 2.15 < x 2.75 6 6 12 12 2.75 < x 3.35 8 14 16 28 3.35 < x 3.95 10 24 20 48 3.95 < x 4.55 11 35 22 70 4.55 < x 5.15 6 41 12 82 5.15 < x 5.75 8 49 16 98 5.75 < x 6.35 1 50 2 100 合計 50 100

適合度檢定 實例一 : 薪資所得的分配檢定

適合度檢定 實例一 : 薪資所得的分配檢定 Table: 期望次數表 範圍 機率值 期望次數 E i 觀察次數 O i 2.15 < x 2.75 0.106 5.3 6 2.75 < x 3.35 0.152 7.6 8 3.35 < x 3.95 0.222 11.1 10 3.95 < x 4.55 0.229 11.5 11 4.55 < x 5.15 0.166 8.3 6 5.15 < x 5.75 0.085 4.2 8 5.75 < x 6.35 0.04 2 1 合計 1.00 50 50

適合度檢定 實例一 : 薪資所得的分配檢定

適合度檢定 實例一 : 薪資所得的分配檢定 Table: 合併期望次數表 範圍 機率值 期望次數 E i 觀察次數 O i 2.15 < x 2.75 0.106 5.3 6 2.75 < x 3.35 0.152 7.6 8 3.35 < x 3.95 0.222 11.1 10 3.95 < x 4.55 0.229 11.5 11 4.55 < x 5.15 0.166 8.3 6 5.15 < x 0.125 6.2 9 合計 1.00 50 50

適合度檢定 實例一 : 薪資所得的分配檢定檢定統計量為 χ 2 0 = (O i E i ) 2 E i (6 5.3)2 (8 7.6)2 (10 11.1)2 = 5.3 + 7.6 + 11.1 (11 11.5)2 (6 8.3)2 (9 6.2)2 + 11.5 + 8.3 + 6.2 = 0.72 5.3 + 0.42 7.6 + 11.1 1.12 + 11.5 0.52 + 2.32 8.3 + 2.82 6.2 = 2.14 因為 χ 2 0.05(6 1) = 11.0705, 所以拒絕域為 C = { χ 2 > 11.0705 }

適合度檢定 實例一 : 薪資所得的分配檢定檢定統計量 χ 2 0 = 2.14 沒有落在 C 中, 故我們無法拒絕 H 0, 表示薪資服從常態分配是可以接受的假設

適合度檢定 實例二 : 颱風警報的分配檢定我們常假設單位時間內某特性事件發生的次數通常是一個卜瓦松分配, 台灣過去 112 多年來, 平均每年有 4.36 個颱風

適合度檢定 實例二 : 颱風警報的分配檢定 Table: 1897 2009 年的颱風統計資料 ( 資料來源 : 中央氣象局 ) 一年侵襲 年 實際值 H 0 下的期望值 台灣次數 數 相對次數 累積次數 相對次數 累積次數 1 4 0.036 0.036 0.068 0.068 2 9 0.08 0.116 0.121 0.19 3 27 0.241 0.357 0.177 0.366 4 24 0.214 0.571 0.192 0.559 5 21 0.188 0.759 0.168 0.727 6 13 0.116 0.875 0.122 0.849 7 9 0.08 0.955 0.076 0.924 8 3 0.027 0.982 0.041 0.966 9 1 0.009 0.991 0.02 0.986 ( )10 1 0.009 1 0.014 1 合計 112 1.0 1.0

適合度檢定 實例二 : 颱風警報的分配檢定我們的假設為 H 0 : 颱風侵襲台灣次數為卜瓦松分配 H 1 : 颱風侵襲台灣次數不是卜瓦松分配 (18) 卜瓦松機率密度函數為 f(x) = e λ λ x, x = 1, 2, (19) x!

適合度檢定 實例二 : 颱風警報的分配檢定 圖 : 卜瓦松 P (4.36) 的機率分配長條圖

適合度檢定 實例二 : 颱風警報的分配檢定當 H 0 為真時, 期望次數 λ 的估計值為 ˆλ = 4.36 根據此一估計值, 我們可以計算每一年颱風侵台次數的機率值為 推估發生機率的理論值 ˆf(x) = e ˆλˆλx, x = 1, 2, (20) x!

適合度檢定 實例二 : 颱風警報的分配檢定 Table: 颱風期望次數分配表 次數 1 2 3 4 5 期望值 7.62 13.55 19.82 21.50 18.82 次數 6 7 8 9 10 期望值 13.66 8.51 4.59 2.24 1.57 次數 8 的期望次數皆小於 5, 考慮合併這些儲存格

適合度檢定 實例二 : 颱風警報的分配檢定 圖 : 颱風衛星雲圖

適合度檢定 實例二 : 颱風警報的分配檢定

適合度檢定 實例二 : 颱風警報的分配檢定 Table: 合併後的颱風期望次數分配表 次數 1 2 3 4 5 6 7 8 實際值 4 9 27 24 21 13 9 5 期望值 7.62 13.55 19.82 21.50 18.82 13.66 8.51 8.52

適合度檢定 實例二 : 颱風警報的分配檢定檢定統計量為 χ 2 0 = (O i E i ) 2 E i (4 7.62)2 (9 13.55)2 (27 19.82)2 = 7.62 + 13.55 + 19.82 (24 21.5)2 (21 18.82)2 + 21.5 + 18.82 (13 13.66)2 (9 8.51)2 (5 8.52)2 + 13.66 + 8.51 + 8.52 = 3.622 7.62 + 13.55 7.182 + 19.82 2.52 + 0.662 21.5 + 18.82 2.182 + 13.66 0.492 + 3.522 8.51 + 3.522 8.52 = 9.04

適合度檢定 實例二 : 颱風警報的分配檢定因為 χ 2 0.05(8 2) = 12.5916, 所以拒絕域為 C = { χ 2 > 12.5916 } 檢定統計量 χ 2 0 = 9.04 沒有落在 C 中, 故我們無法拒絕 H 0, 表示颱風侵台次數服從卜瓦松分配

獨立性檢定 獨立性檢定是指兩個變數是否獨立的檢定方法 這兩變數來自相同個體, 獨立性檢定分析變數間是否有關聯性 在第 11 章連續型變數, 稱之為成對樣本, 例如身高和體重這兩個變數是否有關, 在測量方法上對每一個人做身高與體重的測量, 身高與體重是來自同一個抽樣的結果 在類別型變數亦同, 例如在問卷調查中, 我們對受訪者詢問一系列的問題, 每一個問題都是一個變數, 研究者常常對這些變數的關係, 關聯和結構有興趣, 而兩變數的獨立性檢定是最初步的瞭解方法

獨立性檢定 Example 在探討健行科技學生的學習活動與對學校滿意度的關係之研究中, 我們直觀上可能認為學生上網時間會影響上課出席狀況, 更明確地說, 上網時間增加將使得學生曠課次數增加, 我們對此有疑問, 想予以證實

獨立性檢定 在問卷上我們會調查 n 位受訪者上網時間 (X, 小時 ) 和每周曠課時數 (Y ) 假設這問卷共有 c 個受訪者, 令 (X k, Y k ) 代表第 k 位受訪者對這兩題的回應, k = 1,, n 假設在問卷中變數 X 有 r 選項, 用 a 1,, a r 表示之 ; 變數 Y 有 c 選項, 用 表示之 b 1,, b c

獨立性檢定 列聯表第 (i, j) 位置上的數值 O ij 代表同時勾選 X = a i 和 Y = b j 的人數 此表示統計所有可能事件 {(a i, b j )} 在此次調查中發生的次數

獨立性檢定 定義定義兩變數的聯合機率分配 (jointly probability distribution) 為 p ij = P ((X, Y ) = {a i, b j }), i = 1,, r; j = 1,, c. (21) 也就是受訪者勾選 {(a i, b j )} 的機率

獨立性檢定 以相對次數的觀點, 可以以 ˆp ij = O ij n (22) 做為 p ij 的估計

獨立性檢定 Table: 獨立性檢定的列聯表 Y X b 1 b j b c 合計 a 1 O 11 O 1j O 1c O 1..... a i O i1 O ij O ic O i..... a r O r1 O rj O rc O r 合計 O 1 O j O n O

獨立性檢定 其中 O i = c O ij = O i1 + O i2 + + O ic (23) j=1 O j = r O ij = O 1j + O 2j + + O rj (24) i=1 O = r c O ij = r O i = c O j (25) i=1 j=1 i=1 j=1

獨立性檢定 O i 為變數 X 在 a i 選項上的邊際次數 (marginal frequency), 也就是這份問卷中回答勾選 a i 的總人數 O j 為變數 Y 在 b j 選項上的邊際次數, 為這份問卷中回答勾選 b j 的總人數 O 洽等於 n, 因為每一個受訪者的回應結果應該是這些可能情況的其中之一

獨立性檢定 令 p i+ = P (X = a i ) p +j = P (Y = b i ) 如式 (7) 一樣, 若兩個變數是獨立的, 則 (26) p ij = P (X = a i )P (Y = b i ) = p i+ p +j (27)

獨立性檢定 獨立性檢定的兩個假設為 H 0 : X&Y 兩個變數相互獨立 H 1 : 兩個變數不獨立 (28) 轉換成事件機率是否獨立的假設檢定, H 0 : p ij = p i+ p +j H 1 : 不全相等 (29)

獨立性檢定 上式 p i+, i = 1,, r 和 p +j, j = 1,, c 都是未知數 可以分別利用下式估計之 ˆp i+ = O i n, i = 1,, r ˆp +j = O j n, j = 1,, c (30)

獨立性檢定 在 H 0 的假設下, p ij 的估計為 ˆp ij = ˆp i+ˆp +j (31) 且表 14 中每一個儲存格的期望次數為 E ij = nˆp ij = nˆp i+ˆp +j = n O i n O j n = O (32) i O j O

獨立性檢定 Table: 獨立性檢定的列聯表 Y X b 1 b j b c 合計 a 1 E 11 E 1j E 1c O 1..... a i E i1 E ij E ic O i..... a r E r1 E rj E rc O r 合計 O 1 O j O c O

獨立性檢定 獨立性檢定的卡方統計量為 χ 2 0 = r c (O ij E ij ) 2 (33) i=1 j=1 E ij

獨立性檢定 關於卡方分配的自由度, 在虛無假設有 rc 個參數, 對應 rc 個儲存格, 而每一個儲存格都是一個隨機變數的結果, 有 rc 的自由度, 但因為總觀察次數為 n, 少了 1 個自由度, 儲存格有 rc 1 個自由度 式 (30) 有 r + c 條方程式, 有 r + c 個參數需要估計, 每一個參數估計都是一個限制式, 但有限制總機率和為 1 的法則, 只需要估計 r + c 1 個參數 卡方檢定的自由度為 v = rc (r c 1) = (r 1)(c 1) (34)

獨立性檢定 拒絕域為 C = { χ 2 > χ 2 α((r 1)(c 1)) }

獨立性檢定 獨立性檢定虛無假設 : 兩個變數獨立 ( 不相關 ) 卡方檢定統計量 : χ 2 0 = r i=1 c (O ij E ij ) 2 E j=1 ij 自由度 v = (r 1)(c 1) 拒絕域 C = { χ 2 > χ 2 α((r 1)(c 1)) }

獨立性檢定 實例三 : 學生曠課與上網時數的獨立性檢定表 16 是調查本校 384 為學生每周曠課時數與上網時間的列聯表, 請檢定兩者是否有關連性? Table: 學生曠課與上網時數之列聯表 曠課 上網時間 合 次數 1 2 3 4 5 6 計 1 8 31 34 18 16 27 134 2 4 22 28 28 21 23 126 3 2 10 11 19 7 11 60 4 1 6 4 8 5 6 30 5 1 2 3 1 2 1 10 6 1 1 4 2 3 13 24 合計 17 72 84 76 54 81 384

獨立性檢定 實例三 : 學生曠課與上網時數的獨立性檢定 [STEP1]: 兩個假設 H 0 : 學生曠課與上網時數無關 H 1 : 學生曠課與上網時數有關 (35)

獨立性檢定 實例三 : 學生曠課與上網時數的獨立性檢定 圖 : 上課或上網?? [STEP2]: 次數, 得 檢定統計量 首先, 利用式 (32) 計算期望

獨立性檢定 實例三 : 學生曠課與上網時數的獨立性檢定 Table: 學生曠課與上網時數之期望次數列聯表 曠課 上網時間 合 次數 1 2 3 4 5 6 計 1 5.93 25.13 29.31 26.52 18.84 28.27 134.00 2 5.58 23.63 27.56 24.94 17.72 26.58 126.00 3 2.66 11.25 13.13 11.88 8.44 12.66 60.00 4 1.33 5.63 6.56 5.94 4.22 6.33 30.00 5 0.44 1.88 2.19 1.98 1.41 2.11 10.00 6 1.06 4.50 5.25 4.75 3.38 5.06 24.00 合計 17 72 84 76 54 81 384

獨立性檢定 實例三 : 學生曠課與上網時數的獨立性檢定將期望次數低於 5 與相鄰儲存格合併, 得 Table: 合併後之期望次數表 曠課 上網時間 合 次數 2 3 4 5 6 計 1 31.06 29.31 26.52 18.84 28.27 134.00 2 29.20 27.56 24.94 17.72 26.58 126.00 3 13.91 13.13 11.88 8.44 12.66 60.00 4 14.83 14.00 12.67 9.00 13.50 64 合計 89 84 76 54 81 384

獨立性檢定 實例三 : 學生曠課與上網時數的獨立性檢定對應於期望次數表的合併情形, 我們亦將觀察次數表的儲存格合併, 得 Table: 合併後之觀察次數 曠課 上網時間 合 次數 2 3 4 5 6 計 1 39 34 18 16 27 134 2 26 28 28 21 23 126 3 12 11 19 7 11 60 4 12 11 11 10 20 64 合計 89 84 76 54 81 384

獨立性檢定實例三 : 學生曠課與上網時數的獨立性檢定 計算每一個儲存格的偏離量 (O i E i ) 2 E i 如下表 卡方檢定統計量 Table: 個別儲存格之卡方統計量 曠課 上網時間 次數 2 3 4 5 6 1 2.03 0.75 2.74 0.43 0.06 2 0.35 0.01 0.38 0.61 0.48 3 0.26 0.34 4.28 0.24 0.22 4 0.54 0.64 0.22 0.11 3.13 χ 2 0 = 2.03 + 0.75 + + 3.13 = 17.82

獨立性檢定 實例三 : 學生曠課與上網時數的獨立性檢定 [STEP3]: 拒絕域 根據顯著水準 α = 0.05, 自由度為 (4 1) (5 1) = 12, 查出 χ 2 0.05(12) = 21.03, 所以, 拒絕域為 C = { χ 2 0 > 21.03 } [STEP4]: 結論 因為 χ 2 0 == 17.82 沒有落在 C 內, 故證據無法證實學生曠課與上網時數是有關的, 或者說學生曠課與上網時數沒有明顯的關係

齊一性檢定 齊一性檢定旨在數個母體在某個特性變數的分配是否一致, 如表 5 討論本校各院學生面對未來的信心程度是否相同? 在問卷調查將信心程度分成五個等第, 比較各院學生的回應在每一個等第的比例是否相同

齊一性檢定 齊一性檢定應採用分層隨機抽樣, 將每個學院視為子母體, 控制 各學院的抽樣人數, 並在學院中進行隨機抽樣 假設有 A 1,, A r 層, 屬性變數 Y 的選項為 b 1,, b c, 統計各子母體屬性變數 Y 的次數分配

齊一性檢定 在齊一性檢定中, 將層別視為另一個變數, 使得討論分配是否一致的問題轉換成獨立性檢定, 變成層別變數與屬性變數是否有關? 因此, 齊一性檢定的實施與決策法則完完全全與獨立性檢定相同, 故此不再贅述

齊一性檢定 兩個假設為 H 0 : 本校各學院學生對學校滿意度沒有差異 H 1 : 本校各學院學生對學校滿意度有差異 (36)

齊一性檢定 Table: 齊一性檢定的列聯表 Y 層別 b 1 b j b c 合計 A 1 O 11 O 1j O 1c O 1..... A i O i1 O ij O ic O i..... A r O r1 O rj O rc O r 合計 O 1 O j O c O

齊一性檢定 Example 請依據表 5 檢定本校各院學生面對未來的信心程度是否相同? 解 : 兩個假設 H 0 : 本校各院學生面對未來的信心程度是相同的 H 1 : 本校各院學生面對未來的信心程度不相同的 (37)

齊一性檢定 計算期望次數 Table: 本校各學院學生對未來信心調查之列聯表 有信心 普通 沒信心 合計 管理 37.92 50.17 23.92 112.00 工 29.45 38.97 18.58 87.00 商 29.11 38.52 18.36 86.00 電資 33.52 44.34 21.14 99.00 合計 130.00 172.00 82.00 384.00

齊一性檢定 計算卡方檢定統計量 Table: 本校各學院學生對未來信心調查之列聯表 有信心 普通 沒信心 合計 管理 0.22 1.02 4.25 5.50 工 0.01 0.02 4.94 4.97 商 2.85 2.33 0.01 5.19 電資 0.07 0.04 0.00 0.11 合計 3.15 3.42 9.20 χ 2 0 = 15.77

齊一性檢定 自由度 v = (4 1) (3 1) = 6 拒絕域為 C = { χ 2 0 > 12.59 } 結論 : 因為 χ 2 0 = 15.77 落在 C 內, 故證實本校各院學生面對未來的信心程度是不相同的, 或者本校各院學生面對未來的信心程度有明顯的不同

齊一性檢定 實例四 : 請討論本校各學院學生滿意度是否有差異? 請根據表 24 說明本校各學院學生對學校滿意度是否有差異? 解 : 設定兩個假設 H 0 : 本校各學院學生對學校滿意度沒有差異 H 1 : 本校各學院學生對學校滿意度有差異 (38)

齊一性檢定 實例四 : 請討論本校各學院學生滿意度是否有差異? Table: 健行科技大學各院學生滿意度的列聯表 非常 贊成 普通 不贊成 非常 合計 贊成 不贊成 管理學院 5 43 52 10 2 112 工學院 10 31 41 5 0 87 商學院 1 30 44 9 2 86 電資學院 8 31 49 10 1 99 合計 24 135 186 34 5 384

齊一性檢定 實例四 : 請討論本校各學院學生滿意度是否有差異? 計算期望次數 利用期望次數的計算公式 E ij = O i O j 得下表 : O Table: 健行科技大學各院學生滿意度的列聯表 非常 贊成 普通 不贊成 非常 合計 贊成 不贊成 管理學院 7.00 39.38 54.25 9.92 1.46 112 工學院 5.44 30.59 42.14 7.70 1.13 87 商學院 5.38 30.23 41.66 7.61 1.12 86 電資學院 6.19 34.8 47.95 8.77 1.29 99 合計 24 135 186 34 5 384

齊一性檢定 實例四 : 請討論本校各學院學生滿意度是否有差異? 合併儲存格 將鄰近儲存格合併使得每一個期望次數的儲存格數值皆大於 5 Table: 合併後的期望次數 非常贊成 贊成 普通 不贊成 合計 管理學院 7 39.38 54.25 11.38 112 工學院 5.44 30.59 42.14 8.84 87 商學院 5.38 30.23 41.66 8.73 86 電資學院 6.19 34.8 47.95 10.05 99 合計 24 135 186 39 384

齊一性檢定 實例四 : 請討論本校各學院學生滿意度是否有差異? 合併後的觀察次數表 Table: 合併後的觀察次數 非常贊成 贊成 普通 不贊成 合計 管理學院 5 43 52 12 112 工學院 10 31 41 5 87 商學院 1 30 44 11 86 電資學院 8 31 49 11 99 合計 24 135 186 39 384 卡方檢定統計量 χ 2 0 = 11.9

齊一性檢定 實例四 : 請討論本校各學院學生滿意度是否有差異? Table: 卡方統計量 非常贊成 贊成 普通 不贊成 合計 管理學院 0.57 0.33 0.09 0.03 1.03 工學院 3.83 0.01 0.03 1.67 5.53 商學院 3.56 0 0.13 0.59 4.28 電資學院 0.53 0.42 0.02 0.09 1.06 合計 8.49 0.76 0.28 2.38 χ 2 0 = 11.9 自由度 v = (4 1) (4 1) = 9 拒絕域 C = { χ 2 0 > 16.92 } 結論 : 因為 χ 2 0 = 11.9 沒有落在 C 內, 故無法證實本校各院學生的學生滿意度有明顯不同

齊一性檢定 練習 : 請討論本校各年級學生滿意度是否有差異? 請根據表 29, 檢定校各年級學生滿意度是否有差異? Table: 健行科技大學各年級學生滿意度的列聯表 非常 贊成 普通 不贊成 非常 合計 贊成 不贊成 一年級 11 33 50 6 0 100 二年級 6 22 53 14 3 98 三年級 4 45 46 11 2 108 四年級 3 35 37 3 0 78 合計 24 135 186 34 5 384

齊一性檢定 練習 : 請討論本校各年級學生滿意度是否有差異? 愛因斯坦 : 人生就像騎單車 想保持平衡就得往前走 Life is like riding a bicycle. To keep your balance you must keep moving.