公職王歷屆試題 4 高考 共 8 頁第 頁 在以向量表示法的迴歸模型 M:ε 中, 如何將 更精簡的以矩陣與參數向量表示? 另外, 在一般情形下, 此時 ε 之機率分分為何? 計計迴歸模型計中之參數向量 的最小平方估計量及估計其變異數共變異數矩陣 variacecovariace matrix 今

Similar documents
Microsoft Word - 94_2_stat_handout08_線性迴歸(考古題).doc

無投影片標題

Regression Analysis

試題評析

When the rejection rule for a test at every level α can be re-written as then xxx is the p-value of the test. xxx < α, If p-value < α, then the test c

複迴歸分析簡介 (Multiple Regression Analysis) 迴歸分析是利用一個或一組自變數來預測或解釋一個 ( 反 ) 應變數 (response variable), 其中自變數又可稱為預測變數 (predictors) 解釋變數(explanatory variables) 控

基礎財金統計分析

( ) t ( ) ( ) ( ) ( ) ( ) t-

(baking powder) 1 ( ) ( ) 1 10g g (two level design, D-optimal) 32 1/2 fraction Two Level Fractional Factorial Design D-Optimal D

Microsoft Word - ACI chapter00-1ed.docx

1 500 表 1: 各國平均分數

Microsoft Word - CH12-001~030_1_.doc

認識 SAS

Microsoft PowerPoint - spss2-1.ppt

材 料 目 录 1. 党 员 发 展 及 转 正 流 程 图 2. 申 请 入 党 人 员 基 本 信 息 及 培 养 记 录 表 3. 思 想 汇 报 传 阅 及 意 见 反 馈 表 4. 入 党 积 极 分 子 培 养 考 察 表 5. 政 治 审 查 函 调 信 模 板 6. 政 治 审 查

<4D F736F F D20BDD7A4E5A4BAA4E5BB50A5D8BFFD2E646F63>

國人之健康行為初探

Ps22Pdf

,00024,000 84,

幻灯片 1

妇幼保健健康教育核心信息

《晚年周恩来》目录

中華民國 第51屆中小學科學展覽會


礼仪玉和葬玉

邻居啊 第二天 对门却悄无声息了 莫非昨夜的吵闹 仅是个幻觉 夜幕拉下时 寒风又吱溜溜地叫个不停 老婆 睡下后 我这只夜猫子 继续兴致勃勃地跟着福尔 摩斯去探案 白天的喧嚣退去了 周围格外安静 正 是读书的好时候 突然 响起了钟摆声 哒 哒 哒 节奏匀称 不疾不徐 声响却愈来愈大 格外突兀 了 原来

<4D F736F F D BAC520CAD7B6BCCAA6B7B6B4F3D1A C4EAD7A8D2B5BCBCCAF5D6B0CEF1C6C0C6B8B9A4D7F7D2E2BCFB2E646F63>

其 他 方 面 也 可 以 采 用 同 样 的 方 式, 这 样 又 可 以 锻 炼 除 语 文 方 面 的 其 他 能 力 了 而 英 语 方 面, 我 认 为 配 合 英 语 专 业 举 办 英 语 演 讲 比 赛 就 很 不 错 这 样 开 展 一 系 列 的 创 新 活 动, 锻 炼 多 方

第 六 条 办 法 第 五 条 ( 三 ) 协 会 考 评, 考 评 指 考 核 评 价 第 七 条 办 法 第 六 条 职 业 操 守 包 括 的 内 容 : 个 人 诚 信 不 做 假 账 不 偷 漏 税 不 贪 污 盗 窃 等 第 八 条 企 业 财 务 管 理 人 才 评 价 实 行 五 星

他 随 身 带 有 二 三 十 张 古 方, 白 天 卖 药, 夜 晚 将 药 材 精 细 研 末, 按 方 配 制 对 于 病 人 服 药 后 反 应, 特 别 留 心 发 现 问 题, 就 近 向 老 医 生 老 药 贩 虚 心 求 教, 千 方 百 提 高 药 效 同 时 对 于 春 夏 秋

6寸PDF生成工具

Microsoft Word - 送報伕2.doc

申论写作套路万能模板

Microsoft Word - 三方协议书与接收函的相关说明学生版.doc

untitled

PowerPoint Presentation

4

14052_公開用.pdf

# 7 % % % < % +!,! %!!

目 录 专 稿 季 烨 文 革 之 初 北 京 师 大 二 附 中 的 红 色 暴 力 姜 培 良 之 死 与 仇 恨 教 育 评 论 唐 燕 关 于 北 京 女 十 中 教 师 孙 迪 之 死 给 王 友 琴 纠 错 校 史 王 逸 伦 编 辑 合 肥 市 第 六 中 学 校 史 关 于 文 革

<4D F736F F D B0EAA5C1A470BEC7A4CEB0EAA5C1A4A4BEC7B8C9B1CFB1D0BEC7B9EAAC49A4E8AED7>

来 正 式 组 织 关 系 转 出 后 未 收 到 组 织 关 系 介 绍 信 回 执 的 党 员 排 查 的 主 要 任 务 是, 核 查 党 员 身 份 信 息, 摸 清 流 动 党 员 底 数, 理 顺 党 员 组 织 关 系, 健 全 完 善 党 员 档 案, 对 与 党 组 织 失 去 联

穨飲食與養老_決定版_.PDF

untitled

《捕捉儿童敏感期》

2 國 文 考 科 試 題 解 析 命 題 出 處 與 南 一 版 第 五 冊 第 二 課 幽 夢 影 選 課 程 內 涵 同 試 題 解 析 某 君 講 信 用, 重 然 諾, 行 事 穩 健, 工 作 負 責 較 符 合 謹 飭 友 謹 飭 友 指 的 是 言 行 謹 慎 而 有 節 制 的 朋

untitled

29 碳 酸 钙 D3 片 ( 别 名 维 生 素 D3 碳 酸 钙 ) 吉 林 省 第 一 批 低 价 药 30 炔 诺 酮 滴 丸 吉 林 省 第 一 批 低 价 药 31 去 氯 羟 嗪 片 吉 林 省 第 一 批 低 价 药 32 茶 苯 海 明 片 吉 林 省 第 一 批 低 价 药 33

生命科学学院 学年度学风建设实施方案

Microsoft Word - p11.doc


第二章

:

2013年度西藏自治区教育厅

薛 秦 高 继 宁 宋 明 锁 文 洪 梁 瑞 敏 贾 跃 进 内 蒙 古 自 治 区 (3 人 ) 琪 格 其 图 米 子 良 赵 震 生 辽 宁 省 (8 人 ) 田 素 琴 白 凤 鸣 肖 瑞 崇 黄 恩 申 白 长 川 杨 世 勇 李 敬 林 王 秀 云 吉 林 省 (5 人 ) 赵 继 福

要 及 时 为 入 党 积 极 分 子 确 定 两 名 培 养 联 系 人, 进 行 联 络 帮 助 要 定 期 ( 每 季 度 至 少 一 次 ) 听 取 培 养 联 系 人 的 思 想 和 工 作 情 况 汇 报, 及 时 完 成 入 党 积 极 分 子 登 记 表 ( 见 附 件 2) 的 填

0 0 = 1 0 = 0 1 = = 1 1 = 0 0 = 1

1

由社會發展趨勢探討國人睡眠品質

: p Previous Next First Last Back Forward 1

Transcription:

公職王歷屆試題 4 高考 類科 : 統計科目 : 迴歸分析 4 年公務人員高考考試試題 附表 :F 分分. 臨界值 Fdf,df,. df\df 5 6 7 8 9.7.48.6.7.99.975.695.668.645.64.66.589.49.46.47.46.97.8 4.6..8.86.66.49 一 若考慮配適一簡單線性迴歸模型 yx, 其中 為參數,ε 為隨機誤差, 且假設其為具均數, 標準差 之常態分配 今於配適模型後, 繪出殘差對自變數 x 的分析圖 請分別針對圖 ac 的結果, 說明迴歸模型是否恰當? 若模型不恰當時, 請指出對於參數估計值是否會有偏差 bias 之影響, 對於有關參數的假設檢定是否正確, 另外也請提出修正的方法 擬答 : 原始資料可能有二次或更高次的相關, 違背線性的前提假設 OLSE 之點估計是否有偏誤不一定, 但因以線性估計法, 會產生較大的變異, 所以不為有效的估計值, 對於假設檢定的結果會不正確 可利用二次式之迴歸模式來配適, 並重新檢驗迴歸模型是否符合假設 殘差散布隨著 變大而變大, 此時為變異數不同質, 違反變異數同質的假設 OLSE 之點估計仍不偏, 但因為變異數不同質, 所以不為有效的估計值, 對於假設檢定的結果會不正確 可利用加權最小平方法校正 從殘差的散布情況, 可以發現除了隨著 變大而變大以外, 同時伴隨著影響點的出現 下方的殘差離中心較遠 所以 OLSE 之點估計可能會產生偏誤, 且因為變異數不同質, 所以亦不為有效的估計值, 對於假設檢定的結果會不正確 可利用加權最小平方法校正變異數異質, 並且透過檢查原始資料 刪除離群值 或藉由穩健迴歸等方式來防護影響點的過度影響 二 根據下列 變數,6 個觀察值的資料 - 令 分表各變數觀察值所形成的向量, 另定義 為長度等於 6 且元素均等於 的向量 共 8 頁第 頁

公職王歷屆試題 4 高考 共 8 頁第 頁 在以向量表示法的迴歸模型 M:ε 中, 如何將 更精簡的以矩陣與參數向量表示? 另外, 在一般情形下, 此時 ε 之機率分分為何? 計計迴歸模型計中之參數向量 的最小平方估計量及估計其變異數共變異數矩陣 variacecovariace matrix 今 Ŷ 為長度等於 6 的向量, 其元素為迴歸模型 M 對 的配適值 fitted values, 則存在一矩陣 H 使得 Ŷ H, 計計此矩陣 H 計計迴歸模型 M 中的變異數膨脹因子 variace iflatio factor, vifvif 與 vif 擬答 : 此為兩自變數之線性迴歸模型假設. 所以迴歸模型 M: ε + + + 可表示為 + ε ε ε ε MN ~ I, μ 誤差項 ε 服從多元常態分配 6 6 6 6 6 6 4 6 6 44 4 由.4.. 4 6 6 4 6 6 44 ˆ ˆ SSE [ ] 44. 4.4...445.44 ˆ SSE MSE 6 6 4 6 6 44.445 ˆ ˆ Cov

公職王歷屆試題 4 高考.6.6 ˆ Ŷ H 所以 H.4.6.6 44 6 6 4 6 6 44 6 4 4 6 4 48 4 6 6 6 6 44 84 4 4 6 4 4 4 4 4 4 84 6 4 4 6 6 4 4 4 4 4 4 4 6 4 4 6 計計 VIF, 可考慮為 應變數, 為 自變數作迴歸 SS, 可得 R, VIF SS SS R 即 α + α 同理計計 VIF, 可考慮為 應變數, 為 自變數作迴歸 即 α + α SS, 可得 R, VIF SS SS R 三 三高 高血壓 高血糖 高血脂 與許多重大慢性病皆有重要關係 為了解個人體質 生活習慣等對於三高的影響因子, 並對社會大眾提出建議與注意事項 因此, 研究人員由臺灣數個醫學中心, 採用隨機抽樣法蒐集了 個就診慢性病者的資料進行調查分析 該資料測量每個人的血壓 以收縮壓為例, 單位為 mmhg 及其他相關變數如下 : 性別 男性為, 女性為, 年齡 5-85 歲, 身體質量指數 BMI 定義為身高 / 體重, 單位為 m/kg, 量血壓習慣 有量血壓習慣者為, 反之為, 量血糖習慣 有量血糖習慣為, 反之為, 量血脂習慣 有量血脂習慣為, 反之為, 喝酒習慣 平均每天喝 瓶 6c.c. 啤酒或相當之酒類以上者為, 反之為, 抽煙習慣 有抽煙習慣者為, 反之為, 外食頻率 每週外食次數, 運動習慣 有運動習慣者為, 反之為, 睡眠品質 睡眠品質佳者為, 反之為 研究者建立血壓y 對所有解釋變數的迴歸模共 8 頁第 頁

公職王歷屆試題 4 高考 型, 得到如下表 LM 之結果, 其殘差分析也無明顯瑕疵 模型 LM 之所有變數的解釋力為多少? 一般來說, 此解釋力計是高 中或低? 並解釋表中 F-statistic: 496 o ad 9988 DF, p-value:.e6 之意義 在模型 LM 下, 以兩人之不同的性別 年齡及 BMI 解釋參數估計值所代表之意義 為了為為存為, 研究人員為除兩個為常不顯著的變數並得到下表模型 LM 之結果 根據 LM 及 LM, 請就下面 或 擇一擇答 說明 LM 與 LM 何者較佳或差不多, 並建議大眾那些變數為三高影響因子應儘量避免或注意? 此分析結果不適合用來此此三高影響因子 說明原因及提出此進方法, 此結此是否與此 結此結結? 模型 LM Estimate Std. Error t value Pr t Itercept 97.487.67 55.65. 性別 9.564. 7.786. 年齡.45.5 86.894. 身體質量指數 BMI.49.458.79.64 量血壓習慣.7.8 9.84. 量血糖習慣.557. 5.545. 量血脂習慣.. 9.697. 喝酒習慣.74.94.5.7 抽煙習慣.46.49.96.494 外食頻率.87.979.866.6 運動習慣.9.858.48.6 睡眠品質.5.9.84.7764 Residual stadard error:4.9 o 9988 degrees of freedom Multiple R-squared:.845, Adjusted R-squared:.845 F-statistic:496 o ad 9988 DF, p-value:.e 6 模型 LM Estimate Std. Error t value Pr t Itercept 97.55.64 56.44. 性別 9.57. 76.78. 年齡.45.5 86.9. 身體質量指數 BMI.47.457.76.64 量血壓習慣.7.8 9.8. 量血糖習慣.556. 5.5. 量血脂習慣.. 9.7. 喝酒習慣.746.94.59. 外食頻率.86.979.876.67 運動習慣.94.858.4.6 Residual stadard error:4.9 o 999 degrees of freedom Multiple R squared:.845, Adjusted R-squared:.845 F-statistic:664 o 9 ad 999 DF, p-value:.e 6 擬答 : 在 LM 中, 調整後判定係數為.845, 代表以此 個自變數來解釋血壓, 有 84.5% 的解釋力, 屬高解釋力 F-statistic:496 o ad 9988 DF, p-value.e-6 共 8 頁第 4 頁

公職王歷屆試題 4 高考 代表 F 統計量為 496, 在自由度為 與 9988 時 6 相對的 p 值小於., 代表 p 值為常小, 模型顯著成立 在 LM 中, 男性相對於女性的收縮壓, 高 9.564 mmhg 年齡每增加一歲, 收縮壓會高.45 mmhg 每增加一單位 BMI, 收縮壓會高.49 mmhg 兩個模型調整後判定係數相同, 可知兩模型沒有差異但選擇 LM 可少估計 個自變數, 所以應考慮 LM 即可再者, 以 LM 中可以發現, 除了外食頻率不顯著外, 其餘變項皆顯著, 但這些變項的單位不同, 所以僅考慮迴歸係數大小, 並不足以找出對收縮壓影響最大的因素, 需有標準化迴歸係數方可得知 又此模型的迴歸係數並不合理, 舉例來說, 有固定量血壓 量血糖 量血脂習慣的民眾, 理應較重視自身健康, 收縮壓應較低, 不過迴歸係數反倒為正 ; 並且有喝酒習慣的迴歸係數為負, 代表有喝酒相對沒喝酒反倒有較低的收縮壓, 與常理不合 可見此模型可能出現共線性問此, 因為有量血壓習慣者, 很容易有量血糖 量血脂的習慣, 又或者有喝酒習慣者, 外食頻率可能相對較高, 這些自變數間易產生高度相關, 產生共線性問此, 導致迴歸分析的結果不可信 雖然模型估計結果不可信, 但解釋力高卻是事實, 代表這些變項確實可以有效解釋收縮壓, 兩者並不結結 四 一個學習效果評量相關分析的報告裹, 資料內容由 人 男女各半 的 4 個變數 y,x,x,x 所構成 其中 y 為學習效果 其平均值 96. 且標準差為 4.47,x 或 表男性及女性,x 其平均值 8.6 且標準差為 5.9 與 x 其平均值 65 且標準差為. 分別表某性向測驗的兩種分數 下圖為資料之 4 個變數間的散分圖 ; 此外, 下表也列出配適學習效果 y 與不同解釋變數之迴歸模型的 R 共 8 頁第 5 頁

公職王歷屆試題 4 高考 Model Variables i model R M x.97 M x.4 M x.487 M4 x,x.54 M5 x,x.676 M6 x,x.697 M7 x,x,x.697 考慮模型 M, 完成下面的分析表, 說明填入之 F value 及 t value 的值所代表意義 Aalysis of Variace Table:Respose:y Df Sum Sq Mea Sq F value x Residuals Total Coefficiets: Estimate Std. Error t value Itercept x 考慮模型 M, 計計 y 在 x 之信心水準為 9% 的預測區間 在 M-M7 模式中, 給定進入模式水準 etry levelα., 採用 F 採定法, 列出前進選取 forward selectio 程序與其最終選定之模式 根據準則 Akaike Iformatio CriterioAIC, 依序列出 MM7 模式中的最佳 個模型 針對 M7 模式, 在顯著水準 α. 下, 檢定 x 與 x 之係數是否同時等於 擬答 : SSTO SS 4.47 76. 87 R SSR SSR.97 SSR SSTO 76.87 456.64 因為男女各半, 所以 SS. 5 5 ANOVA 表 Df Sum Sq Mea Sq F value 456.64 456.64.85 Residuals 8 686.8 8.4 Total 9 76.87 S 4.47 利用 ˆ r.97. 86 S.5 因為散布圖可以看出 x 越大 y 越小, 呈現負相關 * * T F.85.44 ˆ *.86 又 ˆ T S 8. 956 S ˆ.44 共 8 頁第 6 頁

公職王歷屆試題 4 高考 ˆ ˆ 96..86.5.68. 5 ˆ S MSE + 8. 4 + 6. 74 5 SS ˆ *.68 T 8.8 S ˆ 6.75 係數估計表 Estimate Std. Error T value Itercept.68 6.74 8.8 -.86 8.956 -.44 h x 之 9% 預測區間為 x ˆ h h ± t α + + MSE SS.68.86 ±.7 +.5 + 5 8.4 [44.875, 7.4765] 先選擇最顯著的變數加入模型 R 最大者 * R.97 F.85 > F., 8 R.97 * R.4 F.66 > F., 8 R.4 * R.487 F 7.9 > F., 8 R.487 故選擇 x 加入模型中 將另一變數 x 加入模型, 並作偏 F 檢定 F * SSR x x SSE x, x SSR x, x SSR x SSE x, x R x, x R x 7 分子分母同除 SSTO R x, x.697.487 7.78 > F., 7.697 故在有 x 變數下, x 需引入模式中再將另一變數 x 加入模型, 並作偏 F 檢定 共 8 頁第 7 頁

公職王歷屆試題 4 高考 * SSR x x F SSE x, x SSR x,x SSR x SSE x,x R x,x R x 7 分子分母同除 SSTO R x,x. 54. 487 7. 58 < F., 7. 54 x 故在有 變數下, x 不需引入模式中所以利用向前選取法, 模型為 i + xi + xi AIC l SSE + l + p 將表格整理如下 Model SSR SSE p AIC M 456.64 686.8 4.5846 M 4698.67 6678.4 4.467 M 554.597 586.74 7.58 M4 57.959 564.9 8.6778 M5 769.749 686.95.6 M6 799.6555 447.86 8.89 M7 799.6555 447.86 4.89 由 AIC 準則可知,AIC 較小即較佳, 所以最佳三個模型分別為 M6,M5,M7 H : H :, 不全為 α. F * SSR, / SSE,, / 4 6 SSR,, SSR SSE,, SSR,, SSR 8 SSTO SSTO SSR,, SSTO. 697. 97 8 7. 9 C. 697 * C { F > F, 6.668} :. 拒絕 H, 有顯著的證據說, x, x 之係數, 不全為 共 8 頁第 8 頁