認識 SAS

Similar documents
SAS系統簡介

Microsoft Word - 94_2_stat_handout08_線性迴歸(考古題).doc

基礎財金統計分析

0 0 = 1 0 = 0 1 = = 1 1 = 0 0 = 1

Microsoft Word - ACI chapter00-1ed.docx

無投影片標題

プリント

Microsoft Word - 生統e報_ __v3_1210-Final

(baking powder) 1 ( ) ( ) 1 10g g (two level design, D-optimal) 32 1/2 fraction Two Level Fractional Factorial Design D-Optimal D

Microsoft Word - CH12-001~030_1_.doc

Regression Analysis

Microsoft Word - p11.doc

統計分析入門與應用 說明 : a. 獨立樣本 : 兩個來自於獨立, 沒有相關的樣本 b. 成對樣本 : 兩個平均數來自於同一個樣本, 有關係的樣本 7-2 Means 平均數分析 Means 平均數分析是用在不同類別變數組合下, 連續變數在各組的統計量, 例如 : 平均數 中位數 標準差 總合 最小

國家圖書館典藏電子全文

7. 下列何者敘述錯誤? (A) 抽樣分佈 (sampling distribution) 的抽樣樣本數越大, 其分佈之集中趨勢 (central tendency) 越小 (B) 樣本 (sample) 可以告訴我們關於母群體 (population) 的資訊 (C) 參數 (parameter)

複迴歸分析簡介 (Multiple Regression Analysis) 迴歸分析是利用一個或一組自變數來預測或解釋一個 ( 反 ) 應變數 (response variable), 其中自變數又可稱為預測變數 (predictors) 解釋變數(explanatory variables) 控

When the rejection rule for a test at every level α can be re-written as then xxx is the p-value of the test. xxx < α, If p-value < α, then the test c

目次 CONTENTS 2 1 乘法公式與多項式 二次方根與畢氏定理 因式分解 一元二次方程式

《儿童少年卫生学》教学大纲

公職王歷屆試題 4 高考 共 8 頁第 頁 在以向量表示法的迴歸模型 M:ε 中, 如何將 更精簡的以矩陣與參數向量表示? 另外, 在一般情形下, 此時 ε 之機率分分為何? 計計迴歸模型計中之參數向量 的最小平方估計量及估計其變異數共變異數矩陣 variacecovariace matrix 今

马 为 名 的 教 会, 而 且 还 可 找 到 他 不 少 遗 迹 多 马 的 英 文 是 Thomas, 也 翻 译 成 托 马 斯, 许 多 西 方 人 给 子 女 取 名 叫 托 马 斯, 来 纪 念 这 位 伟 大 的 宣 教 士 接 下 来 我 们 思 想 另 一 个 人, 就 是 雅

Microsoft Word newsletter.doc

由社會發展趨勢探討國人睡眠品質

第一章

¥]¸Ë»¡©ú

美容 丙級 工作項目0 1 : 職業道德

100-1「經典研讀:梁啟超《新民說》」學習歷程檔案

<4D F736F F D D C4EAC5A9D2B5B2FAD6B5BACDBCDBB8F1D7DBBACFCDB3BCC6B1A8B1EDD6C6B6C82E646F63>


<4D F736F F D B0EABB79A4E5B8D5C344BBBCB065AAA9>


康體藝術

[9] R Ã : (1) x 0 R A(x 0 ) = 1; (2) α [0 1] Ã α = {x A(x) α} = [A α A α ]. A(x) Ã. R R. Ã 1 m x m α x m α > 0; α A(x) = 1 x m m x m +

:

840 提示 Excel - Excel -- Excel (=) Excel ch0.xlsx H5 =D5+E5+F5+G5 (=) = - Excel 00

Microsoft PowerPoint - C_Structure.ppt

( ) t ( ) ( ) ( ) ( ) ( ) t-

Process Data flow Data store External entity 6-10 Context diagram Level 0 diagram Level 1 diagram Level 2 diagram

投影片 1

2

4

Python a p p l e b e a r c Fruit Animal a p p l e b e a r c 2-2

Microsoft PowerPoint - spss2-1.ppt

A. 初級資料處理人員 : 建議修習基礎程式設計師課程 (PRG1 + PRG2 + CRB) 並取得基礎程式設計師認證 B. 進階資料處理人員 : 除基礎程式設計師課程外, 建議修習進階程式設計師課程 (MAC1 + SQL1 + PRG3), 並取得進階程式設計師認證 C. 統計分析師 : 除基

tech_atmn_h1h4_E

11第十一章階層線性模式.DOC

<4D F736F F D20BDD7A4E5A4BAA4E5BB50A5D8BFFD2E646F63>

ii Vue Bootstrap 4 ES 6 Vue Vue Bootstrap 4 ES 6 Vue 2 vue html vue html vue Vue HTML 5 CSS ES 6 HTML 5 CSS Visual Studio Code h

Microsoft Word - SPSS軟體操作-basic docx

輕鬆學 Dreamweaver CS5 網頁設計..\Example\Ch0\ \.html..\example\ch0\ \mouse.txt..\example\ch0\ \ _Ok.html 學習重點 JavaScript 複製程式碼 mouse.txt Ctrl+C Ctrl+C 0-4

試題評析

Spyder Anaconda Spyder Python Spyder Python Spyder Spyder Spyder 開始 \ 所有程式 \ Anaconda3 (64-bit) \ Spyder Spyder IPython Python IPython Sp


基于因子分析的敦煌莫高窟游客满意度研究

105-1 計量報告 關於個股與 SP500 的市場模型實證分析 姓名 : 唐昭輝 班級 : 財金三年級交換生 學號 : 學期 : 105 學年第一學期

(1) z 分數! 分析 / 描述統計 / 描述性統計量! 將變數選入 變數 中, 勾選 將標準化的數值存成變數, 按 選項! 勾選所需要的統計量項目後按 繼續 (2) 其他標準分數 ( 例 T 分數 ) (5) 轉換 / 等級觀察值! 將變數選入 變數 中, 按 等級類型 勾選 常態分數, 按 繼

2a-4

三維空間之機械手臂虛擬實境模擬

國家圖書館典藏電子全文

公司简介

個 人 的 手, 拉 著 瞎 子 的 手 把 他 帶 往 村 外 的 時 候, 對 於 瞎 子 來 講, 那 個 人 的 手 和 耶 穌 的 手 有 沒 有 區 別? 沒 有! 為 什 麼 沒 有 區 別? 因 為 對 於 一 個 瞎 子 來 說, 手 和 耳 朵 就 是 他 接 觸 世 界, 瞭

Microsoft Word - 教師薪資的探討_施珮玉epaper.doc

¾ú¥v¬ì²Ä8¦¸-«ü¦Ò«Êٱ.prn, page Normalize ( <4D F736F F D20BEFAA576ACECB2C438A6B82DABFCA6D2ABCAADB12E646F63> )

臺北醫學大學生物統計研究中心 enews 第 17 期 2017/02 多重檢定問題,false discovery rate (FDR) 與 q 值 王紋璋在統計假設檢定分析過程中, 根據收集的資料我們得到檢定統計量 (test statistic) 之樣本觀察值 ; 然後, 我們計算在虛無假設

( ) (1) (2) (3) (4) 2

中國外交機構演變歷程

國立中山大學學位論文典藏.PDF

一、選擇題(共35題,佔70%)

中國醫藥大學生物統計中心 2011 年 10 月 評估科克斯比例風險模式 (Cox s proportional hazard model) 之等比風險假設的方法 生統所李采娟教授 此篇文章介紹兩種方式評估科克斯比例風險模式 (Cox s proportional hazard model) 的等比

Fun Time (1) What happens in memory? 1 i n t i ; 2 s h o r t j ; 3 double k ; 4 char c = a ; 5 i = 3; j = 2; 6 k = i j ; H.-T. Lin (NTU CSIE) Referenc

(Microsoft Word - 11-\261i\256m\253i.doc)

Chapter 3 Camera Raw Step negative clarity +25 ] P / Step 4 0 ( 下一頁 ) Camera Raw Chapter 3 089

認識 SAS

Design of Experiments DOE 1. (Design of Experiments) (Designed Experiments), , 1-1 Input ; Output ; Controllable input factors X1,X2,,Xp; Uncon

Microsoft Word - ACL chapter02-5ed.docx

一、選擇題(共35題,佔70%)

1 500 表 1: 各國平均分數

Transcription:

4.3. PROC REG PROC REG 的主要功能為執行迴歸分析 (regression analysis), 欲分析之依變數與自變 數皆需為數值 PROC REG 可執行線性迴歸 (linear regression) 與多項式迴歸 (polynomial regression), 本節僅就線性迴歸部份作介紹 線性迴歸分析之基本概念 欲探討兩個變數之間的關聯性時, 除使用相關係數以瞭解兩變數之間的關聯強度外, 亦可將兩變數以線性模式串連起來, 並觀察其關係, 此即為迴歸分析之基本觀念 線性迴歸分析是利用一個含有單一或多個自變數的迴歸模型來解釋依變數 y, 若只有單一自變數 x 則為簡單線性迴歸分析 (simple linear regression); 若含有多個自變數則為多元線性迴歸分析, 迴歸模型如下 : y x x, i 0 1 1 i... p pi i (,,..., p) 為未知而需估計之迴歸係數, i 為測量誤差並具有以下性質 其中 0 1 1. i 相互獨立, 2 2. i 具有相同分佈, 其期望值為 0, 變異數為, 3. i 通常假設為常態分佈 請注意, ( 0, 1,..., p) 之估計為最小平方法 (least square method), 其性質之一為估計 值不會受到 i 分佈之假設影響, 但在常態假設之下, 最小平方法之估計與最大概似估 計法所得相同 簡單線性迴歸 以一實例示範如何使用 PROC REG 進行迴歸分析 : 現有 19 位孩童的身高及體重 資料, 欲以簡單線性回歸模型探討孩童身高及體重之間的關連性之外 ( 身高為自變 數, 體重為依變數 ): 4.3. PROC REG 1

Name Weight Height Age Name Weight Height Age Name Weight Height Age Alfred 69.0 112.5 14 Alice 56.5 84.0 13 Barbara 65.3 98.0 13 Carol 62.8 102.5 14 Henry 63.5 102.5 14 James 57.3 83.0 12 Jane 59.8 84.5 12 Janet 62.5 112.5 15 Jeffrey 62.5 84.0 13 John 59.0 99.5 12 Joyce 51.3 50.5 11 Judy 64.3 90.0 14 Louise 56.3 77.0 12 Mary 66.5 112.0 15 Philip 72.0 150.0 16 Robert 64.8 128.0 12 Ronald 67.0 113.0 15 Thomas 85.0 11 William 66.5 112.0 15 備註 : 第 19 筆 weight 有缺值 程式碼 DATA children; INPUT name $ weight height age @@; CARDS; Alfred 69.0 112.5 14 Carol 62.8 102.5 14 Jane 59.8 84.5 12 John 59.0 99.5 12 Louise 56.3 77.0 12 Robert 64.8 128.0 12 William 66.5 112.0 15 Alice 56.5 84.0 13 Henry 63.5 102.5 14 Janet 62.5 112.5 15 Joyce 51.3 50.5 11 Mary 66.5 112.0 15 Ronald 67.0 133.0 15 Barbara 65.3 98.0 13 James 57.3 83.0 12 Jeffrey 62.5 84.0 13 Judy 64.3 90.0 14 Philip 72.0 150.0 16 Thomas. 85.0 11 ; ODS GRAPHICS ON; PROC REG DATA=children; MODEL weight=height / CLI CLM; 4.3. PROC REG 2

RUN; ODS GRAPHICS OFF; 程式碼說明 ODS GRAPHICS ON 敘述句 : 宣告 ODS GRAPHICS 模組啟動,ODS 為 Output Delivery System 之縮寫, 是 SAS 8.2 版之後開始發展的新功能, 主要為協助報表的產生, 而在 SAS 9 版開始支援各程序 的簡易圖表繪製, 其使用方法為, 將欲產生內定統計圖的程序以 ODS GRAPHICS ON 及 ODS GRAPHICS OFF 包括起來, 執行之後會自動產生統計圖, 前提是該程 序已經支援 ODS GRAPHICS 功能 PROC REG 敘述句 : DATA= 欲分析的資料集 MODEL 敘述句 : 執行 PROC REG 敘述句時,SAS 程式預設迴歸方程式具有截距項, 本例中的 model 為 : 在程式中僅需表示為 weight = 0 + 1 height + weight = height 若模型無截距項, 亦即, 模型無 0 項, 則需在斜線之後下指令 weight = 1 height + weight = height/ NOINT 請注意在單一 PROC REG 步驟中可以有多個 MODEL 敍述句 斜線 / 分隔選項指令, 常用選項包括 : P 輸出依變數的預測值 CLM 輸出依變數期望值之信賴區間 CLI 輸出個別預測值之信賴區間 CLB 輸出迴歸係數估計值之信賴區間 ALPHA= 設定信賴區間與檢測的型一誤差率 ODS GRAPHICS OFF 敘述句宣告 ODS GRAPHICS 結束, 請注意 RUN 須先被執行 4.3. PROC REG 3

Output 結果 1 顯示此次 PROC REG 指令中的依變數為體重 (weight), 並且讀到有 19 組觀測值, 但由於 有一觀測值出現缺值, 因此只剩 18 組觀測值可用 Output 結果 2 變異數分析之虛無假設為 自變數無法解釋依變數, 亦即 自變數之迴歸係數為 0, 本例中 output 結果顯示 p-value < 0.001, 因此有足夠證據顯示依變數得以被自變數所解釋 R-square 為自變數解釋依變數之比例, 在本例中 height 解釋了 76.63% 的 weight 算是還不錯 Output 結果 3 在簡單線性迴歸模式中, 由於只有一個自變數,ANOVA 的虛無假設會同等於 Parameter Estimates 中 height 的虛無假設, 亦即 H0: 1 0, 故實際上為檢驗同一件事, 讀者可檢驗 F Value 實為 t Value 的平方, 但在多元回歸分析中即非如此 ( 見例 2) 不 過上圖仍有提供其他資訊, 即是參數 0 ( 截距 intercept) 以及 1( 斜率 ) 的估計值與其檢 測, 因此我們可以求得簡單線性迴歸線為 : 4.3. PROC REG 4

weight 43.0023 0.1944 height 因此, 根據配適出來的迴歸式, 身高每增加一公分, 則孩童體重會增加 0.1944 公斤 請注意, 再次提醒迴歸分析中的迴歸係數估計為最小平方法, 其估計不受測量誤差之 假設影響, 則即便 Output 結果 3 當中的 p-value 不顯著, 迴歸線之估計依然不受影響 Output 結果 4 Predicted Value 為根據估計之迴歸線 weight 43.00227 0.19436 height 代入觀察之身高所得的體重預測值 請注意雖然第 19 筆數據的體重為缺失值 (missing value), 由於身高資料並未缺失,SAS 依然得以計算該筆資料之體重預測值 Std Error Mean Predict 為預測值之標準誤, 而 95% CL Predict 為體重預測值之 95% 信賴區間, 為 MODEL 敘述句之選項 CLI 輸出結果 95% CL Mean 為體重期望值估計值之 95% 信賴區間, 為 MODEL 敘述句之選項 CLM 之 輸出結果 Residual 為殘差 = 觀察值 - 預測值, 可用於評估測量誤差的假設是否合理 除了上面的 OUTPUT 結果, 我們還可從 Result 視窗 中可以叫出更多 ODS GRAPHICS 結果 : 4.3. PROC REG 5

ODS GRAPHICS 結果 1 殘差診斷圖 ODS GRAPHICS 結果 2 殘差對自變數圖 ODS GRAPHICS 結果 3 配適圖 ODS GRAPHICS 結果 1 此為殘差對 height 作的散佈圖, 目的是為了觀察殘差是否與自變數 height 之間存在某 種關係, 因自變數不為一隨機變數, 理論上應該與殘差並無相關, 若如上圖中殘差分 布的情形無顯著存在某趨勢性, 我們可視殘差與自變數身高無關 ODS GRAPHICS 結果 2 4.3. PROC REG 6

ODS GRAPHICS 結果 2 為殘差對依變數體重作的各種圖形分析, 其中比較重要的是, y 左上角的殘差對預測值作圖, 理論上殘差與預測值之相關亦為 0, 因此我們同樣觀察殘差是否均勻散佈在此圖當中, 以判斷假設之正確性, 而中間左邊的常態機率圖, 如果殘差符合常態分佈, 則各殘差值應該都在斜線附近, 我們得以此檢驗模型之常態假設 ODS GRAPHICS 結果 3 4.3. PROC REG 7

ODS GRAPHICS 結果 3 為身高與體重之散佈圖, 並繪製估計出來的簡單線性迴歸線 與其 95% 期望值估計信賴值區間與 95% 預測值信賴區間 多元線性迴歸 以同樣例子加入年齡資料, 探討孩童身高 年齡二者與體重之間的關連性 ( 身高 及年齡為自變數, 體重為依變數 ), 故為一多元線性迴歸模型 程式碼 ODS GRAPHICS ON; PROC REG DATA=children; MODEL weight=height age / CLI CLM; RUN; ODS GRAPHICS OFF; 4.3. PROC REG 8

程式碼說明 MODEL 敘述句 : 宣告迴歸分析模型, 本例中的模型為 weight height age ε 故語法為 MODEL weight=height age 其餘指令與解釋請參照例一說明 0 1 2 Output 視窗 5 本例為兩個自變數的多元線性迴歸分析, 因此變異數分析的虛無假設為 H0: 1 2 0, 且由於 p-value<0.001, 即代表 1 2 至少有一個不為 0 若想進一步探究哪一個不為 0 或是否兩者皆不為 0 的話, 就必需從下面 output 結果去了解 與簡單線性迴歸分析比較不同的是, 在多元線性迴歸分析中, 決定係數 R-Square 會隨著自變數增加而增加, 即便某些自變數在統計學上不一定可以解釋依變數的變量, 這時要改用校正後的決定係數 Adj R-Sq, 在本例中 Adj R-Sq = 0.7944 表示 height 與 age 可以解釋 79.44% 的 weight, 與未修正的 R-Square = 81.86% 相去不遠 Output 視窗 6 4.3. PROC REG 9

由此報表我們可以求得多元線性迴歸線為 : weight 32.0990 0.1378height 1.2354age 亦即孩童身高每增加一公分則體重增加 0.1378 公斤, 年紀每大一歲則體重增加 1.2354 公斤 此報表亦提供檢驗身高的係數是否為 0 以及年齡的係數是否為 0, 因此有兩個基本假 設, 分別為 H 0 : 1 = 0 以及 H 0 : 2 = 0, 根據分別的 p-value 顯示, 在 0.05 的顯著水準下, 有足夠證據前宣稱身高的係數不為 0, 而沒有足夠證據年齡的係數不為 0 4.3. PROC REG 10