相关与回归分析

Similar documents
<4D F736F F F696E74202D20CAB5CFB0C1F920CAFDD6B5B1E4C1BFD7CAC1CFB5C4CDB3BCC6CDC6B6CF E707074>

<4D F736F F F696E74202D20B5DA3135BDB220D2BBD4AACFDFD0D4BBD8B9E9B7D6CEF6205BBCE6C8DDC4A3CABD5D205BD0DEB8B4B5C45D>

.., + +, +, +, +, +, +,! # # % ( % ( / 0!% ( %! %! % # (!) %!%! # (!!# % ) # (!! # )! % +,! ) ) &.. 1. # % 1 ) 2 % 2 1 #% %! ( & # +! %, %. #( # ( 1 (

# % & ) ) & + %,!# & + #. / / & ) 0 / 1! 2

Template

1

) & ( +,! (# ) +. + / & 6!!!.! (!,! (! & 7 6!. 8 / ! (! & 0 6! (9 & 2 7 6!! 3 : ; 5 7 6! ) % (. ()

北京中创幻想科技有限公司

% %! # % & ( ) % # + # # % # # & & % ( #,. %

%! # # % % & # ( ) ( +, & +, +, & +, & +, +, &!

# ( + + # + # 6 +,! + # +! +, + # ( + ) ( + ( + ) + 7! + # + /8 + ) ( +! + #. + ( +, +! + # + # + + ( ! ( + ) ( + ) +, + ( + 9% +! +, + ( +

, 2016,.51,.1 7, (ε) ;,,, ;,,, [14-15], 2,( ),2,,, [14-15] (), [16],,, [17-18],, [19-20] Ⅰ,, 2 [21-22] ;,, [23],,,


14052_公開用.pdf

#!! +!,! # &!. / !!, 7!!, & #! % 7! % )

& ( )! +!, # %! ( & &.! / /.

# 7 % % % < % +!,! %!!

CWP156.pdf

Remark:随机变量不只离散和连续两种类型

! + +, ) % %.!&!, /! 0! 0 # ( ( # (,, # ( % 1 2 ) (, ( 4! 0 & 2 /, # # ( &

, ( ) :,, :,, ( )., ( ) ' ( ),, :,,, :,, ;,,,,,, :,,,, :( ) ;( ) ;( ),,.,,,,,, ( ), %,. %,, ( ),,. %;,

Ps22Pdf

%% &% %% %% %% % () (! #! %!!!!!!!%! # %& ( % & ) +, # (.. /,) %& 0

计量经济学


Microsoft PowerPoint - 概率统计Ch02.ppt [Compatibility Mode]

, & % # & # # & % & + # & # # # & # % #,

untitled

3. 流 程 管 理 ( 系 统 管 理 员 或 者 教 务 处 管 理 员 主 要 操 作 功 能 部 分 ) 系 统 管 理 员 发 布 的 供 学 校 登 录 人 员 查 看 校 内 公 告 信 息 ; 系 统 管 理 员 审 核 提 前 实 习 的 学 生 申 请 ; 系 统 管 理 员 审

第三章       多元线性回归模型

礼仪玉和葬玉

概率统计 B 第七章回归分析方法 根据李东风老师课件修改 2017 春季学期 根据李东风老师课件修改 () 概率统计 B 第七章回归分析方法 2017 春季学期 1 / 90

第五章 数理统计中的统计量 及其分布

关于建立境内违法互联网站黑名单管理制度的通知

<4D F736F F D20D0C5CFA2BBAFB7A2D5B9D6D8B5E3D7A8CFEEB9E6BBAE2E646F63>

? 這 全 都 是 市 政 府 提 供 給 我 的 資 料 低 底 盤 公 車 計 畫 96 年 預 算 新 台 幣 4,500 萬 元 97 年 預 算 新 台 幣 1 億 6,500 萬 元 98 年 預 算 新 台 幣 3 億 2,300 萬 元, 共 有 307 台 低 底 盤 公 車,99

untitled

学习目的 通过学习相关与回归, 明确变量间非确定性关系的统计分析方法, 学会从专业角度考虑相关与回归的实际意义 学习要点 相关与回归的概念, 直线相关与直线回归分析, 直线相关与直线回归的区别与联系, 多重线性回归的意义

:DDQ-D3266 (3) : :SA % 15% :CR-400 ( ) :TA-XTPlus Stable MicroSystem (1) : 3 Design- Expert

!! # % & ( )!!! # + %!!! &!!, # ( + #. ) % )/ # & /.

( ) t ( ) ( ) ( ) ( ) ( ) t-

untitled

! # % & # % & ( ) % % %# # %+ %% % & + %, ( % % &, & #!.,/, % &, ) ) ( % %/ ) %# / + & + (! ) &, & % & ( ) % % (% 2 & % ( & 3 % /, 4 ) %+ %( %!

<4D F736F F D C4EAD7A8D2B5D1A7CEBBD1D0BEBFC9FAC8EBD1A7CDB3D2BBBFBCCAD4A3A8D3A6D3C3CDB3BCC6CBB6CABFA3A92D DA1B6CDB3BCC6D1A7A1B7BFBCCAD4D6B8B5BCD0D4D2E2BCFB2E646F63>

ⅠⅡⅢ Ⅳ

& &((. ) ( & ) 6 0 &6,: & ) ; ; < 7 ; = = ;# > <# > 7 # 0 7#? Α <7 7 < = ; <


,!! #! > 1? = 4!! > = 5 4? 2 Α Α!.= = 54? Β. : 2>7 2 1 Χ! # % % ( ) +,. /0, , ) 7. 2

08-01.indd

! /. /. /> /. / Ε Χ /. 2 5 /. /. / /. 5 / Φ0 5 7 Γ Η Ε 9 5 /

习题

第九章回归分析与方差分析 回归分析和方差分析是数理统计中的两个常用方法. 回归分析是处理多个变量之间相关关系的一种统计方法, 其用意是研究一个被解释变量 ( 又称因变量 ) 与一个或多个解释变量 ( 又称自变量 ) 之间的统计关系. 而方差分析是通过试验数据的离差来分析各个因素对试验结果有无影响的有


! %! &!! % &

Multiple linear regression Choice of independent variable Application

多元回归 2 时间序列 3 考题分析 2

,.2018, 38,.1 :1, 220 ( ) 140, ;2,,,;3,,,, >180 ( ) >120,,, [10] :,,,,,,,, ( ), [6,11],,,,,, ( ), ( Ⅱ ),,, ( -6),,,,, -,, [2],, [12],, (

PowerPoint 演示文稿

! Ν! Ν Ν & ] # Α. 7 Α ) Σ ),, Σ 87 ) Ψ ) +Ε 1)Ε Τ 7 4, <) < Ε : ), > 8 7

高等数学A

! # %& ( %! & & + %!, ( Α Α Α Α Χ Χ Α Χ Α Α Χ Α Α Α Α

# #! ) ( ( +,! %,! ( # # %& % ( ) +! +, +. /

!!! #! )! ( %!! #!%! % + % & & ( )) % & & #! & )! ( %! ),,, )

D1ZFM

# # 4 + % ( ) ( /! 3 (0 0 (012 0 # (,!./ %

基于大数据技术的政府财政收入预测

互联网+时代:变革与创新

基于多项式回归分析的核电站汽轮机基础沉降预测方法

Ρ Τ Π Υ 8 ). /0+ 1, 234) ς Ω! Ω! # Ω Ξ %& Π 8 Δ, + 8 ),. Ψ4) (. / 0+ 1, > + 1, / : ( 2 : / < Α : / %& %& Ζ Θ Π Π 4 Π Τ > [ [ Ζ ] ] %& Τ Τ Ζ Ζ Π

第一章三角函数 1.3 三角函数的诱导公式 A 组 ( ) 一 选择题 : 共 6 小题 1 ( 易诱导公式 ) 若 A B C 分别为 ABC 的内角, 则下列关系中正确的是 A. sin( A B) sin C C. tan( A B) tan C 2 ( 中诱导公式 ) ( ) B. cos(

& & ) ( +( #, # &,! # +., ) # % # # % ( #

&! +! # ## % & #( ) % % % () ) ( %

!! )!!! +,./ 0 1 +, 2 3 4, # 8,2 6, 2 6,,2 6, 2 6 3,2 6 5, 2 6 3, 2 6 9!, , 2 6 9, 2 3 9, 2 6 9,

ebook42-13

Microsoft PowerPoint - Lect06a

经典线性回归模型的基本假设与高斯 马尔可夫定理 假设 被解释变量 与解释变量 具有线性关系 也就是说 经典线性回归模型的基本出发点是 存在形如 的方程准确地描述了变量之间的关系 即被解释变量线性依赖于解释变量 同时还受到其他随机因素的影响 从而 对所有样本点 式 成立 假设

<4D F736F F D20B5DAC8FDCAAED5C22020C6ABD7EED0A1B6FEB3CBBBD8B9E92E646F63>

: ; # 7 ( 8 7

., /,, 0!, + & )!. + + (, &, & 1 & ) ) 2 2 ) 1! 2 2

证券市场导报 理论综合 ~ ~ ~ ~ ~ ~

附件1:理论课程教学大纲修订样表

, ( 6 7 8! 9! (, 4 : : ; 0.<. = (>!? Α% ), Β 0< Χ 0< Χ 2 Δ Ε Φ( 7 Γ Β Δ Η7 (7 Ι + ) ϑ!, 4 0 / / 2 / / < 5 02

<4D F736F F D20A3A8CEF7C3F1B7A2A1B A1B33238BAC5A3A9CEF7B3C7C7F8D2BDC1C6BEC8D6FAB0ECB7A85FB6A8B8E55F31322D385F325F2E646F63>


现代天文学7.ppt

# # # #!! % &! # % 6 & () ) &+ & ( & +, () + 0. / & / &1 / &1, & ( ( & +. 4 / &1 5,

寿险分支机构营业场所统计表(0706) .xls


4= 8 4 < 4 ϑ = 4 ϑ ; 4 4= = 8 : 4 < : 4 < Κ : 4 ϑ ; : = 4 4 : ;

二 本 课 程 实 验 的 基 础 知 识 本 课 程 实 验 是 建 立 在 传 统 财 务 会 计 基 础 之 上, 对 一 些 新 出 现 有 特 殊 性 打 破 一 般 传 统 会 计 观 念 且 必 须 处 理 的 业 务 进 行 反 映 和 控 制 的 财 务 会 计 它 与 传 统 财

8 9 8 Δ 9 = 1 Η Ι4 ϑ< Κ Λ 3ϑ 3 >1Ε Μ Ε 8 > = 8 9 =

标题

Β 8 Α ) ; %! #?! > 8 8 Χ Δ Ε ΦΦ Ε Γ Δ Ε Η Η Ι Ε ϑ 8 9 :! 9 9 & ϑ Κ & ϑ Λ &! &!! 4!! Μ Α!! ϑ Β & Ν Λ Κ Λ Ο Λ 8! % & Π Θ Φ & Ρ Θ & Θ & Σ ΠΕ # & Θ Θ Σ Ε

湖北省残疾人抽样数据分析报告(简版)

5 551 [3-].. [5]. [6]. [7].. API API. 1 [8-9]. [1]. W = W 1) y). x [11-12] D 2 2πR = 2z E + 2R arcsin D δ R z E = πr 1 + πr ) 2 arcsin


Microsoft Word - 12.doc

/ Ν #, Ο / ( = Π 2Θ Ε2 Ρ Σ Π 2 Θ Ε Θ Ρ Π 2Θ ϑ2 Ρ Π 2 Θ ϑ2 Ρ Π 23 8 Ρ Π 2 Θϑ 2 Ρ Σ Σ Μ Π 2 Θ 3 Θ Ρ Κ2 Σ Π 2 Θ 3 Θ Ρ Κ Η Σ Π 2 ϑ Η 2 Ρ Π Ρ Π 2 ϑ Θ Κ Ρ Π

Outline 线性回归 Gauss Markov 模型最小二乘估计的性质预测误差正态误差下的假设检验回归模型的延伸分类问题

8 9 < ; ; = < ; : < ;! 8 9 % ; ϑ 8 9 <; < 8 9 <! 89! Ε Χ ϑ! ϑ! ϑ < ϑ 8 9 : ϑ ϑ 89 9 ϑ ϑ! ϑ! < ϑ < = 8 9 Χ ϑ!! <! 8 9 ΧΧ ϑ! < < < < = 8 9 <! = 8 9 <! <

Transcription:

第三节 多元线性回归 一. 多元线性回归模型二. 回归参数的估计三. 回归方程的显著性检验四. 回归系数的显著性检验五. 多元线性回归的预测 1

多元线性回归模型 2

多元线性回归模型 ( 概念要点 ) 1. 一个因变量与两个及两个以上自变量之间的回归 2. 描述因变量 y 如何依赖于自变量 x 1, x 2,, x p 和误差项 ε 的方程称为多元线性回归模型 3. 涉及 p 个自变量的多元线性回归模型可表示为 β 0,β 1,β 2,,β p 是参数 ε 是被称为误差项的随机变量 y 是 x 1,,x 2,,x p 的线性函数加上误差项 ε ε 说明了包含在 y 里面但不能被 p 个自变量的线性关系所解释的变异性 3

多元线性回归模型 ( 概念要点 ) 对于 n 组实际观察数据 (y i ; x i1,,x i2,,x ip ),(i=1,2,,n), 多元线性回归模型可表示为 y 1 = β 0 + β 1 x 11 + β 2 x 12 + + β p x 1p + ε 1 y 2 = β 0 + β 1 x 21 + β 2 x 22 + + β p x 2p + ε 2 y n = β 0 + β 1 x n1 + β 2 x n2 + + β p x np + ε n 4

多元线性回归模型 ( 基本假定 ) 1. 自变量 x 1,x 2,,x p 是确定性变量, 不是随机变量 2. 随机误差项 ε 的期望值为 0, 且方差 σ 2 都相同 3. 误差项 ε 是一个服从正态分布的随机变量, 即 ε~n(0,σ 2 ), 且相互独立 5

多元线性回归方程 ( 概念要点 ) 1. 描述 y 的平均值或期望值如何依赖于 x 1, x 1,,x p 的方程称为多元线性回归方程 2. 多元线性回归方程的形式为 E( y )=β 0 + β 1 x 1 + β 2 x 2 + + β p x p β 1,β 2,,β p 称为偏回归系数 β i 表示假定其他变量不变, 当 x i 每变动一个单位时,y 的平均平均变动值 6

多元线性回归方方程的直观解释 二元线性回归模型 y ( 观察到的 y) 回归面 β 0 } ε i x 2 (x 1,x 2 ) x 1 7

多元线性回归的估计 ( 经验 ) 方程 1. 总体回归参数 是未知的, 利用样 本数据去估计 2. 用样本统计量 代替回归方程中的 未知参数 即得到估计的回归方程 是估计值 是 y 的估计值 8

参数的最小二乘估计 9

参数的最小二乘法 ( 要点 ) 1. 使因变量的观察值与估计值之间的离差平方和达到最小来求得 即 2. 根据最小二乘法的要求, 可得求解各回归参数的标准方程如下 10

回归方程的显著性检验 11

多重样本决定系数 ( 多重判定系数 R 2 ) 1. 回归平方和占总离差平方和的比例 2. 反映回归直线的拟合程度 3. 取值范围在 [ 0, 1 ] 之间 4. R 2 1, 说明回归方程拟合的越好 ; R 2 0, 说明回归方程拟合的越差 5. 等于多重相关系数的平方, 即 R 2 =(R) 2 12

修正的多重样本决定系数 ( 修正的多重判定系数 R 2 ) 1. 由于增加自变量将影响到因变量中被估计的回归方程所解释的变异性的数量, 为避免高估这一影响, 需要用自变量的数目去修正 R 2 的值 2. 用 n 表示观察值的数目,p 表示自变量的数目, 修正的多元判定系数的计算公式可表示为 13

回归方程的显著性检验 ( 线性关系的检验 ) 1. 检验因变量与所有的自变量和之间的是否存在一个显著的线性关系, 也被称为总体的显著性检验 2. 检验方法是将回归离差平方和 (SSR) 同剩余离差平方和 (SSE) 加以比较, 应用 F 检验来分析二者之间的差别是否显著 如果是显著的, 因变量与自变量之间存在线性关系 如果不显著, 因变量与自变量之间不存在线性关系 14

1. 提出假设 回归方程的显著性检验 ( 步骤 ) H 0 :β 1 =β 2 = =β p =0 线性关系不显著 H 1 :β 1,β 2,,β p 至少有一个不等于 0 2. 计算检验统计量 F 3. 确定显著性水平 α 和分子自由度 p 分母自由度 n- p-1 找出临界值 F α 4. 作出决策 : 若 F F α, 拒绝 H 0 ; 若 F<F α, 接受 H 0 15

回归系数的显著性检验 ( 要点 ) 1. 如果 F 检验已经表明了回归模型总体上是显著的, 那么回归系数的检验就是用来确定每一个单个的自变量 x i 对因变量 y 的影响是否显著 2. 对每一个自变量都要单独进行检验 3. 应用 t 检验 4. 在多元线性回归中, 回归方程的显著性检验不再等价于回归系数的显著性检验 16

回归系数的显著性检验 ( 步骤 ) 1. 提出假设 H 0 : β i = 0 ( 自变量 x i 与因变量 y 没有线性关系 ) H 1 : β i 0 ( 自变量 x i 与因变量 y 有线性关系 ) 2. 计算检验的统计量 t 3. 确定显著性水平 α, 并进行决策 t t α/2, 拒绝 H 0 ; t <t α/2, 接受 H 0 17

一个二元线性回归的例子 例 一家百货公司在 10 个地区设有经销分公司 公司认为商品销售额与该地区的人口数和年人均收入有关, 并希望建立它们之间的数量关系式, 以预测销售额 有关数据如下表 试确定销售额对人口数和年人均收入的线性回归方程, 并分析回归方程的拟合程度, 对线性关系和回归系数进行显著性检验 (α=0.05) 销售额 人口数和年人均收入数据 地区编号 销售额 ( 万元 )y 人口数 ( 万人 ) x 1 年人均收入 ( 元 )x 2 1 2 3 4 5 6 7 8 9 10 33.3 35.5 27.6 30.4 31.9 53.1 35.6 29.0 35.1 34.5 32.4 29.1 26.3 31.2 29.2 40.7 29.8 23.0 28.2 26.9 1250 1650 1450 1310 1310 1580 1490 1520 1620 1570 18

SUMMARY OUTPUT 一个二元线性回归的例子 回归统计 Mul 0.968159025 R Square 0.937331897 Adjusted R Squar0.919426725 标准误差 2.010050279 观测值 10 (Excel 输出的结果 ) 2 R 调整 = 1 (1 R n 1 n p 1 方差分析 df SS MS F ignificance F 回归分析 2 423.01789 211.50894 52.34978 6.1612E-05 残差 7 28.282115 4.0403021 总计 9 451.3 Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept -38.8251694 8.4785911-4.579201 0.002546-58.873837-18.7765 X Variable 1 1.340693618 0.1433159 9.3548147 3.31E-05 1.00180562 1.679582 X Variable 2 0.022802293 0.0047542 4.7962172 0.001975 0.01156035 0.034044 S y = n i= 1 n ( y i 2 ) yˆ) p 1 2 19

一个二元线性回归的例子 ( 计算机输出结果解释 ) 1. 销售额与人口数和年人均收入的二元回归方程为 2. 多重判定系数 R 2 = 0.9373; 调整后的 R 2 = 0.9194 3. 回归方程的显著性检验 F = 52.3498 F>F 0.05 (2,7)=4.74, 回归方程显著 4. 回归系数的显著性检验 t β1 = 9.3548>t α2 =0.3646,; t β2 = 4.7962> t α2 =2.3646; 两个回归系数均显著 一个含有四个变量的回归 20

结 束