Slide 1 - PDF Free Download

统计信号处理基础估计理论杨文电子信息学院测绘校区教学实验大楼十楼 1008 室 E-mail: yw@eis.whu.edu.cn

估计的数学问题必须估计一组参数的值例如 : 雷达, 声纳, 语音, 图像分析, 生物医学, 通信, 控制, 地震学等参数估计问题 : 假设有 N 点数据集, 它与未知参数有关, 我们希望为定义一个估计量 : θ θ ˆ = g( x[0], x[1], x[2] x[ N 1]) 用 PDF( 概率密度函数 ) 来描述数据模型 :PDF 以未知量 θ 为参数, 即 : p( x; θ ) 是确定参数 / 随机参数经典估计 / 贝叶斯估计 θ

估计量性能评估估计量的性能评估估计量是否接近参数的真实值? 是否还有更好的估计? eg. 样本平均 vs. X[0] 估计量是随机变量, 它的性能只能由统计或者 PDF 来描述为了评估估计性能, 采用计算机模拟将永远不会得出明确的结论, 尽管它在洞察一些问题和促进作一些推测方面相当有价值性能与计算复杂性之间的折衷

性能评价指标无偏性 : 一致性 : b= E( ˆ θ ) θ lim ˆ θ θ( wp..1) N = 方差 ( 有效性 ): [( ˆ )( ˆ T E θ θ θ θ) ] 分布 : 估计误差的渐进分布 ( 理想正态 ) N( ˆ θ θ) N(0, C) d

无偏性无偏估计意味着估计量的平均值是未知参数的真值估计量是无偏的, 如果参数 θ 满足 E( ˆ θ) = θ, 当 θ是确定信号时, E( ˆ θ) = E( θ), 当 θ是随机信号无偏估计不一定总是存在, 并且它们可能很难计算无偏估计的性质在经过函数变换后并不是不变的

一致性对于任意的 ε > 0, 如果 { ˆ θ θ ε} lim Pr > = 0 N 此时的估计量 ˆ θ称为一致估计 (consistent)

有效性方差衡量了估计量的性能估计量的有效性可以通过比较与所有无偏估计的最小误差方差的大小来进行评价如果 Var( θˆ 1)< Var( θˆ 2) 并且 E( θˆ 1)=E( θˆ 2), 那么, θˆ 的有效性比 θˆ 的有效性好 1 如果一个估计值是无偏的并且达到了 C R 的下限那它被称为有效的 2 两个基于观测值的估计值 T 1 和 T 2 的相对有效性为 : Var( T2 ( N)) Var( T ( N)) 1 θˆ

MSE: mean square error 最小均方误差准则最佳的估计准则 : MSE = E( θˆ θ) 2 [ ] MSE = E θˆ E θˆ + E θˆ θ) 2 {[( ( )) ( ( ) ] } = Var θˆ + θ 2 ( ) bias ( ) E.g. 对于 xn [ ] = A+ wn [ ], n= 0,1 N 1 1 N 1 令 A = a x[ n] n = 0 N 为均值样本估计值我们试图找一个 a, 使 MSE 最小

最小均方误差准则 EA ( ) = aa, 2 2 Var( A) = a σ / N 我们得到 : 对 MSE 求导, 令其导数为零, 可得到 : a 2 2 a σ M SE( A) = + ( a 1) A N opt 2 = A A N 不可实现的 2 + σ 2 / 2 2

MVU: Minimum variance unbiased 最小方差无偏估计一般来说,MSE 最小的估计量是不可实现的 θˆ 当是一个未知的确定性参数时, 使 MSE 最小的估计量是一个典型的有偏估计量从实际的观点来看, 需要放弃最小 MSE 估计另一种方法就是约束偏差为零, 从而求出使方差最小的估计量 - 最小方差无偏 (MVU) 估计量或者在允许较小偏差情况下运用 MSE 准则允许较小偏差可以有效地减小 MSE 一个使 MSE 最小的无偏估计量也是一个最小方差估计量

最小方差无偏估计无偏估计量 : 例子 : 白色高斯白噪声中 DC 电平的无偏估计量 xn [ ] = A+ wn [ ], n= 0,1, N 1, A 是要估计的参数,w[n] 是 WGN 1 < A < A = x n N 有偏估计量 : 例子 : E ( Aˆ ) A 1 2 N N 1 ˆ [ ] n = 0 N 1 ˆ = x[ n] n = 0 A

最小方差无偏估计的存在性 θˆ 3 也称为一致最小方差无偏估计量 MVU 不总是存在单一的无偏估计量也有可能不存在, 在这种情况下寻找 MVU 估计量的任何努力都是没有结果的

最小方差无偏估计的求解即使一个 MVU 存在我们可能也无法求解, 目前还不存在一种普遍的方法以下是几种寻找 MVU 的途径 : 确定 CRLB 并检查是否有估计量满足该条件应用 Rao-Blackwell-Lehmann-Scheffe 定理进一步限定估计量为线性的, 然后在这些限制中寻找最小方差估计

C-R 不等式的引出由上面的讨论我们知道, 无偏估计的方差越小越好, 一个很自然的问题是 : 无偏估计的方差是否可以任意小? 如果不可以任意小, 那么这个无偏估计方差的下界是什么? 这个下界能否达到? 回答这些问题的最重要结果是 Cramer 和 Rao 分别在 1945 年和 1946 年所证明的一个重要不等式, 即被称之为 C-R 不等式

CRLB(Cramer-Rao lower bound) CRLB 允许我们确定对于任意的无偏估计量, 它的方差肯定大于或等于一个给定的值, 如下图所示 :

Cramer-Rao 下限对任何无偏估计量的方差确定一个下限, 这在实际中证明是极为有用的最好的情况下, 允许确定估计量是 MVU 估计量最坏的情况下, 为比较无偏估计量的性能提供了一个标准也提醒我们不可能求得方差小于下限的无偏估计量

Cramer-Rao 下限一般而言, 未知参量对概率密度函数的影响越大, 所得的估计就越好假设一个信号抽样的观测值为 :x[0]=a+w[0],, 当方差很小时, 我们期望得到一个好的估计值当把 PDF 作为未知参数的函数时 (x 固定 ), 我们称其为似然函数直观地看, 似然函数的尖锐程度决定了我们估计未知参数的精度考虑由对数似然函数在其峰值处的负二阶导数来度量尖锐性, 即对数似然函数的曲率

Cramer-Rao 下限方差随曲率的增加而减少曲率更一般的度量是对数似然函数的平均曲率, 它度量了

Cramer-Rao 定理定理 3.1 CRLB- 标量参数假设 pdf 满足正则条件 ln p(x; θ ) E 0 θ θ = 对于所有的数学期望是对 p(x; θ ) 求取的那么, 任何无偏估计量 θˆ 的方差必须满足 1 var( ˆ θ ) 2 ln p(x; θ ) E 2 θ 其中导数是在 θ 的真值处计算的, 数学期望是对 p(x; θ ) 求取的而且对于某个函数 gi, 下限的无偏估计量就可以求得 ln p(x; θ ) θ p(x; θ ), 当且仅当下式成立时, 对所有 θ 达到 = I( θ )( g(x) θ ) 该估计量是 ˆ θ = g(x), 它是 MVU 估计量, 最小方差是 1/ I( θ )

Cramer-Rao 定理 - 例 3.3

Cramer-Rao 定理 - 例 3.3 可以看到, 样本均值估计量达到了下限, 因此肯定是 MVU 估计量, 且最小方差为

Cramer-Rao 定理 - 例 3.4 本例中, 不满足下限成立的条件, 因此, 不存在无偏的且达到 CRLB 的相位估计量然而,MVU 仍然可能存在, 后面的章节将讨论这类问题

Cramer-Rao 定理 - 例 3.4

有效性与最小方差

Cramer-Rao 下限 Cramer Rao 不等式为估计误差方差的估计提供了下限最小可获得的方差一般大于 CRLB 估计 CRLB 需要知道 pdf 一般我们无法知道这些信息也无法估计其范围, 但当数据为已知分布的多元高斯信号或 iid 信号则可以被估计如果估计误差方差是所有无偏估计中的最小值并且达到了 CRLB, 那么该估计是有效的

CRLB-Fisher 信息 Fisher 信息 : Fisher 信息的基本性质非负的对独立观测的可加性

Fisher 信息的非负性导出了计算 Fisher 信息的另外一种方法

Fisher 信息的独立可加性

高斯白噪声中信号的一般 CRLB 由于通常将信号假定为高斯白噪声的, 推导这种情况的 CRLB 是值得的假定在 WGN 中观测到具有未知参数 θ的确定性, 即 xn [ ] = sn [ ; θ ] + wn [ ] n= 0,1,, N 1 其中清楚地标明了信号对 θ的依赖性 2 var( ˆ σ θ ) (3.14) N 1 2 sn [ ; θ ] n= 0 θ 下限的形式表明了信号依赖 θ的重要性信号随未知参数的改变而迅速改变将产生精确的估计量

例 3.5 正弦频率估计

CRLB- 参数变换实际情况中常常出现所要估计的参数是某个基本参数的函数的情况, 如果希望估计, 那么 CRLB 为例如, 的估计为估计的有效性被非线性变换破坏

CRLB- 参数变换 1 估计的有效性具有仿射变换不变性 2 非线性变换破坏了一个估计量的有效性, 但是如果数据记录足够大, 有效性也可大致保持 3 例如 : 是渐进无偏的, 由, 我们可以估计方差是渐进有效的

CRLB- 矢量参数定理 3.2 CRLB 矢量参数 : 假设概率密度函数满足正则条件其中数学期望是对的协方差矩阵满足求取的那么任何无偏估计量其中解释为矩阵是半正定的 Fisher 信息矩阵为其中导数是在 θ 的真值上计算的, 数学期望是对求取的

CRLB- 矢量参数而且对于某个 p 维函数 g 和某个 p p 的矩阵 I, 当且仅当可以求得达到下限的无偏估计量, 这个估计量是, 它是 MVU 估计, 其协方差矩阵是

例 3.6 高斯白噪声中的 DC 电平

例 3.7 直线拟合

矢量参数变换的 CRLB 如果要估计, 是 r 维的函数则雅可比 (Jacobian) 矩阵 CRLB 是一个很强大的工具, 允许我们寻找线性模型的 MVU 估计

信号处理的例子 -pp:44 现在将 CRLB 理论应用到感兴趣的几个信号处理问题 : 距离估计 - 声纳雷达机器人学频率估计 - 声纳雷达计量经济学光谱测定方位估计 - 声纳雷达自回归参数估计 - 语音计量经济学

例 3.13 距离估计 (pp:44( pp:44)

距离估计续

例 3.13 距离估计 (pp:44( pp:44)

例 3.14 正弦参数估计 (pp:46( pp:46)

例 3.14 正弦参数估计

例 3.15 方位估计 (pp:48( pp:48)

方位估计续

练习题 1,2

练习一

练习二

练习题 3,4

练习三

练习四

思考题 P21:2.9 P53:3.3 P55:3.18

谢谢大家