水利期刊网页制作格式说明

中国水利水电科学研究院第 13 届青年学术交流会论文文章编号 : 大坝变形监测的粗差处理及稳健统计建模朱赵辉 1,, 刘健 1,, 李新 3 3, 尚层 ( 中国水利水电科学研究院, 北京 100048. 北京中水科工程总公司, 北京 100048;3. 新疆额尔齐斯河流域开发工程建设管理局, 新疆乌鲁木齐 830000 摘要 : 变形监测于大坝安全至关重要, 由于诸多干扰因素的存在, 数据采集过程不可避免地产生与实际工况不符的粗差粗差的出现, 往往使监测资料的分析结果失真本文采用稳健估计的思想, 根据常规统计模型的残差分布对观测值进行赋权迭代计算, 使模型具有抗差性基于某工程 RCC 主坝变形监测资料, 探讨了残差的分布对于统计模型参数的影响以及粗差密度与较佳稳健权函数选取的关系, 结果于变形监测数据粗差处理有一定借鉴意义关键字 : 变形监测 ; 稳健估计 ; 统计模型 ; 粗差中图分类号 : 文献标识码 :A 1 引言大坝变形监测数据中无法避免粗差的存在, 粗差的处理常分两种途径 [1] : 一是将粗差归为均值漂移模型, 在数据分析前进行定位和剔除, 得到一簇清洁干净的数据 ; 二是将粗差归于方差膨胀模型, 采用稳健估计的方法通过逐次迭代来不断地改变观测值的权, 最终使粗差观测值的权趋于零, 达到限制排除粗差对建模分析的不利影响粗差定位理论中, 传统 3σ 准则适用于监测量符合正态分布的情况, 无法适应坝体变形所面临的 [, 3] 动态复杂条件 ( 库水位温度等的变化 ; 格罗布斯狄克逊准则适用于小样本的粗差剔除, 在一 [4] 定显著性水平下, 无法保证粗差被剔除 ; 采用 Barrada 数据探测法由于每次只考虑一个粗差, 未顾及各残差间的相关性, 检验可靠性受到一定的限制总体而言, 对于长序列的变形监测数据粗差的定位与剔除存在理论和应用上的诸多困难稳健估计的目的是挖掘利用有效数据, 限制使用有用数据和清除有害数据自 1953 年 G.E.P.BOX 首 [5-8] 提稳健性 (Robustess 的概念以来, 国外学者 Huber Hampel Rousseeuw 等人对参数的稳健估计进 [9, 10] 行研究, 成果颇丰国内学者周江文李德仁欧吉坤杨元喜等人也进行了大量卓有成效的研究 [11] [1] 稳健估计的方法最早由 Huber 引入回归分析 (1981 年, 目前在水质模型地质统计学等多领域得到了广泛应用回归分析是大坝变形监测统计模型的核心, 粗差的存在导致回归参数为之迁就, 造成统计模型一定 [13] 程度的失真在自动化监测不断普及的背景下, 如何对粗差数量巨大的数据序列进行行之有效的建模尤为重要本文通过对某 RCC 主坝变形监测资料的粗差进行处理和建模分析, 提出可根据常规模型残差大小进行粗差定位的方法, 并探讨了残差的分布对于模型参数的影响以及粗差密度与较佳稳健权函数选取的关系收稿日期 : 论文未公开发表过基金项目 : 国家重点基础研究发展计划 (013CB035900 作者简介 : 朱赵辉 (1981-, 男, 河北秦皇岛人, 博士, 高级工程师, 主要从事水工结构安全监测研究 E_mail:zzhtbb@163.com 原理 1

.1 常规统计模型原理根据成因, 可将坝体及坝基变形 δ 主要可分为由水压分量 δh 温度分量 δt 时效分量 δθ 组成 [14], 即 : H T (1 在坝体已运行多年, 温度场基本趋于稳定的条件下, 根据坝工理论和数学力学原理常规统计模型可表示为 : 3 i1 i i a1 ( 0 i Hu Hu it it0 it it0 b1i si si bi cos cos 1 365 365 365 365 i c ( c (l l a 1 0 0 0 式中,H u H u0 分别为监测日始测日所对应的上游水头 ;t 表示监测日到起始监测日的累计天数, t 0 建模资料系列第一个监测日到始测日的累计天数 ;θ 等于 t 除以 100,θ 0 等于 t 0 除以 100; 其余均为回归系数基于多元逐步回归原理, 常规统计模型可表示为 : Y X N(0, E y1 0 1 x11 x1 m 1 y 1 1 x1 x m Y,, X, y 1 x x 3 m 1 m 3 式中,Y 为监测值向量,β 为待估参数向量,X 为结构矩阵 ε 为维随机误差向量, 其期望为维零向量, 方差协方差阵为 σ E(E 为阶单位矩阵量 ˆ : 为了求解模型 (6 中的参数 β, 采用最小二乘法 ( 令结构矩阵 X 为满秩矩阵即可求得 β 的估计 ( (3 ˆ ( T 1 T X X X Y (4. 稳健统计模型原理稳健统计模型的建立基于稳健估计原理, 稳健的含义就是在监测数据出现粗差 ( 或某一时段系统误差的情况下使模型参数的估计结果不致失真与多元回归不同, 稳健回归不追求绝对意义上的最优 ( 残差平方和最小, 而着眼于抗差意义下的最优或接近最优, 即追求估值的可靠性换而言之, 稳健统计模型是以抗差的目的, 冒着损失一些效率的风险, 去求解可靠并具有实际意义有价值的估计结果稳健统计模型与常规统计模型的根本区别在于前者是把稳健估计理论建立在符合于监测数据的实际分布模式而非如后者那样建立在某种理想的分布模式下稳健估计常分三大类型, 即 M 估计 L 估计和 R 估计其中,M 估计又称极大似然估计, 在测量 [9, 10] 界应用成熟广泛 M 估计的准则为 : vi mi (5 i1 ρ 称极值函数 ( 增长速率小于残差平方和 v i, 对未知参数 β 求导, 并令其为零可得 : i1 ( vi vi ( vi 0 (6 i1

考虑到多元的残差方程 V X ˆ Y v x ˆ y (x i 是 X 的第 i 行向量, 有 : ( vi 令权函数 pi( vi, 则式 (7 变为 v i ; i i i ( v ( 0; 0 T i vi xi xi vi i1 i1 vi (7 i=1 T x p ( v v 0, 这与最小二乘估计的法方程形式一致, 仅是 i i i i 用权阵 P(V diag( p1 ( vi,, p ( vi 代替了观测矩阵 P 值得注意的是与最小二乘所给出的先验定值权不同的是,M 稳健估计的权函数是残差的函数, 计算是未知的, 只能通过给其赋予一定的初值, 采用迭代的方法估计未知参数由于极值函数 ρ 的选取不同, 可构成的权函数也就不同, 故称选权迭代法其误差方程与权函数分别为 V X ˆ Y; P( V, 常用的权函数迭代方法有 Huber 法 Adrews 法 IGG 方案等计算流程如图 1 所示 : 本文稳健权函数选择采用 Huber 法 Adrews 法,u 表示标准化的残差指标 ( u v / S i i Huber 法 : 1 u c wu c u c u 式中,c 取 1.0 和 0.7 Adrews 法 : 1 u 0 wu 0 u c csi( u / c / ( u / c u c 式中,c 取 1.0 和 0.75 由于常规统计模型剩余标准差 S 受粗差离群幅度及其密度的影响, 其值应大于无粗差时模型的剩余标准差 S 以 Huber 法为例, 当满足条件 u c, 即 vi cs 时, 对残差数据点做降权处理按传统的粗差剔除 S 准则或 3S 准则进行粗差剔除,c 值应取地比小, 原因主要有以下两点 :( 1 由于 S S, 故 S S,3S 3S ;( 当 v i S, 作降权处理, 并未剔除因此在 Huber 法中 c 取 1.0 和 0.7,Adrews 法 c 取值同理 3 粗差影响的评价列立误差方程, 令观测权函数初值为 1, 即 P(V (0 =E T 解算法方程 ˆ T X P( V X X P( V Y 0, 得出 β 和 V 的首次估值 : ˆ (1 T 1 T (1 ˆ (1 ( X X X Y; V X Y 根据 V (1 各元素的大小对各观测值进行赋权, 得到新的等价权 P(V (1, 再次解算方程, 得 : ˆ ( T (1 1 T ( X P( V X X Y 计算 ( (1 判断 ( k ( k 1 是否小于限差 L 若满足结束迭代 ( k 输出计算 ( k ( k 1 若不满足图 1 基于选权迭代的稳健回归参数计算步骤返回迭代计算 ( k ˆ ( k V X Y 根据逐步回归的理论可知, 常规统计模型的得到基于最小二乘原理 ( 残差平方和 Σv i 最小, 而实际上模型的解析力一定程度还与残差的分布有关由于数据的采集过程实际上属于等权观测, 因此在模型解析力较高的情况下, 残差应该大致服从正态分布残差的正态性的检验方法常用的有 : 夏皮罗 - 威尔克 (Shapiro-Wilk 法 Pearso 法柯尔莫哥洛夫 [15-17] (Kolmogorov-Smirov 法 Jarque-Bera 检验及达戈斯提诺 (D Agostio 法等本文算例均采用 Pearso 卡方拟合优度检验法, 检验方法的步骤为 : 3

a. 将总体 X 的取值范围分成 k 个互不重迭的小区间, 记作 A 1, A,, A k b. 把落入第 i 个小区间 A i 的样本值的个数记作 f i, 称为实测频数所有实测频数之和 f 1+ f + + f k 等于样本容量. c. 选定根据所假设的理论分布, 可以算出总体 X 的值落入每个 A i 的概率 p i, 于是 p i 就是落入 A i 的样本值的理论频数 d. 引进如下统计量表示经验分布与理论分布之间的差异 : Pearso 证明了如下定理, 若理论分布 F(x 已经完全给定, 那么当布渐近自由度为 k-1 的分布文中拟合优度检验显著性水平 α 取 0.10 k ( fi pi (8 p i1 i 时, 式 (8 中统计量的分 4 算例分析某工程碾压混凝土重力坝坝长 1489m, 主坝最大坝高 11.5m, 副坝最大坝高 14m, 发电引水洞及电站地面厂房布置在右岸, 电站总装机容量为 140MW 该坝布置有正倒垂线及引张线等监测设备监测坝体变形, 坝基倾斜监测主要由布设在坝基横向廊道的静力水准系统完成 4.1 残差分布正态性较差的情况如图所示, 由于受纵向廊道内各类机械施工影响 ( 如混凝土取芯钻孔引起的铟钢丝颤动等以及观测间密闭状况钢护管窜风等干扰因素的存在, 正垂线上各测点上下游向位移在自动化监测系统在数据采集过程中出现了大量的粗差大量粗差的存在给数据分析工作带来了阻碍, 常规的时空分析和特征值分析 ( 极值点常为粗差已不能准确反映大坝变形的真实状况因此要挖掘出数据序列中的有效信息, 必须进行行之有效的统计建模如图 3 为 4 # 坝段 EL706.5m 高程 PL6-1 测点按周频次取值所建常规统计模型过程线, 可以看图坝体 675.1m 高程上下游向位移时序过程线出模型整体拟合精度较高 ( 模型复相关系数 R=0.9495 但由于受到粗差的影响, 残差在粗差密度较大的时段明显增大图 4 为残差的频次分布图, 按 Pearso 卡方拟合优度检验法,P 值为 0.0001 因此残差显著地不符合正态分布, 对常规模型拟合曲线存在较大影响图 3 PL6-1 测点常规统计模型过程线图 4 PL6-1 测点常规统计模型残差频次图表 1 该测点为常规统计模型与稳健统计模型参数对比表其中不含粗差的常规模型参数是按 v i> 1.5 S 准则对粗差点进行剔除后再进行多元回归分析得到由表可知, 剔除粗差后, 常规模型各项系数 4

变化较大, 温度因子系数 b11 最大变幅达 3.9% 而不含粗差常规模型与 Huber 法 (c=1.0 的参数求解结果基本一致表中系数变幅按下式计算 : 模型系数 - 不含粗差模型系数系数变幅 (9 不含粗差模型系数表 1 PL6-1 常规模型与稳健模型参数如图 5 所示为常规模型 ( 含粗差不含粗差与稳健模型 Huber(c=1.0 拟合值过程线, 可以看出三参数常规模型 Huber(c=1. 0 含粗差 Huber(c=0. 7 Adrews(c=1. 0 Adrews(c=0.7 不含粗差常规模型常规模型系数变幅 Huber(c=1. 0 系数变幅 a 0-0.3960-0.5133-0.5373-0.5305-0.5659-0.4916 19.5% 4.4% a 1-0.0018-0.0015-0.0015-0.0014-0.0014-0.0015 15.3% 0.5% a 31 1.69E-06 1.46E-06 1.44E-06 1.38E-06 1.33E-06 1.48E-06 14.8% 0.5% c 1 0.1896 0.1857 0.1888 0.1897 0.1916 0.1856.1% 0.1% b 11-0.863-0.335-0.349-0.113-0.168-0.31 3.9% 1.0% 5 图 5 PL6-1 统计模型拟合过程线图 6 PL6-1 测统计模型水压分量过程线者拟合过程线基本重合稳健统计模型结果在追求可靠性分析结果的同时, 并未明显降低拟合效果而如图 6 所示, 三者水压分量过程线存在较为明显的差异, 其中稳健模型 Huber(c=1.0 水压分量与粗差剔除的常规模型水压分量较为接近 016 年 6 月 6 日, 二者水压分量值分别为 4.34mm 4.41mm, 而未剔除粗差常规模型水压分量为 3.94mm, 分量评价存在较大偏差此外, 还可看到将常规统计模型的剩余标准差 S 是作为尺度, 并结合残差值 v i 的大小来具体判定粗差点, 较之常规的粗差剔除方法具有以下几个优点 :(1 统计模型顾及了坝体变形量与库水位温度时效等因子的相互影响关系, 采用该法进行粗差的定位, 不再如 3σ 准则格布罗斯及狄克逊准则那样完全基于一定的统计分布或根据一定的显著性水平孤立地判别变形效应量是否为粗差 ( 对于拟合效果较好的统计模型, 残差过程线能够直观准确地反映出粗差点的位置, 并估算粗差密度 (3 可用于大样本长序列的粗差定位 4. 残差分布正态性较好的情况如图 7 所示, 坝基倾斜采用静力水准监测, 仪器抗干扰能力较强, 测值粗差数量相对较小结合表可知,8 # 坝段 ( 坝下 0+007.0 至坝下 0+058.0 坝基倾斜量常规统计模型拟合效果良好, 模型各分量能够反映出坝基倾斜量发展过程的良好规律如图 8 所示, 该坝段倾斜量常规统计模型残差基本符合正态分布,Pearso 拟合优度检验 P 值达 0.81 注 : 坝基倾斜量以向下游转动为正, 向上游转动为负表 8 # 坝段坝基倾斜常规统计模型拟合效果及 Pearso 检验结果图 7 8 # 坝段倾斜量 ( 坝下 0+007.0 至坝下 0+058.0 统计模型过程线 5

坝段复相关系数 R 剩余标准差 S ( 残差检验 p 值 8 # 0.96 0.70 0.81 如表 3 所示, 由于残差分布接近正态分布, 故剔除边缘粗差尖点后, 模型参数变化相对较小, 与稳健统计模型 Huber(c=1.0 Adrews(c=1.0 参数较为接近而且若采用粗差限制较为严格的权函数 Huber (c=0.7 和 Adrews(c=0.75, 将使统计参数一定程度上失真因此, 说明了在进行稳健统计模型建模前, 应对常规统计模型的残差分布有一定的把握 : 对于近于正态分布的残差序列, 常规统计模型参数已较为稳定, 不建议使用稳健统计模型 ; 对于与正态分布相去甚远的残差序列, 应根据残差大小, 判定粗差密度, 进而选择相应的稳健统计权函数进行建模分析图 8 常规统计模型残差频次分布图表 3 8 # 坝段坝基倾斜量常规模型与稳健模型参数参含粗差不含粗差常规模型 Adrews(c=1.0 数常规模型 Huber(c=1.0 Huber(c=0.7 Adrews(c=1.0 Adrews(c=0.75 常规模型系数波幅系数波幅 a 0-0.6190-0.614-0.5687-0.6154-0.591-0.6161 0.5% 0.1% a 1-0.0003-0.0003-0.0003-0.0003-0.0003-0.0003 0.7% 0.7% a 3 1 3.94E-07 4.00E-07 4.01E-07 4.00E-07 4.05E-07 3.98E-07 0.9% 0.7% c 0.4359 0.46 0.4158 0.455 0.410 0.4346 0.3%.1% b 1-0.5010-0.556-0.5350-0.5-0.5571-0.4953 1.% 5.4% 5 权函数的选取如前所述, 常规统计模型的剩余标准差 S 是有效判断粗差的一个尺度 ( 如按 v i>1.5s 准则或 v i> S 准则对粗差点进行剔除, 因此可根据残差 v i 的大小得到粗差的密度 ( 粗差数 / 样本数而粗差密度可作为权函数选取的一个导向,Hampel 认为, 实际测量的数据中粗差出现的概率达 10% [18] 是属正常的, 如表 5 所示, 根据某工程正垂线测点统计结果来看, 在干扰条件较强的情况下, 粗差密度可达 15.58% 表中粗差判定根据 v i>1.5s 准则, 并由此得到粗差密度而较佳稳健权函数的统计模型参数与剔除粗差后的常规统计模型参数最为接近, 定义 Am 为模型系数平均变幅, 按下式计算 : Am a a b c m c m ij b a c b m ij N ij (10 式 (10 中,a bij cm 为稳健统计模型回归参数,a bij cm 为去粗差后的常规模型参数 ; 当取 6

0 时,a0 与 a0 为分别为模型常数项参数 ;N 为逐步回归选入自变量因子个数 Am 最小时对应的权函数即为较佳稳健权函数 1.339 此外, 表 5 中 Huber 及 Adrews 函数若未注明 c 的大小, 则为 Matlab 中默认取值, 分别为 1.345 由表 5 可以看出, 粗差密度小于 6% 时, 可选 Adrews 或 Huber 作为稳健权函数 ; 密度介于 6%~9% 之间时, 应选取 Huber 函数进行赋权迭代计算 ; 粗差密度在 10%~11% 时, 较佳权函数为 Huber(c=1.0; 密度在 1% 左右时, 宜选取 Huber(c=0.7 作权函数 ; 密度大于 15% 时, 稳健权函数应选取 Adrews(c=0. 75, 此时根据残差 v i 大小给观测值赋权有较严格的控制表中稳健模型效果较差两组数据 (PL- PL6- 具有两个共性的特点 : 一是常规统计模型与稳健统计模型中的常数项参数 a0 与 a0 较大, 例如 PL- 表 4 PL6- 测点水位相关系数矩阵测点 016 年 6 月 0 日位移量为 6.03mm, 而其常规统计模型与稳健统计模型常数项分别为 501.5mm 583.08mm 由于各分量值远远小于常数项, 统计模型的解析力弱, 造成剔除粗差或稳健统计建模后参数变化较大 ; 二是两测点均选入了三个水位因子, 如表 4 所示, 由于各水位因子间内部相关性较高, 存在信息冗余, 导致系数变化相互影响表 5 某工程正垂测点上下游向水平位移粗差密度与较佳稳健权函数统计表测点编号测值样本数粗差密度较佳稳健权函数 Mi(Am 备注 PL1-1 77 15.58% Adrews(c=0.75 5.0% PL-1 305 10.80% Huber(c=1.0 4.84% PL- 7 6.90% Huber(c=1.0 15.8% 效果差 PL3-1 94 5.10% Adrews 或 Huber 8.3% PL3-130 11.54% Huber(c=0.7 4.0% PL3-3 117 10.3% Huber(c=1.0.6% PL4-1 306 8.8% Adrews 或 Huber 1.65% PL4-307 1.05% Huber(c=0.7 3.16% PL4-3 11 3.57% Adrews 或 Huber.87% PL5-1 308 10.39% Huber(c=1.0 7.35% PL5-74 6.94% Huber 1.3% PL5-3 79 15.0% Adrews(c=0.75 3.96% PL6-1 310 5.16% Huber 或 Adrews 1.44% PL6-86 11.63% Huber 13.70% 效果差注 : 表中较佳稳健权函数 xx 或 yy 表示两权函数下的模型系数较为接近, 相对变幅小于 % 如 Adrews 或 Huber, 前者 (Adrews 为较佳稳健权函数, 而 Huber 系数与其较为接近水位因子 H H H 3 H 1.000000 0.999997 0.999989 H 0.999997 1.000000 0.999997 H 3 0.999989 0.999997 1.000000 6 结论本文根据某工程 RCC 主坝变形监测实测资料, 对当前大坝自动化变形监测数据序列中出现的粗差处理进行了初步探讨, 并采用稳健估计原理进行统计建模, 得到如下结论 :(1 以常规统计模型剩余标准差 S 为尺度, 根据残差 v i 的大小来判别处理粗差的方法可顾及变形量与库水位温度时效等因子的相互影响关系, 较之传统的 3σ 格布罗斯和狄克逊准则等方法直观准确, 适用于大样本长序列的粗差定位 ( 残差序列 {v i} 符合正态分布, 常规统计模型参数稳定, 不建议使用稳健统计模型 ; 与正态分 7

布相去甚远的残差序列 {v i}, 可判定其粗差密度, 选择相应的稳健统计权函数进行建模分析当粗差密度小于 6% 时选取 Adrews 与 Huber 作权函数 ; 密度介于 6%~9% 介于 10%~11% 及密度约为 1% 时最佳权函数分别为 Huber Huber(c=1.0 Huber(c=0.7; 密度大于 15% 时, 稳健权函数应选取 Adrews(c=0.75 (3 常数项参数过大以及选入多重相关性较强的因子对于统计模型参数稳定不利 (4 总结得到对于较大密度粗差数据的处理步骤 : 首先, 按周频次或旬频次取监测值 ; 然后, 进行常规统计建模, 得到剩余标准差 S 及残差序列 {v i}, 并检验残差分布的正态性 ; 对于正态性较差的残差序列, 判别其粗差密度选择相应的稳健权函数进行建模分析参考文献 : [ 1 ] 姚宜斌. 粗差的定性分析 [J]. 测绘信息与工程, 00,7(1:1-3. [ ] 杨建潮. 测量误差及粗大误差的判别与消除 [J]. 计量与测试技术, 006, 33(11:4-5. [ 3 ] 杨茂兴. 小样本容量测量数据中粗差的剔除 [J]. 计量与测试技术, 005, 3(1:7-8. [ 4 ] 陶本藻姚宜斌. 可靠性分析与数据探测 [J]. 武汉大学学报 ( 信息科学版, 00, 7(6:607-610. [ 5 ] HUBER P J. Robust estimatio of a locatio parameter [J]. The Aals of Mathematical Statistics, 1964, 35(1: 73-101. [ 6 ] HUBER P J. Robust statistics [M]. Spriger, 011. [ 7 ] ROUSSEEUW F H E R P, HAMPEL F, RONCHETTI E, et al. Robust statistics: the approach based o ifluece fuctios [J]. J Wiley, New York, 1986. [ 8 ] ROUSSEEUW P J, LEROY A M. Robust Regressio & Outlier Detectio [M]. JSTOR. [ 9 ] 周江文, 黄幼才, 杨元喜, 等. 抗差最小二乘法 [M]. 武汉 : 华中理工大学出版社, 1997. [ 10 ] 李德仁. 测量平差系统的误差处理和可靠性理论 [M]. 武汉测绘科技大学. 1985. [ 11 ] 李黎武, 施周. 随机噪声干扰下水质模型参数的鲁棒估计方法 [J]. 水利学报, 006, 37(6:687-693. [ 1 ] 陈亚新, 徐英, 魏占民, 等. 基于稳健统计学的水盐空间变差函数逼近方法 [J]. 水利学报, 004(9: 44-49. [ 13 ] 贾超. 稳健回归分析方法在变形监测中的应用 [D], 011. [ 14 ] 吴中如. 水工建筑安全监控理论及应用 [M]. 北京 : 高等教育出版社. 003. [ 15 ] D'AGOSTINO R B, BELANGER A, D'AGOSTINO JR R B. A suggestio for usig powerful ad iformative tests of ormality [J]. The America Statisticia, 1990, 44(4: 316-1. [ 16 ] BERA A K, JARQUE C M. Efficiet tests for ormality, homoscedasticity ad serial idepedece of regressio residuals: Mote Carlo evidece [J]. Ecoomics Letters, 1981, 7(4: 313-8. [ 17 ] GHASEMI A, ZAHEDIASL S. Normality tests for statistical aalysis: a guide for o-statisticias [J]. Iteratioal joural of edocriology ad metabolism, 01, 10(: 486-9. [ 18 ] HOAGLIN D C, MOSTELLER F, TUKEY J W, et al. 探索性数据分析 [M]. 中囯统计出版社, 1998. 8

Gross error hadlig ad robust statistical modelig for dam deformatio moitorig Zhu Zhao-hui 1,,Liu Jia 1,,Li Xi 3,Shag Ceg 3 (1.Chia Istitude of Water Resources ad Hydropower Research,Beijig 100044,Chia;. Beijig IWHR Techology Co.,Ltd,Beijig 100048,Chia; 3. Project Costructio Authority,Xijiag Irtysh River Basi, Urumqi 830000,Chia Abstract: Deformatio moitorig plays a vital role i dam safety. Due to the existece of various iterferece factors, it is ievitable to produce the gross error which is ot i coformity with the actual workig coditios i the process of data acquisitio.the appearace of gross error teds to distort the results of the aalysis of the moitorig data. This paper is based o the idea of robust estimatio, the weight of the observed value is weighted by the residual size of the covetioal statistical model,which makes model have Robustess. Based o a Project RCC mai dam deformatio moitorig data, we discuss the ifluece of residual distributio o model parameters ad the relatioship betwee gross error desity ad optimal robust weight fuctio,this has referece sigificace. Key words: deformatio moitorig; robust estimatio; statistical model; gross error 9

中国水利水电科学研究院第十三届青年学术交流会大坝变形监测的粗差处理及稳健统计建模朱赵辉 1,, 刘健 1,, 李新 3, 尚层 3 1. 中国水利水电科学研究院, 北京 100048;. 北京中水科工程总公司, 北京 100048 3. 新疆额尔齐斯河流域开发工程建设管理局, 新疆乌鲁木齐 830000 摘要摘要 : 变形监测于大坝安全至关重要, 由于诸多干扰因素的存在, 数据采集过程不可避免地产生与实际工况不符的粗差粗差的出现, 往往使监测资料的分析结果失真本文采用稳健估计的思想, 根据常规统计模型的残差分布对观测值进行赋权迭代计算, 使模型具有抗差性基于某工程 RCC 主坝变形监测资料, 探讨了残差的分布对于统计模型参数的影响以及粗差密度与较佳稳健权函数选取的关系, 结果于变形监测数据粗差处理有一定借鉴意义关键词关键词文字变形监测 ; 稳健估计 ; 统计模型 ; 粗差朱赵辉报告人即第一作者简介 : 朱赵辉, 高级工程师, 35 岁, 男, 研究方向 : 水工建筑物安全监控理论与方法, 手机号码 : 150103530, 通讯地址 : 北京市海淀区车公庄西路 0 号中国水科院新主楼 509 室 zzhtbb@163.com 注 : 论文未公开发表过 10