54 天文学报 56 卷潮汐项可以由国际地球自转与参考系服务 (International Earth Rotation and Reference Systems Service, IERS) 协议给出的模型精确确定 [2], 而非

第 56 卷第 1 期天文学报 Vol.56 No.1 2015 年 1 月 ACTA ASTRONOMICA SINICA Jan., 2015 doi: 10.15940/j.cnki.0001-5245.2015.01.007 基于高斯过程的日长变化预报雷雨 1,2,3 赵丹宁 1,3 高玉平 1,2 蔡宏兵 1,2 (1 中国科学院国家授时中心西安 710600) (2 中国科学院时间频率基准重点实验室西安 710600) (3 中国科学院大学北京 100049) 摘要由于日长 (length-of-day, LOD) 变化具有复杂的时变特性, 传统线性模型如最小二乘外推模型时间序列分析模型等的预报效果往往不甚理想, 所以将一种新型的机器学习算法高斯过程 (Gaussian processes, GP) 方法用于 LOD 变化预报, 并将预报结果同利用反向传播神经网络 (back propagation neural networks, BPNN) 和广义回归神经网络 (general regression neural networks, GRNN) 的预报结果以及地球定向参数预报比较竞赛 (Earth Orientation Parameters Prediction Comparison Campaign, EOP PCC) 的预报结果进行对比. 结果表明, GP 用于 LOD 变化预报是高效可行的. 关键词天体测量, 时间, 方法 : 数据分析中图分类号 : P127; 文献标识码 : A 1 引言 LOD 变化是表征地球自转变化的一个重要参数, 它是指天文意义上的 1 d 和标准日长 86 400 s 之间的差异, 反映了地球自转速率的变化. LOD 和极移 (polar motion, PM) 统称为地球自转参数 (Earth rotation parameters, ERP). ERP 是实现天球参考系和地球参考系之间相互转换的必需参数, 在深空探测卫星精密定轨和天文地球动力研究等领域都有重要应用 [1]. 现代测地技术 ( 甚长干涉基线 (Very Long Baseline Interferometry) 全球卫星导航系统 (Global Navigation Satellite Systems, GNSS) 和卫星激光测距 (Satellite Laser Ranging, SLR) 等 ) 被广泛应用于地球自转变化的常规监测中, 提供了高时空分辨率和高精度的观测资料. 然而, 由于复杂的数据处理过程, 由现代测地技术获取的 ERP 往往需要延迟几天甚至 2 个星期, 所以对 ERP 进行实时快速的预报成为一项值得深入研究的课题. LOD 变化的精确预报是 ERP 预报中的难点之一, 特别是在厄尔尼诺 (El Niño) 事件发生期间, 热带季风的变化导致 LOD 变化出现大幅振荡. LOD 变化的高精度实时快速预报引起了越来越多学者的关注. LOD 变化主要由潮汐项和非潮汐项 2 部分组成, 2014-07-02 收到原稿, 2014-08-04 收到修改稿国家自然科学基金项目 (10573019) 资助 leiyu@ntsc.ac.cn

54 天文学报 56 卷潮汐项可以由国际地球自转与参考系服务 (International Earth Rotation and Reference Systems Service, IERS) 协议给出的模型精确确定 [2], 而非潮汐项中的半年项和周年项等季节性变化主要是由固体地球和全球大气海洋以及地下水之间的角动量交换引起的 [3]. 学者们在 ERP 预报方面已经做了许多研究, 提出了各种预报模型, 包括最小二乘 (least squares, LS) 外推模型 [4] LS 外推模型和自回归 (autoregressive, AR) 模型的组合 (LS+AR) [4 5] 卡尔曼滤波联合大气角动量 (Kalman Filter+OAM) [6 7] LS 外推模型和人工神经网络 (artificial neural networks, ANN) 模型的组合 (LS+ANN) [3,8 11] 模糊推理系统 (fuzzy-inference systems, FIS) [12] 以及离散小波变换 (discrete wavelet transform, DWT) 和自协方差 (autocovariance, AC) 模型的组合 (DWT+AC) [13] 等. 为了对比不同模型的预报效果, 维也纳理工大学大地测量与地球物理研究所从 2005 年 10 月 1 日至 2008 年 2 月 28 日组织了全球性的地球定向参数预报比较竞赛, 2 yr 多的预报结果表明, 没有一种模型既适合于 ERP 所有分量的预报又适合于所有跨度的预报 [14]. 受多种激发因素的影响, 地球自转变化呈现复杂的非线性不规则变化特性, 因此采用非线性的预报方法对其进行预报在理论上更为合理 [8 11]. ANN 是逼近复杂非线性函数的一种有效工具, 所以有许多学者将其应用于 ERP 预报中, 并取得了显著的预报效果 [3,5,8 11]. 但是 ANN 存在一些缺点, 例如网络拓扑结构难以确定训练过程存在过学习现象迭代过程易陷入局部最优收敛速度较慢. 此外, ANN 的优化目标是基于经验的风险最小化, 无法保证网络的泛化能力 [15]. 针对上述缺点很多学者提出了改进措施, 例如将 ANN 和其他人工智能 (artificial intelligence, AI) 算法结合进行网络优化, 如遗传算法与 ANN 的组合粒子群算法与 ANN 的组合等, 然而这些算法均存在一定的不足, 仍处于不断的尝试研究阶段. GP 是近年来发展起来的一种新型机器学习算法, 它有着严格的统计学习理论基础, 对处理高维数小样本非线性等复杂问题具有很好的适应性, 且泛化能力强 [16 17]. 与 ANN 和支持向量机相比, GP 具有容易实现超参数自适应获取非参数推断灵活以及输出具有概率意义等优点 [16 17]. 现已成为机器学习领域的研究热点, 并在许多领域得到了成功的应用 [18 19]. 本文将 GP 算法用于 LOD 变化预报, 研究表明 : GP 算法用于 LOD 变化预报是可行的, 且预报效率和精度较高. 2 GP 的基本原理及其用于 LOD 变化预报的方法 2.1 GP 回归的基本原理高斯过程又称正态随机过程, 其任意有限变量集合都有着联合高斯分布的特性, 即对于任意的变量 x 1, x 2,, x n 与其对应的函数 f(x 1 ), f(x 2 ),, f(x n ) 的联合概率分布服从 n 维高斯分布. 高斯分布的全部统计特征完全由它的均值函数 m(x) 和协方差函数 C(x, x ) 来确定, 一般记为 f(x) GP(m(x), C(x, x )). 若给定训练样本集 D = {(x i, y i ) x i R d, y i R, i = 1, 2,, n}, 其中 d 为向量 x i 的维数, 则对于测试样本输入 x, GP 模型的预测值为 y = k T (x )K 1 y, (1)

1 期雷雨等 : 基于高斯过程的日长变化预报 55 其中 k(x ) = [C(x, x 1 ), C(x, x 2 ),, C(x, x n )] 为测试样本输入和训练样本输入值之间的 1 n 阶协方差矩阵, K 是训练样本输入值之间的 n n 阶协方差矩阵, K ij = C(x i, x j ). (1) 式表明, GP 模型可以根据协方差函数和测试样本进行预测. 协方差函数在 GP 回归模型中起到关键作用, 它表达了一种样本间的相似性, 对所要学习的函数提供了假设信息, 协方差函数必须是半正函数. 常用的协方差函数为平方指数函数 [17], 即 [ C(x i, x j ) = σf 2 exp 1 d ( ) (m) x i x (m) 2 ] j + σ 2 l nδ 2 ij, (2) m m=1 其中 x (m) i x (m) j 分别是向量 x i x j 的第 m 个分量, l 1, l 2,, l d 为协方差的尺度因子, σf 2 为信号方差, σn 2 为噪声方差, 称参数集 θ = {l 1, l 2,, l d, σ f, σ n } 为超参数 ; δ ij 为 Kronecker 函数, 当 i = j 时 δ ij = 1, 当 i j 时 δ ij = 0. 2.2 基于 GP 回归模型的 LOD 变化预报 2.2.1 数据预处理本文所用的 LOD 变化数据来自 IERS 发布的 EOP C04 序列, 采样间隔为 1 d. LOD 变化序列中周期为 5 d 18.6 yr 的固体地球带谐潮汐项可以通过 IERS 协议给出的经验模型精确确定 [2], 近周日和半周日海洋潮汐项不作修正, LOD 变化的长期趋势项季节性变化的周年和半年项等根据下述线性模型确定 [4] : 4 f LODR (t) = a + bt + [c i,1 cos(2πt/p i ) + c i,2 sin(2πt/p i )], (3) i=1 其中 LODR 表示经过固体地球带谐潮修正后的 LOD 变化序列, p 1 p 2 p 3 和 p 4 分别表示半年项周年项 9.3 yr 项和 18.6 yr 项的周期, 取 p 1 = 182.62 d p 2 = 365.24 d p 3 = 3396.732 d p 4 = 6793.464 d, t 为协调世界时 (Coordinated Universal Time, UTC), 在拟合时单位转换为 d. a b 表示长期趋势项的参数, c 1,1 c 1,2 表示半年项的参数, c 2,1 c 2,2 表示周年项的参数, c 3,1 c 3,2 表示 9.3 yr 项的参数, c 4,1 c 4,2 表示 18.6 yr 项的参数, 这 10 个未知参数通过最小二乘法求得. 经过上述数据预处理后的剩余部分为含有非线性成分的残差序列, 主要包括海洋近周日半日潮项以及不规则的短周期成分. 图 1 从上至下依次绘出了 1990 2010 年期间 LOD 变化的原始序列带谐潮序列线性模型拟合序列以及残差序列. 本文采用 GP 回归模型对残差序列进行建模和预测, 将线性模型的预报结果和残差序列的预报结果相加即可获得最终的 LOD 变化预报值. 2.2.2 建模和预报 GP 模型的建模过程就是通过对样本数据 D 的训练, 确定协方差函数的超参数. 超参数的选取方法主要有交叉检验法贝叶斯推理法和最大似然法 [13]. 本文采用最大似然法选取超参数, 即任意给定超参数的初值, 采用共轭梯度优化算法求取训练样本对数似然函数的最大值, 从而得到似然函数最大值所对应的超参数即为最优超参数. 对数似然函数的形式为 ln p(y x, θ) = 1 2 yt K 1 y 1 2 ln K n ln(2π). (4) 2

56 天文学报 56 卷 Raw series/ ms Tidal term/ ms Fitting of linear model/ ms Residual/ ms 5 0 5 1 0 1 5 0 5 1 0 (a) (b) (c) (d) 1 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 year 图 1 LOD 变化的原始序列 (a); 带谐潮项 (b); 线性模型拟合项 (c); 残差项 (d) Fig. 1 The raw series (a); tidal terms (b); fitting terms of linear model (c); and residual terms (d) of the LOD variations 除了协方差函数及其超参数, 样本的输入和输出方式也非常重要. 按以下方式构建样本的输入和输出 : 在训练阶段, 样本的输入和输出方式为 {ξ(t d), ξ(t d + 1),, ξ(t 1)} ξ(t), t = d + 1, d + 2,, n, (5) 其中 {ξ(i), i = 1, 2,, n}, 表示 LOD 变化序列经数据预处理后的残差序列, 根据经验确定, 本文取 d = 4. 在预报阶段, 预报跨度为 k = 1, 2,, d, d + 1, 时样本的输入和输出方式分别为 {ξ(n d + 1), ξ(n d + 2),, ξ(n)} ξ(n + 1) k = 1 {ξ(n d + 2), ξ(n d + 3),, ξ(n + 1)} ξ(n + 2) k = 2 {ξ(n), ξ(n + 1),, ξ(n + d 1)} ξ(n + d). k = d { ξ(n + 1), ξ(n + 2),, ξ(n + d)} ξ(n + d + 1) k = d + 1., (6) 其中 ξ(n + k) 表示残差序列为 k 的预报值. 可以看出 : 当 k 2 时, 每一次预报都需要前几步的预报值作为输入, 所以这种样本输入和输出模式实质上是一种递推迭代预报方式, 其优点是对于连续的多天预报, 只需进行一次模型计算, 而不像跨度模式等需要进行多次模型计算 [20 21], 预报效率大大提高. 此外, 这种模式的数据利用率高, 对于长度为 n

1 期雷雨等 : 基于高斯过程的日长变化预报 57 的基础序列, 可构建 n d 个训练样本. 2.2.3 精度评定指标采用均方根误差 (root mean square error, RMSE) 和平均绝对误差 (mean absolute error, MAE) 作为预报结果的精度评定指标, 其计算公式分别为 RMSE i = 1 N (P i j Oj i N )2, (7) j=1 MAE i = 1 N N P i j Oj i. (8) j=1 其中 i 为预报跨度, N 为预报期数, P i j O i j 分别表示第 j 期的第 i d LOD 变化的预测值和实际值. 3 实验分析首先将 1990 年 1 月 1 日至 1999 年 12 月 31 日的 LOD 变化残差序列用于 GP 模型的训练, 然后用训练好的 GP 回归模型对 2000 2001 年的 LOD 变化残差序列进行 1 10 d 15 d 20 d 25 d 30 d 60 d 90 d 120 d 150 d 360 d 跨度的预报 ( 与 Schuh 等 [3] 和张晓红等 [8 9] 的预报时间段相同 ). 图 2 给出了基于 GP 方法的预报跨度为 1 d 的 LOD 变化残差的预报曲线 (a) 和预报误差 (b) 图, 图 2(a) 中虚线和实线分别代表残差预报值和观测值. 0.6 (a) Residual/ ms Prediction error/ ms 0.3 0.0 0.3 Prediction Observation 0.6 2000.1 2000.2 2000.3 2000.4 2000.5 2000.6 2000.7 2000.8 2000.9 year 0.05 0.05 (b) 2000.1 2000.2 2000.3 2000.4 2000.5 2000.6 2000.7 2000.8 2000.9 year 图 2 跨度为 1 d 的 LOD 变化残差的预报结果 (a) 和预报误差 (b) Fig. 2 The prediction results of the residual of LOD variations (a) and the predicted errors (b) at the prediction horizon of 1 d

58 天文学报 56 卷同时本文将基于 GP 方法的 LOD 变化预报结果同 Schuh 等 [3] 使用的反向传播神经网络 (back propagation neural networks, BPNN) 和张晓红等 [8 9] 使用的改进的 BPNN 以及广义回归神经网络 (general regression neural networks, GRNN) 的预报结果进行对比, 预报 RMSE 值见表 1. 从图 2(a) (b) 和表 1 可以看出, GP 用于 LOD 变化预报是可行和有效的, 随着预报跨度的增大, 预报精度有所降低. [3] 表 1 GP 预报结果与 BPNN 预报结果 (Schuh 等的预报结果 ) 改进的 BPNN 及 GRNN 预报结果 [8 9] ( 张晓红等的预报结果 ) 的比较 ( 单位 : ms) Table 1 The comparison of the prediction results of GP with those of the BPNN (Schuh et al. [3] ), the modified BPNN, and the GRNN (Zhang et al. [8 9] ) (unit: ms) Prediction day GP BPNN [3] Modified BPNN [8 9] GRNN [8 9] 1 0.027 0.019 0.027 0.037 2 0.057 0.049 0.073 0.074 3 0.078 0.074 0.093 0.097 4 0.097 0.097 0.110 0.117 5 0.112 0.121 0.131 0.134 6 0.126 0.142 0.148 0.151 7 0.138 0.159 0.162 0.164 8 0.149 0.174 0.170 0.174 9 0.158 0.184 0.176 0.179 10 0.166 0.193 0.185 0.187 15 0.190 0.246 0.211 0.204 20 0.201 0.251 0.217 0.210 25 0.207 0.249 0.215 0.211 30 0.210 0.245 0.219 0.217 60 0.232 0.292 0.219 0.222 90 0.266 0.306 0.231 0.226 120 0.260 0.314 0.229 0.226 150 0.252 0.330 0.237 0.233 180 0.257 0.361 0.234 0.234 210 0.268 0.397 0.241 0.236 240 0.257 0.377 0.236 0.236 270 0.251 0.386 0.231 0.240 300 0.222 0.402 0.249 0.247 330 0.280 0.372 0.262 0.254 360 0.273 0.347 0.245 0.250

1 期雷雨等 : 基于高斯过程的日长变化预报 59 为了更加直观地比较 4 种方法的预报精度, 图 3 绘出了不同跨度的预报精度. 从图中可以看出, 在短期 (1 30 d) 预报中, 除了当跨度为 1 3 d 时 GP 的预报精度略低于 BPNN 预报精度外, 其它跨度的预报精度均高于另外 3 种方法的预报精度. 对于中期 (1 360 d) 预报, GP 的预报精度仍优于 BPNN 的预报精度, 但低于改进 BPNN 和 GRNN 的预报精度. 在预报效率上, 由于 GP 模型参数 ( 协方差参数 ) 可以自适应获取, 而不必像 ANN 技术需要对训练样本反复训练才能得到最优网络参数, 故训练速度较 ANN 技术要快. 此外, 因为本文采用的 GP 预报模式只需建模一次便可实现 LOD 变化的多天连续预报, 因此预报所用时间较少, 对于 1 360 d 的连续预报, 训练时间和预报时间之和一般在 20 min 以内, 保证了算法的实时性. 0.40 0.35 0.30 GRNN BPNN Modified BPNN GP (a) 0.50 0.40 GRNN BPNN Modified BPNN GP (b) RMSE/ ms 0.25 0.20 0.15 RMSE/ ms 0.30 0.20 0.05 0 5 10 15 20 25 30 day in future 0 60 120 180 240 300 360 day in future 图 3 GP 预报精度与 BPNN 改进 BPNN 和 GRNN 预报精度对比. (a) 短期 (1 30 d) 预报, (b) 中期 (1 360 d) Fig. 3 预报 The comparison of the prediction accuracies of GP with those of the BPNN, the modified BPNN, and the GRNN. (a) The short-term (1 30 d) prediction, and (b) the medium-term (1 360 d) prediction 为了与 EOP PCC 的预报结果进行比较, 选取了 1990 年 1 月 1 日至 2005 年 9 月 30 日的 LOD 变化数据作为基础序列, 预报 2005 年 10 月 1 日到 2008 年 2 月 28 日 ( 与 EOP PCC 预报时间段相同 ) 1 360 d 跨度的 LOD 变化值, 统计了预报结果的 MAE, 并与 EOP PCC 的结果进行了对比, 对比结果见图 4 6. 图 4 6 中不同颜色和不同形状线条分别代表参与 EOP PCC 的不同团队所得的预报误差, 参与此项竞赛的团队详细情况参见文献 [14]. 在图 4 5 中红色实线代表 Gross 团队的预报误差, 粉色实线代表 Kalarus 团队的预报误差, 蓝色虚线代表 Akyilmaz 团队的预报误差, 蓝色点划线代表 Kosek 团队的预报误差, 绿色实线绿色虚线和绿色点划线代表 Zotov 团队的预报误差, 黄色实线代表 Pasynok 团队的预报误差, 蓝色实线代表 Mendes Cerveira 团队的预报误差, 黑色实线代表本文预报误差 ; 在图 6 中黑色方形线条代表 Mendes Cerveira 团队的预报误差, 黑色三角形线条代表 Kosek 团队的预报误差, 黑色五角星线条代表 Gross 等的预报误差, 黑色圆形线条代表本文预报误差, 其中超

60 天文学报 56 卷短期 (1 10 d) 预报精度较高的团队是 Gross 和 Kalarus 团队, 短期 (1 30 d) 预报精度较高的团队是 Gross Kalarus 和 Kosek 团队, 而参与中期 (1 360 d) 预报竞赛的只有 Gross Kosek 以及 Mendes Cerveira 3 个团队. 从图 4 6 的比较中可以看出, 对于 1 4 d 的预报, GP 方法的预报精度低于排在第 1 位的 Gross 等和排在第 2 位的 Kalarus 等的预报精度, 从第 5 d 开始, GP 的预报精度优于 Kalarus 等的预报精度, 但仍低于排在第 1 位的 Gross 等的预报精度 ; 对于短期 (1 30 d) 预报, GP 的预报精度仅次于排在第 1 位的 Gross 等的预报精度, 与并列排在第 2 位的 Kalarus 等和 Kosek 等的预报精度大致相当 ; 对于中期预报, GP 的预报效果则不如 EOP PCC. 0.40 0.35 0.30 MAE/ ms 0.25 0.20 0.15 0.05 1 2 3 4 5 6 7 8 9 10 day in future 图 4 超短期 (1 10 d) MAE 对比 Fig. 4 The comparison of the predicted MAE for the ultra short-term (1 10 d) MAE/ ms 0.40 0.35 0.30 0.25 0.20 0.15 0.05 0 5 10 15 20 25 30 day in future 图 5 短期 (1 30 d) MAE 对比 Fig. 5 The comparison of the predicted MAE for the short-term (1 30 d)

1 期雷雨等 : 基于高斯过程的日长变化预报 61 0.50 0.40 MAE/ ms 0.30 0.20 0 60 120 180 240 300 360 day in future 图 6 中期 (1 360 d) MAE 对比 4 讨论与总结 Fig. 6 The comparison of the predicted MAE for the medium-term (1 360 d) 本文根据实验验证了 GP 用于 LOD 变化的可行性和有效性. 与 ANN 方法相比, GP 方法较容易实现, 并且它不需要太多的先验信息, 只需事先选择适当的协方差函数, 其超参数在训练过程中便可以自适应地确定, 从而可以避免预报的人为主观性, 提高预报结果的可信度. 通过实例发现, GP 方法用于 LOD 变化预报可以取得较好的预报效果. 通过与 ANN 预报结果以及与 EOP PCC 预报结果的比较发现, GP 方法的短期 (1 30 d) 预报精度较高, 但中期 (1 360 d) 预报精度则不如 ANN 预报精度和 EOP PCC 预报精度, 这可能是由本文所使用的递推预报模式的误差累积效应引起的, 对此可以尝试以下两种方法对 GP 中期预报精度进行改进, 一种是改进样本输入方式, 如采用连续输入方式或者跨度输入方式 [20 21], 另外一种方法是对 GP 模型进行在线训练, 本文暂不对此进行讨论. 在预报效率方面, 由于本文采用递推预报模式进行预报, 故只需一次模型计算便可以实现多步预报, 极大提高了预报效率. 对于跨度为 1 360 d 的预报, 应用 GP 方法预报 LOD 变化只需要 20 min 左右的时间, 而应用 ANN 则需要数小时, 预报效率大大提高, 这对于 ERP 的实时快速预报具有重要的现实意义. 此外, 基于 GP 方法预报 LOD 变化所需训练样本数量远远小于 ANN 所需样本量, 这在历史数据较少的情况下进行 LOD 变化的预报具有更高的现实意义. 由于协方差函数类型超参数选取方法以及样本输入方式等对 GP 方法的预报效果都有一定的影响, 因此, 如何从上述角度来优化 GP 模型以进一步提高 LOD 变化的预报精度是我们下一步的研究重点. 对此我们将另行文讨论. 致谢感谢 IERS 提供的 LOD 变化资料, 对中国科学院上海天文台郑大伟研究员提供的帮助表示由衷的感谢! [1] Gambis D, Luzum B. Metro, 2011, 48: 165 [2] McCarthy D D, Petit G. ITN, 2003, 13: 605 参考文献

62 天文学报 56 卷 [3] Schuh H, Ulrich M, Egger D, et al. JGeod, 2002, 76: 247 [4] Tomasz N, Kose W. JGeod, 2008, 82: 83 [5] 许雪晴, 周永宏. 飞行器测控学报, 2010, 29: 70 [6] Freedman A P, Steppe J A, Dickey J O, et al. JGR, 1994, 99: 6981 [7] Gross R S, Eubanks T M, Steppe J A, et al. JGeod, 1998, 72: 215 [8] 张晓红, 王琪洁, 朱建军, 等. 天文学报, 2011, 52: 322 [9] Zhang X H, Wang Q J, Zhu J J, et al. ChA&A, 2012, 36: 86 [10] 王琪洁, 廖德春, 周永宏. 科学通报, 2007, 52: 1728 [11] Wang Q J, Liao D C, Zhou Y H. ChSBu, 2008, 53: 969 [12] Akyilmaz O, Kutterer H. JGeod, 2004, 78: 82 [13] Kosek W, Kalarus M, Johnson T J. ArtSa, 2005, 40: 119 [14] Kalarus M, Schuh H, Kosek W, et al. JGeod, 2010, 84: 587 [15] Samanta B, Al-Balushi K R, Al-Araimi S A. JAGI, 2003, 16: 657 [16] Seeger M. IJNS, 2004, 14: 69 [17] 何志昆, 刘光斌, 赵曦晶, 等. 控制与决策, 2013, 28: 1121 [18] Brahim-Belhouari S, Bermak A. Computational Statistics & Data Analysis, 2004, 47: 705 [19] 刘冬, 张清华. 测绘学报, 2011, 40: 59 [20] 张晓红, 王琪洁, 朱建军, 等. 中国科学院上海天文台年刊, 2011, 32: 147 [21] Akyilmaz O, Kutterer H, Shum C K, et al. Applied Soft Computing, 2011, 11: 837 The Prediction of Length-of-day Variations Based on Gaussian Processes LEI Yu 1,2,3 ZHAO Dan-ning 1,3 GAO Yu-ping 1,2 CAI Hong-bing 1,2 (1 National Time Service Center, Chinese Academy of Sciences, Xi an 710600) (2 Key Laboratory of Time and Frequency Primary Standards, Chinese Academy of Sciences, Xi an 710600) (3 University of Chinese Academy of Sciences, Beijing 100049) ABSTRACT Due to the complicated time-varying characteristics of the length-of-day (LOD) variations, the accuracies of traditional strategies for the prediction of the LOD variations such as the least squares extrapolation model, the time-series analysis model, and so on, have not met the requirements for real-time and high-precision applications. In this paper, a new machine learning algorithm the Gaussian process (GP) model is employed to forecast the LOD variations. Its prediction precisions are analyzed and compared with those of the back propagation neural networks (BPNN), general regression neural networks (GRNN) models, and the Earth Orientation Parameters Prediction Comparison Campaign (EOP PCC). The results demonstrate that the application of the GP model to the prediction of the LOD variations is efficient and feasible. Key words astrometry, time, methods: data analysis

54 天 文 学 报 56 卷 潮 汐 项 可 以 由 国 际 地 球 自 转 与 参 考 系 服 务 (International Earth Rotation and Reference Systems Service, IERS) 协 议 给 出 的 模 型 精 确 确 定 [2], 而 非

54 天文学报 56 卷潮汐项可以由国际地球自转与参考系服务 (International Earth Rotation and Reference Systems Service, IERS) 协议给出的模型精确确定 [2], 而非