Methodology Chin J Evid-based Med 2016, 16(8): 972-977 手 机 健 康 管 理 类 应 用 纵 向 大 数 据 管 理 与 统 计 分 析 徐 海 鹏 1, 董 冲 亚 2, 阎 小 妍 2, 姚 晨 1,2* 1. 北 京 大 学 第 一 医 院 ( 北 京 100034);2. 北 京 大 学 临 床 研 究 所 ( 北 京 100191) 摘 要 目 的 探 索 移 动 医 疗 健 康 管 理 类 手 机 应 用 程 序 (APP) 收 集 的 纵 向 大 数 据 的 数 据 管 理 及 统 计 分 析 方 法 方 法 对 健 康 管 理 类 APP 数 据 特 点 进 行 总 结, 提 出 针 对 该 类 数 据 的 数 据 管 理 及 统 计 分 析 方 法, 并 通 过 一 个 女 性 月 经 管 理 APP 实 例 具 体 说 明 上 述 方 法 的 实 施 过 程 结 果 健 康 管 理 类 APP 数 据 属 于 纵 向 大 数 据,APP 原 始 记 录 需 要 通 过 相 应 的 运 算 方 法 提 取 信 息 后 可 用 于 统 计 分 析 因 此 在 数 据 管 理 中, 需 采 用 针 对 原 始 数 据 和 提 取 后 的 二 次 数 据 进 行 两 步 清 理 该 类 数 据 的 统 计 分 析 可 采 用 混 合 效 应 模 型 等 纵 向 数 据 的 分 析 方 法 结 论 健 康 管 理 类 APP 数 据 经 过 特 定 的 数 据 管 理 和 统 计 分 析 可 用 于 医 学 科 研, 数 据 管 理 中 对 可 疑 数 据 应 优 先 做 剔 除 处 理 ; 统 计 分 析 涉 及 大 量 数 据 的 运 算, 使 用 云 计 算 手 段 可 以 提 高 运 算 速 度 关 键 词 移 动 医 疗 ; 健 康 管 理 ; 手 机 应 用 程 序 ; 纵 向 数 据 ; 大 数 据 Data Management and Statistical Analysis of Longitudinal Big Data Collected from Mobile Health Management Applications XU Hai-peng 1, DONG Chong-ya 2, YAN Xiao-yan 2, YAO Chen 1,2* 1. Peking University First Hospital, Beijing 100034, China; 2. Peking University Clinical Research Institute, Beijing 100191, China Abstract Objective To explore the methods of data management and statistical analysis for longitudinal big data collected from mobile health management applications (APP). Methods The data management process and statistical analysis method were proposed by summarizing the characteristics of the data from mobile health management APPs. The methods would be clarified by a practical case: an APP recording female menstruation. Results The data from health management APPs belong to longitudinal big data and the original record of the APP should be reprocessed or computed before conducting statistical analysis. A two-step data cleaning procedure was suggested for data management of the original records and reprocessed data, and longitudinal models such as mixed models was recommended for statistical analysis. Conclusions The data from health management APPs could be used for medical research via specific data management and statistical analysis after removing suspicious data. Cloud computing could be a viable method to improve efficiency of the big data analysis of health management APPs. Key words Mobile health; Health management; APP; Longitudinal data; Big data 移 动 医 疗 是 以 智 能 手 机 为 依 托 的 电 子 医 疗 手 段, 用 来 记 录 处 理 分 析 和 传 递 健 康 相 关 信 息 [1] 近 年 来, 随 着 智 能 手 机 技 术 和 用 户 量 的 普 及 和 人 们 对 自 我 健 康 管 理 的 需 求 逐 渐 提 升, 各 种 类 型 的 健 康 管 理 收 集 应 用 软 件 (APP) 应 运 而 生, 包 括 健 身 饮 食 用 药 提 醒 等 生 活 方 式 类 健 康 管 理, 也 包 括 具 体 疾 病 治 疗 管 理 如 糖 尿 病 高 血 压 精 神 疾 患 等 [2] 2015 年 初, 中 国 医 疗 健 康 类 APP 已 经 达 到 2 000 多 款 [3] 大 量 的 健 康 相 关 信 息 汇 集 到 APP 开 发 者 手 DOI: 10.7507/1672-2531.20160149 作 者 简 介 : 徐 海 鹏, 男 (1988 年 ~), 硕 士 研 究 生, 以 临 床 试 验 数 据 管 理 与 统 计 分 析 为 主 要 研 究 方 向 Email: xuhaipeng@pku.edu.cn * 通 讯 作 者,Email: yaochen@hsc.pku.edu.cn 中 这 其 中 包 括 用 户 主 动 记 录 的 如 饮 食 月 经 等 数 据, 也 包 括 各 类 传 感 器 ( 如 手 机 中 的 动 作 感 应 器, 与 手 机 关 联 的 各 类 可 穿 戴 智 能 设 备 等 ) 记 录 的 用 户 客 观 行 为 数 据, 比 如 走 路 睡 眠 心 跳 体 重 等 数 据 有 效 利 用 这 类 数 据 将 为 医 学 科 研 提 供 新 的 思 路 和 手 段 国 外 已 有 APP 开 发 者 和 科 研 机 构 合 作 利 用 此 类 数 据 进 行 医 学 科 研, 这 其 中 比 较 知 名 的 是 苹 果 公 司 于 2015 年 3 月 发 布 的 ResearchKit 系 列 APP, 用 以 开 展 心 血 管 疾 病 糖 尿 病 乳 腺 癌 等 领 域 的 科 学 研 究 [4] 首 都 医 科 大 学 宣 武 医 院 陈 彪 教 授 团 队 也 参 与 了 其 中 帕 金 森 病 APP 的 设 计 工 作 目 前 鲜 有 科 研 机 构 利 用 国 内 的 健 康 管 理 类 APP 的 数 据 进 行 科 学 研 究 本 文 从 总 结 常 见 健 康 管 理 类 APP 数 据 特 点 出 发, 972 2016 Editorial Board of Chin J Evid-based Med
中 国 循 证 医 学 杂 志 2016, 16(8): 972~977 探 索 对 于 相 同 类 型 的 大 数 据 管 理 及 统 计 分 析 的 方 法, 并 通 过 一 个 作 者 参 与 的 研 究 实 例, 利 用 女 性 月 经 管 理 APP 的 数 据, 介 绍 具 体 操 作 流 程 和 经 验 1 资 料 与 方 法 1.1 健 康 管 理 类 APP 的 数 据 特 点 1.1.1 一 个 横 库 与 多 个 纵 库 的 组 合 形 式 健 康 管 理 类 APP 数 据 库 常 见 的 构 成 形 式 为 一 个 横 向 数 据 库 与 多 个 纵 向 数 据 库 的 组 合 横 向 库 中 保 存 用 户 的 基 本 信 息, 以 用 户 的 性 别 地 址 等 类 似 数 据 构 成, 横 库 中 常 常 包 含 用 户 的 一 些 敏 感 信 息, 如 姓 名 电 话 电 子 邮 箱 等 APP 相 应 记 录 功 能 的 每 一 个 模 块 又 对 应 着 一 个 纵 向 数 据 库, 其 包 含 的 信 息 为 事 件 类 型 数 值 记 录 的 时 间 例 如 APP 中 体 重 记 录 模 块 会 记 录 用 户 每 次 测 量 体 重 的 具 体 数 值 和 时 间 该 类 数 据 为 标 准 的 纵 向 数 据 横 库 和 纵 库 通 过 用 户 的 唯 一 编 码 进 行 关 联 具 体 如 图 1 所 示 1.1.2 数 据 量 大 健 康 管 理 类 APP 的 数 据 量 大 体 现 在 两 个 层 面 第 一 层 面 为 用 户 量 层 面, 应 用 商 店 中 用 户 量 为 千 万 级 别 的 热 门 健 康 管 理 APP 越 来 越 多 第 二 层 面 为 用 户 的 记 录 层 面, 健 康 管 理 类 APP 记 录 的 数 据, 尤 其 是 客 观 记 录 的 传 感 器 数 据, 包 括 用 户 记 录 的 走 步 运 动 睡 眠 等 信 息, 单 位 用 户 本 身 的 原 始 记 录 量 是 巨 大 的 而 近 年 来, 社 交 元 素 也 加 入 到 了 健 康 管 理 类 APP 中, 这 也 促 使 了 这 类 APP 吸 引 了 大 量 用 户 进 行 长 期 的 详 细 的 信 息 记 录 1.1.3 原 始 记 录 需 进 一 步 信 息 提 取 这 类 APP 所 记 录 的 原 始 数 据 往 往 不 能 直 接 被 利 用, 比 如 用 户 记 方 法 学 录 的 走 步 实 际 数 据 库 中 的 原 始 数 据 为 某 一 步 伐 发 生 的 具 体 时 间, 用 户 记 录 的 睡 眠 数 据 实 际 为 睡 眠 开 始 时 间 结 束 时 间, 某 一 时 间 段 的 深 睡 眠 和 浅 睡 眠 的 开 始 时 间 结 束 时 间 但 进 行 统 计 分 析 时, 原 始 数 据 需 要 进 行 进 一 步 的 信 息 提 取, 以 获 得 符 合 统 计 分 析 目 的 数 据, 如 每 日 步 数, 睡 眠 总 时 长 等 1.1.4 数 据 质 量 差 健 康 管 理 类 APP 的 数 据 质 量 在 不 同 的 数 据 类 型 中 有 一 定 差 异 例 如 实 例 中 的 女 性 月 经 管 理 数 据 和 用 户 的 膳 食 记 录 数 据, 均 属 于 用 户 自 报 型 数 据 受 本 身 数 据 收 集 形 式 所 限, 数 据 质 量 较 差 而 运 动 数 据 睡 眠 数 据 这 类 被 动 收 集 的 数 据, 数 据 本 身 来 自 于 传 感 器 的 客 观 数 据, 因 此 质 量 较 好 但 其 受 该 传 感 器 所 限, 例 如 忘 记 佩 戴 设 备 电 量 不 足 佩 戴 方 式 不 正 确 等, 会 导 致 实 际 记 录 到 的 数 据 并 非 完 整 的 用 户 行 为 数 据 另 外, 由 于 APP 缺 乏 其 他 信 息 的 辅 助, 对 于 异 常 数 据, 无 法 判 断 该 异 常 数 据 是 用 户 本 身 的 状 态 异 常 还 是 由 于 错 误 记 录 产 生 1.2 健 康 管 理 类 APP 的 纵 向 数 据 管 理 1.2.1 数 据 脱 敏 与 传 输 利 用 APP 中 用 户 记 录 的 健 康 相 关 数 据, 保 护 用 户 的 隐 私 至 关 重 要 APP 数 据 库 包 含 用 户 注 册 和 使 用 过 程 中 的 敏 感 信 息, 如 电 话 号 码 电 子 邮 箱 密 码 等 信 息 数 据 脱 敏 的 目 的 就 是 将 敏 感 信 息 去 除, 以 保 护 用 户 隐 私 此 过 程 建 议 由 APP 开 发 者 完 成, 数 据 完 成 脱 敏 后 使 用 加 密 方 式 传 输 至 分 析 单 位 1.2.2 原 始 记 录 的 清 理 对 于 原 始 记 录 的 数 据 清 理, 采 用 的 方 法 同 常 规 数 据 的 清 理 方 式, 主 要 去 除 缺 失 值 重 复 记 录 异 常 记 录 等 图 1 横 向 库 和 纵 向 库 2016 中 国 循 证 医 学 杂 志 编 辑 部 973
Methodology 1.2.3 信 息 提 取 最 常 见 的 信 息 提 取 方 法 为 按 照 某 一 特 定 时 间 段 对 原 始 数 据 进 行 归 纳 汇 总 例 如 通 过 对 计 步 器 的 原 始 数 据 以 天 为 单 位 进 行 计 数, 则 可 获 得 每 位 用 户 每 天 的 走 路 步 数 对 用 户 饮 食 记 录 以 天 为 单 位 进 行 归 纳 汇 总, 可 获 得 用 户 每 日 的 能 量 及 营 养 素 摄 入 此 外, 特 定 研 究 中 需 要 获 得 两 个 特 定 事 件 间 隔 时 间, 如 通 过 用 户 睡 眠 结 束 与 开 始 的 时 间 差 获 得 用 户 每 日 的 睡 眠 时 长, 通 过 用 户 本 月 月 经 开 始 日 期 和 上 月 月 经 开 始 日 期 的 获 得 本 次 月 经 周 期 天 数 具 体 数 据 库 操 作 的 方 式 为 以 用 户 为 单 位 进 行 错 位 相 减, 具 体 操 作 见 表 1 1.2.4 二 次 数 据 的 清 理 原 始 数 据 经 过 适 当 方 法 进 行 信 息 提 取 得 到 二 次 数 据 后, 对 于 二 次 数 据 采 用 类 似 的 方 法 进 行 缺 失 值 异 常 值 的 清 理 若 发 现 的 缺 失 值 异 常 值 来 源 于 原 始 数 据 异 常, 需 对 原 始 数 据 进 行 清 理, 并 同 时 再 次 进 行 信 息 提 取 生 成 更 新 后 的 二 次 数 据 库 1.2.5 筛 选 可 靠 用 户 数 据 与 信 息 库 合 并 为 保 证 数 据 的 可 靠 性, 建 议 在 获 得 清 理 后 的 二 次 数 据 后, 筛 选 出 数 据 记 录 详 实 的 用 户 可 限 定 所 保 留 的 用 户 最 少 记 录 条 数, 已 筛 选 出 相 对 活 跃 用 户 的 记 录, 数 据 更 可 靠 将 筛 选 后 的 数 据 ( 纵 库 ) 和 用 户 信 息 库 ( 横 库 ) 合 并, 在 纵 库 里 获 得 横 库 中 的 受 试 者 信 息 具 体 的 数 据 管 理 过 程 如 图 2 1.3 统 计 分 析 方 法 经 过 数 据 管 理 后 的 健 康 管 理 类 APP 数 据 符 合 如 下 特 点 :1 数 据 为 纵 向 大 数 据 ;2 每 位 用 户 的 记 录 次 数 和 记 录 时 间 点 不 一 定 相 同 ;3 不 同 时 点 的 观 测 值 可 能 存 在 相 关 性 本 类 资 料 需 根 据 数 据 类 型 的 不 同, 对 数 值 型 资 料 可 采 用 混 合 效 应 模 型 [5,6], 对 分 类 型 资 料 可 采 用 广 义 混 合 线 性 模 型 和 广 义 估 计 方 程 进 行 分 析 [7,8] Chin J Evid-based Med 2016, 16(8): 972-977 据 最 终 数 据 管 理 的 过 程 和 结 果 见 表 2 3 2.3 统 计 分 析 过 程 与 结 果 数 据 管 理 所 获 得 的 用 户 月 经 周 期 长 度 为 纵 向 大 数 据, 且 不 同 用 户 记 录 时 点 和 记 录 次 数 不 一 定 相 同, 本 例 采 用 混 合 效 应 模 型 进 行 数 据 分 析 因 变 量 是 用 户 的 月 经 周 期 长 度, 自 变 量 为 开 始 观 测 时 的 用 户 年 龄 观 察 时 间 由 于 女 性 本 次 月 经 周 期 长 度 与 上 次 月 经 周 期 长 度 存 在 较 强 的 相 关 性, 因 此 采 用 一 阶 自 回 归 结 构 [AR(1)] 作 为 残 差 自 回 归 矩 阵 的 结 构, 模 型 及 参 数 估 计 的 结 果 如 表 4 5 由 表 5 固 定 效 应 的 模 型 参 数 估 计 可 知, 时 间 的 回 归 系 数 有 统 计 学 意 义, 时 间 与 年 龄 交 互 项 的 回 归 系 数 18 ~ 岁 有 统 计 学 意 义, 年 龄 别 中 除 了 30 ~ 岁, 其 他 组 别 回 归 系 数 均 有 统 计 学 差 异 月 经 周 期 18 岁 后 随 着 年 龄 别 增 大 先 变 大 后 变 小 时 间 因 素 有 统 计 学 意 义, 同 一 用 户, 月 经 周 期 长 度 也 会 随 着 时 间 变 短, 这 可 能 与 女 性 雌 激 素 水 平 和 卵 巢 储 备 功 能 下 降 有 关 [9,10] 时 间 与 年 龄 别 的 交 互 作 用 可 知, 随 表 1 错 位 相 减 操 作 示 例 用 户 ID 原 始 记 录 原 始 记 录 向 后 错 1 位 错 位 相 减 用 户 1 月 经 开 始 日 期 1 用 户 1 月 经 开 始 日 期 2 月 经 开 始 日 期 1 月 经 周 期 1 用 户 1 月 经 开 始 日 期 3 月 经 开 始 日 期 2 月 经 周 期 2 用 户 1 月 经 开 始 日 期 4 月 经 开 始 日 期 3 月 经 周 期 3 用 户 1 月 经 开 始 日 期 5 月 经 开 始 日 期 4 月 经 周 期 4 用 户 1 月 经 开 始 日 期 6 月 经 开 始 日 期 5 月 经 周 期 5 用 户 1 月 经 开 始 日 期 6 2 实 例 分 析 2.1 实 例 数 据 介 绍 本 实 例 所 使 用 的 数 据 来 源 于 某 互 联 网 公 司 开 发 的 女 性 月 经 管 理 APP 该 APP 的 核 心 功 能 是 用 户 记 录 每 月 经 开 始 日 期 及 结 束 日 期 以 获 得 下 次 月 经 的 预 测 和 提 醒 用 户 每 月 定 期 记 录 月 经 开 始 事 件 (eventtype=1) 及 结 束 事 件 (eventtype=2)( 图 3),APP 实 现 月 经 周 期 的 记 录 及 预 测 本 研 究 使 用 的 数 据 为 该 公 司 从 注 册 用 户 的 前 100 万 活 跃 用 户 中 随 机 抽 选 的 15 万 用 户, 截 至 时 间 为 2015 年 2 月 1 日 以 前 的 数 据 2.2 数 据 管 理 过 程 与 结 果 通 过 两 次 月 经 开 始 的 间 隔 获 得 月 经 周 期 的 数 974 图 2 数 据 管 理 流 程 2016 Editorial Board of Chin J Evid-based Med
中 国 循 证 医 学 杂 志 2016, 16(8): 972~977 方 法 学 图 3 用 户 记 录 与 数 据 存 储 形 式 表 2 数 据 管 理 过 程 步 骤 名 称 具 体 说 明 1 去 除 重 复 观 测 对 于 ID 编 号 日 期 事 件 类 型 的 重 复 记 录, 仅 保 留 第 一 条 记 录 2 日 期 筛 选 仅 保 留 软 件 上 线 日 期 2012 年 1 月 1 日 至 获 得 数 据 日 期 2015 年 2 月 1 日 之 间 的 数 据 3 剔 除 异 常 值 缺 失 值 删 除 月 经 开 始 事 件 以 外 的 其 他 记 录 4 计 算 月 经 周 期 长 度, 剔 除 月 经 周 期 过 短 数 据 进 行 错 位 相 减, 后 一 次 月 经 开 始 日 期 与 前 一 次 月 经 开 始 日 期 之 差 为 本 次 月 经 周 期 长 度, 若 计 算 所 得 月 经 周 期 过 短 ( 小 于 3 天 ), 为 用 户 短 时 间 连 续 记 录 月 经 开 始 事 件, 仅 保 留 最 早 开 始 事 件, 其 余 从 原 始 记 录 剔 除 5 重 复 步 骤 4 从 原 始 数 据 删 除 异 常 记 录 后 需 重 新 计 算 月 经 周 期 6 提 取 异 常 值 针 对 每 位 用 户, 删 除 其 月 经 周 期 小 于 10 天 及 大 于 100 天 的 周 期 记 录 7 筛 选 记 录 详 细 的 用 户 仅 保 留 具 有 5 个 及 以 上 月 经 周 期 记 录 的 用 户 表 3 数 据 管 理 结 果 记 录 用 户 步 骤 名 称 清 理 前 记 录 条 数 清 理 记 录 条 数 清 理 记 录 数 占 比 (%) 清 理 前 用 户 数 清 理 用 户 数 清 理 用 户 数 占 比 (%) 1 去 除 重 复 观 测 1 867 236 12 0.00 155 842 0 0.00 2 日 期 筛 选 1 867 224 77 810 4.17 155 842 26 0.02 3 剔 除 异 常 值 缺 失 值 1 789 414 20 739 1.16 155 816 18 0.01 4 计 算 月 经 周 期, 剔 除 月 经 1 768 675 39 451 2.23 155 798 0 0.00 周 期 过 短 数 据 5 重 复 步 骤 4 1 729 224 0 0.00 155 798 0 0.00 6 提 取 异 常 值 1 573 426 21 708 1.38 150 382 525 0.35 7 筛 选 记 录 详 细 的 用 户 1 551 718 98 393 6.34 149 857 38 536 25.72 表 4 月 经 周 期 影 响 因 素 分 析 结 果 ( 固 定 效 应 的 Type3 检 验 ) 效 应 自 由 度 F 值 P 年 龄 组 别 3 582.60 <0.001 时 间 1 5 587.35 <0.001 时 间 年 龄 组 别 3 9.94 <0.001 着 年 龄 增 大, 月 经 周 期 随 时 间 变 化 的 幅 度 下 降 2016 中 国 循 证 医 学 杂 志 编 辑 部 3 讨 论 3.1 数 据 管 理 需 做 原 始 数 据 和 二 次 数 据 的 两 步 清 理 由 于 移 动 健 康 管 理 APP 记 录 的 原 始 数 据 往 往 不 能 直 接 用 于 统 计 分 析, 因 此 需 要 对 其 进 行 运 算 或 处 理 以 获 得 可 供 统 计 分 析 的 二 次 数 据 因 此, 相 应 的 数 据 管 理 也 应 采 用 两 步 清 理 的 过 程, 针 对 原 始 记 录 和 原 始 记 录 生 成 的 二 次 数 据 均 需 要 清 理 且 二 次 975
Methodology Chin J Evid-based Med 2016, 16(8): 972-977 表 5 AR(1) 模 型 参 数 估 计 结 果 ( 固 定 效 应 的 解 ) 固 定 效 应 参 数 估 计 标 准 误 t P 常 数 项 32.120 0.095 339.83 <0.001 年 龄 组 (30 ~) 0.136 0.101 1.35 0.1763 年 龄 组 (25 ~) 0.705 0.098 7.20 <0.001 年 龄 组 (18 ~) 0.520 0.097 5.35 <0.001 年 龄 组 (<18) 0 时 间 0.122 0.011 11.14 <0.001 时 间 年 龄 组 (30 ~) 0.009 0.011 0.83 0.4083 时 间 年 龄 组 (25 ~) 0.015 0.011 1.38 0.1665 时 间 年 龄 组 (18 ~) 0.027 0.011 2.43 0.0150 时 间 年 龄 组 (<18) 0 表 6 数 据 管 理 与 分 析 步 骤 普 通 计 算 机 与 服 务 器 处 理 时 间 对 比 项 目 步 骤 计 算 机 时 间 (s) 服 务 器 时 间 (s) 计 算 机 时 间 / 服 务 器 时 间 数 据 管 理 去 除 重 复 观 测 3.20 1.18 2.71 日 期 筛 选 1.03 0.92 1.12 剔 除 异 常 值 缺 失 值 2.24 0.96 2.33 计 算 月 经 周 期, 剔 除 月 经 周 期 过 短 数 据 7.13 4.41 1.62 重 复 步 骤 4 6.09 1.43 4.26 提 取 异 常 值 0.76 0.34 2.24 筛 选 记 录 详 细 的 用 户 3.38 1.81 1.87 小 计 23.83 11.05 2.16 统 计 分 析 月 经 周 期 分 析 2 509.02 761.11 3.30 合 计 2 532.85 772.16 3.28 计 算 机 :Windows 10,RAM 8G,64 位,Intel Core i7 四 核 ; 云 计 算 平 台 :Windows Server 2012 R2,RAM 32G,64 位,Intel Xeon E5 16 核 数 据 清 理 过 程 中 若 需 要 对 原 始 记 录 进 行 再 次 清 理, 应 重 新 运 算 清 理 后 的 原 始 数 据, 生 成 新 的 二 次 数 据 3.2 使 用 服 务 器 或 云 计 算 处 理 数 十 万 用 户 数 百 万 条 的 记 录, 将 会 对 配 置 不 高 的 计 算 机 产 生 比 较 大 的 挑 战 使 用 高 配 置 的 服 务 器 去 处 理 这 类 大 数 据 将 提 高 程 序 的 运 行 效 率 若 不 具 备 服 务 器 条 件, 可 考 虑 租 用 互 联 网 云 服 务 在 处 理 实 例 中 的 数 据 时, 对 于 需 要 大 内 存, 长 时 间 运 行 的 循 环 程 序, 笔 者 尝 试 租 用 的 国 内 某 网 络 公 司 的 云 计 算 服 务, 将 程 序 运 算 托 管 到 云 服 务 器 进 行 处 理, 获 得 了 比 较 理 想 的 使 用 效 果, 具 体 程 序 运 行 时 间 比 较 见 表 6 3.3 可 疑 数 据 一 般 直 接 做 剔 除 处 理 由 于 数 据 质 量 问 题, 需 要 对 原 始 数 据 以 及 原 始 数 据 产 生 的 信 息 数 据 均 进 行 数 据 清 理 由 于 无 法 判 断 异 常 数 据 是 用 户 本 身 的 状 态 异 常 产 生 还 是 由 于 错 误 记 录 产 生, 在 大 数 据 对 于 数 据 量 有 保 障 的 前 提 下, 将 可 疑 数 据 直 接 做 剔 除 处 理, 一 般 不 对 可 疑 数 据 进 行 矫 正 或 填 补, 以 最 大 程 度 保 证 剩 余 数 据 的 真 实 性 也 正 因 为 此, 对 于 该 类 数 据 的 统 计 分 析, 除 非 APP 中 能 鉴 别 异 常 数 据 为 用 户 真 实 异 常 数 据, 分 析 应 侧 重 于 用 户 的 正 常 数 据 3.4 局 限 性 和 总 结 本 研 究 通 过 对 移 动 医 疗 健 康 管 理 类 APP 数 据 特 点 进 行 总 结, 提 出 该 类 型 数 据 的 数 据 管 理 和 统 计 分 析 方 法 的 建 议, 并 通 过 一 个 女 性 月 经 管 理 APP 实 例 具 体 展 示 实 施 过 程, 旨 在 说 明 可 以 通 过 特 定 的 数 据 管 理 和 统 计 分 析 方 法 处 理 移 动 医 疗 健 康 管 理 类 APP 纵 向 大 数 据, 供 科 学 研 究 实 例 中 的 APP 数 据 量 巨 大, 但 由 于 APP 并 非 针 对 科 研 设 计, 所 以 数 据 中 包 含 的 信 息 比 较 有 限, 仅 包 含 月 经 开 始 结 束 日 期 以 及 用 户 信 息 库 中 的 年 龄 及 地 域 信 息 为 了 更 有 效 地 利 用 该 APP 本 身 庞 大 的 用 户 群 体 开 展 更 有 针 对 性 的 科 研, 研 究 团 队 利 用 该 APP 向 用 户 投 放 了 三 次 问 卷 调 查, 主 题 分 别 为 : 女 性 生 活 习 惯 调 查 更 多 的 女 性 生 活 习 惯 女 性 生 理 健 康 在 15 天 内 共 回 收 57 135 份 问 卷 这 种 利 用 APP 本 身 庞 大 用 户 群 并 以 APP 作 为 调 查 工 具 的 模 式 值 得 继 续 探 索 和 推 广 研 究 在 一 定 程 度 上 将 实 例 中 介 绍 的 方 法 外 推 至 其 他 应 用 场 景 但 研 究 的 局 限 976 2016 Editorial Board of Chin J Evid-based Med
中 国 循 证 医 学 杂 志 2016, 16(8): 972~977 在 于 健 康 管 理 类 APP 种 类 繁 多, 所 介 绍 的 方 法 可 能 无 法 适 用 于 所 有 情 况 本 研 究 得 到 了 互 联 网 公 司 团 队 数 据 及 统 计 团 队 临 床 团 队 三 方 的 支 持 为 了 更 好 地 将 这 一 类 数 据 加 以 合 理 的 利 用, 提 高 数 据 质 量 和 信 息 量, 以 获 得 更 有 价 值 的 产 出, 需 要 临 床 团 队 进 行 顶 层 设 计, 互 联 网 公 司 提 供 研 究 人 群 和 研 究 平 台, 数 据 管 理 和 统 计 团 队 提 供 相 应 技 术 支 持 这 种 跨 领 域 多 学 科 合 作 形 式 需 要 进 一 步 深 化 和 加 强 参 考 文 献 1 Adibi S. Mobile Health: A Technology Road Map. Available at: http://link.springer.com/book/10. 1007%2F978-3-319-12817-7. 2 王 小 岩, 罗 仁. 美 国 移 动 医 疗 健 康 App 应 用 状 况 的 研 究 与 分 析. 中 国 数 字 医 学, 2015, 10(11): 2-6. 3 中 国 医 药 物 资 协 会. 2014 中 国 医 药 互 联 网 发 展 报 告. Available at: http://health.gmw.cn/yp/2015-02/03/content_14731574.htm. 方 法 学 4 Apple Inc. ResearchKit and CareKit. Available at: https://www. apple.com/researchkit/. 5 余 松 林, 向 惠 云. 重 复 测 量 资 料 分 析 方 法 与 SAS 程 序. 北 京 : 科 学 出 版 社, 2004: 136-162. 6 陈 峰, 姚 晨, 孙 高, 等. 新 药 临 床 试 验 中 重 复 测 量 资 料 的 混 合 效 应 模 型. 中 国 卫 生 统 计, 2000, 17(6): 373-376. 7 罗 天 娥, 刘 桂 芬. 广 义 线 性 混 合 效 应 模 型 在 分 类 重 复 测 量 资 料 中 的 应 用. 中 国 卫 生 统 计, 2007, 24(5): 486-487. 8 高 茂 龙. 分 类 重 复 测 量 资 料 广 义 估 计 方 程 应 用. 山 西 : 山 西 医 科 大 学, 2007: 1-47. 9 赖 爱 鸾, 孙 艳 格, 张 李 松, 等. 性 激 素 年 龄 月 经 模 式 变 化 对 卵 巢 储 备 功 能 的 预 测 价 值. 中 国 实 用 妇 科 与 产 科 杂 志, 2010, 26(9): 717-719. 10 刘 继 龙, 林 春 莲, 蒙 钟 明, 等. 年 龄 及 性 激 素 预 测 卵 巢 储 备 功 能 的 临 床 研 究. 基 层 医 学 论 坛, 2013, 17(1): 3-4. 收 稿 日 期 :2016 03 30 修 回 日 期 :2016 07 07 本 文 编 辑 : 樊 斯 斯 张 永 刚 2016 中 国 循 证 医 学 杂 志 编 辑 部 977