量性资料的分析 ( 上 ) 护理本科生核心课程 护理研究 复旦大学护理学院邢唯杰 xingweijie@fudan.edu.cn
1 基本概念 变异 个体之间的差异 生物医学数据最显著的特征 统计的任务就是从同质性与变异性出发, 揭示事物规律
1 基本概念 总体与样本 总体 : 根据研究目的而确定的同质观察单位的全体 样本 : 从总体中抽取的部分观察单位 调查或干预的对象是样本, 而统计的目的是从样本来推测总体
1 基本概念 抽样误差 由于抽样的偶然性而出现的样本指标与总体指标之间的差异 抽样误差无法避免 随机抽样 增加样本量可减少抽样误差
1 基本概念 概率 描述随机事件发生可能性大小的一个估计 必然事件 :p=1 不可能事件 :p=0 小概率事件 :p 0.05
1 基本概念 假设检验 / 统计推断 由样本的差异去推断样本所代表的总体之间是否存在差异 6 岁农村男孩身高 < 6 岁城市男孩身高? 100 名 6 岁农村男孩身高 < 100 名 6 岁城市男孩身高
2 总体思路 确认结局指标 ( 因变量 ) 的资料类型 计量资料 : 年龄 工作年限 科研能力总分 计数资料 : 性别 婚姻状况 所在医院 科研能力高 / 低 等级资料 : 月收入 学历 职位 职称 科研能力高 / 中 / 低 确认样本的组数和比较的形式 两个独立样本比较? 多个独立样本比较? 两个配对样本比较? 多个配对样本比较? 两个变量之间的相关性分析?
3 计量资料的统计分析 计量资料 正态分布 样本统计描述 : 均数 ± 标准差单样本与总体 比较 : 单样本 t 检验两个独 立样本 比较 : 独 立样本 t 检验由样本推断总体两个配对样本 比较 : 配对 t 检验多个独 立样本 比较 : 单因素 方差分析多个 非独 立样本 比较 : 重复测量 方差分析分析变量间的关联与另 一个计量资料的关系 :Pearson 相关分析与多个变量之间的关系 : 回归分析样本统计描述 : 中位数 四分位数间距单样本与总体 比较 : 单样本秩和检验 偏态分布 由样本推断总体 两个独 立样本 比较 :Mann-Whitney 秩和检验 配对资料 比较 :Wilcoxon 符号秩和检验 多个独 立样本 比较 :Kruskal-Wallis 秩和检验 分析两变量间的关联 :Kendall 相关分析
3 计量资料的统计分析 计量资料 正态分布 样本统计描述 : 均数 ± 标准差单样本与总体 比较 : 单样本 t 检验两个独 立样本 比较 : 独 立样本 t 检验由样本推断总体两个配对样本 比较 : 配对 t 检验多个独 立样本 比较 : 单因素 方差分析多个 非独 立样本 比较 : 重复测量 方差分析分析变量间的关联与另 一个计量资料的关系 :Pearson 相关分析与多个变量之间的关系 : 回归分析样本统计描述 : 中位数 四分位数间距单样本与总体 比较 : 单样本秩和检验 偏态分布 由样本推断总体 两个独 立样本 比较 :Mann-Whitney 秩和检验 配对资料 比较 :Wilcoxon 符号秩和检验 多个独 立样本 比较 :Kruskal-Wallis 秩和检验 分析两变量间的关联 :Kendall 相关分析
3 计量资料的统计分析 1. 判断资料是否符合正态分布 Mean
3 计量资料的统计分析 1. 判断资料是否符合正态分布 : 正态性检验 举例 :534 名护 士的科研能 力总分, 是否符合正态分布? SPSS 实现 : 分析 非参数检验 单样本 K-S 检验图形 直 方图 绘制正态分布曲线
3 计量资料的统计分析 2. 正态分布资料的统计描述 : 均数 ± 标准差 均数 : 表达资料的集中趋势 标准差 : 表达资料的离散趋势 534 名护 士的科研能 力总体情况如何? SPSS 实现 : 分析 描述统计 描述 选择统计量
3 计量资料的统计分析 3. 单个样本与总体比较 : 单样本 t 检验 将样本均数与已知总体均数比较 样本分布须为正态分布 举例 :534 名护 士的科研能 力处于何种 水平?( 低于 100 分为良好 ) SPSS 实现 : 分析 比较均值 单样本 t 检验
3 计量资料的统计分析 4. 两个独立样本比较 : 两独立样本 t 检验 两个样本均为正态分布 且方差齐 常用于寻找影响结局的单个影响因素 或用于随机 非随机对照研究的结果分析 举例 : 这 534 名护 士中, 高学历组与低学历组相比, 科研能 力评分是否存在差异呢? SPSS 实现 : 分析 比较均值 独立样本 t 检验 选择检验变量 ( 因变量 ) 和分组变量 ( 自变量 )
3 计量资料的统计分析 5. 两个非独立样本比较 : 配对样本 t 检验 两个样本之间存在关系 样本分布均为正态分布 常用于自身前后对照试验的结果分析 举例 :534 名护 士接受了在线课程学习, 学习前后科研能 力是否提 高呢? SPSS 实现 : 分析 比较均值 配对样本 t 检验 成对选择检验变量 ( 因变量 )
3 计量资料的统计分析 6. 多个独立样本比较 : 单因素方差分析 三个及以上样本的比较 样本均为正态分布 且方差齐 常用于寻找影响结局的单个影响因素 或用于三组及以上的随机 非随机对照研究的结果分析 举例 : 八所的护 士相比, 科研能 力评分是否存在差异呢? SPSS 实现 : 分析 比较均值 单因素 ANOVA 选择检验变量 ( 因变量 ) 和因 子 ( 自变量 ) 两两比较
3 计量资料的统计分析 7. 因变量为计量资料的影响因素分析 单因素分析 自变量为二分类资料 ( 如学历高 低 ): 两独立样本 t 检验 自变量为无序多分类资料 ( 如八所医院 ): 单因素方差分析 自变量为有序多分类资料 ( 如年资高 中 低 ): 秩和检验 自变量为计量资料 ( 如年龄 ): 相关分析 多因素分析 : 线性回归分析 举例 : 这 534 名护 士的 工作年限与科研能 力评分是否有关系呢? SPSS 实现 : 分析 相关 双变量 同时选 入两个变量 Pearson
3 计量资料的统计分析 计量资料 正态分布 样本统计描述 : 均数 ± 标准差单样本与总体 比较 : 单样本 t 检验两个独 立样本 比较 : 独 立样本 t 检验由样本推断总体两个配对样本 比较 : 配对 t 检验多个独 立样本 比较 : 单因素 方差分析多个 非独 立样本 比较 : 重复测量 方差分析分析变量间的关联与另 一个计量资料的关系 :Pearson 相关分析与多个变量之间的关系 : 回归分析样本统计描述 : 中位数 四分位数间距单样本与总体 比较 : 单样本秩和检验 偏态分布 由样本推断总体 两个独 立样本 比较 :Mann-Whitney 秩和检验 配对资料 比较 :Wilcoxon 符号秩和检验 多个独 立样本 比较 :Kruskal-Wallis 秩和检验 分析两变量间的关联 :Kendall 相关分析
2 总体思路 确认结局指标 ( 因变量 ) 的资料类型 计量资料 : 科研能力总分 计数资料 : 科研能力合格率 ( 合格 / 不合格 ) 等级资料 : 完全做到 基本做到 尚能做到 较少做到 无法做到 确认样本的组数和比较的形式 两个独立样本比较? 多个独立样本比较? 两个配对样本比较? 多个配对样本比较? 两个变量之间的相关性分析?
4 计数资料的统计分析 样本统计描述 : 率 构成 比 计数资料 由样本推断总体 分析变量间的关联 两个样本率 比较 : 四格表卡 方检验配对样本率 比较 : 配对卡 方检验多个样本率或构成 比 比较 : 行 列表卡 方检验与另 一计数资料的关系 : 关联性分析 / 卡 方检验与多个变量的关系 :Logistic 回归 注 : 这 里的计数资料重点指 二分类变量
4 计数资料的统计分析 1. 计数资料的统计描述 : 率 构成比 率 : 某现象发生的频率, 如 534 名护士的科研能力合格率 构成比 : 某事件内部各构成部分所占比重或分布 如 534 名护士的职称构成比 举例 :534 名护 士的科研能 力合格率如何 ( 分数 100 分 )? SPSS 实现 : 转换 重新编码到不同变量分析 描述统计 频率 选择变量
4 计数资料的统计分析 2. 两个样本率比较 : 四格表卡方检验 自变量为二分类变量, 因变量也是二分类变量 举例 :534 名护 士中, 低学历组和 高学历组相比, 科研能 力合格率有 无差异? SPSS 实现 : 分析 描述统计 交叉表 选择 行 列变量 统计量 卡 方
4 计数资料的统计分析 3. 配对样本率比较 : 配对卡方检验 常用于两种检验方法 诊断方法的比较 举例 : 对 534 名护 士进 行科研能 力测评, 分析科研能 力测评与护 士科研能 力自评的合格率是否 一致? SPSS 实现 : 分析 描述统计 交叉表 选择 行 列变量 统计量 Kappa 值
4 计数资料的统计分析 4. 多个样本率比较 : 行 列表卡方检验 自变量为多分类变量, 因变量也是二分类变量 举例 :534 名护 士中, 不同医院的护 士相比, 科研能 力合格率有 无差异? SPSS 实现 : 分析 描述统计 交叉表 选择 行 列变量 统计量 卡 方
4 计数资料的统计分析 5. 因变量为二分类计数资料的影响因素分析 单因素分析 自变量为二分类资料 ( 如学历高 低 ): 四格表卡方 / 关联性分析 自变量为多分类资料 ( 如八所医院 ): 行 列表卡方 / 关联性分析 自变量为连续性资料 ( 如年龄 ): 两独立样本 t 检验 / 判别分析 多因素分析 :Logistic 回归 举例 : 这 534 名护 士的学历 高低与科研能 力合格率是否有关系呢? SPSS 实现 : 分析 描述统计 交叉表 选择 行 列变量 统计量 相关性
5 等级资料的统计分析 等级资料的处理 计量资料 ( 连续性变量 ): 科研能力评分 (1~5 分 ) 等级资料 ( 有序分类变量 ): 完全能做到 经常能做到 尚能做到 较少做到 无法做到 计数资料 ( 二分类变量 ): 合格 不合格
5 等级资料的统计分析 样本统计描述 : 率 构成 比 等级资料 由样本推断总体 两个独 立样本 比较 :Wilcoxon 秩和检验 /Mann-Whitney U 检验 配对资料 比较 :Wilcoxon 秩和检验 多个独 立样本 比较 :Kruskal-Wallis 秩和检验 分析变量间的关联 : Spearman 相关分析
6 统计分析方法小结 计量资料 正态分布 样本统计描述 : 均数 ± 标准差单样本与总体 比较 : 单样本 t 检验两个独 立样本 比较 : 独 立样本 t 检验由样本推断总体两个配对样本 比较 : 配对 t 检验多个独 立样本 比较 : 单因素 方差分析多个 非独 立样本 比较 : 重复测量 方差分析分析变量间的关联与另 一个计量资料的关系 :Pearson 相关分析与多个变量之间的关系 : 回归分析样本统计描述 : 中位数 四分位数间距单样本与总体 比较 : 单样本秩和检验 偏态分布 由样本推断总体 两个独 立样本 比较 :Mann-Whitney 秩和检验 配对资料 比较 :Wilcoxon 符号秩和检验 多个独 立样本 比较 :Kruskal-Wallis 秩和检验 分析两变量间的关联 :Kendall 相关分析
6 统计分析方法小结 样本统计描述 : 率 构成 比 计数资料 由样本推断总体 分析变量间的关联 两个样本率 比较 : 四格表卡 方检验配对样本率 比较 : 配对卡 方检验多个样本率或构成 比 比较 : 行 列表卡 方检验与另 一计数资料的关系 : 关联性分析 / 卡 方检验与多个变量的关系 :Logistic 回归 注 : 这 里的计数资料重点指 二分类变量
6 统计分析方法小结 样本统计描述 : 率 构成 比 等级资料 由样本推断总体 两个独 立样本 比较 :Wilcoxon 秩和检验 /Mann-Whitney U 检验 配对资料 比较 :Wilcoxon 秩和检验 多个独 立样本 比较 :Kruskal-Wallis 秩和检验 分析变量间的关联 : Spearman 相关分析
6 统计分析方法小结 判断 自变量 因变量类型, 正确选择统计推断 方法 因变量类型 连续性变量 ( 计量资料 ) 有序分类变量 ( 等级资料 ) 二分类变量 ( 计数资料 ) 自变量类型 连续性变量 ( 计量资料 ) 有序分类变量 ( 等级资料 ) 二分类变量 ( 计数资料 ) 不同年龄的护 士科研能 力评分差异? 五种职称的护 士科研能 力评分差异? 不同性别的护 士科研能 力评分差异? 不同年龄的护 士科研能 力等级差异? 五种职称的护 士科研能 力等级差异? 不同性别的护 士科研能 力等级差异? 不同年龄的护 士科研能 力合格率差异? 五种职称的护 士科研能 力合格率差异? 不同性别的护 士科研能 力合格率差异? 无序多分类变量 ( 计数资料 ) 八所医院的护 士科研能 力评分差异? 八所医院的护 士科研能 力等级差异? 八所医院的护 士科研能 力合格率差异? 注 : 自变量 因变量独 立, 且满 足检验条件
6 统计分析方法小结 判断 自变量 因变量类型, 正确选择统计推断 方法 因变量类型 连续性变量 ( 计量资料 ) 有序分类变量 ( 等级资料 ) 二分类变量 ( 计数资料 ) 自变量类型 连续性变量 ( 计量资料 ) 有序分类变量 ( 等级资料 ) 二分类变量 ( 计数资料 ) 不同年龄的护 士科研相关分析 / 回归模型能 力评分差异? 五种职称的护 士科研 方差分析能 力评分差异? 不同性别的护 士科研 t 检验能 力评分差异? 不同年龄的护 士科 Logistic 回归研能 力等级差异? 五种职称的护 士科 Logistic 回归研能 力等级差异? 不同性别的护 士科秩和检验研能 力等级差异? 不同年龄的护 士科 Logistic 回归研能 力合格率差异? 五种职称的护 士科卡 方检验研能 力合格率差异? 不同性别的护 士科卡 方检验研能 力合格率差异? 无序多分类变量 ( 计数资料 ) 八所医院的护 士科 方差分析研能 力评分差异? 八所医院的护 士科秩和检验研能 力等级差异? 八所医院的护 士科卡 方检验研能 力合格率差异? 注 : 自变量 因变量独 立, 且满 足检验条件
THANKS 谢谢聆听