医学统计学总结
(基础部分)
一、医学统计学基础
(一)基本概念
同质与变异 总体与样本 参数与统计量 变量与数据类型 概率 误差
1. 由变异(variation)衍生出的术语:
变量variable 方差variance
方差分析、变异数分析(ANOVA analysis of variance) 多反应变量multivariate
2. 变 量:
数值变量(顺序变量、连续性变量、定量变量)
名义变量(定性变量、无序分类变量)
等级变量(有序分类变量)
3. 资料类型:
定量资料/定性资料
计数资料/计量资料
连续型资料/离散型资料。
4. 统计步骤:
(1)统计设计;
(2)搜集资料;
(3)整理资料;
(4)分析资料
(二)统计描述:
1. 定量资料的统计描述:平均数(均数,中位数,几何均数)
2. 理解:标准差与标准误的区别与联系
3. 定性资料的统计描述:
相对数(率,构成比,比),一些常用率的应用: 发病率与患病率 死亡率与病死率、因病死亡率等 标准化法
动态数列
4. 统计图表:统计图(线图,半对数线图,直条图,直方图,百分条图,圆图,散点图,统计地图,箱式图) 图 形
条 图
直 方 图
百分条图
饼 图
线 图
半对数线图
散 点 图
箱 式 图
茎 叶 图 适 用 资 料 组间数量对比 定量资料的分布 构成比 构成比 定量资料数值变动 定量资料发展速度 双变量间的关联 定量资料取值范围 定量资料的分布 做 图 方 法 用直条高度表示数量大小 用直条的面积表示各组段的频数或频率 用直条分段的长度表示全体中各部分的构成比 用圆饼的扇形面积表示全体中各部分的构成比 线条位于横、纵坐标均为算术尺度的坐标系 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 点的密集程度和形成的趋势,表示两现象间的相关关系 用箱体、线条标志四分位数间距及中位数、全距的位置 用茎表示组段的设置情形,叶片为个体值,叶长为频数
5. 几个分布
(三)统计推断:
1. 抽样误差、标准误
2. t分布特点:
① 以0为中心左右对称的单峰分布;
② 自由度越小,曲线越扁平,自由度越大曲线越尖峭; ③ 自由度∞,t分布曲线趋近与标准正态分布曲线。
3. 参数估计:用样本统计量推断总体参数——均数、率 ① 区间估计:置信区间或可信区间
② 理解:参考值范围与可信区间的区别
4. 假设检验原理
5. 假设检验步骤:
① 建立假设确定检验水准;
② 计算检验统计量;
③ 确定P值,作出推断结论。
6. 两型错误:
①第一类错误α;
②第二类错误β,1-β为检验效能。
二、比较分析
(一)定量资料
1. 数据类型:
(1)单样本均数 ——t检验
(2)两样本均数(配对设计,完全随机设计)——t检验
(3)多样本均数(完全随机设计,区组设计)——方差分析
(4)两两比较、多重比较、事后检验
——LSD法、Bonferoni法、SNK法……
2. 前提条件:正态分布,方差齐,数据独立
3. 不满足前提条件:变量变换、非参数检验
二、比较分析 (一)定量资料
1. 数据类型:
(1)单样本均数 ——t检验 (2)两样本均数(配对设计,完全随机设计)——t检验 (3)多样本均数(完全随机设计,区组设计)——方差分析
(4)两两比较、多重比较、事后检验
——LSD法、Bonferoni法、SNK法……
2. 前提条件:正态分布,方差齐,数据独立 3. 不满足前提条件:变量变换、非参数检验
(二)定性资料
1. 二项分布与POISSON分布(见上) 2. 列联表的卡方检验
3. 注意对于“有序(等级)”行×列表的辨析处理
(三)非参数检验
1. 非参数检验的概念 2. 非参数检验的优缺点: ①适用范围广; ②受限条件少; ③具有稳健性。
对符合参数检验条件的资料,若采用非参数检验会导致检验效能下降。
3. 非参数检验的分析步骤: (1)编排秩次; (2)求秩和与统计量; (3)确定P值,作出推断。 4. 秩和检验方法要点及注意事项
三、关联性分析
(一)回归分析重点
1. 直线回归的概念:回归方程与回归系数 2. 回归分析的一般步骤
(1) 散点图:观察是否有线性趋势及是否有异常点; (2) 最小二乘法求解回归系数与截距与回归方程;
ˆabX 回归方程 Y
回归系数及其统计意义 (3) 统计推断
参数估计:
回归系数的置信估计 条件均数的容许区间
注意区分
条件均数的置信区间 假设检验:
回归方程的假设检验——方差分析 回归系数的假设检验——t检验
拟合效果的假设检验——拟合优度检验(R2)
(4) 统计应用
统计预测:XY 统计控制:YX
3. 假设检验
(1) 平方和划分——方差分析的基本思想
(2
) 方差分析:回归方程的检验
(3) t检验:回归系数的检验(在简单回归中t2=F) 4. 决定系数——反映拟合优度的统计量(R2=SS回归/SS总) 5. 了解前提条件:线性、独立、正态、等方差(LINE) (二)相关分析重点(Pearson相关与Spearman秩相关) 1. Pearson相关:适用于双随机变量正态分布资料 2. 相关系数概念:密切程度与相关方向 3. 相关系数的取值范围:-1≤r≤1 4. 相关系数的假设检验:t检验与r检验 5. Spearman秩相关:
数据不服从正态分布; 分布型未知;
等级资料或有不确定值。
6. 理解:回归与相关的区别与联系——四同六不同 四联系:
①理论基础; ②符号; ③假设检验; ④回归解释相关 六不同:
①资料要求; ②应用目的; ③指标意义; ④计算; ⑤取值范围; ⑥单位
(三)多重回归重点
1. 多重回归方程与偏回归系数、标准化回归系数的概念 2. 假设检验
(1)方差分析:回归方程的假设检验 (2)t检验:偏回归系数的假设检验
(3)拟合优度检验:决定系数与调整的决定系数(假设检验等价于方差分析) (4)偏回归平方和:回归系数与模型筛选的假设检验 3. 模型筛选方法:
(1)常用评价准则:调整决定系数、AIC准则、Cp统计量等
(2)模型筛选方法:全局择优法与局部择优法(前进法、后退法、逐步法)
四、统计设计
(一)调查设计/观察性研究设计 1. 观察性研究设计的意义与特点 (1)研究/分析因素是客观存在的;
(2)不能用随机分配方法平衡混杂因素的影响。 2. 观察性研究方法
研究范围:普查和非全面调查 非全面调查指包括: ① 重点调查; ② 典型调查; ③ 抽样调查。 据研究时间可分为:
① 横断面调查:也称现况调查; ② 纵向研究。 3. 观察性研究设计的内容:
① 明确具体的调查目的,选择客观、准确的研究指标; ② 确定调查对象和观察单位,估计观察单位数; ③ 明确调查方法,选择调查方式; ④ 确定调查项目,设计调查表;
⑤ 明确调查的组织计划。整理分析计划主要考虑:资料核查、数据库设计、录入、检查及资料分组和组织计划等。
4. 基本的抽样方法:
单纯随机抽样 系统抽样 整群抽样 分层抽样。
5. 估计样本含量时应考虑:
(1)容许误差δ;
(2)Ⅰ型错误α的大小; (3)变异程度σ。
(二)实验研究设计 1. 特点:
① 处理因素是由研究者据研究目的设置的;
② 受试对象接受何种处理与水平由随机分配决定,是
一种高效的研究方法。
2. 实验研究按照受试对象不同分为动物实验和临床试验。 3. 实验研究的基本要素:
包括处理因素、受试对象和实验效应三部分。
4. 实验设计的基本原则:
对照(control) 重复(replication) 随机化(randomization)
5. 常见的实验研究设计类型:完全随机设计(completely random
design)、配对设计、随机区组设计(randomized block design)、交叉设计(crossover design)、析因设计(factorial design)、重复测量设计、正交设计(orthogonal design)
6. 实验研究中估计样本含量应考虑:
①检验水准即I型错误的概率(α);单侧或双侧检验。 ②检验效能1-β; ③变异程度(σ)大小; ④容许误差δ;
(三)临床试验设计
1. 临床试验以人为受试对象,分治疗型临床试验、预防型临床试验和保健型临床试验。 2. 新药临床试验是临床试验中最常见的一种,Ⅰ期、Ⅱ期、Ⅲ期和Ⅳ期临床试验设计。
五、统计分析策略(参考自宇传化主编《SPSS与统计分析》电子工业出版社)
(一)单变量定量资料分析
(三)双变量资料分析
(张岩波整理)