医学统计学总结

医学统计学总结

（基础部分）

一、医学统计学基础

（一）基本概念

同质与变异总体与样本参数与统计量变量与数据类型概率误差

1. 由变异（variation）衍生出的术语：

变量variable 方差variance

方差分析、变异数分析（ANOVA analysis of variance）多反应变量multivariate

2. 变量：

数值变量（顺序变量、连续性变量、定量变量）

名义变量（定性变量、无序分类变量）

等级变量（有序分类变量）

3. 资料类型：

定量资料/定性资料

计数资料/计量资料

连续型资料/离散型资料。

4. 统计步骤：

（1）统计设计；

（2）搜集资料；

（3）整理资料；

（4）分析资料

（二）统计描述：

1. 定量资料的统计描述：平均数（均数，中位数，几何均数）

2. 理解：标准差与标准误的区别与联系

3. 定性资料的统计描述：

相对数（率，构成比，比），一些常用率的应用：发病率与患病率死亡率与病死率、因病死亡率等标准化法

动态数列

4. 统计图表：统计图（线图，半对数线图，直条图，直方图，百分条图，圆图，散点图，统计地图，箱式图）图形

条图

直方图

百分条图

饼图

线图

半对数线图

散点图

箱式图

茎叶图适用资料组间数量对比定量资料的分布构成比构成比定量资料数值变动定量资料发展速度双变量间的关联定量资料取值范围定量资料的分布做图方法用直条高度表示数量大小用直条的面积表示各组段的频数或频率用直条分段的长度表示全体中各部分的构成比用圆饼的扇形面积表示全体中各部分的构成比线条位于横、纵坐标均为算术尺度的坐标系线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系点的密集程度和形成的趋势，表示两现象间的相关关系用箱体、线条标志四分位数间距及中位数、全距的位置用茎表示组段的设置情形，叶片为个体值，叶长为频数

5. 几个分布

（三）统计推断：

1. 抽样误差、标准误

2. t分布特点：

① 以0为中心左右对称的单峰分布；

② 自由度越小，曲线越扁平，自由度越大曲线越尖峭； ③ 自由度∞，t分布曲线趋近与标准正态分布曲线。

3. 参数估计：用样本统计量推断总体参数——均数、率 ① 区间估计：置信区间或可信区间

② 理解：参考值范围与可信区间的区别

4. 假设检验原理

5. 假设检验步骤：

① 建立假设确定检验水准；

② 计算检验统计量；

③ 确定P值，作出推断结论。

6. 两型错误：

①第一类错误α；

②第二类错误β，1－β为检验效能。

二、比较分析

（一）定量资料

1. 数据类型：

（1）单样本均数 ——t检验

（2）两样本均数（配对设计，完全随机设计）——t检验

（3）多样本均数（完全随机设计，区组设计）——方差分析

（4）两两比较、多重比较、事后检验

——LSD法、Bonferoni法、SNK法……

2. 前提条件：正态分布，方差齐，数据独立

3. 不满足前提条件：变量变换、非参数检验

二、比较分析（一）定量资料

1. 数据类型：

（1）单样本均数 ——t检验（2）两样本均数（配对设计，完全随机设计）——t检验（3）多样本均数（完全随机设计，区组设计）——方差分析

（4）两两比较、多重比较、事后检验

——LSD法、Bonferoni法、SNK法……

2. 前提条件：正态分布，方差齐，数据独立 3. 不满足前提条件：变量变换、非参数检验

（二）定性资料

1. 二项分布与POISSON分布（见上） 2. 列联表的卡方检验

3. 注意对于“有序（等级）”行×列表的辨析处理

（三）非参数检验

1. 非参数检验的概念 2. 非参数检验的优缺点： ①适用范围广； ②受限条件少； ③具有稳健性。

对符合参数检验条件的资料，若采用非参数检验会导致检验效能下降。

3. 非参数检验的分析步骤：（1）编排秩次；（2）求秩和与统计量；（3）确定P值，作出推断。 4. 秩和检验方法要点及注意事项

三、关联性分析

（一）回归分析重点

1. 直线回归的概念：回归方程与回归系数 2. 回归分析的一般步骤

（1）散点图：观察是否有线性趋势及是否有异常点；（2）最小二乘法求解回归系数与截距与回归方程；

ˆabX  回归方程 Y

 回归系数及其统计意义（3）统计推断

 参数估计：

 回归系数的置信估计  条件均数的容许区间

注意区分

 条件均数的置信区间  假设检验：

 回归方程的假设检验——方差分析  回归系数的假设检验——t检验

 拟合效果的假设检验——拟合优度检验（R2）

（4）统计应用

 统计预测：XY  统计控制：YX

3. 假设检验

（1）平方和划分——方差分析的基本思想

（2

）方差分析：回归方程的检验

（3） t检验：回归系数的检验（在简单回归中t2＝F） 4. 决定系数——反映拟合优度的统计量（R2=SS回归/SS总） 5. 了解前提条件：线性、独立、正态、等方差（LINE）（二）相关分析重点（Pearson相关与Spearman秩相关） 1. Pearson相关：适用于双随机变量正态分布资料 2. 相关系数概念：密切程度与相关方向 3. 相关系数的取值范围：-1≤r≤1 4. 相关系数的假设检验：t检验与r检验 5. Spearman秩相关：

 数据不服从正态分布；  分布型未知；

 等级资料或有不确定值。

6. 理解：回归与相关的区别与联系——四同六不同  四联系：

①理论基础； ②符号； ③假设检验； ④回归解释相关  六不同：

①资料要求； ②应用目的； ③指标意义； ④计算； ⑤取值范围； ⑥单位

（三）多重回归重点

1. 多重回归方程与偏回归系数、标准化回归系数的概念 2. 假设检验

（1）方差分析：回归方程的假设检验（2）t检验：偏回归系数的假设检验

（3）拟合优度检验：决定系数与调整的决定系数（假设检验等价于方差分析）（4）偏回归平方和：回归系数与模型筛选的假设检验 3. 模型筛选方法：

（1）常用评价准则：调整决定系数、AIC准则、Cp统计量等

（2）模型筛选方法：全局择优法与局部择优法（前进法、后退法、逐步法）

四、统计设计

（一）调查设计/观察性研究设计 1. 观察性研究设计的意义与特点（1）研究/分析因素是客观存在的；

（2）不能用随机分配方法平衡混杂因素的影响。 2. 观察性研究方法

研究范围：普查和非全面调查非全面调查指包括： ① 重点调查； ② 典型调查； ③ 抽样调查。据研究时间可分为：

① 横断面调查：也称现况调查； ② 纵向研究。 3. 观察性研究设计的内容：

① 明确具体的调查目的，选择客观、准确的研究指标； ② 确定调查对象和观察单位，估计观察单位数； ③ 明确调查方法，选择调查方式； ④ 确定调查项目，设计调查表；

⑤ 明确调查的组织计划。整理分析计划主要考虑：资料核查、数据库设计、录入、检查及资料分组和组织计划等。

4. 基本的抽样方法：

 单纯随机抽样  系统抽样  整群抽样  分层抽样。

5. 估计样本含量时应考虑：

 （1）容许误差δ；

 （2）Ⅰ型错误α的大小；  （3）变异程度σ。

（二）实验研究设计 1. 特点：

① 处理因素是由研究者据研究目的设置的；

② 受试对象接受何种处理与水平由随机分配决定，是

一种高效的研究方法。

2. 实验研究按照受试对象不同分为动物实验和临床试验。 3. 实验研究的基本要素：

包括处理因素、受试对象和实验效应三部分。

4. 实验设计的基本原则：

 对照（control）  重复（replication）  随机化（randomization）

5. 常见的实验研究设计类型：完全随机设计（completely random

design）、配对设计、随机区组设计（randomized block design）、交叉设计（crossover design）、析因设计（factorial design）、重复测量设计、正交设计（orthogonal design）

6. 实验研究中估计样本含量应考虑：

①检验水准即I型错误的概率（α）；单侧或双侧检验。 ②检验效能1-β； ③变异程度（σ）大小； ④容许误差δ；

（三）临床试验设计

1. 临床试验以人为受试对象，分治疗型临床试验、预防型临床试验和保健型临床试验。 2. 新药临床试验是临床试验中最常见的一种，Ⅰ期、Ⅱ期、Ⅲ期和Ⅳ期临床试验设计。

五、统计分析策略（参考自宇传化主编《SPSS与统计分析》电子工业出版社）

（一）单变量定量资料分析

（三）双变量资料分析

（张岩波整理）

相关内容

热门内容