介绍及讲解:杜斌 |
[最近在上网时发现,有些医生对统计学的部分概念并不清楚。相信这是当前国内医学教育的典型弊病之一。课堂上虽然学习了统计学,考试也及了格,但其实并不会使用。这种现象颇值得统计学老师反思。] |
| |
| (CSCCM原创,转载请注明) |
| |
|
|
| |
首先通过一个例子说明混杂因素的影响: |
| |
|
|
| |
Q:灰头发是否死亡的危险因素? |
| |
|
共200例患者中,死亡75例,灰发100例。四格表如下: |
| |
|
表1 患者头发颜色与预后的关系 |
| |
|
|
|
死亡 |
存活 |
|
|
灰发 + |
45 |
55 |
100 |
灰发 - |
30 |
70 |
100 |
|
75 |
125 |
200 |
|
|
| |
|
|
| |
|
据上表计算: |
| |
|
灰发患者死亡的危险为45% |
| |
|
非灰发患者死亡的危险为30% |
| |
|
因此,灰发患者死亡的相对危险度(RR)为1.5 |
| |
|
|
| |
Q:上述结论是否正确?究竟存在什么问题? |
| |
|
其实,进一步分析可能发现(表2和表3),与青年患者相比,老年患者灰发比例更高(80% vs. 20%),同时死亡率也更高(50% vs. 25%) |
| |
|
表2 老年患者头发颜色与预后的关系 |
| |
|
|
|
死亡 |
存活 |
|
|
灰发 + |
40 |
40 |
80 |
灰发 - |
10 |
10 |
20 |
|
50 |
50 |
100 |
|
|
| |
|
|
| |
|
表3 青年患者头发颜色与预后的关系 |
| |
|
|
|
死亡 |
存活 |
|
|
灰发 + |
5 |
15 |
20 |
灰发 - |
20 |
60 |
80 |
|
25 |
75 |
100 |
|
|
| |
|
|
| |
|
对于老年患者而言(表2),灰发并非死亡的危险因素(RR = 50%/50% = 1) |
| |
|
对于青年患者而言(表3),灰发也不是死亡的危险因素(RR = 25%/25% = 1) |
| |
|
|
| |
|
因此, |
| |
|
经过校正后的相对危险度(RR) = 1.0(未经校正的RR = 1.5) |
| |
|
灰发对死亡率的影响能够完全用年龄因素的影响解释 |
| |
|
所以, |
| |
|
年龄是本例中的混杂因素(confounder) |
| |
|
|
| |
|
如果存在混杂因素,就意味着: |
| |
|
一种因素的作用受到了另一种因素作用的影响 |
| |
|
从而影响了对该因素作用的解释 |
| |
|
|
| |
由上可见,混杂因素的特点为 |
| |
|
> 是研究结局的独立危险因素(年龄是死亡率的独立危险因素) |
| |
|
> 与研究因素相关,且在研究因素阳性(暴露)组和阴性(非暴露)组中分布不均一(灰发组年龄大者多,非灰发组年龄小者多) |
| |
|
> 并非研究因素与研究结局因果关系中的中间环节 |
| |
|
|
>> 年龄并非灰发与死亡相关关系之间的中间环节,因此年龄可以成为混杂因素 |
| |
|
|
>> 高脂食品 --> 高脂血症 --> 冠心病,因此高脂血症并非混杂因素 |
| |
|
|
| |
|
例如:ICU患者病死率低是否意味治疗水平高? |
| |
|
ICU收治患者病情轻 --> 病死率低 --> 与治疗水平无关 |
| |
|
病情轻重即为混杂因素,需要对此进行校正 |
| |
|
|
| |
Q:如何识别混杂因素? |
| |
|
灰发与死亡存在相关关系。年龄是否为混杂因素? |
| |
|
年龄与死亡存在相关关系。灰发是否为混杂因素? |
| |
|
|
| |
|
需要注意的是:数据本身不能告诉我们哪一个为混杂因素! |
| |
|
判断某个因素是否为混杂因素的简单方法:比较校正前后的OR值 |
| |
|
|
| |
|
例如:分析中度饮酒与冠心病的相关关系 |
| |
|
表4 中度饮酒与冠心病的关系 |
| |
|
|
|
冠心病 |
对照 |
|
|
中度饮酒 |
71 |
52 |
123 |
不饮酒 |
29 |
48 |
77 |
|
100 |
100 |
200 |
|
|
| |
|
|
| |
|
计算OR = 71 x 48 / (52 x 29) = 2.26 |
| |
|
提示中度饮酒为罹患冠心病的危险因素 |
| |
|
|
| |
|
但是,我们知道,饮酒与吸烟密切相关。因此,当根据吸烟情况进行校正后, |
| |
|
表5 根据吸烟校正后中度饮酒与冠心病的关系 |
| |
|
|
| |
吸烟 |
不吸烟 |
|
|
|
冠心病 |
对照 |
冠心病 |
对照 |
|
|
中度饮酒 |
|
36 |
|
16 |
123 |
不饮酒 |
|
4 |
|
44 |
77 |
|
OR |
1.0 |
1.0 |
|
|
|
| |
|
|
| |
|
校正后的OR = 1.0,说明吸烟可能为混杂因素 |
| |
|
但是,吸烟究竟是否真正的危险因素呢? |
| |
|
|
| |
|
需要:根据自己的认识和知识确定: |
| |
|
|
某些因素为独立的危险因素 |
| |
|
|
某些因素与可能的危险因素之间存在相关性 |
| |
|
|
某些因素与病因无关 |
| |
|
|
| |
Q:如何对待混杂因素 — 试验设计 |
| |
|
> 随机分组(即把已知和未知的混杂因素均一分布在治疗组与对照组中) |
| |
|
> 限制(即把试验局限于某些特殊人群,如老年患者) |
| |
|
> 匹配(即对于每位老年灰发患者,选择一名老年非灰发患者进行配对) |
| |
|
|
| |
Q:如何对待混杂因素 — 结果分析 |
| |
|
> 数据分层(对于所有混杂因素进行单独分析) |
| |
|
> 多因素分析(通常包括线性回归,逻辑回归,Cox回归) |
| |
|
|
| |
|
需要注意的是,除随机分组外,其他方法仅对已知的混杂因素有效 |
| |
|
如果我们不知道哪些因素是可能的混杂因素,就无法在结果分析时对其进行校正 |
| |
|
|
| |
|
例如:BMI对发生ESRD危险性的影响,应当对哪些混杂因素进行校正? |
| |
|
年龄,性别,动脉收缩压,蛋白尿 |
| |
|
表6 发生ESRD的危险因素 — 单因素分析结果 |
| |
|
|
|
OR (95%CI) |
P值 |
|
年龄 |
1.013 (1.007 – 1.020) |
< 0.0001 |
男性 |
1.013 (1.007 – 1.020) |
< 0.0001 |
SBP, mmHg |
1.029 (1.025 – 1.033) |
< 0.0001 |
BMI |
1.293 (1.181 – 1.415) |
< 0.0001 |
蛋白尿 |
3.073 (3.868 – 3.294) |
< 0.0001 |
|
|
| |
|
|
| |
|
单因素分析结果表明, |
| |
|
年龄,性别,动脉收缩压,BMI和蛋白尿均是罹患ESRD的危险因素 |
| |
|
|
| |
|
但是,如果进行多因素分析 |
| |
|
表7 发生ESRD的危险因素 — 多因素分析结果 |
| |
|
|
|
OR (95%CI) |
P值 |
|
年龄 |
1.000 (0.993 – 1.007) |
NS |
男性 |
1.510 (1.225 – 1.861) |
0.0001 |
SBP, mmHg |
1.018 (1.013 – 1.023) |
< 0.0001 |
BMI |
1.111 (1.012 – 1.220) |
0.0274 |
蛋白尿 |
2.835 (2.637 – 3.048) |
< 0.0001 |
|
|
| |
|
|
|
OR (95%CI) |
P值 |
|
年龄 |
1.000 (0.993 – 1.007) |
NS |
男性 |
1.510 (1.225 – 1.861) |
0.0001 |
SBP, mmHg |
1.018 (1.013 – 1.023) |
< 0.0001 |
BMI |
1.111 (1.012 – 1.220) |
0.0274 |
蛋白尿 |
2.835 (2.637 – 3.048) |
< 0.0001 |
|
|
| |
|
|
| |
|
多因素分析结果表明, |
| |
|
性别,动脉收缩压,BMI和蛋白尿是罹患ESRD的“独立”危险因素 |
| |
|
但是,年龄不再成为独立的危险因素,说明年龄受到某个(或某些)混杂因素的影响(虽然我们并不确切知道是哪个或哪几个因素,但应当是表格中列举的危险因素之一) |
| |
|
|
| |
|
另一个例子: |
| |
|
研究血液系统恶性肿瘤是否对急性肾功能衰竭患者的ICU病死率产生影响 |
| |
|
表8 急性肾功能衰竭患者死亡的危险因素 — 单因素分析结果 |
| |
|
|
|
HR (95%CI) |
P值 |
|
基础情况 |
|
|
血液系统恶性肿瘤 |
1.52 (1.07 – 2.13) |
0.018 |
年龄> 65岁 |
1.20 (0.09 – 1.59) |
0.21 |
入ICU前住院日(每增加一天) |
1.01 (1.01 – 1.02) |
< 0.001 |
入住ICU期间病情严重程度 |
|
|
APACHE II(每增加一分) |
1.05 (1.03 – 1.06) |
< 0.001 |
机械通气 |
1.92 (1.35 – 2.73) |
< 0.001 |
使用升压药物 |
2.51 (1.65 – 3.82) |
< 0.001 |
应用CRRT |
2.34 (1.75 – 3.14) |
< 0.001 |
|
|
| |
|
|
| |
|
表9 急性肾功能衰竭患者死亡的危险因素 — Cox比例风险模型分析结果 |
| |
|
|
|
HR (95%CI) |
P值 |
|
基础情况 |
|
|
血液系统恶性肿瘤 |
|
0.78 |
年龄> 65岁 |
|
0.093 |
入ICU前住院日(每增加一天) |
1.02 (1.01 – 1.03) |
< 0.001 |
入住ICU期间病情严重程度 |
|
|
APACHE II(每增加一分) |
1.04 (1.02 – 1.05) |
< 0.001 |
机械通气 |
|
0.35 |
使用升压药物 |
2.1 (1.38 – 3.28) |
0.001 |
应用CRRT |
|
|
|
|
| |
|
|
| |
|
结果显示: |
| |
|
未经过校正时,血液系统恶性肿瘤的HR = 1.52, p = 0.018(是死亡的危险因素) |
| |
|
对APACHE II评分进行校正后,HR = 1.28 (0.91 – 1.85), p = 0.16 |
| |
|
对入ICU前住院日进行校正后,HR = 1.33 (0.93 – 1,89), p = 0.12 |
| |
|
对所有因素进行校正后,p = 0.78 |
| |
|
|
| |
|
研究者在讨论中提到: |
| |
|
“在对这些混杂因素进行校正后,我们发现,血液系统恶性肿瘤不再是6个月病死率的危险因素” |
| |
(CSCCM原创,转载请注明) |
| |
|
| |