因果推断与 Simpson 悖论

一、 因果揣摸

早在 2000多年前亚里士多德就指出: 真正的科学常识是关于原因的常识。自古以来 ,商量事物之间的因果关系就是哲学、天然科学、社会科学、医学等几乎所有科学研究的最终目的。因果与相关是两个分歧的主要概念 ,尽管在多少科学研究中因果比相关更主要 ,可是 ,今朝大多数统计方式仅适用于相关性研究。两个身分之间即使无因果关系 ,仍可能会显示出子虚的相关性;相反地 ,有因果关系也可能表示出虚伪的自力性。好多例子或许说明子虚相关性 ,张三和李四的手表的时间具有很强的相关性 ,然则工钱地改变张三的手表时间 ,不会引起李四的手表时间的改变。Freedm an( 1991)写到: 小学生的阅读能力与鞋的尺寸有相关性 ,可是很显着它们没有因果关系 ,工钱地改变鞋的尺寸 ,不会提高他们的阅读能力。曾经不少统计学者和医学研究者问我: 有因果关系的话 ,总应该显露有相关性吧?! 实际上 ,虚伪自力性的例子也多少。能够想象 ,打太极拳或许强壮身体 ,延伸寿命 ,也就是说 ,打太极拳对身体健康有因果感化。然则 , 打太极拳的人的寿命可能会与不打太极拳的人的寿命没有什么不同 (或者反而打太极拳的人的寿命更短一些 )。这可能是因为打太极拳的人都是体弱多病的人 ,所以显示出子虚的自力性。再好比 ,在铀矿工作的工人与其它人的寿命日常长 (或更长 ) ,这并不及说明露出于铀矿不会影响寿命 ,而可能是因为铀矿工人是经由遴选出来的身体健壮的人 ,假若昔时他们不表露于铀矿的话 ,寿命可能会更长一些。这种现象称为健康工人效应

在统计科学的成长史上 ,因果揣摸研究未能获得应有的正视和成长。早期的统计学关于因果揣摸的理论和方式为列联表、路径剖析和构造方程模型。尽管相关关系与因果关系是两个众所周知的分歧概念 ,可是 ,操纵统计揣摸获得的事物之间相关关系经常被错误地用于说明为原因与成绩之间的关系。今朝 ,在上面的理论和方式的应用中 ,常轻忽了本来模型提出时对因果机制的假定 ,仅是将关于相关的参数看成因果关系进行解说。Rubin ( 1974)提出了因果感化模型 ,与 Lew is ( 1973) 的虚拟事实( Counterfactuals)的哲学理论相似 ,又称为虚拟事实模型。( 令 Ye ( u ) Ye ( u ) 分辨透露个别 u 在露出和非表露情形下的响应; 个别的露出的因果感化界说为 ICE= Ye ( u ) - Ye ( u ) ; 总体平均因果感化界说为 ACE= E ( Ye - Ye ) ,此中 E ( ) 表现总体的所有个别的希冀。Holland( 1986)清楚地论说了因果揣度的各类统计模型 ,提出了统计的因果阐发的三个见解: ( 1)统计研究原因的后果 ,而不是研究了局的原因; ( 2)原因的成效老是相对其它原因而言; (3)不是所有事物都或许作为原因的 ,个别属性不克看成原因。Pearl( 1995)提出了因果收集图和外部干涉的概念 , 将因果机制的常识和考察研究的数据连系 ,提出了因果揣摸的收集图方式。

二、 实验研究与视察研究

“考察与实验的区别在于视察向我们供应的常识似乎是本身呈现出来的; 而实验向我们供应的常识则是为了知道事实是否如斯而进行某种试探的果实。” ( Zim mermann,论医学上的实验 , 1774)“观测是一种用于汇集事实的研究方式 , 而实验则是一种获得常识的手段。”( Berna rd,实验医学研究导论 , 1920)

因为实验与察看的手段分歧 ,它们获得的数据有素质的差别。实验试图索求的是因果信息;考察仅能获得相关信息 ,而与样本巨细无关。在必然前提或假定下 ,两者才能够互相转换。Ho lland( 1986)指出: 假如没有不行磨练的假定的话 ,因果揣度是弗成能的。假如不进行随机化实验 ,或者没有经验弗成证伪的假定的话 ,就不成能由数据的统计阐明得出因果结论。按照Popperian哲学概念 ,当一个断言不是经验可证伪的话 ,它就不是科学的。随机化实验是评估因果感化的最好的科学方式。可是 ,很多研究是禁止使用随机化实验 ,甚至禁止使用实验方式 , 而仅能进行观测研究。众所周知的例子: 关于抽烟与肺癌的风行病研究。在不克应用随机实验的状况下 ,对照研究试图寻找一个与处理组能够比力的对照组 ,进行因果揣度的实验研究。Grace et al. ( 1966)给出关于静脉吻合分流手术的 51次随机实验研究 ,对照研究和无对照研究的后果。它们说明分歧的研究方式可能会导致完全分歧的结论。( Freedman, 1991)

三、Simpson's 悖论与混同身分

首先 ,我们过程一个数值例子介绍一下 Simpson 's悖论。假设我们获得 表1中关于抽烟与癌症的数据。由抽烟人群的患癌症的比率 ( 20% )与不抽烟人群的患癌症的比率 ( 30% )之差来看 ,似乎抽烟对人类没有患病的风险。然则 ,凭据性别将数据进行分层后 ,我们获得 表2 的数据 ,发现抽烟对男性和女性都有患病的风险。这种现象称为 Simpson 's悖论 ( Simpson, 1951)。有好多真实的数据显示了 Simpson's 悖论现象 , 拜见 Bickel 等 ( 1975) , Wag ner ( 1982) , Neufeld( 1995)。是以 ,在统计查询和剖析时 ,必需慎重考虑哪些变量要察看 ,哪些能够忽略。

若是忽略后台身分 (如上例的性别 )后 ,所关心的相关测度 (如上例的风险差 )不发生改变 , 那末 ,我们称该配景身分是可压缩的 (或称可忽略的 )。当布景身分弗成压缩时 ,平日称该靠山变量 (如上例的性别 )为混同身分 ,因为忽略该身分将稠浊真实因果关系 ,得失足误的结论。这是一种以可压缩性判断稠浊身分的准则。关于可压缩性的评论拜见 Kleinbaum et al. ( 1982) , Whittem ore( 1978) , Geng ( 1992)。

另一种判断混同身分的准则为可比力性准则。假若表露总体 (如抽烟人群 )不露出 (即不抽烟 )的话 ,响应的分布 (如患病的概率 )与非露出总体 (如不抽烟人群 )的响应分布 (如患病的概率 )不异;而且 ,假若非表露总体表露的话 ,响应的分布与露出总体的响应分布不异 ,那么称表露总体与非表露总体是可交换的 ,也称无混同。这时露出总体的响应分布与非表露总体的响应分布之差等于虚拟事实模型的总体平均因果感化 ,是以 ,在无稠浊的情形下 ,能够过程对露出总体和非表露总体的视察进行总体平均因果感化的估量。当露出总体和非露出总体不成交换 , 可是凭据某靠山变量对总体分层后 ,使得露出子总体与非露出子总体是可交换的话 ,称该配景变量为混同身分; 也就是说 ,用该变量对总体分层后 ,能够消弭稠浊 ,使得子总体的平均因果感化可估量 ,再用该稠浊身分的分布将子总体平均因果感化进行加权平均 ,能够获得总体平均因果感化。有关判断稠浊身分的可比力性准则拜见 Miettinen 和 Cook ( 1981) , Greenland 和 Robins( 1986) , Wickramaratne和 Holford( 1987)。

混同身分的可压缩性准则依靠于所用的相关测度 ,是以可能会显现对于有些测度是可压缩的 ,而对另一些是不行压缩的 ,造成对混同身分的判断取决于所用的测度。该准则能够简洁地凭据数据进行检讨 ,是以在实际中被普遍应用。可对照性准则竖立在虚拟事实模型的根本上 ,不依靠于所用的相关测度 ,然则 ,总体的可交换性普通是不克经由数据进行磨练的。Geng , Guo, Lau和 Fung ( 2000)评论了两种准则之间的关系。面临因果揣摸和混同因子识别等难题 , 现有的统计理论和方式显得如斯穷乏和力所不及。因果揣摸是一个涉及统计学和哲学以及有关应用范畴的复杂问题 ,在国外的统计刊物上已开展了强烈的商量 ,拜见 Greenla nd, Robins和Pearl(1999), Freedman (1999) ,  Rosenbaum(1999) ,进展能获得我国的统计学者的正视和研究。

上一篇:沉迷手机真的会短命!关爱生命,远离手机
下一篇:2020医学界有哪些医疗创新?

网友回应