随机对照试验(randomized controlled trial, RCT)及其Meta分析提供流行病学研究的最高等级证据,是验证科学假设的理想首选。但RCT往往花费巨大、耗时长,个别情况下甚至会违背伦理或没有实际可行性。受到现实条件的种种限制,RCT往往难以开展或难以满足当下的证据需求。此时,观察性研究便会成为循证决策的主要证据来源。
观察性研究与RCT相比,有着直接缺陷,即无法实现随机化。但设计良好、分析规范的观察性研究仍可提供高质量的证据。观察性研究的统计分析过程实质上可以看作是在模拟相对应的RCT[1],研究者们往往也会耗费相当多的精力通过倾向性评分匹配、逆概率加权、工具变量等方法减轻混杂因素的干扰。
但事实上,除了混杂偏倚,研究者往往会因为考虑得不周全,或机械地遵循所谓“套路”,使观察性研究出现本可以避免的选择偏倚。究其原因,是因为研究者没有从头至尾贯彻模拟RCT的思路。为此,哈佛大学公共卫生学院的Miguel Hernan教授完善了模拟目标试验(emulate a target trial)的方法框架[1,2],并应用于队列研究[3]和巢式病例对照研究[4],以研究流行病学的实际问题。
观察性研究传统分析范式带来的问题
Dickerman等在Nature Medicine杂志刊文[5],以他汀类药物和癌症的关系为例,指出了传统分析范式的弊端。
既往很多观察性研究报道了他汀类药物使用者患癌风险较低[6-9],有些研究[7-9]甚至报道使用他汀类药物可降低高达50~65%的癌症发病风险。然而后续的RCT[10,11]并未发现他汀类药物对癌症发病存在影响。Dickerman等[5]使用英国733 804名成年人的纵向电子病历数据,重复了既往观察性研究的方法,同样发现了他汀类药物的强保护效应。研究者们使用同样的数据,应用模拟目标试验的方法,却与RCT研究得到了同样的结论:他汀类药物与癌症发病不存在因果关联。
Dickerman等[5]认为传统方法简单地根据他汀类药物使用时间是否达到规定时长将研究对象分组,造成了永恒时间偏倚(immortal time bias),导致出现了虚假的保护效应,即研究对象需要在规定时长内不发病才能被分为暴露组,在用药时间未达到规定时长而癌症发病的患者会被分为非暴露组。
此外,RCT暴露组是初始使用他汀类药物的研究对象,而既往观察性研究往往只收集基线的暴露情况进而根据基线将研究对象分为现用药者和从未用药者,或者基线后连续收集了多次暴露情况但没有排除基线前服用他汀类药物的对象,这些都会造成现使用者偏倚(prevalent user bias),即药物的现使用者与曾经使用但未能入组的人群相比,可能有更好的依从性,更可能从药物获益,或更少经历药物引起的不良反应。
传统分析方法的常见弊端在于随访开始、符合入组标准以及暴露分配三个时间点的不同步导致的永恒时间偏倚(图1)和现使用者偏倚(图2),以及使用基线后信息作为纳入排除标准(例如要求至少有一次随访)带来的选择偏倚等[12]。Zhao等对风湿性关节药物的有效性对比研究进行系统总结后,发现94%的研究存在至少一种设计缺陷,其中最常见的是将基线后的信息作为纳入排除标准[13],由此可见引入模拟目标试验方法的必要性。
图2 现使用者偏倚
模拟目标试验的方法框架
模拟目标试验的方法主要分为两步(图3):①确定理想中的目标试验方案,至少应包含研究对象的纳入排除标准、干预措施等7部分;②根据目标试验的方案,基于观察性数据,制定对应的模拟方案。
其中,对于因果对比的估计,在RCT研究中,经常会同时使用意向性分析(intention-to-treat, ITT)和符合方案分析(per protocol, PP)两种方法;但在观察性研究中,并没有所谓的干预分配意向,因此常常采用的是PP分析的结果。对于干预措施的随机分配,观察性研究要模拟RCT的随机化效果只能借助多元回归等统计学方法实现,在这一点上,模拟目标试验的方法和传统的分析方法是一致的。
在RCT中,研究对象的入组、干预的分配和随访的开始是同步的,即随访开始时间(time zero)是研究对象达到纳入排除标准的入组时间,也是干预措施的分配时间。因此,RCT避免了永恒时间偏倚和和现使用者偏倚。模拟目标试验方法的关键便是实现研究对象的入组、干预分配和随访开始时间的同步。
如果要使用观察性研究数据实现这一目标,则有以下问题需要解决:①在RCT中,研究对象入组时被分配的干预措施是已知的,但真实世界研究中,研究对象入组时,未被分配干预措施(不能依据研究对象之后接受的干预措施决定前面的组别),即无法实现入组和干预分配的同步;②在观察性研究中,研究对象可能在多个时间点满足入组标准,都可以作为随访开始时间,但分析时需将随访开始时间确定下来。
图3 模拟目标试验的方法框架
模拟目标试验方法的技术实现
要解决上节提到的问题①,Hernan等[1]基于反事实思想,提出克隆和逆概率删失加权(inverse probability of censoring weighting,IPCW)相结合的方法(图4)。所谓克隆,是将所有研究对象的信息复制为两份,在随访开始时分别分配到对照组和干预组,之后如果某时间点研究对象违背了该组的干预措施,则该组的研究对象便被视为删失。如此便解决了研究对象入组时,无法明确暴露组别的问题。
但删失可能会带来选择偏倚,IPCW可以用来弥补删失的影响。IPCW的基本思想是,如果两名研究对象的协变量特征很接近,其接受某种干预措施的概率应该也比较接近,因此,我们可以赋予未删失的研究对象一定的权重,使得其信息不仅可以反映自身的情况,也可以反映删失个体的情况。
图4 克隆和逆概率删失加权法
同一个研究对象可能在多个时间点符合纳入排除标准,即有多个随访开始时间可供选择,此时,可以选择单个随访开始时间,例如第一次可入组的时间或者随机选取某个可入组时间;也可以通过模拟多个试验以选择所有或部分可入组的时间作为随访开始时间[14]。后者具有更高的统计效能,但需要对估计的方差进行校正。
以Garcia-De-Albeniz等[14]的研究为例,研究者使用美国Medicare医保数据库,试图探讨已接受筛查的70~74岁女性和75~84岁女性继续接受乳腺癌筛查能否获益,其入组标准是70~84岁无乳腺癌史,前9个月无乳腺癌症状,入组当天接受筛查的女性。在Medicare这一真实世界数据库中,同一个研究对象在若干个时间点符合纳入标准。
研究者便采用了创建多个模拟试验的方法,模拟了15个队列,每个队列在70~84岁不同年龄开始。同一个研究对象在70岁接受钼靶筛查时,符合纳入标准即进入70岁队列,被随访至结局或删失;在71岁接受钼靶筛查时,若仍符合纳入标准,即进入71岁队列,被随访至结局或删失;以此类推。最后15个队列数据综合,每个个体可能贡献1~15条记录不等,对此,研究者进一步校正了估计的方差。
在RCT中,虽然随访开始时间与干预分配时间同步,但由于现实操作的需要,随访开始时间往往并不是干预开始时间。例如,研究对象被随机分配至手术组,但准备手术需要一段时间,但也必须对这个准备时间加以限制。因此便有了干预分配和干预开始之间的宽限期(grace period)。在宽限期内开始的干预都会被视为服从分组的干预。在RCT中,如果开始干预时间对结局有明显影响,宽限期的长度设定便相当重要了。
在模拟目标试验的方法中,也可以设置这样的宽限期,一方面是为了保证干预措施实际应用的真实性,另一方面可以纳入更多的样本量。例如,在上述的Garcia-De-Albeniz等[14]的研究中,便对接受钼靶筛查设置了三个月的宽限期,即在规定时间(每年一次)的三个月前后接受钼靶筛查均被视为按照计划接受了干预。
进展与应用
模拟目标试验的方法提出以来,受到了学界的认可[15],在流行病学的诸多领域得到了广泛应用[5,16-19],特别是临床治疗中的疗效比较研究。例如,Keyhani等采用模拟目标试验的方法比较了颈动脉内膜切除术和药物治疗对无症状颈动脉狭窄患者预后的影响[20]。
值得一提的是,近日刊发在《新英格兰医学杂志》的辉瑞/BioNTech新冠疫苗在以色列的真实世界数据分析便应用了模拟目标试验的思想[19]。相比临床干预,生活方式干预更难开展RCT进行评价,模拟目标试验的方法便成为流行病学家们的新工具。例如,Rojas-Saunero等[21]探究了控制血压和戒烟的联合干预措施对脑卒中发病的预防作用。除使用模拟目标试验的方法进行研究外,Zhao等[13]还使用该方法框架作为既往观察性研究方法学质量的评价工具,在对风湿性关节药物的有效性对比研究进行总结和评价后,Zhao等认为大多数研究存在可以避免的方法学缺陷。
需要强调的是,模拟目标试验并不是一种新的流行病学设计,仍然无法规避观察性研究的“先天缺点”(如残余混杂和测量偏倚等)。此外,模拟目标试验的分析过程也基于一系列的假设,容易受到研究者的操纵。模拟目标试验也无法实现RCT的盲法和严谨的数据收集,其在证据等级上仍无法与RCT相比。贯彻模拟目标试验的方法最好基于有多次重复调查的数据,已发表的文献往往是基于有多次重复调查的队列研究或者医保数据。即使没有类似的数据资料,模拟目标试验的思想对观察性研究也有普适性。
在真实世界证据日益被重视的当下,混杂因素的识别和控制成为研究者和同行评审所关注的焦点。Miguel Hernan教授注意到观察性研究分析的其他缺陷,完善了模拟目标试验的方法,向我们展示了传统分析范式的弊端。
一直以来,一些流行病学研究总是在发现统计学关联的基础上,努力寻找各种支持性证据,研究的局限性总会提及残余混杂作为挡箭牌,研究结果往往并不稳健、不可重复,造成低质量证据的泛滥。众多无法重复、时常反复的流行病学证据损害的是研究者的信誉和学科的公信力。模拟目标试验的方法框架已被用来作为既往观察性研究方法学质量的评价工具,很明显,该方法的提出将促进流行病学观察性研究的健康发展。
参考文献:
[1] Hernán MA, Robins JM. Using big data to emulate a target trial when a randomized trial is not available [J]. Am J Epidemiol, 2016, 183(8): 758-764.
[2] Hernán MA, Alonso A, Logan R, et al. Observational studies analyzed like randomized experiments: An application to postmenopausal hormone therapy and coronary heart disease [J]. Epidemiology, 2008, 19(6): 766-779.
[3] García-Albéniz X, Hsu J, Hernán MA. The value of explicitly emulating a target trial when using real world evidence: An application to colorectal cancer screening [J]. Eur J Epidemiol, 2017, 32(6): 495-500.
[4] Dickerman BA, García-Albéniz X, Logan RW, et al. Emulating a target trial in case-control designs: An application to statins and colorectal cancer [J]. Int J Epidemiol, 2020, 49(5): 1637-1646.
[5] Dickerman BA, García-Albéniz X, Logan RW, et al. Avoidable flaws in observational analyses: An application to statins and cancer [J]. Nat Med, 2019, 25(10): 1601-1606.
[6] Friis S, Poulsen AH, Johnsen SP, et al. Cancer risk among statin users: A population-based cohort study [J]. Int J Cancer, 2005, 114(4): 643-647.
[7] Poynter JN, Gruber SB, Higgins PD, et al. Statins and the risk of colorectal cancer [J]. N Engl J Med, 2005, 352(21): 2184-2192.
[8] Shannon J, Tewoderos S, Garzotto M, et al. Statins and prostate cancer risk: A case-control study [J]. Am J Epidemiol, 2005, 162(4): 318-325.
[9] Khurana V, Bejjanki HR, Caldito G, et al. Statins reduce the risk of lung cancer in humans: A large case-control study of us veterans [J]. Chest, 2007, 131(5): 1282-1288.
[10] Emberson JR, Kearney PM, Blackwell L, et al. Lack of effect of lowering ldl cholesterol on cancer: Meta-analysis of individual data from 175,000 people in 27 randomised trials of statin therapy [J]. PLoS One, 2012, 7(1): e29849.
[11] Dale KM, Coleman CI, Henyan NN, et al. Statins and cancer risk: A meta-analysis [J]. Jama, 2006, 295(1): 74-80.
[12] Hernán MA, Sauer BC, Hernández-Díaz S, et al. Specifying a target trial prevents immortal time bias and other self-inflicted injuries in observational analyses [J]. J Clin Epidemiol, 2016, 79: 70-75.
[13] Zhao SS, Lyu H, Solomon DH, et al. Improving rheumatoid arthritis comparative effectiveness research through causal inference principles: Systematic review using a target trial emulation framework [J]. Ann Rheum Dis, 2020, 79(7): 883-890.
[14] García-Albéniz X, Hernán MA, Logan RW, et al. Continuation of annual screening mammography and breast cancer mortality in women older than 70 years [J]. Ann Intern Med, 2020, 172(6): 381-389.
[15] Labrecque JA, Swanson SA. Target trial emulation: Teaching epidemiology and beyond [J]. Eur J Epidemiol, 2017, 32(6): 473-475.
[16] Caniglia EC, Rojas-Saunero LP, Hilal S, et al. Emulating a target trial of statin use and risk of dementia using cohort data [J]. Neurology, 2020, 95(10): e1322-e1332.
[17] Caniglia EC, Zash R, Jacobson DL, et al. Emulating a target trial of antiretroviral therapy regimens started before conception and risk of adverse birth outcomes [J]. Aids, 2018, 32(1): 113-120.
[18] García-Albéniz X, Hsu J, Bretthauer M, et al. Effectiveness of screening colonoscopy to prevent colorectal cancer among medicare beneficiaries aged 70 to 79 years: A prospective observational study [J]. Ann Intern Med, 2017, 166(1): 18-26.
[19] Dagan N, Barda N, Kepten E, et al. Bnt162b2 mrna covid-19 vaccine in a nationwide mass vaccination setting [J]. N Engl J Med, 2021.
[20] Keyhani S, Cheng EM, Hoggatt KJ, et al. Comparative effectiveness of carotid endarterectomy vs initial medical therapy in patients with asymptomatic carotid stenosis [J]. JAMA Neurol, 2020, 77(9): 1110-1121.
[21] Rojas-Saunero LP, Hilal S, Murray EJ, et al. Hypothetical blood-pressure-lowering interventions and risk of stroke and dementia [J]. Eur J Epidemiol, 2021, 36(1): 69-79.
点击左下角“阅读原文”,免费学习医咖会的各种临床研究课程,包括SPSS教程、R教程、Stata教程、数据管理、样本量计算等。
医咖会面向医生个人、医院/单位、企业提供各种科研服务,包括研究设计、统计分析、EDC系统、科研培训等,详情查看:。快加小咖微信(xys2019ykh)或扫描以下二维码加小咖微信咨询吧。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.