实验组和对照组的样本量一定要“均衡”才行何帅

“随机、对照、重复、均衡”是统计学和流行病学老师在课堂上经常强调的内容之一。受此影响,很多同行在开展科研的过程中不分青红皂白地遵循这四大原则。特别是对于“均衡”这一概念,很多研究者总是觉得要是实验组和对照组不平衡(样本量相差甚远)的话,研究结果就不够可靠。殊不知,并非所有的研究都要遵循“均衡”原则的。而且,部分研究如果严格遵循“均衡”原则的话,不仅无助于研究质量的提升,反而会削弱研究的论证强度。

实际上,“均衡”这一原则主要是针对干预性研究提出来的,旨在维持较高的统计效能。而在医学研究领域,除了干预性研究(比如随机对照试验)外,还有观察性研究和诊断准确性试验,这些研究就不需要研究者老老实实地遵循“均衡”原则了。对于观察性研究和诊断准确性试验而言,最重要的设计要点之一就是要体现“真实世界”,或者说样本来源及构成比要接近于临床实际。

1、诊断准确性试验

理想的诊断准确性试验属于单门设计,即设立统一的纳入排除标准,连续或随机招募所有符合条件的病人,然后根据金标准将病人分为疾病组和对照组(非疾病组),然后采用受试者工作特征曲线(ROC)或四格表评价某一手段对疾病的鉴别能力。此外,为了保证研究质量,提升论证强度,还应该遵循双盲、统一金标准、全部接受金标准、金标准独立等原则。从上述设计原则我们不难看出,实验组和对照组是自然形成的,无需刻意将比例控制在1:1。

比如:某研究分析了 NT-proBNP 在呼吸困难人群中对心力衰竭的诊断价值(J Am Coll Cardiol 2010; 55:2062-2076.),在设立了统一的纳入标准(因呼吸困难而就诊)和排除标准(外伤)后,研究者采用连续招募的方式募集到了 1641 例呼吸困难的人群,并采用金标准将病人划分为心衰病人(n=568)和非心衰病人(n=1073)。在此研究中,实验组(心衰病人)和对照组(非心衰病人)的样本之比大约是 1:2 左右。

按照“均衡”原则来衡量的话,这项研究有一个明显的设计缺陷:试验组和对照组的样本量居然不均衡。J Am Coll Cardiol 这种丧心病狂到令人发指的杂志怎么会接受这样一篇用脚拇指都能看出的有漏洞的论文呢?

实际上,试验组和对照组不平衡的问题并不是这项研究的缺陷,反而是研究的亮点。我们知道,在诊断试验中,诊断敏感性和特异性与诊断界值的取舍密切相关,而诊断界值的取舍又在很大程度上取决于待评价试验结果在实验组和对照组中的分布状况。如果刻意将实验组和对照组比例控制到 1:1,当然也能进行诊断准确性方面的统计学分析,但是问题在于,这种统计分析结果不具备外推性(clinical application),或者说其结论不能直接用于指导临床工作,因为实验组和对照组的比例完全是虚拟的,与真实世界的情况相差甚远。在真实世界中,如果您接诊了 1641 个因呼吸困难而就诊的人群的话,确实只能观察到约 568 例心衰病人。因此,基于这样一个人群的研究结果,显然才会具有外推性。实际上,这种实验设计理念在诊断准确性试验质量评价工具(QUADAS)中也得到了充分的体现。感兴趣的读者可以阅读 QUADAS 的相关内容。

2、队列研究

队列研究主要有两种,一种是研究疾病发生风险,另一种则是研究疾病的预后。我们以前一种队列研究为例,重点谈一谈实验组和对照组是否需要平衡的问题。

2012 年的 BMJ 杂志刊登了一篇文章,分析类风湿因子(RF)与类风湿关节炎(RA)发病风险的关系。该研究于 1982 年左右纳入了 9712 名无 RA 的普通人群进行了分析,检测了这些人群当时的 RF 水平,随后对这些研究对象进行了长达 28 年的随访,发现有 183 人发展为 RA,之后研究者采用了 Kaplan-Meier 法和 Cox 模型分析了基线 RF 与未来 RA 发病风险的关系。在这个研究中,实验组就是在随访过程中发生 RA 的患者(n=183),对照组则是剩下的人群(n=9529),两者的样本量可谓相差甚远。但是就这样一个不“均衡”的研究,却能“堂而皇之”地发表在大名鼎鼎的 BMJ 上,因为这样的研究设计才是真实世界的研究!

众所周知,在队列研究中,一般采用 Kaplan-Meier 法和 Cox 模型去分析暴露因素与结局事件之间的关系,通过 Cox 模型中的风险比(HR)来反映暴露因素与结局事件之间的关系密切程度。HR 具有极为重要的临床价值,因为它直接反映了暴露因素与结局事件的关联性。比如:与 RF<25 IU/ml 的患者相比,RF>100 IU/ml 的个体的 HR 为 5,其对应的临床解释为:RF>100 IU/ml 的个体在未来三十年内发生 RA 的风险是 RF<25 IU/ml 的人群的 5 倍。

在 Cox 模型中,HR 在很大程度上受样本构成比的影响。假如在上述研究中,我们刻意将实验组和对照组的比例控制在 1:1(采用巢式病例对照研究的模式),当然也能用 Cox 模型算出一个 HR,但是这个 HR 显然不能外推,不能用于临床实践,因为这个 HR 是经虚拟世界的研究出来的,在这个虚拟世界中,RA 和对照组的构成比是 1:1,即有一半的研究对象在随访过程中发生了 RA!而在真实世界中,在三十年的随访过程中,发生 RA 的仅为少数。

3、基于回顾性资料的观察性研究或诊断准确性试验也应该尽量体现真实世界

前面两个例子都是基于前瞻性资料的研究,在这些研究中,真实世界尚未开始,因为研究者可以采用各种方法去确保研究对象、研究过程接近于真实世界。但是如果是基于回顾性资料的研究,真实世界早已一去不复返,又该怎么办呢?笔者认为,即使是基于回顾性资料的研究,也应该尽量将研究设计得接近真实世界。

笔者以 2015 年发表在 Am J Cardiol(2015; 115:57-61.)上面的一篇基于回顾性资料的队列研究来谈谈如何在此类研究中体现真实世界。研究者欲研究中性粒细胞/淋巴细胞比值(NLR)与心力衰竭患者预后的关系,因此从所在医院的电子病历库中提取 2007 年至 2010 年期间求治于克利夫兰诊所的所有进展期心力衰竭患者的病历资料,共计 549 份。进一步分析后,发现其中有 22 份病例上没有 NLR 的结果,因此只能对剩下的 527 份病例进行分析。研究者通过社保系统查询到了这 527 名研究对象的远期预后,发现在随访期间共有 121 例患者接受了心脏移植,158 例患者死亡。经过一系列统计分析后,作者发现基线 NLR 与患者的远期预后密切相关,NLR 大于 5.4 的患者,发生全因死亡的风险是 NLR 小于 3 的患者的 2.16 倍。

这是一项基于回顾性资料的队列研究(回顾性队列研究),从中我们可以看出,为了保证研究对象接近于真实世界,作者可谓煞费苦心!最重要的措施就是纳入所有病例,向读者和审稿人传递一个信息:虽然我们的研究不是真实世界的研究,但是我们想了很多办法去回溯真实世界,目前的研究对象和真实世界已经很接近了。的确,在 549 份病例中,只遗漏了 22 份病例,其对结果的影响是很小的。

国内杂志上刊登的很多研究,往往没有花笔墨去介绍研究是否接近于真实世界,只是轻描淡写地写一句“选取某段时间在医院就诊的患某种疾病的患者 200 名”。问题在于:这 200 名患者是如何获得的?随机选取还是随意选取?能否代表真实世界中这个疾病的状况呢?

4、总结

“均衡”原则主要是针对干预性研究提出来的,如果研究者开展的是观察性研究或者诊断性试验,则没有必要遵循这一原则。观察性研究和诊断准确性试验最重要的是要体现真实世界,即实验组和对照组应该是自然形成的,无需刻意将其比例控制在 1:1!

THE END
0.“真实世界研究”专家共识2018版(全文)传统临床试验的核心是随机化对照试验设计,即将受试个体进行试验组和对照组的随机分配,以避免个体差异对试验的影响,然后对受试样本进行特定的试验干预以获取临床试验证据; “真实世界研究”涉及到干预性研究和观察性研究两种类型,多数情况下是观察性研究(见图2);“真实世界证据”并非要去取代传统的临床试验证据在药物评jvzq<84yyy4489iqe0ipo8hqpvkov87312;1486518?94A>3a;=64=:29:4tj}rn
1.心理学研究方法笔记四(肖内西版本)d观察法的使用:当伦理和道德上的考量导致无法进行实验控制时,自然观察就成为重要的研究策略。 ●干预观察 为了观察效应,或许也为了去验证理论,科学家喜欢对自然进行干预。干预比非干预更能表现大多数心理学研究的特色。 当研究者在自然情境中进行干预的时候,通常采用三种主要的观察方法∶参与性观察、结构化观察和现场实jvzquC41yy}/lrfpuj{/exr1r1>:6l64feg1co
2.将研究分为试验性研究和观察性研究A、有无干预措施B、研究目的C搜标题 搜题干 搜选项 搜索 单项选择题 根据___的不同,可以将研究分为试验性研究和观察性研究 A、有无干预措施 B、研究目的 C、研究领域 D、资料类型jvzquC41yy}/rypcq0ipo8|cpiqf1mfcp19ddBhdf6=3g;9d28gdc=957d>8h>k7gg
3.安全性评价研究中心指导原则国家药监局关于发布真实世界证据真实世界研究的类型大致分为非干预性(观察性)研究和干预性研究。前者包括不施予任何干预措施的回顾性和前瞻性观察性研究,患者的诊疗、疾病的管理、信息的收集等完全依赖于日常医疗实践;后者与前者最大的不同是主动施予某些干预措施,如实用临床试验(Pragmatic Clinical Trial,PCT)等。由于真实世界研究的多样性、设计的jvzquC41cr€y0qre0gjv0ls1ctz0497313603<4ctve:;<:a49:/j}rn
4.读书荟什么是真实世界研究?观察性研究医疗疾病临床真实世界研究的基本设计通常包括干预性研究和观察性研究。在真实世界条件下开展干预性研究的方式是通过对临床已使用的不同干预措施进行随机分组,在尽量贴近临床实际情况下对患者进行干预和随访,并针对患者、临床医生或医疗卫生决策者有重要价值的结局进行评价,常被称为实效性或实用性随机对照试验( pragmatic randomizedjvzquC41yy}/ew2jgcrujlftg0ipo8ftvkimg€r142823:821euovnsv/38:2<=20jznn
5.临床研究方案撰写相关指南申请指南医学伦理科研教学临床研究人员姓名、职务、职称和任职部门。 4 研究摘要 目的 设计(受试人群及参研中心数、样本量、病人分组、干预措施、结局评价指标及统计方法等) 5 目录 6 正文 6.1 研究概论/背景以及立项理由 观察性研究:对所报告研究的背景和原理进行解释,提供研究脉络,定位研究在整个学科中所处的阶段,并描述研究的核心内容所jvzquC41yy}/zvmgctz/exr1iwoeg6::0jznn
6.临床研究伦理审查申请/报告指南(2025年4月27日更新)1、符合上述范围的研究项目,应在研究开始前提交伦理审查申请,经批准后方可实施。“初始审查申请”是指临床研究项目申请人首次向伦理委员会提交的伦理审查申请。 2、研究者发起的临床研究中干预性研究或按照干预性研究管理的观察性研究使用ECCT(KY)-FJ-019-01.0研究者发起的临床研究初始审查申请,其他类别研究使用ECCT(KYjvzq<84yyy4ycp{{0ipo8nphq522?;167:80qyo
7.【医药.Plus】真实世界研究在临床试验中的地位变化药苑杂谈YAOYUAN真实世界证据是指通过对适用的真实世界数据进行恰当和充分的分析所获得的关于药物的使用情况和潜在获益-风险的临床证据,包括通过对回顾性或前瞻性观察性研究或者使用临床试验等干预性研究获得的证据。 并非所有的真实世界数据经分析后都能成为真实世界证据,只有满足适用性的真实世界数据才有可能产生真实世界证据。 jvzquC41zwkrk~3eqo55::72;7:4287;86816A<
8.这个临床研究类型“贼牛”,且好上手!适合护理、营养、康复和医学准实验研究可以用来评估这些干预措施对学习成果和技能发展的影响。 事实上,Quasi-Experimental Study研究在医学科学中适用于各种专业人员,当随机分配不可行时,它可以提供有关干预效果的重要信息。 3、与RCT、观察性研究的区别与联系 图源:梅斯自制 4、发表论文举例 各位老师们,赶紧试试吧!jvzquC41yy}/oniuek4dp8ftvkimg8xjqyebt}neng4eqHnf?9;7gn>253919