大肠息肉的症状

方法学介绍切除传统腺瘤和锯齿状息肉


ClinicalTrialsCommunication

方/法/学/介/绍

December,Vol1,No.2

作者简介

史李铄

医院临床研究中心统计师,研究方向为流动人口健康、临床试验统计学。

本科毕业于武汉大学公共卫生学院预防医学专业,硕士毕业于武汉大学公共卫生学院流行病学专业,博士毕业于中山大学公共卫生学院卫生统计学专业;参与多项流动人口相关国自然与省自然基金项目,同时参与多项临床试验项目数据分析以及统计分析报告撰写。

摘要

通过是否对研究对象采取人为干预措施,可以将临床研究分为两大类,包括以临床试验为代表的干预性研究,和以传统的病例对照及队列研究为代表的观察性研究。上一期内容以中山六院肿瘤内科邓艳红教授的论文(点击可阅读)为案例探讨了临床试验中的统计学问题,本期评述以中山六院结直肠肛门外科何晓生副主任医师的论文《切除传统腺瘤和锯齿状息肉后发生结直肠癌的长期风险评估》(点击可阅读)为案例,探讨观察性临床研究中应该注意的统计学要点。

1

研究问题的提出及研究类型的确定

观察性研究通常为探索性的分析疾病的发病或者预后与危险因素之间的关系,大多数观察性研究是对研究者在临床经验中发现的一些关联现象进行系统的提炼与分析,通过科学的方法来判断该关联是否真实存在。本研究的目的在于评估首次内镜检查结果分别为无息肉、传统腺瘤或锯齿状息肉的人群发展为直肠癌的风险,为临床上确定直肠癌的高风险人群提供理论依据,对提升结肠镜监测的效果具有重要价值。

本研究的相关数据来源于既往数据库,研究类型为回顾性的队列研究。

2

数据的搜集

2.1数据库:根据研究目的,本研究选取了三个数据库获取相关数据:护士健康研究(theNursesHealthStudy,NHS)、护士健康研究2(theNursesHealthStudy2,NHS2)和卫生专业人员随访研究(theHealthProfessionalsFollow-upStudy,HPFS)。

2.2自变量和因变量:本研究根据首次内镜检查结果将自变量(分组变量)设定为无息肉组、传统腺瘤组和锯齿状息肉组,并对每组的评判标准做了清晰的定义;因变量(结局变量)设定为第一次做结肠镜检查到以死亡、CRC诊断、失访或随访结束的年龄差。

2.3协变量:观察性研究中除了数据质量外,最重要的就是协变量的控制,这直接关系到研究结果的可信度,也是评价研究好坏的重要标准。由于不同组的人群没有进行随机化(事实上也不可行),不同组间人群除了分组差异外,还存在各种已知和未知混杂因素的分布不均衡,因此观察性研究应尽可能多的纳入可能影响结局指标的因素作为协变量,在分析中加以控制,从而更准确的判断自变量对结局变量的影响。本研究的协变量来源于首次结肠镜检查报告的调查问卷,包括CRC家族史、吸烟、身高、体重、饮酒、体力活动和规律使用阿司匹林等诸多因素,可以看出研究者为了得出更为可靠的结论,进行了大量的混杂因素相关数据搜集工作,这也是发表高质量论文的必备条件。

2.4可行性:在有了好的研究假设后,根据能够获取的数据也能够评估研究的可行性。首先,需要判断样本量是否足够,通常而言,研究的总样本量至少应该是变量个数的15倍(也有说法是20倍)以上;各组的样本量也不能够太小,否则对模型拟合会有较大的影响,造成模型不稳定,研究结果不可靠;病例对照和队列研究也有相应的样本量估算公式,但是在论文撰写时样本量的计算依据通常不会强制要求汇报。其次,研究者需要判断混杂因素相关变量是否得到较充分的收集,尤其是那些在既往研究中已经被证实与结局指标相关的变量;对回顾性研究而言,搜集的变量已经确定,如果发现有重要的混杂变量未被搜集也难以再弥补,这就需要提前考虑好该问题的解决方案,包括在研究的limitation中加以声明或者结合其他数据库来补充相应的变量,当然,这些方案只是不得已而为之的权宜之计,仍然难以消除重要变量缺失对结论可靠性的影响,研究的价值也会大打折扣,因此在数据库的建立时,就需要进行充分的文献复习,尽可能多的搜集混杂变量。

3

统计分析

3.1描述性分析:包括各组人群基线特征和结局指标描述。本研究有例患者至少有一个传统腺瘤,例至少有一个锯齿状息肉,例没有发现有任何息肉,首先对各组疾病特征和可能影响结局的混杂因素进行描述,见表1。同时,研究者对各组结局指标,即疾病进展情况进行描述,绘制了生存曲线,见图1,值得注意的是,这里并没有像临床试验中的生存分析一样进行log-rank统计推断,这是由于观察性研究并没有随机化步骤,组间存在非常多的混杂,因此未进行校正的单因素分析结果无论有无统计学差异,参考价值均较小。从现有论文的结果汇报来看,观察性研究通常以校正混杂后的多因素结果为准,而临床试验则通常以单因素的log-rank结果来判断是否存在组间差异。

3.2cox回归:用cox回归来评估校正混杂因素后的组间差异,并估算HR值。本研究比较了不同亚型的传统腺瘤和锯齿状息肉相对于无息肉者发生直肠癌的风险,发现进展期腺瘤和管状绒毛状腺瘤等多个亚型组风险高于无息肉组(见表2),≥10mm锯齿状息肉组风险高于无息肉组(见表3)。同时研究者均通过3个模型,逐步纳入混杂因素进行校正来判断组间差异,这是检测结果稳健性常用步骤,三个模型结果一致,则意味着不会因为多纳入一个变量或少纳入一个变量,HR值会变得没有统计学意义或者是影响方向发生变化(从危险因素变为保护因素),表明研究结果的稳健可靠。

3.3交互效应分析:研究根据传统腺瘤的发生部位对人群进行分组,探索不同发生部位的人群相对于无息肉组的HR值是否存在组间异质性,结果表明未发现组间具有统计学上的异质性,见附表2。

3.4敏感性分析:与临床试验类似,观察性研究也可以有多种方式进行结果的敏感性分析,本研究采取的是限定不同的人群来进行组间差异的探索,包括限定首次进行全结肠镜检查的参与者和结肠镜检查用于筛查的参与者,分析结果与全人群结果基本一致(见附表4、5),表明结果稳健性较好,较为可靠。

3.5统计分析总结:以上几种分析可以归结为两点:混杂的控制和结果稳健性判断,其目的都是为了让研究结果更为可靠,这也是统计分析的核心价值所在。同时也让我们看到了研究者为了得出更可靠的结果所做出的努力,这也符合高水平期刊论文的判定标准:观察性研究可能永远无法校正所有的混杂得出真实的结果,但研究者应该要采取一切努力尽可能的让研究结果接近这个真实值。

4

结果讨论

队列研究证据等级在观察性研究中较高,但仍然弱于随机临床对照试验,因此研究结论大都只具有参考意义,并不能直接指导临床,下结论要相对保守,不可夸大,“可能”“提示”等词也是观察性研究结果表述的常用词。

5

论文撰写

与临床试验类似,观察性研究也有对应的汇报规范,可以作为论文撰写过程的参考模板。通过以下链接可以下载观察性研究的STROBE指南


转载请注明:http://www.pindaod.com/drby/7042.html


当前时间: