对象:1050例单胎妊娠孕妇
指标:检查sFlt-1:PlGF的值,观察是否发生子痫前期
结果:sFlt-1:PlGF≤38,1周内不发生子痫前期。阴性预测值99.3%,敏感性80%,特异性78.3%
结论:对于临床上的高危人群, sFlt-1:PlGF 如果≤38,可以预测1周内不发生子痫前期
这是文章的表1,一般资料包括年龄、种族等。诊断试验可以按照Y(疾病)分组,这里分了患病和没有患病的两个组。
作者做了两个队列,一个是Development建模队列,一个是Validation验证队列。
做两个队列的好处是:一个建立诊断标准,一个验证诊断的效果,告诉审稿人我的诊断模型验证了之后,是靠谱的!相信我吧!发表吧!
【吸取经验】
如果你的样本量不小,成两个建模和验证组,会给文章加分不少。后面讲软件操作时,会讲如何分建模和验证组。
图1是研究对象入选流程图,就不专门讲了。只强调两句话:
1、不要随机选择研究对象;2、有随访缺失的人很正常,
研究对象入选流程图里写清楚就行:排除了多少例随访缺失的,如上图排除了52 were lost to follow-up,新英格兰都有随访缺失,你怕什么。
图2是在建模和验证队列中,展示用指标(sFlt-1:PlGF)=38区分是否有疾病的结果。
箱图中间的横线表示这组中位数,上下框是上下四分位数,外面的点是离群值。可以看出,患者的测量值比较高。用38这个值可以较好的区别大部分的患者与非患者。这个图是定性的看看,发现38作为诊断界值还不错,下面进一步分析得出量化结果。
【吸取经验】
做诊断试验的SCI论文,最好也搞这样一个图,一目了然,告诉审稿人你的指标区分患者与非患者,有多好!
这是文章核心结果表2。列出了诊断的界值点Cut-off 是38时,在不同时间建模和验证队列的统计检验指标。
结果如何解读呢?以红框的结果举例:在验证队列中,阴性预测值99.3%,表明如果X≤38,一周内不发生子痫前期的正确率为99.3%,是指测出的全部阴性例数中,真正没有患本病的例数所占的比例为99.3%,这就很高了。括号里面的是95%可信区间,表明波动范围在97.9-99.9。下面是敏感性80%,特异性78.3%。
1周的时间点给出的是阴性预测值,目的是排除不发病,所以写了rule out;
4周的时间点给出的是阳性预测值,目的是纳入发病的,所以写了rule in;
为什么不是37或者39呢?这个界值是怎么确定的呢?下面图3回答这个问题。
图3是诊断试验ROC分析的图,可以看到两条线,一个是建模队列,一个是验证队列。
图中标记的是诊断界值38。这个点基本是最靠近左上角的顶点了。使得敏感度和特异度综合起来最高。取了整数便于临床应用。
如果你做诊断试验,这个图是一定要做的。
本研究诊断的是妊娠期高血压疾病的风险,如果把患者血压值考虑进来进行诊断,是否会使得诊断价值更高呢?作者在附图中进行了分析:
附图给出了
X和临床指标联合做诊断试验ROC分析
,临床指标包括:收缩压、舒张压、尿蛋白。
三条线是不同的组合:黑线是只用上述三个临床指标;蓝线是临床指标+本研究关注的X;红线只是本研究关注的X。可以看出红线在黑线的上面,表明单用X的诊断价值比临床指标高。红线和蓝线有交叉,表明是否加上临床指标,对于X的诊断价值影响可能不大。
【吸取经验】
如果你做诊断试验的SCI论文,最好也搞这样一个图:单指标和多指标联合并进行比较。
如果单个指标和联合多指标诊断结果差不多,直接告诉审稿人你的指标很好,一个顶几个!
如果单个指标比多指标联合好很多,那是文章的亮点,表明新指标比传统方法好,文章临床价值提升好几个等级!
如果单指标没有多个指标好,文章核心结果就可以报道多指标联合诊断,
建立个公式或列线图(Nomogram)
放在文章里也是极好的,后面专题课会讲方法。
把原始数据整理到一张表中,每个研究对象一行,全数字编码,例如ID编号=1的研究对象,金标准诊断结果是没有子痫前期,测量值是12。后面是其他变量。数据整理好后,进行统计分析。
工欲善其事,必先利其器”,工具很重要。第一步,在官网免费下载安装易侕软件。后台是R语言程序,获得国际认可,已有多篇SCI论文发表。
首先,在桌面上新建一个文件夹,命名为DATA。这样后续的分析结果,就存在本文件夹中。
第二步,把数据和变量说明文件放在文件夹内。数据可以在本课程的“资源下载”中获取。把上述两个excel文件分别“另存为”-“文本文件(制表符分隔)”
打开易侕软件,左上角分析项目-创建新项目。
点“浏览”找到文件夹“DATA”里的“DATAsflt.txt ”,点“读取数据文件”
数据成功导入,每个变量的基本统计描述就自动得出了。
点击数据操作-读入变量编码与注解文件,变量就注解好了。
如果投英文的期刊,就注解成英文的;如果投中文期刊,就注解成中文的。
下面看使用易侕软件4个模块5分钟内轻松实现论文中的图表。
结局变量Y: Preeclampsia(子痫前期)
评价指标X: sFlt-1 PlGF ratio (某检测指标)
其他因素Z: AGE(年龄)、 wk of gestation (孕周)、 BMI before pregnancy (孕前BMI)、 Systolic blood pressure (收缩压)、 Diastolic blood pressure (舒张压)
4个模块操作
用“数据分析”的“研究人群描述”模块
用“数据分析”的“变量图示与统计检验”模块
用“数据分析”的“诊断试验与预测方程”-“诊断试验与RCO分析”模块
用“数据分析”的“诊断试验与预测方程”-“预测模型与RCO分析”模块
表一“研究人群描述”,看用易侕如何实现。
选“数据分析”的“研究人群描述”模块。把要分析的变量拖入“分析变量”;把Y拖入“选择列分层变量”,点击“查看结果”。
看这个结果截图,表一就这样做成了!得出连续变量的均数、标准差;分类变量得出例数百分比。本例数据只是为了方便大家练习做的模拟数据,所以具体的数字结果跟原文结果对不上。
慢!还有问题:原文中有两个大组(建模组和验证组)怎么做啊?别急,这个后面讲模型构建的时候会讲。
这里有两个P值,第一列p值是用t检验或者卡方检验做的,第二列p值是用非参数的方法或Fisher精确概率检验做的,具体统计方法,表下面有注解。发文章时取哪个P值呢?如果两个p值一致,例如都小于0.05,就取前面的P值,如果不一致,就取后面的P值。
下面看使用易侕“变量图示与统计检验”模块,轻松实现论文中的箱图。把相应变量拖入输入框内,如图所示,点击“查看结果”。
直接输出论文中需要用到的箱图和所用统计指标结果。
下面看使用易侕“诊断试验与RCO分析”模块。先做个简单的,把X和Y拖入输入框内,如图所示,点击“查看结果”。
直接输出论文中需要用到的ROC曲线,以及所有统计指标结果都有了。图有png格式和pdf格式的矢量图,像素完全能满足高质量SCI期刊的发表要求。各分界点对应的敏感度特异保存在ROC输出文件(.xls)里也都有了。
这里的ROC曲线是一条线,如何把多条线画在一幅图里面呢?需要首先构建联合诊断的方程,操作如下:
继续用这模块,把多个变量联合诊断加上:分析方法选择“2:所有X(预测模型)分析”,并且在下面框中拖入多个指标用于联合诊断,这里选择指标sFlt-1:PlGF、收缩压和舒张压举例。点击“查看结果”。
直接输出论文中需要用到的ROC曲线和所有统计指标结果。
另外还自动得出了列线图(Nomogram)的结果,本篇新英格兰核心结果并非多指标联合诊断,所以文章没有给出列线图。
关于列线图的结果解读和SCI论文模板会有专题课分享。
复制这里得出的方程,用于计算联合指标的新变量Xn1=-2.33602 +0.09980*X +0.00459*X4 -0.02158*X5。
同样的操作,选多个指标用于联合诊断,这里选择收缩压和舒张压。点击“查看结果”。
复制这里得出的方程,用于计算联合指标的新变量Xn2=0.23077 +0.00705*X4 -0.01583*X5
最后,把单个指标、联合3个指标的变量Xn1和联合两个指标的变量Xn2,都放在选框中,分析方法选择“1:逐个X(检测项目)分析”。
下面看使用易侕“预测模型与RCO分析”模块。这里可以设置构建模型所用样本。
可以随机按比例把所有观察样本分成建模组development set (Dset)与验证组validation set (V set)。
这里设置比例为50%建模50%验证。
可以得出一个Excel数据文件,里面的splitGROUP变量就是分组变量。下一步在“数据操作”菜单下选“更新源数据文件”。重新运行一般人群描述模块,把splitGROUP变增加到“选择行分层变量”中,就得出了建模和验证的结果。其他图表也可以通过增加分层变量实现,这里就不再演示了。
到此为止,我们就把这篇新英格兰临床研究的所有核心图表结果做出来了,操作起来并不是那么难吧?不需要自己选择统计分析方法,不需要学R语言编程,临床医生自己就能做出这些分析了。
易侕后台是R语言,因此发表论文时,统计方法部分需要写用R语言做的分析。具体写法可以参考已经发表了SCI论文。
其实,从数据分析思路和统计方法方面,这篇新英格兰的文章还有可以完善的地方。下次课再继续分享。
本内容来源于易侕学院云课堂(mooc)的系列课程
更多云课堂免费公开课简介
易侕精品课:
《接轨SCI临床科研设计与数据分析概述》
《获取免费公开数据资源方法》
《Level 1:易侕软件基本操作课程》
《Level 1:看懂临床型SCI论文核心结果》
【适合人群】本内容适合于希望学习临床型SCI数据分析的学友。
课时1:看懂临床型SCI论文核心结果
课时2:待发布
【联系我们】
返回搜狐,查看更多
责任编辑:
平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。