临床基线表是在临床研究中用于记录和收集患者初始诊断、治疗前的基本信息以及其他关键变量的表格或数据库。这些基本信息通常被用作研究的起点,用于建立患者的初始状态或基线状态。
本文介绍通过 Galaxy生信云平台 usegalaxy.cn 制作临床基线表/三线表的方法。
1. 数据准备
要制作临床基线表/三线表,首先要将临床信息整理成表格:
-
每一行是一个样本;
-
每一列是一个变量。
比如:
本文将以平台自带的一个测试数据集(tableone_pbc.tsv)为例进行演示。
2. Galaxy平台操作步骤
2.1 选择工具
- 进入Galaxy生信云平台:usegalaxy.cn(建议使用Chrome或Firefox浏览器)。
- 主页左侧工具列表中,找到 Statistics > 临床基线表,点击进入工具界面。
2.2 选择测试数据集
点击输入数据最右边按钮 Browse datasets > Data libraries > Table data > tableone_pbc.tsv,如图:
2.3 运行工具
完成数据集的选择后,我们保持其他参数设定框为空,以默认参数运行工具:
2.3 查看结果
点击眼睛图标,查看计算结果:
结果展示:
2.4 下载结果
点击显示数据详情:
点击磁盘图标下载结果文件:
结果是一个文本文件,可以用文本编辑器或者Excel打开:
3. 调整参数重新计算
在Galaxy平台上重新调整参数再次运行工具是非常方便的,只需要点击界面中的“重运行”按钮:
可以看到,界面中出现了刚才运行任务时的参数设置,也就是说,当重新运行任务时,上一次运行的参数得到了保留,我们只需要进行必要的修改,即可再次运行工具。
进行必要的修改,如:
- 指定一个分类变量:sex
- 指定两个符合正态分布的变量:trig, platelet(仅仅是用于举例,实际要依变量的性质而定)
- 指定两个不符合正态分布的变量:time, age(仅仅是用于举例,实际要依变量的性质而定)
- 指定两个分类变量:status, trt。当分类变量以数值表示时,必须明确指定其为分类变量,否则会自动按数值变量处理。
再次点击 Run Tool 运行,查看结果:
可以看到:
- 对于符合正态分布的变量,计算了平均数和标准差:mean(SD)
- 对于不符合正态分布的变量,计算了中位数和上下四分位数:median(IQR)
- 对于分类变量,计算了它们的数量及其中总数中的百分比(%),以数值表示的分类变量得到了正确的处理
此外,表中还展示了 p 值 ,关于检验方法:
- 正态分布的数据,进行了参数检验
- 不符合正态分布的数据,进行了非参数检验
- 分类数据,进行了Fisher精确检验
限于篇幅,本文就介绍到这里,更多生信工具,请到Galaxy生信云平台 usegalaxy.cn 网站进行探索。
3. 最后
生信分析已经进入2.0时代,即云平台时代。
Galaxy生信云平台 usegalaxy.cn 致力于降低生信分析门槛,将许多常见的生信分析都放到云上,用户无需安装本地软件或R包,只需要上传数据,点击鼠标即可进行生信分析。