«

使用Tiverse优雅地处理数据集


»

2023-11-10,Galaxy生信云平台 UseGalaxy.cn 新增 12 个工具。

TIDYVERSE

  • Dplyr Arrange rows
  • Dplyr Count the observations
  • Dplyr Distinct keep unique rows
  • Dplyr Join two tables
  • Dplyr Join with one varibale
  • Dplyr Mutate create, modify, and delete columns
  • Dplyr Rename columns
  • Dplyr Select keep or drop columns
  • Dplyr Slice select rows by position
  • Dplyr Filter keep rows that match a condition
  • Tidyr Pivot Longer from wide
  • Tidyr Pivot Wider from long

Dplyr Arrange rows

arrange 函数用于对数据框按照指定变量进行排序,可以根据一个或多个变量对数据进行升序或降序排列,帮助用户重新整理数据框中的观测顺序。

Dplyr Count the observations

count 函数用于统计数据框中各个组的频数,可以对指定变量进行计数,得到每个类别的观测数目,支持根据需要对结果进行排序。

Dplyr Distinct keep unique rows

distinct 函数用于去除数据框中的重复观测,仅保留唯一的观测。它可以基于指定的列对数据框进行去重操作,确保每个观测都是唯一的。

Dplyr Join two tables

join 函数用于根据指定的键将两个数据框连接起来,可以根据共同的变量将数据框进行合并,支持多种连接操作,如内连接、左连接、右连接和外连接等。

Dplyr Join with one varibale

同上。区别在于只用一个变量连接两个表。

Dplyr Mutate create, modify, and delete columns

mutate 函数用于添加新变量或修改现有变量,能够基于已有数据创建新的变量列,支持对数据框进行实时的变量操作和修改。

Dplyr Rename columns

rename 函数用于重命名数据框中的变量名,能够快速修改变量的名称,使得数据的列名更符合用户的需求和习惯。

Dplyr Select keep or drop columns

select 函数用于选择数据框中的特定列,可以保留感兴趣的变量,并且能够根据列名、位置或条件表达式进行灵活的变量选择操作。

Dplyr Slice select rows by position

slice 函数用于按行数进行切片,能够从数据框中提取特定的行,支持根据行数或行号选择需要的行,也支持使用负数表示从末尾开始计算的行数。

Dplyr Filter keep rows that match a condition

filter 函数用于根据条件筛选数据行,能够仅保留满足条件的观测,支持根据指定的条件表达式对数据框进行灵活的行筛选操作。

Tidyr Pivot Longer from wide

pivot_longer 函数用于将宽格式数据转换为长格式数据,能够根据用户指定的列将数据框中的多个列整理成一对 “名-值” 对,便于进一步的分析和处理。

Tidyr Pivot Wider from long

pivot_wider 函数用于将长格式数据转换为宽格式数据,能够将数据框中的一列分成多个列,根据指定的列名进行展开,使得数据以更直观的宽格式形式呈现。

友情提示

使用问题请加入Galaxy中国交流群: 925694514(QQ群,免费加入),或者关注公众号:简说基因