2. R语言元分析专题第三章:数据导入和预处理
元分析 第三章
数据导入和预处理
为了在 R 中进行元分析,你需要准备好你的研究数据(实际上任何分析都一样)。在本期的文章中,我们将介绍如何准备数据,将数据导入 R 以及对数据进行初步的预处理。
目录
1. 数据准备
2. 将数据导入R
3. 数据预处理
01 数据准备
███首先,你需要准备好你的数据文件。这一步非常简单,实际上不需要任何 R 相关的知识,通常数据都会以表格的形式存储在 Excel 中,常见的格式有 xls , xlsx , csv 等,这里 推荐使用 csv 格式 ,因为 xls 格式较为复杂。此外,其他常见的数据格式有 sav (SPSS数据),txt 和 dat(文本格式)等,使用这些方法保存数据也是可以的。
一般来讲,数据表格的 每一行表示一个个案( or 被试),而每一列则代表一个变量 ,恰当地对变量进行命名是一个好习惯,变量名最好是英文。同时,可以对数据进行初步的筛查,如异常值,缺失值等。
02 将数据导入RStudio
█ █ █Rstudio 提供了两种导入数据的方法:
❶ 第一种方法和 SPSS 等软件类似,即通过菜单命令导入:
针对上面提到的几种数据类型,可以选择相应的选项进行导入:
xls ,csv 数据文件 —— From Excel
sav 数据文件 —— From SPSS
txt 数据文件 —— From Text(readr)
选择之后出现如下界面:
点击右上角的 Browse... ,选择保存好的数据文件,即可看到数据出现在预览框中:
在预览界面可以看到变量的名称和数据类型(这个会在后面详细介绍),点击后会弹出几个选项,前三个用来改变该变量数据的类型:Character(字符型),Numeric(数值型),Data(日期型), Include 则表示该变量会被读取,Skip 表示在读取时跳过该变量 ,即在后续的分析过程中无需使用该变量的数据。