R语言笔记之——常用数据导入方式简介

R语言笔记之——常用数据导入方式简介

因为之前旁听过几节R语言的课程,再加上自己练习数据可视化的需要(特别是可视化包——“ggplot2”),学了些R语言的皮毛。

总觉得基础没打牢,好高骛远、急于求成,总想学高大上的模块,却又总是力不从心。

现在的状态是,参考别人的代码,修修补补,勉强能画一些图,做一些计算,可是

自己写起来却总是磕磕碰碰,漏洞百出。

深感基础语法之重要性,这里分享一些学习过程中总结的笔记,希望初学者可以牢记于心,避免同样的问题。

R语言支持的数据类型很多,但是初学者能接触到却寥寥无几,这里仅仅介绍.TXT、.CSV、直接复制三种方式。(不要问为啥没有xlsx,excel文件属于富文本数据文件格式,导入太麻烦,需要很多转换和专用包的支持,劳神费力)

TXT文件导入:

文件路径在桌面,名为myfile.txt

文件需为很规则的一维表,最好第一行有名称。所有操作均在Rstudio中完成。

语法:

data<-read.csv("C:\\Users\\Administrator\\Desktop\\myfile.csv")  #CSV数据读入

data是自定义名称,“<-”是命名符,等价于“=”,括号内是文件存放路径,如果文件内数据第一行无标题,需要在括号内路径后指定顶行非标题,("******",header = F),默认参数为header=T,即顶行为变量名称。(注意下R认可的路径与PC上文件路径使用的斜杠格式及方向)

导入后,数据文件存放在右上侧environment项目下的data列表中,可以直接点击查看,也可以通过head(data)预览数据前6行记录。

CSV文件导入:

data<-read.table("C:\\Users\\Administrator\\Desktop\\myfile.txt",header=T)#TXT读入:

导入txt文件格式最好直接在路径后指明首行是否为标题,否则容易把第一行直接导入为数据。

剪切板直接复制:

这种方法比较粗暴,当然也较容易出现问题,先在excel或者其他数据文件中复制数据区域,在Rstudio中输入:

data <- read.table("clipboard", header = T, sep = '\t')#直接复制

然后回车或者“Ctrl+L”运行即可导入。

比较推荐前两种,比较保险,不容易出现错误,可以直接将以上语法做笔记保存,需要时直接复制,替换路径和名称直接运行。

以下是小魔方总结的关于R语言包的下载,加载以及更新以及R语言软件更新的方法技巧,供大家参考:

关于包的安装、加载及更新、卸载:

update.packages()#查看可更新包
install.packages("ggplot2")#安装下载工具包
library(ggplot2)#加载下载工具包