R语言处理数据
在R中很多内置函数,用于数据框的基本操作,比如转换、分组、排序、拼接等,常见的函数有rbind(),cbind(),dplyr(),tidyr(),reshape2,tidyverse(),base()等,其中,base()是R语言内置包,无需安装。数据处理是ggplot2绘图的基础,同时也是R语言中花费时间较多的工作之一,提高数据处理的效率能够很快的得到可靠美观的图片。
01
表格拼接
#构建数据框
#给数据框df18添加行或纵向添加表格
>dr1<-rbind(df18,df20)
#给数据框df18添加列或横向添加表格
>dc1<-cbind(df18,df19)
运行结果如下:
02
表格融合
有时候,表格之间没有很好的保持一致,仅仅依靠rbind() 和cbind()函数直接拼接无法实现,当两个表之间有共同的列时,能够进行表格的融合,可以采用merge()函数。merge()函数,合并数据框中的x和y的列名的向量,如果有些数据框y列名中没有数据,也会默认为是匹配x列名的数据。
#构建数据框
>dm1<-merge(df1,df2,by="x",all=TRUE)#by是合并x和y共享列名中的向量,默认为两个表之间有共享的键列。如果y没有键列,则默认为x的键。all=TRUE是x=TRUE,y=TRUE的简写
>dm2<-merge(df1,df3,by.x="x",by.y="f")#by.x与by.y是分别指左边数据框的匹配列,右边数据框的匹配列
>dm3<-merge(df1,df4,by=c("x","y"),all=TRUE)
03
表格分组
#构建数据
#df5的变量名称country,GDP2019,GDP2018储存的向量应为数值,不能含有中文,否则melt运行失败。
#df_m按照year分组
#同时按照year和country两个变量分组操作
#只有根据country分组求year和value的均值
04
表格排序
#将df_m数据框进行排序
本文分享自 菜鸟学数据分析之R语言 微信公众号, 前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!
社区
活动
资源
关于
腾讯云开发者
扫码关注腾讯云开发者
领取腾讯云代金券
热门产品
热门推荐
更多推荐
Copyright © 2013 - 2024 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号: 粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2024 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有