我的R学习札记——箱线图简单小例子
箱图主要是用最小值、下四分位数(第25百分位数)、中位数(第50百分位数)、上四分位数(第75百分位数)以及最大值来考察连续变量的分布情况的图形。下面我们介绍如何利用R的boxplot函数绘制箱图。 首先我们需要生成一个数据集:
dataset <- data.frame(id=c(1:300),x1=rnorm(300,20,6),
sex=sample(c("0","1"),300,replace=TRUE),
smokestatus=sample(c("1","2","3"),300,replace=TRUE))
该数据集包含四个变量,分别是id,x1,sex,smokestatus。其中x1是连续型变量,sex和smokestatus都是分类变量。其中sex的0代表“man”,1代表“female”;smokestatus的1代表“never smoke”,2代表“current smoke”,3代表“quit smoke”。

1.绘制简单箱图:
attach(dataset)