原创 黄小仙
上次分享了小提琴曲线(violin plot)的作图方法,今天小仙同学给大家介绍一下如何用R画出漂亮的
密度图(density plot)
。
Step1. 绘图数据的准备
首先还是要把你想要绘图的数据调整成R语言可以识别的格式,把excel保存成
csv格式
。
数据的格式如下图:一列表示一种变量,第一行是列名
Step2. 绘图数据的读取
data<-read.csv(“your file path”, header = T)
#注释:header=T表示数据中的第一行是列名,如果没有列名就用 header=F
Step3.绘图所需package的安装、调用
install.package(“ggplot2”)
#注释:ggplot2是目前公认绘图很强的一个安装包,如果已经安装,这句就不需要啦
library(ggplot2)
#注释:package使用之前需要调用(每次用前都要调用哦)
Step4绘图
p<-ggplot(data, aes(x = weight))
#注释:x轴表示weight,y轴表示频率就不需要指定啦
p + geom_density(color = “black”, fill = “gray”)
#注释:color是线条的颜色参数,fill表示填充颜色
Step5.美化
p + geom_density(aes(color = sex))
#注释:按照性别不同组
改变线条颜色
p + geom_density(aes(fill = sex), alpha=0.4)
#注释:按照性别不同组改变填充颜色,alpha表示调整透明度
到这里你已经可以画出比较高B格的density plot了,不过有些同学可能有
特殊的要求,比如把
两组的平均值画出来
,那本小仙再小秀一下?
1.准备平均值数据并读取
mean<-read.csv(“your file path”)
2.画图
p+ geom_density(aes(color = sex), alpha=0.4)+
geom_vline(data = mean, aes(xintercept = mean, color=sex),linetype=“dashed”)
#注释:前面是和之前一样作图语句,在后面直接加上这一句就好啦,xintercept表示x轴截断线,dashed表示是虚线
好啦,今天的分享就到这里了,希望可以帮助到大家。有什么新的作图要求,可以留言给我哦!
导出高清图的方法在这里:
R语言作图技巧——导出高清图
R语言作图系列还有:
R语言作图——Beeswarm(蜜蜂图)
R语言作图——Circular bar plot(环形柱状图)
R语言作图——3D scatter(3D散点图)
R语言作图——Line plot with colored background
R语言作图——Scatter plot with marginal density
R语言作图——Dumbbell plot(哑铃图)
R语言作图——Slope chart(坡度图)
R语言作图——Split violin plot
R语言作图——Violin plot with dot
R语言作图——Line plot with error
R语言作图——Ridgeline plot(山脊图)
R语言作图——Dot plot(点图)
R语言作图——Histogram
R语言作图——Violin plot
R语言作图——Facet violin plot
R语言作图——Line plot
R语言作图——Density plot
R语言作图——Bubble matrix
R语言作图——Radar chart
R语言作图——Pie chart
(公众号:生信了)
R语言
使用
ggplot2
包使用geom_
density
()函数绘制分组
密度
图
(填充色配置、半透明填充色、添加均值线)实战(
density
plot
)
#
密度
图
#仿真数据
#geom_
density
()函数绘制分组
密度
图
(填充色配置、半透明填充色、添加均值线)
#
密度
图
与直方
图
(histogram)相关的一种
图
表类型是
密度
图
,它是
直方
图
和曲线
图
是最常用的展示频数和频率分布的统计
图
形。频数(或频率)分布直方
图
(frequency distribution histogram)以直方
图
的形式展示一组定量数据中不同值出现的频数或频率。在直角坐标系中,横轴列为一个有序数列,按数据的最小值和最大值把样本数据分为N组,纵轴统计了每组中数据出现的频数或频率值(落在各组中样本数据的个数称为频数,频数除以样本总个数为频率,各数据组的边界范围按左闭右开区间定义)。
密度
曲线(
Density
C..
1.1.1包的载入以及
密度
函数的书写
library(
ggplot2
) # 载入包
fun <- function(Theta, Thetahat = 0.5, n = 22){
k = "/"("*"(
(n-2)*((1-Theta^2)^((n-1)/2)),
(1-Thetahat^2)^((n-4)
核
密度
估计
图
(Kernel
Density
Estimation, KDE),是在概率论中用来估计未知的
密度
函数,属于非参数检验方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。分析核
密度
函数时主要观察其面积,而不是取值。核
密度
图
中纵轴与横轴所围成的面积为1。
R语言
与非参数统计(核
密度
估计)
核
密度
估计是在概率论中用来估计未知的
密度
函数,属于非参数检验方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。
假设我们有n个数X1-Xn,我们要计算某一个数X的概率
密度
有多大。核
密度
估计的方法是这样的:
r语言
中
密度
图
You can create a
density
plot
in R using
ggplot2
. For
plot
ting using
ggplot2
, you have to use the function geom_
density
(). Let’s see how it works in this tutorial. 您可以使用
ggplot2
在R中创建
密度
图
。 要使用ggp...
三大统计分布
1. χ2\chi^2χ2分布
设随机变量X1,X2,⋯ ,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn相互独立且均服从标准正态分布N(0,1)N(0,1)N(0,1),则称随机变量
χ2=X12+X22+⋯+Xn2
\chi^2=X_1^2+X_2^2+\cdots+X_n^2
χ2=X12+X22+⋯+Xn2
所服从的分布是自由度为nnn的χ2\chi^2χ2分布,记为χ2∼χ2(n)\chi^2\sim \chi^2(n)χ2∼χ2(n)
χ2\chi^
#
密度
图
与直方
图
(histogram)相关的一种
图
表类型是
密度
图
,它是通过计算“可能会产生观测数据的连续概率分布的估计”而产生。一般的过程是将该分布近似为一组核(即诸如正态(高斯)分布之