ggplot2
绘制回归曲线的方法作个汇总。
在先前的很多回归分析相关的推文中,大多都在过程中提及了一些简单的可视化方法,以帮助理解回归中的变量响应关系。在这些作图方法中,有些是特定功能
包自带的可视化方法,有些通过
ggplot2
绘制,还有部分直接使用
作图。相对而言,
ggplot2
里面非常专业的作图包,其同时涵括了多种类型的回归模型在内,这使回归曲线的实现更加轻松。
您是否经常使用
geom_smooth()
拟合线性回归或
LOESS
平滑?除了这两种模型外,您是否还了解过
ggplot2
实现其它回归类型的方法,或者其它方式的回归曲线绘制函数呢?下文就列举一些示例帮助您加深印象吧。尽管如此,并不是所有回归都可以绘制图形展示。例如在二维平面或者三维空间中,可表达的信息有限,多元回归(具有多维的变量信息)就难以呈现出来。因此,本篇就以最常见的双变量关系分析(一元回归)为例,展示回归曲线通过
ggplot2
的绘制方法。
下文中所使用的示例数据和R代码的百度盘链接(提取码,egpa):
https://pan.baidu.com/s/1GwW8EYgFE7EPrW6o9u5ScA
若百度盘失效,也可在GitHub的备份中获取:
https://github.com/lyao222lll/sheng-xin-xiao-bai-yu
通过ggplot2函数stat_smooth()、geom_smooth()统计变量关系并拟合回归
ggplot2内置了回归统计函数,想必同学们也都很熟悉,就是stat_smooth()以及geom_smooth()。两个函数的使用方法大致一致,可基于给定的双变量关系拟合指定的回归,默认方法包含局部加权回归(loess)、一般线性模型(lm)、广义线性模型(glm)、广义加性模型(gam)以及一些非线性回归(nls,如指数回归)等,并同时将双变量关系的回归线绘制在二维图中表示出来。此外,结合一些拓展包也可以实现更多非线性回归的作图。
接下来展示几个简单示例,了解不同模式回归曲线通过ggplot2函数的绘制方法。
示例1.1-局部加权回归(loess)的平滑拟合
MASS包的内置数据集Boston,记录了波士顿郊区的房屋价值与当地社会环境、人口组成等信息。这里希望关注当地低收入人口比例和其所居住地房屋价格是否有关,不妨首先拟合一个双变量关系的平滑曲线进行探索。
平滑回归方法中,局部加权回归(LOESS)是最常用的平滑器。在函数stat_smooth()或geom_smooth()中通过method = 'loess'指定局部加权回归的平滑拟合,并通过span参数控制曲线平滑度。
#MASS 包的示例数据集,波士顿郊区的房屋价值,详情 ?Boston
library(MASS)
data(Boston)
#ggplot2 绘制低收入人口比例和居住地房屋价格的关系
library(ggplot2)
p geom_point() +
theme_bw()
##拟合局部加权回归(loess),并展示 95% 置信区间
#stat_smooth() 参数 span 可控制曲线平滑度,值越大拟合曲线越平滑,详情 ?stat_smooth
#注意平滑参数值应当谨慎设置,它强烈影响曲线意义的解读
p1 p1
#类似地,geom_smooth() 参数中,span 控制曲线平滑度
p2 p2
平滑曲线展现了居住地房屋价格越高,当地低收入人口比例越低。可能与低收入人群难以负担得起较高居住地的成本,而更多选择廉价的房屋租赁或长期居住有关。
示例1.2-一般加性模型的平滑拟合
实现非参数平滑回归的另一方法是使用加性模型。在函数stat_smooth()或geom_smooth()中通过method = 'gam'指定加性模型的平滑拟合,并通过在formula参数中选择平滑器参数实现。默认情况下,该函数假定响应变量服从正态分布,并执行一般加性模型的形式。
##gam 默认情况下执行一般加性模型的平滑回归,并展示 95% 置信区间
#stat_smooth() 和 geom_smooth() 的用法大致相似
#通过 formula = y~s(x) 指定函数关系,s() 中的参数 k 可调整平滑度,详情 ?s()
#注意平滑参数值应当谨慎设置,它强烈影响曲线意义的解读
p + stat_smooth(method = 'gam', formula = y~s(x, k = 10), se = TRUE, level = 0.95)
p + geom_smooth(method = 'gam', formula = y~s(x, k = 5), se = TRUE)
和loess平滑显示了一致的趋势,平滑曲线展现了居住地房屋价格越高,当地低收入人口比例越低。
示例1.3-一般线性模型(lm)之简单线性回归
上图的非参数平滑曲线显示了低收入人口的居住比例随当地房屋价格的升高而降低,不妨使用参数回归代替描述这个趋势,例如最常使用的简单线性回归。函数stat_smooth()或geom_smooth()中,通过method = 'lm'指定线性回归拟合变量关系,默认绘制Y=β
1
X+β
0
形式的简单线性回归形式。
##一般线性模型(lm),并展示 95% 置信区间
#stat_smooth() 拟合简单线性回归,详情 ?stat_smooth
p1 p1
#geom_smooth() 拟合简单线性回归,详情 ?geom_smooth
p2 p2
该图显示了波士顿郊区低收入人口的居住比例随当地房屋价格的升高而呈现明显的线性降低趋势。蓝线,上文的非参数loess平滑拟合;红线,普通线性回归拟合。
示例1.4-一般线性模型(lm)之带多次项的线性回归
不过上述非参数平滑曲线图的走势表明,似乎还可以用一个弯曲的曲线来提高拟合精度,即拟合含多次项的线性回归。因此继续考虑添加二次项关系,即Y=β
1
X+β
2
X
2
+β
0
。类似地,在函数stat_smooth()或geom_smooth()中通过method = 'lm'指定线性回归,并通过formula指定变量间多次项关系。
#添加低收入人口比例和居住地房屋价格的二次线性回归,并展示 95% 置信区间
#geom_smooth() 默认 formula=y~x 对应一次关系,可更改 formula = y~poly(x, n) 拟合 n 次关系,详情 ?stat_smooth
p1 + stat_smooth(method = 'lm', formula = y~poly(x, 2), se = TRUE, level = 0.95, color = 'green3')
#同样地,geom_smooth() 默认 formula=y~x 对应一次关系,可更改 formula = y~poly(x, n) 拟合 n 次关系,详情 ?geom_smooth
p2 + geom_smooth(method = 'lm', formula = y~poly(x, 2), se = TRUE, color = 'green3')
可以看到,考虑了低收入人口比例和居住地房屋价格的二次线性关系后,拟合精度更优,更能描述出二者实际的趋势。蓝线,上文的非参数loess平滑拟合;红线,上文普通线性回归拟合;绿线,二次线性回归拟合。
示例1.5-广义加性模型(gam)之泊松加性模型
网盘示例数据“fish_data.txt”,来自前文泊松响应的广义加性模型的示例,记录了河流中某鱼类个体数量与水体环境的关系。前文已经通过非参数的泊松加性模型探索了影响鱼类物种丰度的环境因素,并描述了响应曲线的特征,在这里将继续通过ggplot2绘制泊松加性模型的平滑拟合曲线。
如上文所述,在函数stat_smooth()或geom_smooth()中通过method = 'gam'指定加性模型的平滑拟合。由于函数默认响应变量服从正态分布并执行一般加性模型的形式,因此在这里需要额外在参数method.args中指定响应变量的泊松分布,以执行泊松加性模型。此外,还需在formula参数中设定平滑器参数。
#读取示例的鱼类物种丰度和水体环境数据
#ggplot2 绘制鱼类物种丰度与水域流域面积的关系
library(ggplot2)
p geom_point() +
theme_bw()
##计数型变量,尝试使用泊松加性模型拟合平滑曲线探索变量关系,并展示 95% 置信区间
#stat_smooth() 和 geom_smooth() 的用法大致相似
#通过 method.args 指定响应变量的类型,这里使用泊松加性模型
#通过 formula = y~s(x) 指定函数关系,平滑器 s() 中的参数 k 可调整平滑度,详情 ?s()
#注意平滑参数值应当谨慎设置,它强烈影响曲线意义的解读
p1 p1
p2 p2
总体来说,随水域流域面积(acre)的增加,鱼类物种数量将提升。
示例1.6-广义线性模型(glm)之泊松回归
如上非参数的泊松加性模型显示了鱼类物种数量随水域流域面积的增加而提升,这种提升效应似乎可以通过线性关系来描述。因此,接下来不妨使用参数化的广义线性模型描述这个趋势,即泊松回归。
无论使用函数stat_smooth()或geom_smooth(),均通过method = 'glm'指定使用广义线性回归拟合变量关系,并需额外在参数method.args中指定响应变量的泊松分布。
##计数型变量,尝试使用广义线性模型的泊松回归描述变量关系,并展示 95% 置信区间
#stat_smooth() 和 geom_smooth() 中,通过 method.args 指定响应变量的类型,这里使用泊松回归
p1 + stat_smooth(method = 'glm', method.args = list(family = 'poisson'), se = TRUE, level = 0.95, color = 'red')
p2 + geom_smooth(method = 'glm', method.args = list(family = 'poisson'), se = TRUE, color = 'red')
泊松回归有效体现出了鱼类物种数量随水域流域面积的增加而提升的线性响应趋势。蓝线,上文非参数泊松加性模型的平滑拟合;红线,泊松回归的线性拟合。
示例1.7-广义线性模型(glm)之logistic回归型
考虑到广义线性模型的种类非常多,这里再展示一例广义线性模型的其它常见类型,logistic回归在ggplot2中的绘制方法,加深对ggplot2直接绘制广义线性模型拟合曲线方法的理解。
网盘示例数据“breast.csv”,来自前文广义线性模型之logistic回归的示例,记录了乳腺癌恶性肿瘤相关的细胞特征得分。前文已经通过logistic回归确定了多种细胞特征得分与肿瘤恶性状态(良性或恶性,属于二分响应变量)的关联,并评估了通过这些细胞特征得分区分肿瘤良性或恶性的准确度。在这里将继续通过ggplot2绘制logistic回归的拟合曲线。
类似地,在函数stat_smooth()或geom_smooth()中通过method = 'glm'指定使用广义线性回归拟合变量关系,并额外在参数method.args中指定响应变量的二项分布。
#威斯康星州乳腺癌数据集
breast
#使用 0-1 的二分数值重新定义肿瘤的两种状态(0,良性;1,恶性)
breast[which(breast$class == 2),'response'] breast[which(breast$class == 4),'response']
#例如以肿瘤厚度得分与肿瘤良性或恶性状态的关系为例
library(ggplot2)
p geom_jitter(height = 0.05, width = 0, alpha = 0.5) + #作图时对点添加了少量上下抖动效果仅为减少点的重叠
theme_bw()
##二分响应变量,使用广义线性模型的二项 logistic 回归描述变量关系,并展示 95% 置信区间
p + stat_smooth(method = 'glm', method.args = list(family = 'binomial'), se = TRUE, level = 0.95, color = 'red')
p + geom_smooth(method = 'glm', method.args = list(family = 'binomial'), se = TRUE, color = 'red')
二项响应的logistic回归常用于描述响应变量被分配为两个类别(0或1)的概率。在这个实例中,0代表肿瘤良性,1代表肿瘤恶性。图中红色曲线为logistic回归获得的概率拟合曲线,形象呈现了肿瘤为恶性的概率随肿瘤厚度得分增加的非线性响应。
示例1.8-非线性参数回归示例之指数回归
再展示一例常见的参数非线性回归方法,指数回归在ggplot2中的绘制。
仍以上文提到的波士顿郊区的房屋价值数据集为例,通过局部加权回归(LOESS)的平滑曲线观察居住地房屋价格和人均城镇犯罪率的关系时,发现二者似乎存在指数关联。随人均城镇犯罪率的升高,房屋价格开始呈现剧烈的下降,随后达到平缓。因此,考虑在图中拟合指数回归曲线。
通过在stat_smooth()或geom_smooth()中指定method = 'nls'即可拟合参数非线性回归,formula中设置非线性回归式,method.args中设定一些必要的补充信息。
#MASS 包的示例数据集,波士顿郊区的房屋价值,详情 ?Boston
library(MASS)
data(Boston)
#ggplot2 绘制居住地房屋价格和人均城镇犯罪率的关系
library(ggplot2)
p geom_point() +
theme_bw() +
stat_smooth(method = 'loess', span = 0.5, se = TRUE, level = 0.95)
##参数非线性回归(nls)的拟合,以指数回归为例
#stat_smooth() 和 geom_smooth() 的用法大致相似
#参数中 a 和 b 的初始值手动指定,可参考 https://mp.weixin.qq.com/s/fxkMlEBs8UEwuGlUi50uLA
p + stat_smooth(method = 'nls', formula = y ~ a*x^b, method.args = list(start = list(a = 2, b = 1.5)), se = FALSE, color = 'red')
p + geom_smooth(method = 'nls', formula = y ~ a*x^b, method.args = list(start = list(a = 2, b = 1.5)), se = FALSE, color = 'red')
这个指数回归大致描述出了随人均城镇犯罪率的升高,房屋价格首先呈现剧烈的下降,并在随后达到平缓的趋势。蓝线,上文的非参数loess平滑拟合;红线,指数回归拟合曲线。
通过ggplot2函数stat_function()指定回归函数绘制拟合线
很多回归方法,特别对于大多数非线性回归而言,ggplot2及其拓展包中缺少作图方案,难以通过stat_smooth()、geom_smooth()直接作图。这时候,可以考虑使用stat_function()根据指定函数绘制拟合线。
如果已经提前计算出了回归式的各参数,则可以直接将已知的回归式指定给ggplot2函数stat_function()。stat_function()能够在作图时将自变量代入至已知的回归式中拟合响应变量的预测值,并使用平滑线连接响应变量的预测值获得回归线。理论上,stat_function()可以实现对任意给定回归式的拟合线绘制。
示例2.1-一个带多次项的线性回归示例
例如在上文“示例1.4-一般线性模型(lm)之带多次项的线性回归”中,已经描述了低收入人口比例和居住地房屋价格的二次线性关系。如要通过stat_function()绘制拟合曲线,则操作过程如下。
#MASS 包的示例数据集,波士顿郊区的房屋价值,详情 ?Boston
library(MASS)
data(Boston)
#ggplot2 绘制低收入人口比例和居住地房屋价格的关系
library(ggplot2)
p geom_point() +
theme_bw()
##通过 lm() 计算低收入人口比例和居住地房屋价格的二次线性关系
fit summary(fit)
#根据 lm() 获得的对回归系数(斜率)和截距的参数估计值
#可知二次回归式书写为 Y = -1.715X + 0.021X^2 + 39.048
#然后将这个回归式书写到 stat_function() 中
p + stat_function(fun = function(x) -1.715*x+0.021*x^2+39.048, color = 'red', size = 1.2)
#或者直接在 lm() 结果中提取回归系数(斜率)和截距
#然后将提取出的值代入至 stat_function() 中
b0 b1 b2
p + stat_function(fun = function(x) b1*x+b2*x^2+b0, color = 'red', size = 1.2)
如此方法,可将已知的低收入人口比例和居住地房屋价格的二次线性关系添加在图中。
示例2.2-一个指数回归的非线性参数回归示例
类似地,再以上文“示例1.8-非线性参数回归示例之指数回归”的结果为例,展示一个非线性参数回归通过stat_function()绘制拟合曲线的过程。
#ggplot2 绘制居住地房屋价格和人均城镇犯罪率的关系
library(ggplot2)
p geom_point() +
theme_bw()
##参数非线性回归(nls)的拟合,以指数回归为例
#参数中 a 和 b 的初始值手动指定,可参考 https://mp.weixin.qq.com/s/fxkMlEBs8UEwuGlUi50uLA
mod summary(mod)
#根据 nls() 获得的对 a 和 b 参数估计值
#可知指数回归式书写为 Y = 20.743X^-0.086
#然后将这个回归式书写到 stat_function() 中
p + stat_function(fun = function(x) 20.743*x^-0.086, color = 'red', size = 1.2)
#或者直接在 nls() 结果中提取 a 和 b 的值
#然后将提取出的值代入至 stat_function() 中
p + stat_function(fun = function(x) a*x^b, color = 'red', size = 1.2)
如此方法,可将已知的房屋价格随人均城镇犯罪率的升高而降低的大致的指数响应趋势添加在图中。
根据已知回归模型预测期望值,并在图中绘制后连接成线
除了通过在stat_function()中手动输入回归关系式外,也可以通过已经在R函数中构建好的回归模型以predict()预测响应变量值,并在图中绘制后以线段或曲线的形式连接起来得到回归线。这种方法更多应用于回归式复杂难以书写的情况,或者应用在其它非参数回归、机器学习方法等难以理解的形式中。
示例3.1-一个非参数的平滑回归示例
例如上文“示例1.1-局部加权回归(loess)的平滑拟合”的平滑回归曲线,是非参数形式的,难以通过具体数学公式来描述。除了直接通过stat_smooth()或geom_smooth()实现外,但若在stat_function()中输入公式则肯定行不通。虽然我们也没必要展示其它冗余的方法了,但此处仅仅是想举例告知其它的可选替代形式,因此请允许我继续。
#MASS 包的示例数据集,波士顿郊区的房屋价值,详情 ?Boston
library(MASS)
data(Boston)
#ggplot2 绘制低收入人口比例和居住地房屋价格的关系
library(ggplot2)
p geom_point() +
theme_bw()
##通过 R 函数 loess() 构建局部加权回归(LOESS)模型
#参数 span 可控制曲线平滑度,值越大拟合曲线越平滑,详情 ?loess
#注意平滑参数值应当谨慎设置,它强烈影响曲线意义的解读
fit summary(fit)
#通过 predict() 根据已构建好的回归模型预测响应变量的期望值
#即根据居住地房屋价格获得低收入人口比例的预测值
lstat_pred head(lstat_pred)
#将低收入人口比例的预测值添加在已有的关系图中,并用折线图连接成“拟合线”
Boston$lstat_pred
p + geom_line(data = Boston, aes(x = medv, y = lstat_pred), color = 'red')
##和 ggplot2 的默认方法 stat_smooth() 的比较
p + stat_smooth(method = 'loess', span = 0.75, se = TRUE, level = 0.95)
局部加权回归(LOESS)平滑曲线展现了居住地房屋价格越高,当地低收入人口比例越低的趋势。红线,首先构建LOESS模型,并通过已知回归模型预测lstat的值后,绘制在图中连接成线;蓝线,ggplot2默认的stat_smooth()方法所得LOESS曲线;二者是一致的。
示例3.2-一个logistic回归的广义线性模型示例
与一般线性模型相比,广义线性模型涉及到连接函数的转换,使其相对复杂不易理解。因此,某些广义线性模型的函数式可能书写麻烦,不易于通过stat_function()描绘出来。除了直接通过stat_smooth()或geom_smooth()实现作图外,也可以用这种替代形式表现出。以上文“示例1.7-广义线性模型(glm)之logistic回归”的数据为例,给个参考过程。
#威斯康星州乳腺癌数据集
breast
#使用 0-1 的二分数值重新定义肿瘤的两种状态(0,良性;1,恶性)
breast[which(breast$class == 2),'response'] breast[which(breast$class == 4),'response']
#例如以肿瘤厚度得分与肿瘤良性或恶性状态的关系为例
library(ggplot2)
p geom_jitter(height = 0.05, width = 0, alpha = 0.5) + #作图时对点添加了少量上下抖动效果仅为减少点的重叠
theme_bw()
##二分响应变量,使用广义线性模型的二项 logistic 回归描述变量关系
fit summary.glm(fit)
#通过 predict() 根据已构建好的回归模型预测响应变量的期望值
#即根据肿瘤厚度得分预测肿瘤为恶性的概率
response_pred head(response_pred)
#将预测的肿瘤为恶性的概率添加在已有的关系图中,并用折线图连接成“拟合线”
breast$response_pred
p + geom_line(data = breast, aes(x = clumpThickness, y = response_pred), color = 'red')
##和 ggplot2 的默认方法 stat_smooth() 的比较
p + stat_smooth(method = 'glm', method.args = list(family = 'binomial'), se = TRUE, level = 0.95)
在这个实例中,0代表肿瘤良性,1代表肿瘤恶性。logistic回归获得的概率拟合曲线,形象呈现了肿瘤为恶性的概率随肿瘤厚度得分增加的非线性响应。 红线,首先构建logistic模型,并通过已知回归模型预测肿瘤为恶性的概率后,绘制在图中连接成线;蓝线,ggplot2默认的stat_smooth()方法所得logistic曲线;二者是一致的。
其它拓展作图
上文主要在几种不同类型的拟合曲线的绘制过程上作了演示,包含局部加权回归(loess)、一般线性模型(lm)、广义线性模型(glm)、广义加性模型(gam)以及一些非线性回归(nls,如指数回归)等,帮助了解不同模式回归曲线怎样通过ggplot2函数的实现方法。
而对于ggplot2主题的调整,怎样让图形更美观,就没作啥提及,大家自己看着来吧。最后再展示几种实用的拓展用法。
示例4.1-一图展示多组的回归
有时涉及了多分组的情况,自变量的水平一致但各组响应变量的值不同。为了方便多组之间能够直观的比较,期望在同一张图中展示多组的回归曲线,并通过斜率的变化描述趋势的升高或降低幅度,这也是平时非常常见的情形。
网盘示例数据“plant.txt”,测量了生长于两个不同温度(低、高)环境中的某种植物的高度,以及土壤中的氮浓度,期望了解土壤氮浓度及温度对植物生长的影响。考虑到线性关系最为直观且易于理解,这里希望通过建立简单线性回归,探讨植物生长高度与其所处环境中土壤氮浓度及温度的关系。
#植物生长与环境条件的数据集
#横坐标土壤氮浓度,纵坐标植物生长高度
#按高温和低维条件分别标记分组后,拟合线性回归
library(ggplot2)
p geom_point(aes(color = temperature)) +
scale_color_manual(values = c('red', 'blue'), limits = c('High', 'Low')) +
geom_smooth(aes(color = temperature), method = 'lm', se = TRUE, show.legend = FALSE) +
theme_bw() +
theme(legend.key = element_blank()) +
labs(x = 'N', y = 'plant height')
p
根据作图结果得知,土壤氮含量高时更有利于该植物生长,并且该植物为喜温植物,在温度允许的范围内,温暖更刺激其生长。
示例4.2-在图中添加文字描述
例如,将上述两组的线性回归的公式、R
2
和p值额外添加在图中,以告知读者回归的精度和显著性水平。此时,您需要额外通过回归函数获取参数估计,并将它们提取出来后,组合成回归公式添加到图中的合适位置。
#通过 lm() 获得线性回归的参数估计
fit_height summary(fit_height)
fit_low summary(fit_low)
#提取两个回归的回归系数(斜率)、截距、R2、p 值等
b0_height b1_height R2_height p_height
b0_low b1_lowt R2_low p_low
#将提取出的结果组合成新的数据集,以便添加在原图中
label_height formula_height = sprintf('italic(Y) == %.3f*italic(X) + %.3f', b1_height, b0_height),
R2_height = sprintf('italic(R^2) == %.3f', R2_height),
p_height = ifelse(p_height < 0.001, sprintf('italic(P) < 0.001'), ifelse(p_height < 0.01, sprintf('italic(P) < 0.01'), ifelse(p_height < 0.05, sprintf('italic(P) < 0.05'), sprintf('italic(P) >= 0.05')))),
formula_low = sprintf('italic(Y) == %.3f*italic(X) + %.3f', b1_lowt, b0_low),
R2_low = sprintf('italic(R^2) == %.3f', R2_low),
p_low = ifelse(p_low < 0.001, sprintf('italic(P) < 0.001'), ifelse(p_low < 0.01, sprintf('italic(P) < 0.01'), ifelse(p_low < 0.05, sprintf('italic(P) < 0.05'), sprintf('italic(P) >= 0.05')))))
#添加文字时手动调整下位置
geom_text(x = 1, y = 42, aes(label = formula_height), data = label_height, parse = TRUE, size = 2.5, hjust = 0, color = 'red', show.legend = FALSE) +
geom_text(x = 1, y = 38, aes(label = R2_height), data = label_height, parse = TRUE, size = 2.5, hjust = 0, color = 'red', show.legend = FALSE) +
geom_text(x = 1, y = 34, aes(label = p_height), data = label_height, parse = TRUE, size = 2.5, hjust = 0, color = 'red', show.legend = FALSE) +
geom_text(x = 1, y = 28, aes(label = formula_low), data = label_height, parse = TRUE, size = 2.5, hjust = 0, color = 'blue', show.legend = FALSE) +
geom_text(x = 1, y = 24, aes(label = R2_low), data = label_height, parse = TRUE, size = 2.5, hjust = 0, color = 'blue', show.legend = FALSE) +
geom_text(x = 1, y = 20, aes(label = p_low), data = label_height, parse = TRUE, size = 2.5, hjust = 0, color = 'blue', show.legend = FALSE)
此时将两组线性回归的公式、R
2
和p值额外添加在图中,形象地告知了回归统计的可靠性等信息。
示例4.3-分面回归图
常用于多个自变量,或者多个响应变量的情况下,双变量回归分析的展示。
例如,这里尝试通过多个简单线性回归,分别描述网盘示例数据“fish_data.txt”中所有6种环境因素对鱼类物种丰度的影响。
#读取鱼类物种丰度和水体环境数据
#绘制二维散点图观测各环境变量与鱼类物种丰度的关系
#并同时添加简单线性回归拟合线
library(ggplot2)
dat_plot
p geom_point() +
facet_wrap(~variable, ncol = 3, scale = 'free') +
geom_smooth(method = 'lm') +
labs(x = '', y = 'fish')
#以下在散点图中添加各环境变量与鱼类物种丰度的一元回归的 R2 和 p 值作为标识
#注:该 R2 和 p 值仅为多个一元回归的 R2 和 p 值,不要将其视为一个多元回归
#拟合各环境变量与鱼类物种丰度的一元回归,并提取各自 R2 和 p 值
env R2_adj p_value
for (i in env) {
fit_stat R2_adj p_value }
env_stat env_stat #数据框中存储了各环境变量与鱼类物种丰度的一元回归的 R2 和 p 值
#自动定义文字在图中的展示坐标位置
env_stat$fish for (i in env) env_stat[i,'value']
#生成文字标签数据集
env_stat$variable env_stat$R2_adj env_stat$p_value
#和先前的数据框合并,便于作图
env_stat dat_plot$R2_adj dat_plot$p_value dat_plot
geom_text(data = dat_plot, aes(label = R2_adj), parse = TRUE, size = 3, hjust = 0) +
geom_text(data = dat_plot, aes(label = p_value), parse = TRUE, size = 3, hjust = 0, vjust = 3)
类似的方法在前文多元线性回归中也有提到,但注意的是,在这种情形下都是考虑的各环境对物种丰度的独立效应,即多个一元线性回归的组合图展示,无法视为多元回归的替代可视化方法。
文本框(TextView)不允许用户编辑文本内容,而编辑框(EditText)允许用户编辑文本内容
2.按钮(Button)和图片按钮(ImageButton)
Button显示文字,ImageButton显示图片。
为ImageButton指定android:text属性没用,不会显示文字
可以指定andr
2.论文阅读:Semi-supervised point cloud segmentation using self-training with label confidence prediction
3.录屏软件Camtasia 2023中文版 功能介绍及 camtasia怎么导出mp4
4.设置git环境,遇到git开头时转为https
5.各省数字专利申请数据计算(acl+permission功能的使用)