//ceshi.R
drink <- read.table("G:/myProject/RDoc/Unit3/rChap1/drink.txt",header = T)
drink <- drink[,-1]
d=dist(drink)
hc1=hclust(d,method="ward.D2")
hc2=hclust(d,method="single")
hc3=hclust(d,method="complete")
hc4=hclust(d,method="median")
opar=par(mfrow=c(2,2))
plot(hc1,hang=-1);plot(hc2,hang=-1);plot(hc3,hang=-1);plot(hc4,hang=-1)
par(opar)
效果如下:
R语言编辑器RStudio的一个绘图错误:Error in plot.new() : figure margins too large
有时总是把问题想复杂了,反而无法处理问题。
这个报错其实很简单,只需要把绘图的窗口手动拉大,就好了。别的窗口小一点没关系。之前以为是软件设置有问题,或者是代码有问题。翻看了网上对这个问题的解决也没有说出个所以然。
最近在研究分类器,鸢尾花数据用得审美疲劳了,就从网上找了一个breast-cancer-wisconsin数据集。
建模前照例是做一些描述性统计,看下样本特征。数据集有9个自变量,1个因变量标签,先简单粗暴地对所有自变量出个直方图看分布特征:
par(mfcol=c(4,3))
for(i in 1:9){
print(hist(data.train[,i]))
本来以为这只是一次平常地出图...
win.graph(width=6, height=5,pointsize=9)
其中,win.graph()函数的参数width、height、pointsize根据需要自行设置。
R-studio画图错误,
figure margins too
large,可以新建画图窗口
解决
win.graph(width=4.875, height=2.5,pointsize=8)
R语言自带的gbm包为梯度提升机算法提供了多种方法。gbm.plot是其中的一个函数,它可以用来绘制模型中各个预测变量(predictors)的重要程度(importance)。在GBM模型中,特征重要性是一种度量方法,用于评估每个特征(predictor)对于模型预测的相对重要程度。此外, gbmtreeplot和gbm.interactionsplot这两个函数可以用来绘制GBM模型中决策树和特征交互的图像。
gbm.plot函数接受以下参数:
1. object: 对象是从gbm()或gbm.perf()函数中得到的
2. i.var:要显示重要性数值的变量的序号或变量名称
3. drop.levels: 是否删除没有关联值的水平(levels)
4. n.trees:绘图时树的数量
5. ylim: y轴的限制
6. rug: 选择是否在x轴上显示每个预测变量(predictor)的实例
7. main:图形标题
由于决策树在GBM算法中的重要性,gbm.plot中的变量重要性图往往呈现出右重尾形状,根据 x 值递减。 具体而言,图的右侧显示的特征更重要,因为它们更能显著地分隔目标。因此,在特征选择过程中,重要性较低的特征可以被过滤或舍弃。除此之外,如果预测变量之间存在共线性或相互依赖的情况,则需要考虑使用更高级的特征选择技术,以提高模型的预测性能和稳定性。