//ceshi.R

drink <- read.table("G:/myProject/RDoc/Unit3/rChap1/drink.txt",header = T)
drink <- drink[,-1]
d=dist(drink)
hc1=hclust(d,method="ward.D2")  #离差平方和法
hc2=hclust(d,method="single")  #最短距离法
hc3=hclust(d,method="complete")  #最长距离法
hc4=hclust(d,method="median")  #中间距离法
opar=par(mfrow=c(2,2))  #分割绘图区域
plot(hc1,hang=-1);plot(hc2,hang=-1);plot(hc3,hang=-1);plot(hc4,hang=-1)
par(opar)  #释放绘图区域分割

  效果如下:

R语言编辑器RStudio的一个绘图错误:Error in plot.new() : figure margins too large 有时总是把问题想复杂了,反而无法处理问题。 这个报错其实很简单,只需要把绘图的窗口手动拉大,就好了。别的窗口小一点没关系。之前以为是软件设置有问题,或者是代码有问题。翻看了网上对这个问题解决也没有说出个所以然。
最近在研究分类器,鸢尾花数据用得审美疲劳了,就从网上找了一个breast-cancer-wisconsin数据集。 建模前照例是做一些描述性统计,看下样本特征。数据集有9个自变量,1个因变量标签,先简单粗暴地对所有自变量出个直方图看分布特征: par(mfcol=c(4,3)) for(i in 1:9){ print(hist(data.train[,i])) 本来以为这只是一次平常地出图...
win.graph(width=6, height=5,pointsize=9) 其,win.graph()函数的参数width、height、pointsize根据需要自行设置。
R-studio画图错误,figure margins too large,可以新建画图窗口解决 win.graph(width=4.875, height=2.5,pointsize=8)
R语言自带的gbm包为梯度提升机算法提供了多种方法。gbm.plot是其的一个函数,它可以用来绘制模型各个预测变量(predictors)的重要程度(importance)。在GBM模型,特征重要性是一种度量方法,用于评估每个特征(predictor)对于模型预测的相对重要程度。此外, gbmtreeplot和gbm.interactionsplot这两个函数可以用来绘制GBM模型决策树和特征交互的图像。 gbm.plot函数接受以下参数: 1. object: 对象是从gbm()或gbm.perf()函数得到的 2. i.var:要显示重要性数值的变量的序号或变量名称 3. drop.levels: 是否删除没有关联值的水平(levels) 4. n.trees:绘图时树的数量 5. ylim: y轴的限制 6. rug: 选择是否在x轴上显示每个预测变量(predictor)的实例 7. main:图形标题 由于决策树在GBM算法的重要性,gbm.plot的变量重要性图往往呈现出右重尾形状,根据 x 值递减。 具体而言,图的右侧显示的特征更重要,因为它们更能显著地分隔目标。因此,在特征选择过程,重要性较低的特征可以被过滤或舍弃。除此之外,如果预测变量之间存在共线性或相互依赖的情况,则需要考虑使用更高级的特征选择技术,以提高模型的预测性能和稳定性。