J48决策树中minNumObj到底控制了什么,C4.5的作者Quinlan时候在论文中提到过?

最近在阅读Weka的J48源码,发现有minNumObj的控制条件,不是很懂这个参数的意义,Quinlan在论文中是否有对minNumObj的相关说明…
关注者
5
被浏览
2,776

1 个回答

minNumObj:如Alex所说是剪枝时需满足叶节点最少实例的个数,同confidenceFactor(-C)一样都是用于控制剪枝的因素。

剪枝的目的同Alex所说一方面用于控制模型复杂度,一方面让模型的泛化能力更好,从而减少过拟合的问题。