scikit-learn的随机森林分类器在预测时默认使用0.5作为阈值,即如果预测概率大于0.5则分配给正类,反之分配给负类。
你可以通过调整阈值来影响模型的效果。使用predict_proba()方法可以得到每一个样本属于每一个类别的概率,然后根据你设定的阈值对其进行分类。
举个例子,如果你想要使用0.7作为阈值:
y_pred = (model.predict_proba(X_test)[:, 1] >= 0.7).astype(int)
这里,predict_proba(X_test)会返回每一个样本属于正类的概率,并且[:,1]表示取第二列,即正类的概率。