评价指标(acc,auc,recall,precision)

评价指标(acc,auc,recall,precision)

评估指标

评价超参数好不好?

1 K折交叉验证

把原始数据分成十份,分别拿10份中每1份做一个验证集,计算出1个错误率,进而求得10个错误率取平均(排除偶然性),作为调整超参数的一个标准。

2 混淆矩阵

混淆矩阵也成为误差矩阵,是表示精度评价的一种标准格式,判断分类好坏的方法。

上图中3看成5的次数为231次,5看成3的次数为193.

3 准确率和表示召回率

逻辑回归(模型):输出概率,<0.5为负例

(1) Acc公式:

(2) Precision(准确率)公式:

在所有你判断为正例的例子中,真正的正例有多少

(3) Recall(召回率)公式:

你认为正确的占所有正确的比例

Tradeoff 会让准确率和召回率顾此失彼

(4) F1_score(precision和recall的综合平均[调和平均数])

既可以兼顾precision又可以兼顾recall。F1_score越高说明precision和recall达到了一个很高的平衡点。

4 tradeoff

上图为precision和recall的关系曲线。

5 ROC曲线

如果表示TPR和FPR的变化关系曲线。若曲线距离左上角越近,代表模型的性能越好。

但是需通过图形进行观察得到。

6 AUC(area under curve)

AUC代表曲线的面积,AUC越大越好,取值范围为[0,1]

参考:

精确率、召回率、F1 值、ROC、AUC 各自的优缺点是什么?

编辑于 2018-12-24 15:45

文章被以下专栏收录