基于不平衡数据的混淆矩阵,通常会用到下列术语:
真正(True Positive, TP)对应 f 11 ,表示正确预测的正样本数。
假负(False Negative, FN)对应 f 10 ,表示错误预测为负类的正样本数。
假正(False Positive, FP)对应 f 01 ,表示错误预测为正类的负样本数。
真负(True Negative, TN)对应 f 00 ,表示正确预测的负样本数。
针对不平衡数据的性能度量有以下几种:
真正率(True Positive Rate, TPR)或灵敏度(Sensitivity)或召回率(Recall):正确预测的正样本占正样本的比例,即
具有高召回率的样本,很少将正样本误分类为负样本。
真负率(True Negative Rate, TNR)或特指率(Specificity):正确预测的负样本占负样本的比例,即:
假正率(False Positive Rate, FPR):错误预测为正类的负样本占负样本的比例,即:
假负率(False Negative Rate, FNR):错误预测为负类的正样本占正样本的比例,即:
精度(Precision, Pre):正确预测的正样本占所有预测为正类的样本的比例,即: