1:监督学习评价
(1)评价点: 准确度
(2)方法: n折交叉验证法
将数据分成大小相同的n组,第一次选择第一组为验证集另外n-1组为训练组,计算得到第一次的准确度。循环n次,选择准确度较高的模型
2:不均衡数据的评估
(1)评价点:精确度、召回率
(2)精确度、召回率的计算与平衡
A:正面预测正确的数量 B:正面预测的总数量 C:实际(标签)为正面的数量 (注意:集合是全正面组成的)
精确度=A/B(预测的正确率) 召回率=A/C(正确预测占实际情况的比)
精确度: 减少预测总量提升
召回率: 提升预测总量提升 (矛盾)
平衡方法: 设定>给定阈值的为正,其余的为负,计算各种情况下的精确度。 依据精确度与召回率画的图形,利用AUC曲线下面积抉择最值点。
|
请发表评论