实操练习:玩转逻辑回归之面部识别!(13)

ROC-AUC曲线和类不平衡

关于ROC-AUC曲线最有用的一点是 , 即使原始数据集中存在类不平衡 , 它们也允许我们评估模型 。

类不平衡是指数据中的一类类型比另一类类别明显多 。 这会使你的分析一团糟 。 举例来说 , 是一个偏斜的罕见疾病数据集(即有类不平衡问题) 。 然后我们说1000中只有2个阳性病例 。 即使你制作了一个将所有内容归类为阴性的蹩脚模型 , 你仍然可以达到99.8%的准确率(即998/1000分类是正确的) 。 因此 , 当您在不平衡数据集上运行模型时 , 需要更多上下文来真正评估模型 。

所以 , 让我们回顾一下 , 看看我们的数据是否不平衡 。 也许可以让我们的模型更好 。

实操练习:玩转逻辑回归之面部识别!