实操练习:玩转逻辑回归之面部识别!(14)

----实操练习:玩转逻辑回归之面部识别!//----

原始数据的类平衡

我们在这里可以看到数据有点不正常 - 大约79%被归类为1(即包含皮肤的像素) , 只有大约21%被归类为0(即不包含皮肤的像素) 。

所以 , 在我们结束之前 , 让我们运行一个名为SMOTE(Synthetic Minority Oversampling)的东西 。 SMOTE创建合成数据以填充我们的少数类的更多值(在我们的例子中 , 这意味着它将为我们提供更多的0数据点) 。 虽然创建合成数据似乎是作弊 , 但在数据科学领域 , 数据集通常不是很平衡 , 这是很常见的做法 。

在我们的原始数据上运行SMOTE并重新生成我们的混淆矩阵和分类报告 , 得到以下结果 。