基于KNN的失衡数据集动态阈值剪枝方法#李鹏,孙渤禹,黄久玲*(哈尔滨理工大学计算机科学与技术学院,哈尔滨150080)510152025摘要:本文提出了基于KNN动态阈值样本剪枝的分类算法来处理支持向量机(SVM)在失衡数据集上的分类问题。由于数据集中复杂性和混叠的现象会影响SVM分类器的分类性能和泛化能力,又因为失衡数据集中正例与反例的失衡比很大,相比反例来说,正例的信息比较重要,因此本文提出基于KNN的失衡数...