烟台大学学报(自然科学与工程版)

2021, v.34;No.125(02) 210-216

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于蚁群聚类的不平衡数据过采样方法
Over-Sampling Method of Unbalanced Data Based on Ant Colony Clustering

高阳;刘其成;牟春晓;

摘要(Abstract):

针对不平衡数据集的低分类准确性,提出基于蚁群聚类改进的SMOTE不平衡数据过采样算法ACC-SMOTE。一方面利用改进的蚁群聚类算法将少数类样本划分为不同的子簇,充分考虑类间与类内数据的不平衡,根据子簇所占样本的比例运用SMOTE算法进行过采样,从而降低类内数据的不平衡度;另一方面对过采样后的少数类样本采用Tomek Links数据清理技术进行及时修正,清除数据集中的噪声和抽样方法产生的重叠样例,从而保证合成样本的质量。本文所用训练数据集和测试数据集均为UCI数据集。实验结果表明本算法可以明显提高不平衡数据集的分类精度,从而提高分类器的分类性能。

关键词(KeyWords): 不平衡数据集;蚁群聚类;数据清理;过采样

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金资助项目(61702439);; 国家海洋局“十三五”海洋经济创新发展示范重点项目(YHC-ZBP201701);; 山东省自然科学基金资助项目(ZR2016FM42);; 山东省重点研发计划资助项目(2016GGX109004)

作者(Author): 高阳;刘其成;牟春晓;

Email:

DOI: 10.13951/j.cnki.37-1213/n.200502

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享