Project

Feature subset selection via an improved discretization-based particle swarm optimization

  • Author: Yu Zhou , Jiping Lin , Hainan Guo
  • Accepted: 7 October 2020
  • Published in: Applied Soft Computing Journal ( ASOC )
  • paper link

Abstract

在机器学习或数据挖掘任务中,高维数据分析越来越受到关注。由于存在不相关的冗余特征,分类精度往往会严重下降。特征选择(Feature Selection,FS)旨在通过选择特征子集来提高预测准确率,它扮演着非常重要的角色。本文针对 FS 提出了一种基于离散化的改进型粒子群优化(PSO)方法。在我们的方法中,我们首先采用了适度的预筛选过程,以获得较小的特征规模。然后,我们得到了一个基于排序的切点表,该表存储了多个切点,每个切点按照基于熵的切点优先级排序。为了找到最能区分数据样本的最佳切点组合,使用了 PSO 中简单而高效的编码和解码方法来灵活选择切点数量。此外,还采用了概率引导的局部搜索策略来寻找更好的切点组合,以获得有前景的特征子集。在 19 个基准数据集上的综合仿真结果证明了我们提出的方法中几种改进策略的有效性,以及我们提出的方法相对于一些基于 PSO 的最先进竞争对手的优势。

框架流程图