日前,学院机器学习实验室多示例学习课题组:杨梅副教授、张雨轩(研究生)、闵帆教授与王熙照教授(深圳大学)合著的论文
“
Multi-Instance Ensemble Learning With Discriminative Bags
”在《
IEEE Transactions on Systems Man Cybernetics: Systems
(
IEEE TSMC
)》上发表。
IEEE TSMC
是中科院
SCI
一区、计算机科学顶级期刊,影响因子
13.451
,目前录取率仅为
10%
左右。
多示例学习是一种比传统监督学习更具挑战性的学习范式,其样本标签在包级别给出。流行的多示例特征映射方法将每个包转换为新特征空间的实例。然而,大多数方法无法保证包在新特征空间中的可区分性,且其模型不具备自增强能力。本论文提出了基于辨别包的多示例集成方法,其总体思想如下图所示。包选择技术
(bag selection technique)
分析数据集的空间及标签分布,设计辨别性指标来选择一组具有辨别性的包,并设计自增强方案,以提升辨别包的辨别能力;集成技术
(ensemble thchnique)
基于辨别包,训练多个分类器,并按其性能分配权重,用于提升模型的分类性能及稳定性。