近日,大连理工大学软件学院刘晗副教授所在科研团队在小样本学习,对抗攻击,图像描述生成等多个领域取得突破性成果。两篇科研论文被人工智能领域CCF A类会议AAAI 2023录用;在华为昇腾AI创新大赛斩获大连赛区金奖,全国铜奖;在字节跳动安全AI挑战赛文本对抗攻击赛道取得全国唯一冠军。

成果一:Boosting Few-shot Text Classification via Distribution Estimation (AAAI 2023)

该成果由刘晗副教授、张枫(2021级研究生,北京大学)、张晓彤副研究员、赵思洋(2021级研究生,大连理工大学)、马凤龙教授,吴晓明教授,陈红阳研究员,于红副教授,张宪超教授共同完成。合作单位包括:北京大学、美国宾州州立大学、香港理工大学,之江实验室。分布估计是解决小样本图像分类任务的有效方法。然而,在文本领域,由于文本类别间差异巨大,直接用源域类别分布信息估计目标类别分布信息极有可能会造成负面影响。为了解决该问题,文章首次提出利用无标注的查询集样本进行新类别的分布估计,并给出了Way-based和Shot-based分布估计方法,进而通过采样为模型训练提供更充分的监督信息。实验在8种基准数据集上取得了显著效果。

成果二:SSPAttack: A Simple and Sweet Paradigm for Black-box Hard-label Textual Adversarial Attack (AAAI 2023)

该成果由刘晗副教授、徐志(2022级研究生,大连理工大学)、张晓彤副研究员、徐晓明(2019级本科生,大连理工大学),张枫(2021级研究生,北京大学)、马凤龙教授,陈红阳研究员,于红副教授,张宪超教授共同完成。合作单位包括:北京大学、美国宾州州立大学、之江实验室。对抗样本研究是解决人工智能安全瓶颈的重要手段。文本对抗攻击作为对抗样本研究的重要方向之一,目前受到了研究人员的普遍关注。目前,基于黑盒的硬标签文本对抗攻击方向发展非常缓慢,其主要原因为文本数据离散不可微,且攻击者仅能访问模型结果,这大大提高了攻击的难度系数。为了解决上述挑战,文章提出了一种简单有效的基于黑盒的硬标签文本攻击算法。首先,通过随机初始化生成对抗样本;然后,通过去除不必要替换词减小搜索空间。最后,将对抗样本中的单词不断推向原始样本。提出的方法想法简单有效。针对BERT,WordCNN, WordLST以及Google Cloud API和Alibaba Cloud API上的实验均表明提出的方法可以取得显著效果。

成果三:华为昇腾AI创新大赛

该比赛由刘晗副教授、于红副教授共同指导,刘元秋(2022级博士研究生),胡兆龙(2021级硕士研究生),赵思洋(2021级硕士研究生),徐志(2022级硕士研究生)、刘晗副教授(选手兼导师)作为参赛选手。2022昇腾AI创新大赛面向全国各学校、科研院所、企事业行业科技领域相关专业人士,旨在通过此次比赛,联动各行业领域大咖,共同推动人工智能产业应用规模化发展,引领新一轮人工智能产业未来。刘晗副教授、于红副教授团队提出的基于图像描述生成的盲人辅助方案,采用了自主研发的基于胶囊网络的图像描述生成算法在比赛中斩获佳绩,在全国应用赛道1129支参赛队伍中杀出重围,取得了大连赛区金奖,全国铜奖。

成果四:字节跳动安全AI挑战赛

该比赛由刘晗老师指导并参与,徐志(2022级硕士研究生),徐晓明(2019级本科生)作为参赛选手,团队以Ace_Attack作为名称。字节跳动安全AI挑战赛由字节跳动安全中心主办,围绕基于文本和多模态数据的风险识别(Track I)和文本对抗攻击(Track II)两个赛道展开,吸引了来自清华大学、北京大学、哈尔滨工业大学、上海交通大学、南洋理工大学等195所高校、科研院所参与。赛题不仅需要选手对学术领域前沿研究有深入的理解,也要求针对实际场景数据提出独到的改进,极具挑战性。刘晗老师指导团队创新性提出引导词插入算法从比赛中脱颖而出,斩获了文本对抗攻击赛道全国唯一冠军。

Email:ssdut@dlut.edu.cn  电话:0411-62274389 辽ICP备09013925号