相关文章推荐
豪情万千的台灯  ·  高生酒店(襄阳火车站店)·  5 天前    · 
被表白的橙子  ·  南非共和國學校制度- 教育百科| 教育雲線上字典·  6 月前    · 
酷酷的打火机  ·  中国国民党革命委员会简介--人民资讯--中国 ...·  10 月前    · 
火爆的草稿本  ·  电力电子与电力传动系-青岛大学电气工程学院·  10 月前    · 
失恋的酱肘子  ·  申万宏源证券2024届“新申力”春季校园招聘简章·  1 年前    · 
Code  ›  CVPR 2018 | 鸡尾酒网络DCTN:源分布结合律引导的迁移学习框架开发者社区
cvpr 学习迁移 大数据 分类器
https://cloud.tencent.cn/developer/article/1170924?policyId=1004
完美的领带
5 月前
机器之心

CVPR 2018 | 鸡尾酒网络DCTN:源分布结合律引导的迁移学习框架

腾讯云
开发者社区
文档 建议反馈 控制台
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
发布
首页
学习
活动
专区
圈层
工具
MCP广场
返回腾讯云官网
机器之心
首页
学习
活动
专区
圈层
工具
MCP广场
返回腾讯云官网
社区首页 > 专栏 > CVPR 2018 | 鸡尾酒网络DCTN:源分布结合律引导的迁移学习框架

CVPR 2018 | 鸡尾酒网络DCTN:源分布结合律引导的迁移学习框架

作者头像
机器之心
发布 于 2018-07-30 17:30:28
发布 于 2018-07-30 17:30:28
799 0
举报
文章被收录于专栏: 机器之心 机器之心

机器之心经授权发布

作者:Ruijia Xu、Ziliang Chen、Wangmeng Zuo、Junjie Yan、Liang Lin

来自中山大学、哈尔滨工业大学以及商汤科技公司的研究人员联合提出了一种名为「鸡尾酒网络」(DCTN)的深度迁移学习框架,将现有的单源域适应过程推广到了更加真实和通用的多源域适应场景。DCTN 启发于 2009 年 Y. Mansou [1] 的源分布结合律(source distribution combining rule)。具体而言,DCTN 通过多路对抗机制学习领域无关的特征表达,依据对抗相似性分数作为多源分布结合律的权重和各自的源分类器合作从而对目标域样本进行联合识别,并使用高置信度的伪标注样本对特征表达进行再适应从而引入更强的判别性能。实验中,DCTN 在 Office31, Image-CLEF 以及新提出的基于同时迁移四个数据源的 Digit-five 评测数据集上均取得了比较显著的性能提升。该论文已经被 CVPR 2018 大会接收。

一、简介

随着大规模数据的不断产生和依靠人力进行信息标注的困难,域适应迁移方法逐渐成为机器学习领域中一项非常重要的研究课题。域适应学习旨在适配不同领域数据间的特征分布,提升不同领域间分类器迁移后的性能表现,解决目标域数据缺乏标注信息的难题。域适应迁移学习同时也是工业界的一项关键技术手段,在人脸识别、自动驾驶和医学影像等垂直领域均具有较强的应用需求。比如在自动驾驶领域,如何最小化虚拟环境与真实环境、其他城市和当前城市的领域偏差?又比如在医学影像领域,如何综合利用多源医疗影像给出全面诊断?这些都是领域迁移学习极具应用潜力的场景。

值得注意的是,我们在生活中搜集到的数据源往往是来自各种渠道的。不同渠道的得到的数据源分别与目标域的数据存在偏移现象,而且这些数据源之间也存在偏移。一种更值得广泛考虑的情况是,多个数据源之间的类别也具有差异性,这对多源迁移学习带来了新的挑战 (单源域适应与多源域适应的区别于联系见图 1)。然而,虽然深度迁移学习已经在单领域适应问题上取得各种研究进展,如何运用深度网络去解决多领域适应问题目前依然处于接近空白的阶段。

图 1.(a)单元域适应;(b)多源域适应

二、鸡尾酒背后的理论驱动

多数据源的迁移学习研究可以追溯到 J. Blitzer [1] 和 Y. Mansour [2] 的理论工作。其中 [1] 提出了第一个多源迁移学习的学习上界,为以后的多源域适应学习模型设计打下了基础;[2] 则提出了迁移目标域分布由多个源域分布混合组成。基于这种设定下,他们提出了源分布结合律(source distribution combining rule)。直观而言,他们认为不同的源域学习应该具有自己的分类器,而非使用一个单一分类器去统一所有源域与目标域分类结果。同时,不同源域跟目标域之间分别有相似度,那么与目标域更相似的源域,它的分类器对于目标域的数据进行分类的结果应该更可信。根据以上两点,目标域的分类结果应该由多个源域的分类结果加权而成,而每个源分类权重应该要反映对应源域与目标域的相似性。

三、鸡尾酒网络(Deep CockTail Network)

图 2. 鸡尾酒网络 DCTN

为满足多源分布结合律,我们提出 Deep CockTail Network(鸡尾酒网络 DCTN)。在图 2 的具体数据流中,我们利用共享特征网络对所有源域以及目标域进行特征建模,然后利用多路对抗域适应技术(基于单路对抗域适应(adversarial domain adaptation)下的扩展,对抗域适应的共享特征网络对应于生成对抗学习 (GAN) 里面的生成器),每个源域分别与目标域进行两两组合对抗学习域不变特征。同时每个源域也分别进行监督学习,训练基于不同源类别下的多个 softmax 分类器。注意到,基于对抗学习的建模,我们在得到共享特征网络的同时,也可以得到多个源分别和目标域对抗的判别器。这些判别器在对于目标域的数据,可以分别给出与每一个源域之间的混淆分数(perplexity score)去衡量该源域与目标域之间的相似性。因此,对于每一个来自目标域的数据,我们首先利用不同源下的 softmax 分类器给出其多个分类结果。然后,基于每一个类别,我们找到包含该类别的所有源域 softmax 分类概率,再基于这些源域与目标域的混淆分数,对分类概率取加权平均得到每个类别的分数。简而言之就是,越跟目标域相识的源域混淆度会更高,意味着其分类结果更可信从而具有更高的加权权值。需要注意的是,我们并没有直接作用于所有 softmax 分类器上反而是基于每个类别分别进行加权平均处理。这是因为在我们的假设下,每个源的类别不一定共享,从而 softmax 结果不能简单相加。当然,我们的方法也适用于所有源共享类别的情况,这样我们的公式会等价于直接将 softmax 分类结果进行加权相加。

考虑到不同源域数据分布间的差异性,某些源域的样本对提升目标域分类性能有较大的正向迁移表现,而有些源域的样本域适应性能则较弱甚至带来相对的负面迁移影响。为此,我们设计了如下基于域间困难样本的梯度回传策略,具体可参考图 3 的算法流程。

图 3. 域间困难样本的梯度回传策略

基于多路对抗域适应下,我们进一步提出分类再适应机制。我们基于各源域的分类器和对抗相似性分数对目标域图片进行识别,选取高置信度的目标域伪标记样本微调特征提取器和多源分类器。如此下两个域适应学习进行交替迭代直至模型收敛。整个 DCTN 的训练可参考图 4 的算法流程。

四、实验

图 4. DCTN 的学习过程

论文在 Office-31、ImageCLEF 等主流域适应数据集上进行了实验。其中 Office-31 数据集来自 Amazon(电商图片)、Webcam(网络摄像头拍摄图片)、DSLR(单反相机拍摄图片) 三个视觉领域,共包含 4652 张图片 31 个类别标签。论文以单源最佳模型、多源合并模型等作为评测标准,与 DAN、RevGrad 等流行算法进行了充分对比。

多源域适应框架在 Office-31 和 ImageCLEF 数据集上的分类准确率

除了常规的域适应设置,我们还进行了包含类别偏差的实验探索。仍然以 Office-31 数据集为例,令两个源域分别包含前三分之二和后三分之二的类别标签,据此进行多源域适应过程,对目标域的图片类别进行预测。

类别偏差设置下在 A,D→W 任务上的分类准确率

类别偏差设置下在 I,P→C 任务上的分类准确率

最后,我们构建了四对一的多源迁移学习任务标准 Digit-five,同时给出在该多源迁移学习标准下的两个多源域适应任务结果。我们可以看出 DCTN 明显优于目前主流的深度迁移学习算法。

论文:Deep Cocktail Network: Multi-source Unsupervised Domain Adaptation with Category Shift

项目链接:http://www.sysu-hcp.net/deep-cocktail-network/

[1] J. Blitzer, K. Crammer, A. Kulesza, F. Pereira, and J. Wortman. Learning bounds for domain adaptation. In Advances in neural information processing systems, pages 129–136, 2008.

[2] Y. Mansour, M. Mohri , and A. Rostamizadeh . Domain adaptation with multiple sources. In Advances in neural information processing systems

本文为机器之心经授权发布,转载请联系本公众号获得授权。

本文参与 腾讯云自媒体同步曝光计划 ,分享自微信公众号。
原始发表:2018-06-12 ,如有侵权请联系 cloudcommunity@tencent.com 删除
其他

本文分享自 机器之心 微信公众号, 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!

其他
评论
登录 后参与评论
0 条评论
热度
最新
登录 后参与评论
推荐阅读
相关产品与服务
人脸识别
腾讯云神图·人脸识别(Face Recognition)基于腾讯优图强大的面部分析技术,提供包括人脸检测与分析、比对、搜索、验证、五官定位、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。 可应用于在线娱乐、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身份确认等需求。
产品介绍 产品文档
人脸识别10万次资源包新用户19.9元起
领券
  • 社区

    • 技术文章
    • 技术问答
    • 技术沙龙
    • 技术视频
    • 学习中心
    • 技术百科
    • 技术专区
  • 活动

    • 自媒体同步曝光计划
    • 邀请作者入驻
    • 自荐上首页
    • 技术竞赛
  • 圈层

    • 腾讯云最具价值专家
    • 腾讯云架构师技术同盟
    • 腾讯云创作之星
    • 腾讯云TDP
  • 关于

    • 社区规范
    • 免责声明
    • 联系我们
    • 友情链接
    • MCP广场开源版权声明

腾讯云开发者

扫码关注腾讯云开发者

扫码关注腾讯云开发者

领取腾讯云代金券

热门产品

  • 域名注册
  • 云服务器
  • 区块链服务
  • 消息队列
  • 网络加速
  • 云数据库
  • 域名解析
  • 云存储
  • 视频直播

热门推荐

  • 人脸识别
  • 腾讯会议
  • 企业云
  • CDN加速
  • 视频通话
  • 图像分析
  • MySQL 数据库
  • SSL 证书
  • 语音识别

更多推荐

  • 数据安全
  • 负载均衡
  • 短信
  • 文字识别
  • 云点播
  • 大数据
  • 小程序开发
  • 网站监控
  • 数据迁移

Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有

深圳市腾讯计算机系统有限公司 ICP备案/许可证号: 粤B2-20090059 深公网安备号 44030502008569

腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287

问题归档 专栏文章 快讯文章归档 关键词归档 开发者手册归档 开发者手册 Section 归档

Copyright © 2013 - 2025 Tencent Cloud.

All Rights Reserved. 腾讯云 版权所有

登录 后参与评论
 
推荐文章
豪情万千的台灯  ·  高生酒店(襄阳火车站店)
5 天前
被表白的橙子  ·  南非共和國學校制度- 教育百科| 教育雲線上字典
6 月前
酷酷的打火机  ·  中国国民党革命委员会简介--人民资讯--中国国民党革命委员会中央 ...
10 月前
火爆的草稿本  ·  电力电子与电力传动系-青岛大学电气工程学院
10 月前
失恋的酱肘子  ·  申万宏源证券2024届“新申力”春季校园招聘简章
1 年前
今天看啥   ·   Py中国   ·   codingpro   ·   小百科   ·   link之家   ·   卧龙AI搜索
删除内容请联系邮箱 2879853325@qq.com
Code - 代码工具平台
© 2024 ~ 沪ICP备11025650号