1.FG-NET (2002)

下载:http://yanweifu.github.io/FG_NET_data/FGNET.zip
命名规则:078A11.JPG,078人物ID,A为Age简写,11为岁数。
FG-Net训练集有818张图片,测试集有170张图片。此数据集包含了82个人在不同年龄的照片,同时提供了每张图中68个人脸关键点信息。鉴于本数据集跨年龄的特色,FG-Net可用于年龄估计、跨年龄人脸识别、年龄变化推演(age progression)等方向的研究。FG-Net曾是年龄方面最流行的数据集之一【9】,但由于此数据集公布时间较早(2002年)、人脸个数较少,且观察其人脸均为白种人,而且一些早期图片为黑白图片,【9】指出该数据的准确率已趋近饱和。所以近期的论文很少用FG-net做Benchmark。

2. MORPH2 (2006)

下载:http://www.faceaginggroup.com/morph/
论文:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=1613043
根据论文引用情况,MORPH2数据集是目前最流行的年龄估计数据集之一,【2】【4】【5】等论文均在数据集基础上进行了评测,但【9】指出该数据集的准确率近年也已趋近饱和。MORPH2也是一个跨时间的数据集,收录了同一个人在不同年龄段的图片。该数据集分为商用和学术用版本,学术用版本包括了13000个人的55134张图片,照片收集时间跨度2003-2007年,人物年龄为16-77岁,平均年龄为33岁。MORPH2数据集除年龄外还记录了人物的其他信息,如性别、种族、是否戴眼镜等。

3. Adience (2014)

下载:https://talhassner.github.io/home/projects/Adience/Adience-data.html
论文:https://www.openu.ac.il/home/hassner/Adience/EidingerEnbarHassner_tifs.pdf
Adience数据集包括2284个人的26580张图片。其特点为均为真实场景下拍摄(in the wild),照片受到噪声、姿态、光照等影响很大,旨在解决真实世界中的年龄和性别检测问题,网站上同时提供了原始数据和矫正后的人脸。该数据集使用了区间标注的方法,分为了8个区间:(0-2, 4-6, 8-13, 15-20, 25-32, 38-43, 48-53, 60-)。

4. CACD (2014)

下载:http://bcsiriuschen.github.io/CARC/
论文:http://cmlab.csie.ntu.edu.tw/~sirius42/papers/chen14eccv.pdf
CACD收集了2000个名人的163,446张图片,年龄跨度为16 到 62。截止论文发表时间,是当时最大规模的跨年龄数据集。收集照片的时间跨度为2004-2013年。数据集同时也提供了16个人脸关键点的标注信息。CACD数据集提供者明确指出,虽然该数据集包含人物年龄信息,但只建议使用此数据集做跨年龄人物检索,不建议使用该数据集来做年龄预估。、

5.ChaLearn LAP Dataset (2015 / 2016)

下载:http://chalearnlap.cvc.uab.es/dataset/19/description/
论文:http://www.cbsr.ia.ac.cn/users/jwan/papers/CVPRW2016_JunWan.pdf
LAP(Look At People)竞赛于2015和2016举办了两年,两年数据集规模分别为5000和8000(基于官网)。与其他数据集的标签为真实年龄不同,LAP数据集的标签是外观显示年龄(apparent age),标签制定平均了至少10个人的标注结果,所以每张图片的年龄标签都是一个正态分布。比赛排名中使用的是结合均值和方差的综合误差E-error【3】。LAP数据集在20-40岁的分布相对均匀,在0-15和65-100区间数据集较少。

6. IMDB-WIKI(2015)

下载:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
论文:https://www.vision.ee.ethz.ch/en/publications/papers/proceedings/eth_biwi_01229.pdf
IMDB-WIKI数据集是目前规模最大的年龄数据集之一,【3】的作者提出了本数据集并在其基础上finetune网络,赢得了LAP2015年的冠军。本数据集来源包括IMDB(一个明星网站)和Wikipedia中的两万个人,图片数量分别为460723和 62328。标注方法是找到某个名人的照片,然后通过照片拍摄年份减其出生年份得到其年龄标签。经过观察和及【5】指出,由于数据集标注过程是自动处理的,故标注质量不高,有很多错误内容。在【3】、【5】中,主要使用该数据集进行网络初始训练。下图是提取了几张与笔者同生日名人的图片,可以看到有些图片甚至没有人脸。

7. AFAD (2016)

下载:https://github.com/afad-dataset/tarball
论文:https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Niu_Ordinal_Regression_With_CVPR_2016_paper.pdf
数据集【4】规模为164432张脸,其中63680张女性、100752男性。年龄段为15-40岁。该数据集的特点是数据几乎全是中国人。该数据的数据来源为人人网,首先爬取人人网上的图片数据并获取相册所有者的年龄,然后使用人力对错误图片进行过滤。本数据年龄分布也不是很均衡,在最年轻和年纪较大的年龄段数据较少(也好理解,因为该年龄使用人人网的人少)。
根据观察,感觉数据集整体标注效果比较准确,但有一些小图片(22*22)看不清楚,且有很多同一个人的图片几乎完全一样。数据集还有一个特点就是图片截取的较小,只留了较少的脸部,发型和颈部都去除了。其实年龄估计和人的发型、身体等也有一定联系,截取太小将无法使用到这些信息。

8. MegaAge/MegaAge-Asian (2017)

下载:http://mmlab.ie.cuhk.edu.hk/projects/MegaAge/
论文:http://personal.ie.cuhk.edu.hk/~ccloy/files/bmvc_2017_megaage.pdf
MegaAge数据集由商汤发布【2】,总数有41941张图片,同一论文提出的MegaAge-Asian包含40000张亚洲人(绝大部分是东亚人)的图片,两个数据集年龄段都是0-70。数据集人脸的原始来源是MegaFace和YFCC。论文中提到,由于MegaAge-Asian的种族相对单一,故同一年龄估计算法MegaAge-Asian上的表现一般要优于MegaAge数据集上的表现。
经观察,MegaAge-Asian标注结果比较精准,提供的图片大小统一为178*218,在保持比例前提下进行了补边操作,数据集包含了明星和普通人的图片。

9.AGE-DB(2017)

下载:https://ibug.doc.ic.ac.uk/resources/agedb/
论文:https://core.ac.uk/download/pdf/83949017.pdf
AgeDB包含16,488个各种名人的图像,如演员,作家,科学家,政治家,每个图像都注明了身份,年龄和性别属性。 共存在568个不同的科目。 每个科目的平均图像数为29。最低和最高年龄分别为1和101。每个科目的平均年龄范围是50.3岁。

10.UTKFace (2017)

下载:https://susanqq.github.io/UTKFace/
论文:https://arxiv.org/pdf/1702.08423.pdf
UTKFace数据集是一个具有较长年龄跨度(范围从0到116岁)的大型人脸数据集。该数据集包含20,000多张面部图像,其中包含年龄,性别和种族的注释。图像覆盖了姿势,面部表情,光照,遮挡,分辨率等的大变化。该数据集可用于各种任务,例如,面部检测,年龄估计,年龄进展/回归,地标定位等。

12.CAF(2018)

下载:腾讯未公开
论文:https://arxiv.org/pdf/1810.07599.pdf
CAF是腾讯收集的,其包括来自4,668个身份的大约313,986张脸部图像。每个身份都有80面部图像。所有这些图像都经过仔细和手动注释。考虑到缺乏确切的年龄信息,他们利用了公共预训练年龄估计模型DEX [12]预测每个面部图像的粗糙年龄标签。

13.CAFR(2019)

下载:腾讯未公开
论文:https://arxiv.org/pdf/1809.00338.pdf
CAFR总共有来自25,000的1,446,500张面部图像 ,CAFR数据集中的主题。 每个人平均有57.86图像。 应该是目前最大的跨年龄数据库。

14.AGFW-v2(2019)

下载:https://dcnhan.github.io/RL-VAP/
论文:https://arxiv.org/pdf/1606.02254.pdf https://arxiv.org/pdf/1811.11082.pdf
得到的数据集包含36,299个具有年龄的图像10至64年不等。 然后将其分解为11年龄跨度为5岁的年龄组。

  1. Age progression in Human Faces A Survey
  2. Quantifying Facial Age by Posterior of Age Comparisons
  3. DEX: Deep EXpectation of apparent age from a single image
  4. Ordinal Regression with Multiple Output CNN for Age Estimation
  5. SSR-Net: A Compact Soft Stagewise Regression Network for Age Estimation
  6. Age and Gender Classification using Convolutional Neural Networks
  7. Face detection without bells and whistles
  8. Ordinal Hyperplanes Ranker with Cost Sensitivities for Age Estimation
  9. Age and Gender Estimation of Unfiltered Faces
  10. Active appearance models
  11. DeepCD: Learning Deep Complementary Descriptors for Patch Representations
  12. Deep expectation of apparent age from a single image
1.FG-NET (2002)下载:http://yanweifu.github.io/FG_NET_data/FGNET.zip命名规则:078A11.JPG,078人物ID,A为Age简写,11为岁数。FG-Net训练集有818张图片,测试集有170张图片。此数据集包含了82个人在不同年龄的照片,同时提供了每张图中68个人脸关键点信息。鉴于本数据集跨年龄的特色,FG-Net可用于年龄估... 项目地址:https://gitcode.com/yeyupiaoling/FaceDataset 在人工智能和计算机视觉领域,拥有一套高质量的 数据集 是训练强大模型的关键。FaceDataset 是一个开源的 人脸 数据集 项目,由开发者yeyupiaoling精心制作并分享,旨在为面部识别、表情识别等应用提供坚实的基础。 FaceDat...
1. 口罩遮挡 人脸 数据 由武汉大学多媒体研究中心发起,目前是全球最大的口罩遮挡 人脸 数据集 。分为真实口罩 人脸 和模拟口罩 人脸 两部分,真实口罩 人脸 包括525人的5000张口罩 人脸 和9万张正常 人脸 。模拟口罩 人脸 包含1万个人共50万张模拟 人脸 数据集 。 应用项目: 人脸 检测、 人脸 识别 URL:https://github.com/X-zhangyang/Real-World-Masked-Face-Dataset 2. Wider Face 人脸 数据 香港中文大学发起的,包含3万张图片共40万张 人脸
完整 数据集 下载地址:http://www.seeprettyface.com/mydataset.html ————————————————————————————————   因为GANs能无限的生成数据,就想到可以让它不停地画各种类型地图片,并做成一套 数据集 。   下面是第二类 数据集 ,按照 年龄 分类,生成了小孩,成年人和老年人 人脸 数据集 ,各1万张,图片大小均为1024*1024。 小孩 人脸 数据集 ...
CAS-PEAL是中科院计算技术研究所在2003年完成的包含1040位志愿者的工99450幅 人脸 图片的数据库。该数据库涵盖了姿态、表情、装饰、光照、背景、距离和时间等特征的变化。 链接:https://pan.baidu.com/s/1KZtOk-sfNkxnNQfNsTgTrQ 提取码:jbp6
@[TOC](文章目录) 论文名:Deep learning approach for facial age classification: a survey of the state of the art 链接:https://pan.baidu.com/s/1_psq6iUu77KTwJQW0eEh5A 提取码:8gdm 主要是对论文的一个翻译,分为 数据集 、常用方法和评价指标三部分 #一、常用 数据集 本人最近在使用AFAD 数据集 做实验,该 数据集 来自人人网(https://github.c.
人脸 情绪识别 数据集 是一种用于训练和测试 人脸 情绪识别算法的 数据集 。它包含了大量的 人脸 图像,每个图像都标注了所表达的情绪类别,如快乐、悲伤、愤怒等。这些 数据集 通常由专业人员或志愿者进行标注,确保情绪类别的准确性。 这样的 数据集 对于开发和评估 人脸 情绪识别算法非常重要。通过使用这些 数据集 ,研究人员可以训练机器学习模型,使其能够自动地从 人脸 图像中提取出情绪信息。这些模型可以应用于各种实际场景,比如情感分析、心理健康评估等。 人脸 情绪识别 数据集 的构建需要考虑多个因素。首先, 数据集 应该包含各种不同的 人脸 图像,以便训练的模型能够泛化到不同的 人脸 。其次, 数据集 应该平衡地包含各种情绪类别的图像,以避免算法对某些情绪类别的过度偏好。此外, 数据集 应该具有较高的标注准确性,以确保模型能够学习到正确的情绪类别。 对于开发 人脸 情绪识别算法的研究人员来说,获取一个高质量的 数据集 是一项挑战。然而,在互联网上有许多免费或商业化的 人脸 情绪识别 数据集 可以使用。例如,CSDN(中国声像网)提供了一些公开可用的 数据集 ,供研究人员下载使用。 总而言之, 人脸 情绪识别 数据集 是训练和评估 人脸 情绪识别算法的重要资源。它为研究人员提供了实验数据,促进了 人脸 情绪识别技术的发展与应用。