人工智能之人脸识别(1)人脸识别标注
一、背景简介
众所周知,人工智能是未来的趋势,其中人脸识别是运用得比较广泛的一项技术,如支付宝、微信的安全验证、表情识别、人脸动画合成、直播、美颜、特效相机等互联网产品。最近对机器学习中的人脸识别学有小得,想着试试进行数据集训练,建立机器模型进行人脸识别。
二、人脸标注由来
人工智能公司如旷视科技、商汤是数据标注的需求大户,因为他们需要大量的数据进行训练、建立模型,从而优化他们的算法。同理我们这种小虾米手里没有标注过的数据集,只能去看看有没有现成的,万一没有就只能自己来进行数据标注了。
三、人脸数据标注
目前人脸识别我认为做得最好的是旷视科技,于是我去他们官网看了一下,了解到脸关键点是对于图像中人脸五官与轮廓定位的标注,主要用来对人脸的关键位置,如脸廓、眉毛、眼睛、嘴唇进行定位,人脸关键点检测是人脸识别过程中重要的一步,同时的爆火也得益于人脸关键点相关技术水平的提升。据我观察它们的数据标注一般是如下图所示:
从上图可以看出
左眼10点、右眼10点、左眉8点、右眉毛8点、鼻子8点、嘴巴18点、轮廓20点,总共92点人脸标准,但是旷视科技标的是106点标注,我猜测有可能是耳朵左右各7点,或者耳朵左右各3点,额头有8点,这个暂且不表。
在了解过程中,发现有的数据标注公司为人工智能公司使用的都是95点人脸标注,如数据堂智能科技有限公司,他们的95点标注分别为
左眼10点、右眼10点、左眉8点、右眉毛8点、鼻子6点、嘴巴22点、耳朵6点、轮廓21点
据我观察可以具体分为以下:
一左眼
1. 左眼瞳孔
2. 左眼左眼角
3. 左眼右眼角
4. 左眼上部最高处
5. 左眼下部最低处
6. 左眼左眼角与左眼上部最高处的等分点
7. 左眼左眼角与左眼下部最低处的等分点
8. 左眼右眼角与左眼上部最高处的等分点
9. 左眼右眼角与左眼上部最低处的等分点
二右眼
10. 右眼瞳孔
11. 右眼左眼角
12. 右眼右眼角
13. 右眼上部最高处
14. 右眼下部最低处
15. 右眼左眼角与右眼上部最高处的等分点
16. 右眼左眼角与右眼下部最低处的等分点
17. 右眼右眼角与右眼上部最高处的等分点
18. 右眼右眼角与右眼上部最低处的等分点
三左眉
19. 左眉左眉角
20. 左眉右眉角
21. 左眉上2分之1处
22. 左眉下2分之1处
23. 左眉上4分之1处
24. 左眉下4分之1处
25. 左眉上4分之3处
26. 左眉下4分之3处
四右眉
27. 右眉左眉角
28. 右眉右眉角
29. 右眉上2分之1处
30. 右眉下2分之1处
31. 右眉上4分之1处
32. 右眉下4分之1处
33. 右眉上4分之3处
34. 右眉下4分之3处
五鼻子
35. 鼻尖
36. 鼻子最下处
37. 鼻梁左侧(与两眼睛内点连线,与鼻子左边的交接点)
38. 鼻梁右侧(与两眼睛内点连线,与鼻子右边的交接点)
39. 左上鼻翼
40. 右上鼻翼
41. 鼻子左边最宽的部分
42. 鼻子右边最宽的部分
43. 鼻子最下处与鼻子左边最宽的部分的等分点(36与41的等分点)
44. 鼻子最下处与鼻子右边最宽的部分的等分点(36与42的等分点)
45. 左鼻孔中心
46. 右鼻孔中心
六嘴唇
47. 左嘴角
48. 右嘴角
49. 上嘴唇上2分之1处
50. 上嘴唇下2分之1处
51. 上嘴唇和鼻唇沟的左交点
52. 上嘴唇和鼻唇沟的右交点
53. 左嘴角与51点的等分点
54. 右嘴唇与52点的等分点
55. 上嘴唇上4分之1处(即左嘴角和49的等分点)
56. 上嘴唇上4分之3处(即右嘴角和49的等分点)
57. 左嘴角与50的等分点(即上嘴唇下4分之1处)
58. 右嘴角与50的等分点(即上嘴唇下4分之3处)
59. 下嘴唇上2分之一处
60. 下嘴唇下2分之一处
61. 左嘴角与59的等分点(即下嘴唇上4分之1处)
62. 右嘴角与59的等分点(即下嘴唇上4分之3处)
63. 下嘴唇左半边3分之1处(即左嘴角和60的3等分点)
64. 下嘴唇左半边3分之2处(即左嘴角和60的3等分点)
65. 下嘴唇右半边3分之1处(从左往右的顺序,即60和右嘴角的3等分点)
66. 下嘴唇右半边3分之2处(从左往右的顺序,即60和右嘴角的3等分点)
67. 下嘴唇下4分之1处
68. 下嘴唇下4分之3处
七耳朵
69. 左耳耳朵最高处
70. 左耳内外耳骨最近的位置
71. 左耳耳垂下面
72. 右耳耳朵最高处
73. 右耳内外耳骨最近的位置
74. 右耳耳垂下面
八轮廓
75. 左侧脸颊,与左眉毛的两个眉角连线的交点(19与20连线)
76. 右侧脸颊,与右眉毛的两个眉角连线的交点(27与28连线)
77. 两外眼角连线,与左边轮廓的交点
78. 两外眼角连线,与右边轮廓的交点
79. 下巴中心
80. 左脸轮廓77到79的8个等分点1
81. 左脸轮廓77到79的8个等分点2
82. 左脸轮廓77到79的8个等分点3
83. 左脸轮廓77到79的8个等分点4
84. 左脸轮廓77到79的8个等分点5
85. 左脸轮廓77到79的8个等分点6
86. 左脸轮廓77到79的8个等分点7
87. 左脸轮廓77到79的8个等分点8
88. 右脸轮廓78到79的8个等分点1
89. 右脸轮廓78到79的8个等分点2
90. 右脸轮廓78到79的8个等分点3
91. 右脸轮廓78到79的8个等分点4
92. 右脸轮廓78到79的8个等分点5
93. 右脸轮廓78到79的8个等分点6
94. 右脸轮廓78到79的8个等分点7
95. 右脸轮廓78到79的8个等分点8
四、人脸标注实操
在了解人脸标注的标准是什么样的之后,我们进入数据标注实操。通过,了解可知,labelme是一个非常好用的数据标注工具,打开Anoconda Prompt 运行界面,输入lableme
出现以下的界面
五、数据标注发展背景
数据标注是人工智能发展中创造出来的一个行业,目前已经创造除了10万+的就业岗位,大多是在校学生做兼职,一直有一小部门聋哑人,但是这个就业前景怎么样,依我来看还是有发展空间的。因为目前的人工智能运用得比较多的还是机器学习中的监督学习,意思就是说需要先把数据标注好,告诉机器哪个是苹果,哪个是梨子,哪个是嘴巴,哪个是鼻子,需要大量的数据进行数据训练。所以数据标注行业在5年内还是一个持续发展的行业,但是一旦机器学习有了质的提升,开始往半监督学习以及无监督学习,那么数据标注这个行业就将要面临转行了。所以,人工智能才是未来的发展趋势,做数据标注如果不往技术层面转,以后可能会面临失业。