《从企业实操的角度谈深度学习(图像方向)的底层逻辑》是我的一个系列随笔,今天说说深度学习中的一些基本概念,无论是深度学习还是人工智能,都是非常实验性的领域,我们在书上,在学术论文上看到的理论,都可能被推翻,所以今天分享的都是现在这个阶段人类的共识。
分类器的一个最基本的架构,我们输入一个张二狗,想看他是不是一个优质的单身狗:
我们第1步就是获得这个输入就是张二狗;
第2步是个非常重要的步骤就是特征提取,我们不管像图像也好,张二狗也好,最后还是要做判断,我们提取了张二狗的三个特征,一个是他是不是高,一个是他是不是帅,一个是他是不是富。我们把这个过程叫做
特征提取
。如果我们把高、帅、富这三个特征放在一起,起个名字叫
特征向量
。我们找到这个特征的过程就叫做
特征工程
。
上面的例子没有用到数据驱动的方法,是手动设定的方法,但是我们也可以更好的看到数据提取和根据特征做出判别这样一个过程。
判断一个张二狗我们并不需要深度学习这样一个手段,可我们为什么在图像的分类上用到机器学习,甚至是深度学习这样的工作呢?就是因为图片分类的本质难点:特征提取是一个非常非常困难的工作。有一些问题有比较明确的特征,但是图像特征有一个难点就是它的特征非常难以设计。
机器视觉发展了几十年,传统上不基于用机器学习或者深度学习的方法,通过手工设计,也有很多特征提取的方法:如HOG,SIFT,SURF,取得了一定的成果,但是瓶颈也很明显,就是面对更复杂问题的时候,是无能为力的。
深度学习最关键的牛X之处,在于能够进行特征学习,自行根据训练数据学习出特征。特征找的好不好决定了分类器的上限,而分类方法,不管是神经网络也好,或者是传统的随机森林这样的方法也好,只是去接近这样的上限。